Hvorfor statistikk? Innhold (9 og 12 desember 2013): Litteratur. Læringsmål statistikk (9 og 12 desember 2013)

Lærigsmål statistikk (9 og desember 3 Medisisk statistikk, termi IC av Stia Lyderse, professor i medisisk statistikk Regioalt kuskapsseter for bar og uge - Psykisk helse og barever (RKBU Midt-Norge Forelesig 9 og desember 3 8..5 redegjøre for følgede begreper iefor beskrivede statistikk: gjeomsitt (mea, media, percetiler, stadardavvik (SD, stadardfeil (SEM, frekvestabell og krysstabell, og tolke hva disse forklarer om ekle eksempeldatasett 8..6 redegjøre for hva som fremstilles i graftypee histogram, stolpediagram, Box-plott og spredigsplott. 8..7 redegjøre for begrepee kofidesitervall, ullhypotese, p-verdi, teststyrke, type I og type II-feil. 8..8 redegjøre for ormalfordelig og biomisk fordelig, og velge eget metode mellom uparet og paret T-test, uparet og paret ikke-paramterisk test, kjikvadrat-test, og tilhørede kofidesitervaller. 3 4 Ihold (9 og desember 3: Hvorfor statistikk? Deskriptiv statistikk Ekel sasylighetsregig Populasjo og tilfeldige utvalg Statistisk iferes: Estimerig, hypotesetestig og kofidesitervaller For å kue lese medisisk litteratur ikl viteskapelige artikler For å kue utføre ekle statistiske aalyser ifm hovedoppgave 5 Litteratur Bowers, D: Medical Statistics from Scratch. ed, Wiley 8. Aale, Odd. m.fl.: Statistiske metoder i medisi og helsefag. Gyldedal, 6. Veierød, M. B., Lyderse, S, Laake, P (eds: Medical Statistics i Cliical ad Epidemiological Research. Gyldedal,. Goick, L ad Wollcott, S: The Cartoo Guide to Statistics Harper Collis, 993 6 Editorial, NEJM, Jauary : Lookig Back o the Milleium i Medicie. The most importat medical developmets of the past milleium: Elucidatio of Huma Aatomy ad Physiology Elucidatio of the Chemistry of Life Applicatio of Statistics to Medicie Developmet of Aesthesia Discovery of the Relatio of Microbes to Disease Elucidatio of Iheritace ad Geetics Kowledge of the Immue System Developmet of Body Imagig Discovery of Atimicrobial Agets Developmet of Molecular Pharmacotherapy

7 8 Ay serious ivestigator i biological ad medical scieces must have a grasp of the basic priciples (of statistics. With moder computer facilities there is little eed for familiarity with the techical detail of statistical calculatios. However, a physicia should uderstad whe such calculatios are valid, whe they are ot, ad how they should be iterpreted. (Campbell ad Machi, 7 Statistikk : Forskjellige betydiger:. E samlig tall f.eks Statistisk årbok fra Statistisk setralbyrå. Egelsk: Statistic, orsk observator eller testobservator : E fuksjo av data som f.eks gjeomsitt, maksimumsverdi eller Studet s t observator. 3. (Matematisk statistikk: E gre av matematikke med ege termiologi og metoder. Det viteskapelige redskap for å trekke koklusjoer basert på data med elemeter av usikkerhet. 9 Tre typer statistikk: Deskriptiv Grafer Oppsummerede tall Bekreftede Hypotesetestig Kofidesitervall Prediktiv Deskriptiv statistikk: Grafer og oppsummerigstall Typer data: Skalavariabel (kotiuerlig variabel - f.eks høyde i cm Kategorisk variabel (diskret variabel Ordial, f.eks Føler du deg deprimert? = Ikke i det hele tatt, = Litt, 3 = Edel, 4 = Svært mye Nomial, f.eks Sivilstad: = ugift, = gift, 3 = samboer, 4 = skilt, 5 = eke(ma Kosetrasjo av serum IgM (g/l hos 98 friske bar, 6 md - 6 år gamle (Altma, 99,8,,7,5,5,5,9,7,4,7,5 4,5,,4,8,8,7,6,6,8,,5,,7,,,7,5,6,6,9,5,4,,7,,,5,4,3,6,8,4,7,,7,,,5,3,5,6,,8,,8,3,,,8,6,3,5,6,6,4,5,5,9,8,4,5,4,4,4,,4,5,,9,7,9,5,7,5,7,5,9,5,,4,7,4,6,4,4,,4,4,3,7,,6,6,6,7,7,,4,9,8,6,,6,,4,3,7,9,7,8,6,9,9,9,5,5,7,,5,,,3,5,8,8,8,,6,,3,7,,8,6,4,,5,3,3,8,4,3,,3,8,8,,4,6,5,4,7,7,9,,8,5,8,8,,9,6,7,4,4,6,,3,8,3,3,5,7,,5,7,5,7,,,,,8,,5,5,3,5,7,4,9,4,6,8,7,7,8,,7,8,8,9,4,6,7,,7,8,7,4,,8,5,6,7,8,3,8,6,8,4,8,7,6,5,9,8,9,4,8,5,,8,,5,9,4,3,4,9,5,,5,4,,4,7,3,5,7,7,6,6,8,6,7,6,6,6,8,3,,3,4,,8,3,8,6,7,,8,3,3,,9,3,6,7,9,6,6,,3,7,6,9

3 4 Histogram - IgM data: Example: EORTC Quality of life questioaire 4 do you feel depressed? * performace Crosstabulatio 3 Cout do you feel depressed? Total : ot at all : a little 3: partly 4: very much performace who - who -4 Total 5 7 3 63 49 49 7 76 8 8 437 548 Atall,,5,,5,,5 3, 3,5 4, 4,5 5, IgM (g/l 5 6 Noe yttige grafer É kategorisk variabel: Bar chart (stolpediagram Pie chart (kakediagram To kategoriske variable: Clustered bar chart (klyget stolpediagram 7 8 Noe yttige grafer (forts. É skalavariabel: Histogram Sammelike data med ormalfordelig: Q-Q plot lettere å lese og tolke e ormal curve overlay i histogram To skalavariable: Scatterplot Noe yttige grafer (forts. É skalavariabel og é kategorisk variabel (sammelike skalavariabele i to eller flere grupper: Dot plot eller scatter plot (ved få observasjoer Box plot (ved mage observasjoer 3

9 Beskrivelse av fordelige Skalavariable, evt også ordiale variable: setrum og spredig: Gjeomsitt og stadardavvik Media og kvartiler Kategoriske data: Frekvestabell Krysstabell Data: x, x,..., x Lettere å rege ut Gjeomsitt: x ( x x... x x i i ( (Empirisk varias: s ( x x x x i i (Empirisk stadardavvik: i i s ( xi x ( i Data sortert: x( x(... x( Media: x( / hvis er oddetall ( x( / x( / / hvis er partall Mediae deler tallmaterialet på midte. Like mage observasjoer uder som over mediae. Nedre kvartil, media, øvre kvartil: Deler tallmaterialet i fire like store deler. Eksempel: Atall dager i sykehus. Behadlig A: 6, 5, 37,, 3,, 7,, 3, 38 Sortert:,, 3, 5, 7,, 6, 37, 38, 3 Behadlig B 4, 3, 5,, 6,, 3, 65, 4, 5, 3, 49, 43 Sortert:, 5,, 6, 3, 3, 4, 49, 65, 5, 4, 3, 43 Hva blir media og kvartiler for behadlig A? 3 4 Hvilke(t mål vil du bruke på setrum og spredig i fordeligee? Gjeomsitt og stadardavvik har gustige matematiske egeskaper. Eks: Hvis gjeomsitt og stadardavvik for hvert av r utvalg er gitt, ka ma berege dem for det totale tallmaterialet: x x... r xr Gjeomsitt totalt: xtotal... Varias totalt: s r ( s ( s... ( r sr total... r r Stadardavvik totalt: s total s total 4

5 Normalfordelige I e del situasjoer er skalavariable (tilærmet ormalfordelt, dvs symmetrisk og med e spesiell klokkeformet fasog. x f ( x e Når data er ormalfordelt: Ca 68% ligger ie stadardavvik fra gjeomsittet Ca 95% ligger ie stadardavvik fra gjeomsittet Visse metoder forutsetter at data er (tilærmet ormalfordelt. F.eks Studets t-test, valig regresjosaalyse 6 Histogram m/ormalfordeligskurve IgM data Atall 4 3 -, -, IgM (g/l,,, 3, 4, 5, 7 8 Normal Q-Q Plot of IgM (g/l,5,,5 Expected Normal Value,,5, -,5-3 4 5 Observed Value 9 3 Box plot Box plot - eksempel 5 Sum score equivalet 4 8 3 6 5 Ekstreme observasjoer Outliers 6 9 57 39 5 9 97 59 3 9 Øvre kvartil 4 Media IgM (g/l N = 98 Nedre kvartil N = 33 5 33 5 36 8 36 8 33 6 3 5 38 34 NHP FAI MADRS BI ESUS OSUS NHP FAI MMS 5

3 3 Eksempel - IgM data: Eksempel - EORTC data Gjeomsitt:,83 Stadardavvik:,47 Media (5% uder:,7 Nedre kvartil (5% uder:,5 Øvre kvartil (75% uder:, Performace status who - who -4 Gjeomsitt.73.4 Stadardavvik.83.87 media 33 34 Valg av deskriptiv statisikk for setrum og spredig i fordelige Gjeomsitt og stadardavvik ELLER media og kvartiler ELLER begge deler? Avheger av målsettige med aalyse. Hvis data er symmetrisk fordelt (for eksempel ormalfordelt: Media = gjeomsitt Hvis data ikke er ormalfordelt: Gaske valig å oppgi media og kvartiler. OK å oppgi gjeomsitt og stadardaavvik. Med stadardavviket har ikke samme ekle tolkig som i ormalfordelige. OK å ata ormalforeldig i små datasett? JA, hvis rimelig atakelse basert på ae kuskap eller ispeksjo av data. Hvorda sjekke om data avviker fra ormalfordelige? Hvis media avviker mye fra gjeomsitt, så er data ikke symmetrisk fordelt (og dermed ikke ormalfordelt. (Me ikke omvedt! Statistisk test: Kolmogorov-Smiroff mye brukt me lite eget. Shapiro-Wilk oe bedre eget. Histogram med ormalfordeligskurve: Vaskelig å vurdere Q-Q plott: Veleget! 35 36 Eksempel - postoperativ kvalme Behadlig * Kvalmeklasse Krysstabell Behadlig Total Nei Ja Atall % Atall % Atall % Kvalme lite eller ige betydelig Total 8 3 6,% 4,%,% 4 5 9 8,8% 7,%,% 4 7 59 7,% 8,8%,% Ekel sasylighetsregig Risikoreduksjo i dette utvalget: 8,8% - 6,% =,8% Hva ka vi si om effekt av behadlig i e populasjo av aktuelle pasieter? 6

37 38 Sasylighet for gutt: Atall Atall gutter Adel gutter levedefødsler 8,8 55,55 55,55 539,539 57,57 376358 9754,547 798936 99,548 34835 7857857,568 Sasylighet (Def 3. Et forsøk gjeomføres gager. Begivehete A itreffer A av gagee. De relative hyppighete A / tederer mot et tall år atall forsøk tederer mot uedelig. Dette tallet, P(A, kalles sasylighete for A. Egelsk: Probability 39 4 Sasylighetsmodell: Forsøk, utfallsrom, sasylighete til hvert ekeltutfall a Terigkast: P( = P( = P(3 = P(4 = P(5 = P(6 = /6 b Barefødsel. P(jete =.487, P(gutt =.53 c Behadlig med peicilli. Realistisk for ekelte pasietgrupper: P(frisk =.6377, P(forblir syk =.36, P(aafylaktisk sjokk =. Aale et al (6, side 49: Det er for eksempel meesker som har kastet e terig svært mage gager, og da har fuet ut at hvert av utfallee opptrer i omtret /6 av tilfellee. 4 4 3.4 Regeregler for sasylighet Positiv uritest Syk (Chalmydia thractomatis 757 Regel 3. Komplemetregele P( A P( A A 8 7 B 89 Regel 3.3 Addisjosregele: For disjukte A og B har vi P( A B P( A P( B Regel 3.4 De geerelle addisjosregel: P( A B P( A P( B P( A B A = Pasiete har positiv uritest P( A 8/ 757.7% B= Pasiete er syk P( B 89 / 757.8% P( A B 7 / 89 8.9% 7 / 757 P( A B P( A B 89 / 757 P( B 7

43 44 Defiisjo av betiget sasylighet for A gitt B: P( A B P( A B P( B Regel 3.5 De geerelle multiplikasjosregele P( A B P( A B P( B P( B A P( A A og B er stokastisk uavhegige hvis P( A B P( A Regel 3.6 mm: A og B er stokastisk uavhegige hvis og bare hvis P( A B P( A P( B Regel 3.7: Hvis A, A,, A er stokastisk uavhegige så er P( A A... A P( A P( A P( A 45 46 Eksempel: Sasylighet for to gutter i to ekeltfødsler: P( G G P( G P( G.53.53.63 Aale et al, eksempel 3.4 s 56: Vi atar da uavhegighet mellom hver fødsel med hesy til barets kjø. Egetlig ka e ikke bare gå ut fra at det er avhegighet i dette tilfellet. Det bør udersøkes om e slik atakelse stemmer med virkelighete. Det fies flere udersøkelser om dette, og det viser seg at det ikke er full stokastisk uavhegighet med hesy til bars kjø i e familie. Ekelte familier har e tedes til å få jeter og adre e tedes til å få gutter. 47 48 Lippert, T, Skjærve, R, Salvese, K. Å: Hvorfor får oe bare gutter eller bare jeter? Tidsskr Nor Lægefore 5; 5: 344-7 Studie basert på kvier som har født to, tre og fire bar i periode 967 3 (Norsk fødselsregister: 54 699 kvier og 38 974 fødsler. Adel gutter 5.33%. Lippert et al (5: Det er ikke holdepukter for at sasylighete for å få gutt eller jete avviker fra populasjosgjeomsittet hos oe spesielle foreldrepar. De viktigste forklarige på at det er flere ree gutte- og jetesøskeflokker e statistisk fordelig forutsier, er at e del mødre med bare gutter eller bare jeter føder flere bar, i hva vi tror er et forsøk på å få et bar av motsatt kjø. 8

49 5 Altså: Barets kjø (ved ekeltfødsler er uavhegig av kjøsfordelig på eldre søske, Norge 967 3. Me: Sigh, N., Pripp, A. H., Brekke, T., & Stray- Pederse, B., "Differet sex ratios of childre bor to Idia ad Pakistai immigrats i Norway", BMC Pregacy ad Childbirth, vol.. Sigh et al (. Idia populatios livig i Norway Time period Birth order of child Female / male Female sex ratio, % (95% cofidece iterval 969-886 59/97 87 (73 to 97/7 95 (77 to 4 3 85/79 8 (75 to 4 4 6/8 93 (4 to 4 987-996 83/5 3 (94 to 3 8/4 (8 to 3 64/3 6 (43 to 8 4 /33 36 ( to 6 997-5 73/35 6 (96 to 36 /37 85 (69 to 3 68/99 69 (47 to 9 4 8/7 47 (8 to 87 Natural female sex ratio: (-.53/.53 = 95% 5 5 Sigh et al (: Our fidigs idicate that the female-to-male ratio of higher birth order childre seems to have declied amog Idia immigrats, but ot amog Pakistai immigrats, after the itroductio of ultrasoud scaig techology i Norway i 987. Lower proportios of female births tha expected were ot foud i the pre-ultrasoud era. This imbalace could reflect the selective abortio of female fetuses due to preatal sex determiatio by ultrasoud. Tilfeldige variable (stokastiske variable Sasylighetsfordelig Forvetigsverdi Varias og Stadardavvik 53 54 Sasylighetsfordelig Stokastisk forsøk: Vet ikke utfallet på forhåd. Me vet megde mulige utfall på forhåd. Stokastisk variabel (tilfeldig variabel Tallstørrelse kyttet til utfallet. Vet ikke verdie på de før forsøket er utført. Sasylighetsfordelig (for kategoriske variable: Sasylighetee for de mulige verdiee. Forvetige til X Forvetigsverdie (expectatio, expected value, mea E( X x P( X x alle xi tygdepuktet i i 9

55 56 Variase til X Var X x E X P X x ( ( i ( ( i alle xi x P( X x ( E( X alle xi i i De store talls lov: Når atall observasjoer vokser (mot uedelig, vil: A / P(A x E( X Stadardavviket til X (Stadard deviatio SD( X Var( X Lettest ved hådregig s Var( X 57 Biomisk forsøksrekke. Defiisjo: De ekelte forsøk er uavhegige av hveradre I hvert forsøk registreres hvorvidt hedelse A itreffer eller ikke Sasylighete for A, p=p(a, er de samme i hvert forsøk. 58 Biomisk forsøksrekke - eksempler Barefødsler: Kjø på etterfølgede ekeltfødsler ved et sykehus Terigkast. P(sekser=/6. Behadlig av e bestemt sykdom: Pasiete blir frisk. 59 6 Biomisk fordelig: X suksesser blat forsøk, P(suksess=p i hvert forsøk: X bi(, p x P( X x p ( p x E( X p Var( X p( p x Eksempel: X=atall gutter blat 4 ekeltfødsler: p=.53 E( X 4.53.5 P X 4 4 (.53 (.53.374

6 6 Populasjo og tilfeldige utvalg Statistisk modell og utvalg Atall gutter blat 4 uavhegige fødsler 63 64 Statistisk iferes SAMPLE The last 3 low-birthweight babies bor i these three materity uits Represetativt(? Tilfeldig(? I oe studier er målpopulasjoe og studiepopulasjoe de samme (ideelt Figur fra Bowers(8 65 66 Populasjo Tilfeldig Utvalg Statistisk iferes Populasjo Utvalg Tilfeldig (stokastisk variabel Observasjoer x,..., x X Forvetigsverdi E( X Gjeomsitt x Varias (Utvalgsvarias, empirisk varias s Stadardavvik (Utvalgsstadardavvik, empirisk stadardavvik s Sasylighetsfordelig: F.eks Normalfordelig: X N(, Biomisk fordelig X bi(, p

67 68 Statistisk iferes (bekreftede statistikk Eksempel - postoperativ kvalme Behadlig * Kvalmeklasse Krysstabell Trekke slutiger om (e eller flere parameter(e i e populasjo basert på aalyse av et tilfeldig utvalg: Estimat Kofidesitervall Hypotesetestig / P-verdi Behadlig Total Nei Ja Atall % Atall % Atall % Kvalme lite eller ige betydelig Total 8 3 6,% 4,%,% 4 5 9 8,8% 7,%,% 4 7 59 7,% 8,8%,% Differase i suksessasylighet i dette utvalget: 8,8% - 6,% =,8% Hva ka vi si om effekt av behadlig i e populasjo av aktuelle pasieter? 69 7 Estimert sasylighet for suksess: kotrollgruppe: pˆ 8 / 3 6% behadligsgruppe: pˆ 4 / 9 83% Hvis vi behadler pasieter vil vi forvete hhv x6%=6 og x83%=83 suksesser. Forvetet differase: 83-6=3 NNT - Number eeded to treat (=NNTB Number eeded to beefit The umber of patiets that a physicia would have to treat with a ew treatmet i order to avoid oe evet that would otherwise have occurred with a stadard treatmet. (Simo Day: Dictioary for cliical trials, d editio, Wiley, 7 7 7 NNT bereges som delt på differase mellom sasylighetee i de to gruppee: NNT 4.4 pˆ pˆ.83.6 Hvis vi behadler 4.4 pasieter vil vi forvete hhv 4.4x6% =.6 suksesser 4.4x83% = 3.6 suksesser Forvetet differase 3.6.6 = Hypotesetestig Sett opp ullhypotese og alterativ hypotese. Eksempel: H : Sasylighete for suksess er lik i gruppee H : Sasylighete for suksess er forskjellig

73 74 Hypotesetestig: Sahete Nullhypotese: H : p = p Alterativ hypotese H : p p (tosidig eller H : p < p (esidig Esidige alterativ hypoteser brukes este aldri i medisisk forskig. Beslutig Aksepter H Forkast H (påstå H H H OK P( Type I feil H = P( Type II feil H = P( OK H =- =testes styrke(fuksjo 75 76 P(Type I feil = P(Forkaste H H = kalles testes sigifikasivå P(Type II feil = P(Akseptere H H = P(Forkaste H H =- kalles testes styrke (power Varierede otasjo: Noe lærebøker bruker for styrke og (- for P(Type II feil Hypotesetestig og p-verdi P-verdie (sigifikassasylighet, sig. er sasylighete for å få de observerte verdier eller oe mer ekstremt, gitt at H er sa. P-verdie er ikke sasylighete for at H er sa! Forkast H hvis p-verdi Dette garaterer P(Type I feil 77 78 Kryssede iteresser: Øsker lav og lav. MEN: Desto lavere, desto lavere teststyrke (høy I praksis: Sett til et lavt tall, valigvis.5 eller.. H og H er ikke likeverdige. Hvis vi er i tvil, aksepteres H. I rettsveseet: H : Tiltalte er uskyldig H : Tiltalte er skyldig 3

79 8 Kofidesitervall: Et mål på usikkerhet i estimatet Et ( kofidesitervall (, for e parameter (for eksempel p p har egeskape l h P( l h ( kalles kofideskoeffisiete. Valigvis er (.95 8 Hva betyr et ( kofidesitervall? Hvis det bereges 95% kofidesitervall for mage forsøk, vil i det lage løp 95% av itervallee dekke de sae verdie Det er IKKE 95% sasylighet for at kofidesitervallet dekker de sae verdie Sammeheg mellom kofidesitervall og hypotesetest: Hvis ( kofidesitervallet for ieholder, vil vi ikke forkaste H : på sigifikasivå 8 Fra Vacouver-retigslijee : Statistics Whe possible, quatify fidigs ad preset them with appropriate idicators of measuremet error or ucertaity (such as cofidece itervals. Avoid relyig solely o statistical hypothesis testig, such as the use of P values, which fails to covey importat iformatio about effect size. (Geerelt: Kofidesitervallet består av de verdier som ikke ville blitt forkastet ved hypotesetestig på ivå ICMJE Iteratioal Committe of Medical Joural Editors http://www.icmje.org/#prepare, jauar 3 83 84 Kaasbøll J, Lyderse S, Idredavik M: (Pai, Psychological symptoms i childre of parets with chroic pai the HUNT study Eksempel - postoperativ kvalme Results adjusted for age Parets with chroic pai Number of Risk for coduct problems: Odds ratio (OR childre estimate Cof. it. P-value Noe 8 (ref. Oly mother 89.3. to.67.36 Oly father 6.99.74 to.3.93 Both parets 7.36.96 to.93.87 Behadlig Total Behadlig * Kvalmeklasse Krysstabell Nei Ja Atall % Atall % Atall % Kvalme lite eller ige betydelig Total 8 3 6,% 4,%,% 4 5 9 8,8% 7,%,% 4 7 59 7,% 8,8%,% Pearso s kjikvadrattest, tosidig alterativ: p-verdi =.54 4

85 86 To grupper av størrelse og. Observerer X bi(, p og X bi(, p H : p =p (eller p -p = mot H : p p. Estimatorer for p og p : pˆ X og p ˆ X Forkaster H hvis pˆ ˆ p avviker mye fra. pˆ pˆ Uder H er z tilærmet stadard ormalfordelt. Var( pˆ pˆ pga uavh. Var( pˆ pˆ Var( pˆ ( Var( pˆ Uder H p ( p p( p p( p Dermed fås z pˆ pˆ pˆ ( pˆ X X hvor pˆ 87 88 Geerelt: pˆ pˆ ( p p z er tilærmet stadard ormalfordelt. Var( pˆ pˆ p ( p p ( p pga uavh. Var( pˆ pˆ Var( pˆ ( Var( pˆ Dermed fås Så Pr( z z z / / pˆ pˆ ( p p Pr( z pˆ ( pˆ pˆ ( pˆ / z / z pˆ pˆ ( p ˆ ˆ p p p ( p p p ( p p ( p pˆ ( pˆ pˆ ( pˆ Løser de mhp p p og får et tilærmet - kofidesitervall for p p 89 9 Tilærmet - kofidesitervall for p p (Wald itervallet pˆ pˆ z ˆ ˆ ˆ ˆ / p( p p( p Tilærmige er OK bare hvis og er store Agresti & Caffo ( kofidesitervall for p -p : Bereg estimert risikodifferase som før: X X pˆ pˆ Legg til i hver celle i x tabelle før du bereger valig asymptotisk kofidesitervall: X X X X p, p Bedre tilærmet kofidesitervall: p p z p ( p p ( p / 5

9 9 Agresti & Caffo ( itervallet: Lett å berege Legg til 4 observasjoer ( suksess og fiasko i hver av gruppee og bereg Wald itervallet som om dette var observasjoee Gode egeskaper (dekigsgrad Abefalt i yere iførigsbøker i statistikk Eksempel: Postoperativ kvalme x x 4 8 pˆ pˆ.876.6.76 9 3 p x x 4 9 p x x 8 3.864.5938 93 94 95% Agresti-Caffo kofidesitervall: p p z p ( p p ( p.5/.76.96.864(.864.6(.6 (.7,.43 3 3 (95% Wald kofidesitervall: (.5,.45 Er kofidesitervallet kosistet med hypoteseteste (p=.54? Eksempel: Atall dager i sykehus. Behadlig A: 6, 5, 37,, 3,, 7,, 3, 38 x 3.9, s 36.4, media = 9 A A Behadlig B 4, 3, 5,, 6,, 3, 65, 4, 5, 3, 49, 43 x 76.54, s 75.86, media = 4 B A Hva ka vi si om forskjell mellom A og B i populasjoe? 95 96 Studet s t-test og kofidesitervall for to uavhegige utvalg. Estimator for : X X ~ N, observasjoer, atas uavh. N(, observasjoer, atas uavh. N(, H : = mot H : Ekvivalet: H : - = mot H : - Atar foreløpig lik varias, = = Ikke brukbar ved observasjoer som avviker mye mer fra gjeomsittet e forvetet I ormalfodelige. X X ( ~, Altså: N Hvis X X ( ~, så er N 95 96 6

97 98 Me er ukjet og estimeres ved pooled estimate of the variace : Atall dager forutsatt (tilærmet ormalfordelt S ( X i X ( X i X i i S S Vi bruker at X X ( ~ t S 97 99 Atall dager er ikke ormalfordelt. Logaritme til atall dager er tilærmet ormalfordelt Logaritme (l til atall dager Tolkig: l( MediaA l( MediaB.7789 MediaA l.7789 MediaB MediaA e.7789.459 MediaB.5353,5 95% kofidesitervall: ( e, e (.5,.978 7

3 Ikke-parametriske metoder: Forutsetter ige parametrisk fordelig: Basert på ragordige av observasjoee, glemmer origialdata 4 Example: EORTC Quality of life questioaire Behadlig A sortert:,, 3, 5, 7,, 6, 37, 38, 3 Rag:,, 4, 5.5, 7, 8,.5, 4, 5, Gjeomsittsrag: 8.7 Behadlig B sortert:, 5,, 6, 3, 3, 4, 49, 65, 5, 4, 3, 43 Rag: 3, 5.5, 9,.5,.5,.5, 6, 7, 8, 9,,, 3 Gjeomsittsrag: 4.54 Cout do you feel depressed? * performace Crosstabulatio do you feel depressed? Total : ot at all : a little 3: partly 4: very much performace who - who -4 Total 5 7 3 63 49 49 7 76 8 8 437 548 Wilcoxo-Ma-Whitey s test for to uavhegige utvalg: P=.4 5 6 Eksempel - EORTC data Er du Performace status deprimert? who - who -4 Gjeomsitt.73.4 Stadardavvik.83.87 media Observert differase:.4.73 =.4 Er det forskjell på forvetet depresjos-skåre mellom de to gruppee? Studet s T-test: 95% KI (.3,.59, p-verdi <. Wilcoxo-Ma-Whitey (Ikke-parametrisk test: p-verdi <. 7 8 Matchede par. Eksempel fra Box, Huter & Huter: Statistics for Experimeters d ed. (5 Metodee vi har sett på, forutsetter uavhegige observasjoer i gruppee. Hva med matchede par? 8 8

9 Matchede par - eksempler fra medisisk forskig: Overkrysigsstudier Kotralateral desig Matchede par: Skalavariable: Reg ut differase for hvert idivid. Bruk e ettutvalgsmetode for å teste om forvetet differase er : Studet s ettutvalgs t-test Ekvivalet: paired samples t-test programvare reger ut differasee. eller Wilcoxo s siged rak ikkeparamertrisk test Ekvivalet: Related samples Dikotome variable (to mulige utfall: McNemar s test Newcombe s metode for kofidesitervall Studet t t-test eller ikke-parametrisk metode? Oppsummerig - valg av metode: Hvis data er ormalfordelt: Ikke-parametriske metoder har tilærmet (dvs este like høy teststyrke som t-teste i middels store og store datasett Ikke-paramteriske metoder er vesetlig svakere e t-teste i små datasett. Hvis data ikke er ormalfordelt: T-teste OK hvis ikke ekstreme observasjoer Bruke t-teste på trasformerte data? Bruk e ikke-parametrisk test Studet s t-test: Ka også berege tilhørede kofidesitervall. Type variabel To uavhegige utvalg Matchede par Normalfordelt (evt etter trasformasjo, eller data ute ekstreme observasjoer Studet s toutvalgs t-test: To versjoer: Ata lik varias Ikke ata lik varias Studet s ettutvalgstest på differasee Ekvivalet: Paret t-test Vilkårlig fordelt skalavariabel eller ordial variabel Dikotom (to mulige utfall (Wilcoxo- Ma- Whitey s test Pearso s kjikvadrattest hvis forvetet atall i alle celler >5. Agresti-Caffo kofidesitervall Wilcoxo s siged rak test på differasee McNemar s test Newcombes kofidesitervall for differase i suksessasylighet 9