Medisisk statistikk, termi IC av Stia Lyderse, professor i medisisk statistikk Regioalt kuskapsseter for bar og uge - Psykisk helse og barever (RKBU Midt-Norge Forelesig 7 jauar 03 Oppdatert 7 jauar 03 Lærigsmål statistikk (3 og 7 jauar 03 8..5 redegjøre for følgede begreper iefor beskrivede statistikk: gjeomsitt (mea, media, percetiler, stadardavvik (SD, stadardfeil (SEM, frekvestabell og krysstabell, og tolke hva disse forklarer om ekle eksempeldatasett 8..6 redegjøre for hva som fremstilles i graftypee histogram, stolpediagram, Box-plott og spredigsplott. 8..7 redegjøre for begrepee kofidesitervall, ullhypotese, p-verdi, teststyrke, type I og type II-feil. 8..8 redegjøre for ormalfordelig og biomisk fordelig, og velge eget metode mellom uparet og paret T-test, uparet og paret ikke-paramterisk test, kjikvadrat-test, og tilhørede kofidesitervaller. 3 4 Ihold: Eksempel - postoperativ kvalme Behadlig * Kvalmeklasse Krysstabell Deskriptiv statistikk Ekel sasylighetsregig Radomiserte kotrollerte studier: Radomiserig Populasjo og tilfeldige ldi utvalg Statistisk iferes: Hypotesetestig og kofidesitervaller Behadlig Total Nei Ja Atall Atall Atall Kvalme lite eller ige betydelig Total 8 30 60,0 40,0 00,0 4 5 9 8,8 7, 00,0 4 7 59 7, 8,8 00,0 Risikoreduksjo i dette utvalget: 8,8-60,0 =,8 Hva ka vi si om effekt av behadlig i e populasjo av aktuelle pasieter? 5 6 4. Sasylighetsfordelig (for tellevariabler Stokastisk forsøk: Vet ikke utfallet på forhåd. Me vet megde mulige utfall på forhåd. Stokastisk variabel (tilfeldig variabel Tallstørrelse kyttet til utfallet. Vet ikke verdie på de før forsøket er utført. Sasylighetsfordelig: Sasylighetee for de mulige verdiee.
7 8 Forvetige til X Forvetigsverdie (expectatio, expected value, mea E( X xp( X x alle xi tygdepuktet i i Variase til X Var X x E X P X x ( ( i ( ( i alle xi xi P( X xi ( E( X alle xi Stadardavviket til X (Stadard deviatio SD( X Var( X Lettest ved hådregig 9 De store talls lov: Når atall observasjoer vokser (mot uedelig, vil: A / P(A x E( X s Var( X 0 Biomisk forsøksrekke. Defiisjo: De ekelte forsøk er uavhegige av hveradre I hvert forsøk registreres hvorvidt hedelse A itreffer eller ikke Sasylighete for A, p=p(a, er de samme i hvert forsøk. Biomisk forsøksrekke - eksempler Barefødsler: Kjø på etterfølgede ekeltfødsler ved et sykehus Terigkast. P(sekser=/6. Behadlig av e bestemt t sykdom: Pasiete blir frisk. Biomisk fordelig: X suksesser blat forsøk, P(suksess=p i hvert forsøk: X bi(, p x PX ( x p( p x E( X p x Var ( X p( p
3 4 Eksempel: X=atall gutter blat 4 ekeltfødsler: p=0.53 EX ( 40.53.05 4 PX 4 ( 0.53 ( 0.53 0.374 Atall gutter blat 4 uavhegige fødsler 5 6 Radomiserte kotrollerte studier (Radomized cotrolled trials RCT Radomiserte kotrollerte studier Sammelike to (eller flere behadliger A og B Trekke tilfeldig (radomisere om pasiete skal ha behadlig A eller B. Datamaskibasert. Forseglede kovolutter ikke abefalt. Dobbelt blidt forsøk: Verke pasiet eller behadler vet hvilke behadlig pasiete får. 7 8 Radomiserig Bør være tilfeldig og uforutsigbar Alterativer Ekel radomiserig i Blokkradomiserig Stratifisert radomiserig Miimerig Ekel radomiserig Trekk med samme sasylighet (valigvis ½ hver gag Eksempel, 30 pasieter: BBABBABBBBBBABAAABABBABBAABBBA Fordeler: Ekelt og fullstedig uforutsigbart Ulempe(r? 3
9 0 Blokkradomiserig Radomiser halvparte av pasietee i hver blokk til behadlig A Eksempel med blokkstørrelse b=4, 30 pasieter BAAB BABA BABA BBAA ABAB AABB BAAB BA Fordel: Omtret like mage i hver behadligsgruppe Ulempe(r? Stratifisert radomiserig Strata ka f.eks være kliikk (i e multiseterstudie, kjø, alder over 75 år. Blokkradomiserig ie hvert stratum Eksempel: 30 pasieter. setre og kjø gir 4 strata Seter, me: BAAB BABA Seter, kvier: AA Seter, me: BBAA ABAB AABB BAAB BA Seter, kvier: AA Statifiser i få strata (om oe, bare meget viktige progostiske faktorer. Tommelfigerregel: Ugå flere strata e /(4b Miimerig Miimizatio Mulig å balasere flere faktorer e ved stratifisertig Blad ad Altma: Treatmet allocatio by miimisatio, BMJ 005. Brukes i økede grad i små studier Populasjo og tilfeldige utvalg Statistisk modell og utvalg 3 4 Statistisk iferes SAMPLE The last 300 low-birthweight babies bor i these three materity uits Represetativt(? Tilfeldig(? I oe studier er målpopulasjoe og studiepopulasjoe de samme (ideelt Figur fra Bowers(008 4
5 6 Populasjo Tilfeldig Utvalg Statistisk iferes Populasjo Utvalg Tilfeldig (stokastisk variabel Observasjoer x,..., x X Forvetigsverdi E( X Gjeomsitt x Varias (Utvalgsvarias, empirisk varias s Stadardavvik (Utvalgsstadardavvik, empirisk stadardavvik s Sasylighetsfordelig: F.eks Normalfordelig: X N(, Biomisk fordelig X bi(, p 7 8 Statistisk iferes (bekreftede statistikk Eksempel - postoperativ kvalme Behadlig * Kvalmeklasse Krysstabell Trekke slutiger om (e eller flere parameter(e i e populasjo basert på aalyse av et tilfeldig utvalg: Estimat Kofidesitervall Hypotesetestig / P-verdi Behadlig Total Nei Ja Atall Atall Atall Kvalme lite eller ige betydelig Total 8 30 60,0 40,0 00,0 4 5 9 8,8 7, 00,0 4 7 59 7, 8,8 00,0 Differase i suksessasylighet i dette utvalget: 8,8-60,0 =,8 Hva ka vi si om effekt av behadlig i e populasjo av aktuelle pasieter? 9 30 Estimert sasylighet for suksess: kotrollgruppe: pˆ 8 / 30 60 behadligsgruppe: pˆ 4 / 9 83 Hvis vi behadler 00 pasieter vil vi forvete hhv 00x60=60 og 00x83=83 suksesser. Forvetet differase: 83-60=3 NNT - Number eeded to treat (=NNTB Number eeded to beefit The umber of patiets that a physicia would have to treat with a ew treatmet i order to avoid oe evet that would otherwise have occurred with a stadard treatmet. (Simo Day: Dictioary for cliical trials, d editio, Wiley, 007 5
3 3 NNT bereges som delt på differase mellom sasylighetee i de to gruppee: NNT 4.4 pˆ pˆ 0.83 0.60 Hvis vi behadler 4.4 pasieter vil vi forvete hhv 4.4x60 =.6 suksesser 4.4x83 = 3.6 suksesser Forvetet differase 3.6.6 = Hypotesetestig Sett opp ullhypotese og alterativ hypotese. Eksempel: H 0 : Sasylighete for suksess er lik i gruppee H : Sasylighete for suksess er forskjellig 33 34 Hypotesetestig: Sahete Nullhypotese: H 0: p = p Alterativ hypotese H : p p (tosidig eller H : p < p (esidig Esidige alterativ hypoteser brukes este aldri i medisisk forskig. Beslu utig Aksepter H 0 Forkast H 0 (påstå H H 0 H OK P( Type I feil H 0 = P( Type II feil H = P( OK H =- =testes styrke(fuksjo 35 36 P(Type I feil = P(Forkaste H 0 H 0 = kalles testes sigifikasivå P(Type II feil = P(Akseptere H 0 H = P(Forkaste H 0 H =- kalles testes styrke (power Varierede otasjo: Noe lærebøker bruker for styrke og (- for P(Type II feil Hypotesetestig og p-verdi P-verdie (sigifikassasylighet, sig. er sasylighete for å få de observerte verdier eller oe mer ekstremt, gitt at H 0 er sa. P-verdie er ikke sasylighete for at H 0 er sa! Forkast H 0 hvis p-verdi Dette garaterer P(Type I feil 6
37 38 Kryssede iteresser: Øsker lav og lav. MEN: Desto lavere, desto lavere teststyrke (høy I praksis: Sett til et lavt tall, valigvis 0.05 eller 0.0. H 0 og H er ikke likeverdige. Hvis vi er i tvil, aksepteres H 0. I rettsveseet: H 0 : Tiltalte er uskyldig H : Tiltalte er skyldig 39 40 Kofidesitervall: Et mål på usikkerhet i estimatet Et ( kofidesitervall ( l, h for e parameter (for eksempel p p har egeskape P ( l h ( kalles kofideskoeffisiete. Valigvis er ( 0.95 4 Hva betyr et ( kofidesitervall? Hvis det bereges 95 kofidesitervall for mage forsøk, vil i det lage løp 95 av itervallee dekke de sae verdie Det er IKKE 95 sasylighet for at kofidesitervallet dekker de sae verdie Sammeheg mellom kofidesitervall og hypotesetest: Hvis ( kofidesitervallet for ieholder 0, vil vi ikke forkaste H0 : 0 på sigifikasivå 4 Fra Vacouver-retigslijee : Statistics Whe possible, quatify fidigs ad preset them with appropriate idicators of measuremet error or ucertaity (such as cofidece itervals. Avoid relyig solely o statistical hypothesis testig, such as the use of P values, which fails to covey importat iformatio about effect size. (Geerelt: Kofidesitervallet består av de verdier 0 som ikke ville blitt forkastet ved hypotesetestig på ivå ICMJE Iteratioal Committe of Medical Joural Editors http://www.icmje.org/#prepare, jauar 03 7
43 44 Kaasbøll J, Lyderse S, Idredavik M: (Pai, 0 Psychological symptoms i childre of parets with chroic pai the HUNT study Results adjusted for age Parets with chroic pai Number of Risk for coduct problems: Odds ratio (OR childre estimate Cof. it. P-value Noe 80 (ref. Oly mother 89.30.0 to.67 0.036 Oly father 6 0.99 0.74 to.3 0.93 Both parets 7.36 0.96 to.93 0.087 Behadlig Total Eksempel - postoperativ kvalme Behadlig * Kvalmeklasse Krysstabell Nei Ja Atall Atall Atall Kvalme lite eller ige betydelig Total 8 30 60,0 40,0 00,0 4 5 9 8,8 7, 00,0 4 7 59 7, 8,8 00,0 Pearso s kjikvadrattest, tosidig alterativ: p-verdi = 0.054 45 46 To grupper av størrelse og. Observerer X bi(, p og X bi(, p H 0: p =p (eller p -p =0 mot H : p p. Estimatorer for p og p : pˆ X og p ˆ X Forkaster H 0 hvis pˆ ˆ p avviker mye fra 0. pˆ pˆ Uder H 0 er z tilærmet stadard ormalfordelt. Var( pˆ pˆ pga uavh. Var( pˆ pˆ Var( pˆ ( Var( pˆ Uder H p 0 ( p p( p p( p Dermed fås z pˆ pˆ pˆ( pˆ X X hvor pˆ 47 48 Geerelt: pˆ pˆ ( p p z er tilærmet stadard ormalfordelt. Var( pˆ pˆ p ( p p ( p pga uavh. Var( pˆ pˆ Var( pˆ ( Var( pˆ Dermed fås Så Pr( z z z / / pˆ pˆ ( p p Pr( z z pˆ ˆ ˆ ˆ ( p p( p / / z pˆ pˆ ( p ˆ ˆ p p p ( p p p ( p p ( p pˆ ( pˆ pˆ ( pˆ Løser de mhp p pog får et tilærmet - kofidesitervall for p p 8
49 50 Tilærmet - kofidesitervall for p p (Wald itervallet pˆ pˆ z pˆ ( pˆ pˆ ( pˆ / Tilærmige er OK bare hvis og er store Agresti & Caffo (000 kofidesitervall for p -p : Bereg estimert risikodifferase som før: X X pˆ pˆ Legg til i hver celle i x tabelle før du bereger valig asymptotisk kofidesitervall: X X X X p, p Bedre tilærmet kofidesitervall: p p z p ( p p ( p / 5 5 Agresti & Caffo (000 itervallet: Lett å berege Legg til 4 observasjoer ( suksess og fiasko i hver av gruppee og bereg Wald itervallet som om dette var observasjoee Gode egeskaper (dekigsgrad Abefalt i yere iførigsbøker i statistikk Eksempel: Postoperativ kvalme x x 4 8 pˆ pˆ 0.876 0.6000 0.76 9 30 p x x 4 9 p x x 8 30 0.8064 0.5938 53 54 95 Agresti-Caffo kofidesitervall: p p z p ( p p ( p 0.05/ 0.76.96 0.8064( 0.8064 0.6( 0.6 ( 0.007,0.43 3 3 (95 Wald kofidesitervall: (0.005, 0.45 Er kofidesitervallet kosistet med hypoteseteste (p=0.054? Eksempel: Atall dager i sykehus. Behadlig A: 6, 5, 37,, 3, 0, 7,, 3, 38 x 3.90, s 36.4, media = 9 A A Behadlig B 4, 3, 5,, 6,, 03, 65, 40, 5, 3, 49, 43 x 76.54, s 75.86, media = 40 B A Hva ka vi si om forskjell mellom A og B i populasjoe? 9
55 56 Studet s t-test og kofidesitervall for to uavhegige utvalg. Estimator for : XX ~ N, observasjoer, atas uavh. N(, observasjoer, atas uavh. N(, H 0 : = mot H : Ekvivalet: H 0 : - =0 mot H : - 0 Atar foreløpig lik varias, = = Ikke brukbar ved observasjoer som avviker mye mer fra gjeomsittet e forvetet I ormalfodelige. X X ( ~ 0, Altså: N Hvis X X ( ~ 0, så er N 55 56 57 58 Me er ukjet og estimeres ved pooled estimate of the variace : Atall dager forutsatt (tilærmet ormalfordelt S ( Xi X ( Xi X i i S S Vi bruker at XX ( ~ t S 57 59 60 Atall dager er ikke ormalfordelt. Logaritme til atall dager er tilærmet ormalfordelt 0
6 6 Logaritme (l til atall dager Tolkig: l( MediaA l( MediaB 0.7789 MediaA l 0.7789 MediaB MediaA e 0.7789 0.459 MediaB.5353 0,05 95 kofidesitervall: ( e, e (0.5,0.978 63 64 Ikke-parametriske metoder: Forutsetter ige parametrisk fordelig: Basert på ragordige av observasjoee, glemmer origialdata Behadlig A sortert: 0,, 3, 5, 7,, 6, 37, 38, 3 Rag:,, 4, 5.5, 7, 8, 0.5, 4, 5, 0 Gjeomsittsrag: 8.7 Behadlig B sortert:, 5,, 6, 3, 3, 40, 49, 65, 5, 4, 03, 43 Rag: 3, 5.5, 9, 0.5,.5,.5, 6, 7, 8, 9,,, 3 Gjeomsittsrag: 4.54 Example: EORTC Quality of life questioaire Cout do you feel depressed? * performace Crosstabulatio do you feel depressed? d? Total : ot at all : a little 3: partly 4: very much performace who 0- who -4 Total 05 7 3 63 49 49 7 76 0 8 8 437 548 Wilcoxo-Ma-Whitey s test for to uavhegige utvalg: P=0.04 65 66 Eksempel - EORTC data Er du Performace status deprimert? who 0- who -4 Gjeomsitt.73.4 Stadardavvik 0.83 0.87 media Observert differase:.4.73 = 0.4 Er det forskjell på forvetet depresjos-skåre mellom de to gruppee? Studet s T-test: 95 KI (0.3, 0.59, p-verdi < 0.00 Wilcoxo-Ma-Whitey (Ikke-parametrisk test: p-verdi < 0.00
67 68 Matchede par. Eksempel fra Box, Huter & Huter: Statistics for Experimeters d ed. (005 Metodee vi har sett på, forutsetter uavhegige observasjoer i gruppee. Hva med matchede par? 68 69 Matchede par - eksempler fra medisisk forskig: Overkrysigsstudier Kotralateral desig 70 Matchede par: Skalavariable: Reg ut differase for hvert idivid. Bruk e ettutvalgsmetode for å teste om forvetet differase er 0: Studet s ettutvalgs t-test Ekvivalet: paired samples t-test programvare reger ut differasee. eller Wilcoxo s siged rak ikkeparamertrisk test Ekvivalet: Related samples Dikotome variable (to mulige utfall: McNemar s test 7 7 Studet t t-test eller ikke-parametrisk metode? Oppsummerig - valg av metode: Hvis data er ormalfordelt: Ikke-parametriske metoder har tilærmet (dvs este like høy teststyrke som t-teste i middels store og store datasett Ikke-paramteriske metoder er vesetlig svakere e t-teste i små datasett. Hvis data ikke er ormalfordelt: T-teste OK hvis ikke ekstreme observasjoer Bruke t-teste på trasformerte data? Bruk e ikke-parametrisk test Type variabel To uavhegige utvalg Matchede par Normalfordelt (evt etter trasformasjo, eller data ute ekstreme Studet s toutvalgs t-test: Ata lik varias eller ikke ata lik varias Studet s ettutvalgstest på differasee Ekvivalet: Paret t-test observasjoer Vilkårlig fordelt skalavariabel eller (Wilcoxo- Ma- Whitey s test Wilcoxo s siged rak test på differasee ordial variabel Dikotom (to mulige utfall Pearso s kjikvadrattest hvis forvetet atall i alle celler >5. Agresti-Caffo kofidesitervall McNemar s test Studet s t-test: Ka også berege tilhørede kofidesitervall.