1 Referanser: Ie-parametrise metoder KLMED 8001 Aalen, O. O. et al: Statistise metoder i medisin og helsefag. Gyldendal aademis, 005. Rosner, B.: Fundamentals of biostatistics 7the ed. Broos/Cole, 010. Altman, D. G.: Practical statistics for medical research. Chapman & Hall / CRC, 1991. 0 november 014 Stian Lydersen Om du ønser, an du sette inn navn, tittel på foredraget, o.l. her. Parametrise vs ie-parametrise metoder Parametrise metoder: Forutsetter bestemt paramteris sannsynlighetsfordeling, f.es normalfordelingen Ie-parametrise metoder Få eller ingen forutsetninger om fordelingen Kunne alles fordelings-uavhengige metoder Forutsetter også uavhengige observasjoner! Valg av parametris vs ie-parametris metode baseres ie på størrelsen på utvalget! Lydersen (ARD 014) og referanser i denne Om du ønser, an du sette inn navn, tittel på foredraget, o.l. her. 4 Ie-parametrise metoder Et utvalg eller to parede utvalg: Tegntesten (The Sign Test) Wilcoxon s signed ran test To uavhengige utvalg Wilcoxon s rangsum-test (også alt Wilcoxon-Mann- Whitney s test eller Mann-Whitney s U-test) Tre eller flere uavhengige utvalg: Ie-ordnede utvalg (tilsv. enveis ANOVA): Krusall-Wallis test Ordnede utvalg: Joncheere-Terpstra s test Tilsvarende toveis ANOVA: Friedman s test Korrelasjon: Spearman s rho Kendall s tau 5 6 Tegntesten (The sign test) Tabell 8.5 i Aalen et al Statistise metoder i medisin og helsefag 006 Agressivitetsscore for tvillingpar Tvillingpar Førstefødt Sistefødt Differense 1 88 86 71 77-6 77 76 1 4 68 64 4 5 91 96-5 6 7 7 0 7 77 65 1 8 91 90 1 9 70 65 5 10 80 71 9 11 88 81 7 1 89 7 17 1
7 8 H 0: Det er ingen forsjell i forventet score mellom første- og sistefødte tvilling H 1: Det er forsjell i forventet score mellom første- og sistefødte tvilling Tegntesten: Tell opp antall positive differanser C (her c obs = 9) blant de n som er forsjellig fra 0 (her n=11) Under nullhypotesen er C binomis fordelt (n, ½) Forast nullhypotesen hvis C avvier mye fra n/. Her er C>n/ så (Rosner eqn 9.) n n 11 1 p verdi P( C 9) (0.069.0054.0005) 0.0656 c obs Es 9.7, Rosner Gir salve A eller salve B best besyttelse mot sola? Hver forøsperson får en salve på hver arm (randomisert) Tre mulig utfall: 1) Arm A mindre rød enn arm B ) Arm B mindre rød enn arm A ) Begge lie røde 9 10 Resultat: 45 personer, st A best, 18 st B best, 5 st begge lie bra. c obs=18, n=40 Binomis fordeling: p-verdi = *P(C18) = 0.66 Wilcoxon s test for pardata (Wilcoxon s signed ran test) = Wilcoxon s ettutvalgstest Rosner bruer normalfordelingstilnærming (hvorfor?) p-verdi 0.65 11 1 9. Wilcoxon s test for pardata (Wilcoxon s signed ran test) = Wilcoxon s ettutvalgstest For forsøsenhet nr i (f.es pasient): x i (f.es grad av rødhet ved salve A) y i (f.es grad av rødhet ved salve B) d i = x i y i Se bort fra de d i som er li 0 Ranger de øvrige etter øende absoluttverdi (avstand fra 0) La R 1 være rangsum for positive d i er. Tabell 8.6 i Aalen et al Tvillingpar i Førstefødt x i Sistefødt y i Differanse d i Rang r i 1 88 86 71 77-6 7 77 76 1 1,5 4 68 64 4 4 5 91 96-5 5,5 6 7 7 0 7 77 65 1 10 8 91 90 1 1,5 9 70 65 5 5,5 10 80 71 9 9 11 88 81 7 8 1 89 7 17 11 R 1 = +1,5+4+10+1,5+5,5+9+9+11=5,5
1 14 n observasjoner (forsjellig fra 0) Summen av alle rangene er 1++ +n= n(n+1)/ Under nullhypotesen: E(R 1 ) = n(n+1)/4 Forast nullhypotesen hvis R 1 avvier mye fra n(n+1)/4 R 1 er tilnærmet normalfordelt (Rosner: Hvis n 16) Hvis ingen sammenfallende observasjoner ( ties ): SD( R ) n( n 1)(n 1) / 4 1 Hvis t i sammenfallende i gruppe nr i: g ( 1) ( 1)( 1)/ 4 ( i i) / 48 i1 SD R n n n t t Alternativ formel: n 1 SD( R1 ) rj j1 Hvor r j er rangen til observasjon nr j, summer over alle observasjonene. 15 16 Esempel Aalen et al: Rosner Table 9.1 E(R 1) = 11(11+1)/4= SD R ( 1) 11(11 1)( 11 1) / 4 [( ) ( )]/ 48 16.5 0.5 11.4 T R E( R ) 5.5 1.84 SD( R ) 11.4 1 1 1 P-verdi=P(Z>1.84)=0.068 17 18 Rosner Fig. 9.4 (revidert) Rosner Fig. 9.4
19 0 Es 9.1 R 1 = 10(7.5) + 6(19.5) + (8.0) = 48 E(R 1) = 40(41)/4 = 410 Var(R 1) = 40(41)(81)/4 [(14-14) + (10-10) + (7-7) + (1-1) + ( -) + ( -) + ( -) + (1-1)]/48 = 555 409/48 = 555 85.5 = 5449.75 Alternativt: Var(R 1) = [14(75) + 10(19.5) + 7(8.8) + + (.5) + (5.5) + (8.0) + 40.0 ]/4 = 5449.75 48 410 T.19 5449.7 Oppsummering es 9.8 og 9.1: Tegntesten: p=0.66 Wilcoxon-testen: p=0.09 Wilcoxon er sterere enn tegntesten, men rever at data er symmetris fordelt under nullhypotesen. Mer: Rosner bruer ontinuitetsorressjonen -1/ i tellerne. Er omdisutert. 1 9.4. Wilcoxon s toutvalgstest (Wilcoxon s Ran-Sum test) = Wilcoxon-Mann-Whithey s test Fra Aalen et al 006. Prøver fra 4 flaser Coca- Cola og 8 flaser Tab. Koffeininnhold i mg/l 4 Wilcoxons toutvalgstest Hypotese: Rosner: H 0 Median 1 = Median H 1 Median 1 Median Mer generelt: H 0 De to fordelingene er lie H 1 Observasjonene fra den ene fordelingen tenderer til å være større 4
5 6 To grupper med n 1 og n observasjoner Ranger alle observasjonene fra minste til største R 1 = rangsum i Gruppe 1. Under H 0: n1 ( n1 n 1) E( R1 ) Hvis ingen sammenfallende observasjoner: n1n SD( R1 ) ( n1 n 1) Hvis sammenfallende observasjoner g ti ( ti 1) n1n i 1 1 1 ( n1 n)( n1 n 1) SD( R ) n n 1 7 8 Esempel offein i Coca-cola versus Tab; Rosner Table 9. R 1 = 1++4+6.5 = 1.5 4(4 8 1) E( R1 ) 6 48 SD( R1 ) (4 8 1) 5.87 1.5 6 T.1 5.87 Tosidig p-verdi=0.0 9 0 Krusall-Wallis test Sammenlining mellom grupper: = > Normalfordelte data To-utvalgs t-test 1) enveis ANOVA 1) Ie normalfordelt Wilcoxon-Mann- Whitney s test Krusall-Wallis test 1) Alternativt multippel lineær regresjon med indiatorvariable for gruppene. Kan også brues ved justering for ovariater (f.es alder, jønn). 0 5
1 Table 1.17 (1.16 in 5 th ed): Ocular anti.inflammatory effects of 4 drugs on lid closure Rabbit Indomethicin Aspirin Piroxicam BW775C no Score Score Score Score 1 + +1 + +1 + + +1 0 + +1 + 0 4 + + +1 0 5 + + + 0 6 0 + + -1 Table 1.18 (1.17 in 5th ed). Assigment of rans Lid-closure score Frequency Range of rans Average ran -1 1 1 1.0 0 5 6 4.0 1 5 7 11 9.0 4 1 15 1.5 9 16 4 0.0 Note: There are 6x4 = 4 rabbits! 1 4 Table 1.17 (1.16 in 5 th ed): Ocular anti.inflammatory effects of 4 drugs on lid closure Rabbit Indomethicin Aspirin Piroxicam BW775C no Score Ran Score Ran Score Ran Score Ran 1 + 1.5 +1 9.0 + 0.0 +1 9.0 + 0.0 + 0.0 +1 9.0 0 4.0 + 0.0 +1 9.0 + 1.5 0 4.0 4 + 0.0 + 1.5 +1 9.0 0 4.0 5 + 0.0 + 1.5 + 0.0 0 4.0 6 0 4.0 + 0.0 + 0.0-1 1.0 Krusall-Wallis test: grupper, gruppe nr i har n i observasjoner og rangsum R i. N n. i1 * 1 1 Ri i i i N( N 1) i1 N( N 1) i1 ni H n [ R / n ( N 1) / ] ( N 1) H 1 H E( Ri / ni ) under H0 * g ( t j t j ) j1 N N Lettere å regne ut i hvor t j er antall sammenfallende observasjoner i lynge nr j er tilnærmet 1 under H 0. 4 5 6 SPSS: Nonparametric tests -> Rans independent DRUG samples N Mean Ran LIDSCORE Indomechitin 6 16,5 Aspirin 6 14,17 Piroxicam 6 15,5 BW755C 6 4, Total 4 Test Statistics a,b Chi-Square df Asymp. Sig. Exact Sig. Point Probability a. Krusal Wallis Test LIDSCORE 11,804,008,00,000 b. Grouping Variable: DRUG 5 1.7. Multiple sammenlininger (Dunn prosedyren) Regn ut z Ri R N( N 1) 1 1 1 ni n j j * Forast H 0 hvis z z * 1 hvor ( 1) Mer at dette tilsvarer Bonferroni orresjon 6 6
7 Es. (Forts) LIDSCORE Rans DRUG Indomechitin Aspirin Piroxicam BW755C Total N Mean Ran 6 16,5 6 14,17 6 15,5 6 4, 4 z1 = 0.51, z1 = 0.4, z14 =.9, z = -0.7, z4 =.41, z4 =.67 * 0.05 0.004, z1-0.004 =.64 4(4 1) 8 Friedman s to-veis ANOVA (Altman, 1..5) Krever ie normalfordeling n subjeter og grupper. Én observasjon per celle (subjet og gruppe). Få eller ingen sammenfallende observasjoner. H 0 (H 1 ) : Det er ie (er) forsjell på gruppene Altså: Gruppe 1 og 4 er forsjellige Gruppe og 4 er forsjellige 7 8 9 40 Table 1.9 Immersion suit leaage (g) during simulated helicopter underwater escape (Light et al., 1987) From Altman (1991) Suit type Subject A B C D 1 08 1 454 64 10 56 0 8 18 14 96 0 4 68 4 64 90 5 166 8 14 4 6 96 458 6 7 198 50 00 90 8 8 74 16 4 Mean 198 8 0 45.7 SD 10 17 179 1.6 Table 1.10. Rans of the data in Table 1.9. From Altman (1991) Suit type Subject A B C D 1 4 1 4 1 4 1 4 4 1 5 4 1 6 4 1 7 4 1 8 4 1 Total (R) 4 7 19 10 Mean ran.00.8.8 1.5 9 40 41 4 Friedman s test: Friedman s test i SPSS: 1 1 H R n R n n( 1) ( 1) [ i ( 1) / ] ( 1) i i1 n i1 er tilnærmet 1 under H 0. (R i er rangsum i gruppe i) E( Ri ) under H0 Lettere å regne ut Et case pr subjet, en variabel pr gruppe Analyse -> Nonparametric tests -> related samples Opsjonen Exact gir p-verdien esat ( Exact Sig. ) i tillegg til ji-vadratfordeligens tilnærming ( Asymp. Sig ) Esempel: 1 H [4 7 19 10 ] 85 1.45 8 45 p-verdi P( 4 1 1.45) = 0.006 41 4 7
4 44 Friedman Test Rans A B C D Mean Ran,00,8,8 1,5 Test Statistics a N Chi-Square df Asymp. Sig. Exact Sig. Point Probability a. Friedman Test 8 1,450,006,00,000 4 Hvile grupper er forsjellige? Friedman s test forteller om minst to grupper er forsjellige. (I esempelet har D åpenbart lavere verdier) Par av grupper an sammenlines vha Wiloxons test for matchede par. Juster for multiple sammenlininger. Friedman s test for grupper tilsvarer tegn-testen! 44 45 Rang-orrelasjon, Spearman s r s 46 Pearson s r (=0.966) beregnes for par av originaldata (x,y) Observasjonene ordnes i stigende reefølge Regn ut Pearson s orrelasjonsoeffisient for rangene (i) Transformasjon : x x i ordnes ( i) Spearman s rho (=0.700): Glem originaldata og beregn Pearson s r for rangparene (i,j) 47 48 Pearson s r = 0.819 (mindre enn før) Ie-parametris orrelasjonsoeffisient Spearman s rho = 0.700 (som før) Kan være å foretree når: Sammenhengen er ie-lineær Data er ordinale (valitative) Ved avvi fra normalfordelingen(?) Alternativer: Spearman s rho Kendall s tau Liten forsjell på dem, men ansje en viss preferanse for Kendall's tau. 8
49 50 "Our results suggest that Kendall's tau, has many advantages over Pearson's and Spearman's r; when applied to psychiatric data, tau, maintained adequate control of type I errors, was nearly as powerful as Pearson's r, provided much tighter confidence intervals and had a clear interpretation. Arndt S, Turvey C, Andreasen NC: Correlating and predicting psychiatric symptom ratings: Spearman's r versus Kendall's tau correlation. JOURNAL OF PSYCHIATRIC RESEARCH Volume: Issue: Pages: 97-104, 1999 Denne, derimot, sriver at begge er ganse bra: Kraemer HC: Correlation coefficients in medical research: from product moment correlation to the odds ratio. STATISTICAL METHODS IN MEDICAL RESEARCH Volume: 15 Issue: 6 Pages: 55-545, 006 51 Ie-parametrise tester Basert på reefølgen (rangordingen) av data, ie de fatise verdiene Få forutsetninger om fordelingen(e). Wilcoxons test for pardata (ettutvalgstest) forutsetter at d-ene er symmetris fordelt under H0. Tåler estreme verdier / avvi fra normalfordelingen Hvis data virelig er normalfordelt: Ved store utvalg er Wilcoxon-testene nesten lie stere som t-testene. Ved små utvalg: Betydelig svaere enn parametrise tester. Ulempe: Gir bare p-verdi, ie estimat og onfidensintervall for effet! 9