Hypotesetestig, to utvalg (Kapitel 8) Medisisk statistikk 009 http://folk.tu.o/slyderse/medstat/medstati_h09.html To-utvalgstest (def 8.) vs ettutvalgstest: To-utvalgstest: Sammelike de uderliggede parameter for to forskjellige grupper, hvor verdiee i begge gruppee er ukjet. Ett-utvalgstest: Sammelike de uderliggede parameter i e gruppe med e kjet verdi (f.eks 0 eller et kjet befolkigsgjeomsitt) Eksempel 8. Er det e sammeheg mellom bruk av p- pille og blodtrykk? Flere studiedesig er mulige 3 Logitudiell studie (oppfølgigsstudie) - eq 8. Idetifiser e gruppe ikke-gravide kvier i fruktbar alder, som ikke bruker p-pille. Mål blodtrykk (baselie) Etter år: Idetifiser e studiegruppe som ikke har vært gravide i periode, og som å bruker p-pille. Mål blodtrykk i studiegruppe. Sammelike verdiee ved år og baselie 4 Tverrsittsstudie (cross-sectioal study) - eq 8. Idetifiser e gruppe som bruker, og e gruppe som ikke bruker, p-pille blat ikkegravide kvier i fruktbar alder Sammelike blodtrykk mellom de to gruppee Matchede par (Eks 8.6) Er det forskjellig fertilitet for p-pille brukere og pessar-brukere? Gruppe består av 0 p-pille brukere. For hver kvie i gruppe idetifiseres e pessar-bruker med samme alder (ie 5 år), rase, paritet, sosio-økoomisk status. Registrere tid til graviditet. 5 6
Parede versus uavhegige utvalg - forskjellig metode To utvalg er paret hvis hver observasjo i første utvalg er relatert til e bestemt observasjo i adre utvalg (f.eks logitudiell studie eller matchede par) To utvalg er uavhegige hvis observasjoee i første utvalg ikke er relatert til observasjoee i adre utvalg (f.eks tverrsittsstudie) Matchede par. Eksempel fra Box, Huter & Huter: Statistics for Experimeters d ed. (005) 7 8 Paret t-test eller kofidesitervall: For hvert par av observasjoer, reg ut differase d = x -x Forvetet differase er Δ =E(D) H 0 : Δ =0 mot H : Δ 0 (evt >0 eller <0) Gjeomfør e ett-utvalgs t-test eller bereg kofidesitervall for Δ basert på differasee d, d,, d Repetisjo: Hvis X, X,..., X er uavhegige N( μσ, ): X μ Da er Z = ~ N(0,). σ / Hvis σ er ukjet brukes S = ( Xi X) = Xi X i= i= X μ Da er T = ~ t S/ Z eller T brukes til å sette opp e hypotesetest eller kofidesitervall for μ. Hvis er stor så er T tilærmet N( μσ, ) 9 0 Eksempel 8.5 (Tabell 8.) =0, d = 4.80, s =0.85=4.566 Tosidig test, t=3.3 Fier 0.00 < p < 0.0 vha Tabell 5 i Appedix EXCEL: =TDIST(3,3;9;) gir verdie p=0.00894
95% kofidesitervall for Δ: d t s, α / / 9 0.975 4.8.6 4.566 / 0 = 4.80 3.7 t-test og kofidesitervall for to uavhegige utvalg observasjoer, atas uavh. N(μ, σ ) observasjoer, atas uavh. N(μ, σ ) H 0 : μ = μ mot H : μ μ Ekvivalet: H 0 : μ -μ =0 mot H : μ - μ 0 Atar foreløpig lik varias, σ = σ = σ dvs.53 til 8.07 (mmhg) 3 4 Estimator for μ μ: X X ( μ μ ) ~ 0, σ σ Altså: N ( ) Hvis σ σ σ σ σ X X ~ N μ μ, X X ( μ μ ) ~ 0, σ = = så er N ( ) Me σ er ukjet og estimeres ved pooled estimate of the variace : S = ( Xi X) ( Xi X ) i= i= = S S Vi bruker at X X ( μ μ) ~ t S 5 6 Eks 8.9 Cardiovascular Disease, Hypertesio Suppose a sample of eight 35- to 39-year-old opregat, premeopausal OC users who work i a compay are idetified who have mea systolic blood pressure of 3.86 mm Hg ad sample stadard deviatio of 5.34 mm Hg. A sample of twety-oe 35- to 39 year-old opregat, premeopausal o-oc users are similarly idetified who have mea systolic blood pressure of 7.44 mm Hg ad sample stadard deviatio of 8.3 mm Hg. What ca be said about the uderlyig mea differece i blood pressure betwee the two groups? Eks 8.0 lik varias =8, x =3.86, s =5.34 =, x =7.44, s =8.3 H 0: μ -μ =0 7 0 x x = 5.4, s = 5.34 8.3 = 307.8 = 7.53 7 7 5.4( 0) t = = 0.74 7.53 8 Frihetsgrader: 8-=7, forhast H 0 på 5% ivå hvis 0.74 >.05 P-verdi f.eks EXCEL TFORDELING(0,74;7;)=0.47 7 8 3
Eks 8. Lik varias 95% kofidesitervall Pr( t T t) = α, hvor t = t =.05 X X ( μ μ) t t S, α / 7 0.975 to uavhegige utvalg, ulik varias observasjoer, atas uavh. N(μ, σ ) observasjoer, atas uavh. N(μ, σ ) H 0 : μ = μ mot H : μ μ Ulik varias, σ σ løser mhp μ μ : 9.5 μ μ 0.36 9 0 To utvalg, σ σ : Vi bruker Satterthwaite s metode : Eks 8. (utvidet) Ulik varias X X ( μ μ) ~ t d ' S S tilærmet, t = x x = 0.8 s s hvor atall frihetsgrader d bereges ut fra,s,,s. ( S / S / ) d ' = ( S / ) /( ) ( S / ) /( ) d' = 5.04 ( d'' = 5) p verdi = 0.43 to uavhegige utvalg, test for ulik varias observasjoer, atas uavh. N(μ, σ ) observasjoer, atas uavh. N(μ, σ ) H 0 : σ = σ mot H : σ σ Ekvivalet: H 0 : σ /σ = mot H : σ /σ Forkast H 0 hvis S /S avviker mye fra Uder H 0 : S /S F -, - (Fisherfordelt med - og - frihetsgrader) SPSS bruker Levee s test i stede for Fisher s test 3 Eksempel 8.6 F = S /S = 8.3 /5.34 =.4 Forkast H 0 : σ /σ = på ivå α=0.05 hvis F > F 0,7,0.975 = 4.47 (FINV(0,05;0;7) i EXCEL) eller F< F 0,7,0.0.05 = 0.33 (FINV(0,975;0;7) i EXCEL) Alterativt: p-verdi = * 0.335 = 0.67 (FDIST(,4;0;7)) Koklusjo: Vi forkaster ikke H 0 4 4
Equatio 8.4 Nedre p-persetil i e F-fordelig med d og d frihetsgrader er de iverse av de øvre p-persetile i e F-fordelig med d og d frihetsgrader: F = / F d, d, p d, d, p Roser, Figure 8.0 Strategy for testig the equality of meas i two idepedet, ormally distributed samples Sigificat Perform F test for the equality of two variaces i Equatio 8.5 Not sigificat (Nyttig hvis tabelle bare iholder øvre persetiler) Perform t test assumig uequal variaces i Equatio 8. Perform t test assumig equal variaces i Equatio 8. 5 6 MEN: Navidi: Statistics for Egieers ad Scietists, 006, page 343-344: Do t Assume the Populatio Variaces are Equal Just Because the Sample Variaces are Close 7 the expressio assumig equal variaces requires that the populatio variaces be equal, or early so. I situatios where the sample variaces are early equal, it is temptig to assume that the populatio variaces are early equal as well. However, whe the sample sizes are small, the sample variaces are ot ecessarily good approximatios to the populatio variaces. Thus it is possible that the sample variaces be close eve whe the populatio variaces are fairly far apart. I geeral, populatio variaces should be assumed equal oly whe there is kowledge about the processes that produced the data that justifies this assumptio. 8 the expressio ot assumig equal variaces produces good results i almost all cases, whether the populatio variaces are equal or ot. (Exceptios ca occur whe the sample sizes are very differet.) Therefore, whe i doubt, use the expressio ot assumig equal variaces. Altså: t-test eller kofidesitervall for differase mellom forvetigsverdee i to uavhegige, ormalfordelte utvalg Du atar lik varias (eq 8.) ulik varias (eq 8.) Virkelig lik varias ulik varias korrekt gir feil svar tilærmet samme svar som ovefor korrekt 9 Altså: Velg t-test for ulik varias, eller e ikke-parametrisk metode, hvis du er i tvil! 30 5
Percet Percet Hvis data ikke er ormalfordelt: 30% Ma Kvie t-tester fugerer brukbart ved begreset variasjo i data t-tester er ubrukelige hvis mage sterkt avvikede verdier ( outliers ). Ikke-parametriske metoder er brukbare uasett. F-teste for sammelikig av varias er lite robust mot avvik fra ormalfordelige. 0% 0% 0% 5,00 0,00 5,00 30,00 35,00 5,00 0,00 5,00 30,00 35,00 bmi bmi Nær ormalfordelig - t-test er bra 3 3 50 Kvier 0-5 år Kvier 40-45 år 5% 40 0% 30 5% 0 0% 0 geder 5% Percet 0 - ot at all - a little 3 - partly 4 - very much female male -0,00-5,00 0,00 5,00 gsfer -0,00-5,00 0,00 5,00 gsfer do you feel depressed? Begreset variasjo i data. T-test er brukbar - eller bruk ikke-parametriske metoder 33 T-test er ubrukelig - beytt ikke-parametriske metoder 34 35 36 6
Kosetrasjo av serum IgM (g/l) hos 98 friske bar, 6 md - 6 år gamle (Altma, 99) 37 38 39 7