Enves varansanalyse (One-way ANOVA, fxed effects model Reaptulerng av t-testen for uavhengge utvalg fra to grupper, G og G : Observasjoner fra G : Y N(, σ j, j=,,...,n Observasjoner fra G : Y N(, σ, j=,,...,n j Estmatorene for forventnngene: ˆ = n Y = j Y og n j= n ˆ = n Y = Y j j= Tester hypotesen H 0: = mot H 0:. Forutsatt at varansen er den samme begge grupper, fås under H 0 testobservatoren ˆ ˆ T = t s / n + / n Dvs. t-fordelt med n +n - frhetsgrader. s er estmert felles standardavv. H 0 forastes dersom T > tn n α +, / ( n + n I tlfelle H 0 forastes, er onlusjonen enten > eller <, avhengg av størrelsen på de tlhørende estmatene ˆ og ˆ. Altså entydg onlusjon. Flere enn to grupper En generalserng av to-utvalgstesten ovenfor. Anta uavhengge utvalg fra grupper, G G, hvert med n uavhengge og normalfordelte observasjoner med onstant varans σ, og =,,...,. Observasjoner fra G : Y j N(, σ, j=,,...,n Observasjoner fra G : Y j N(, σ, j=,,...,n... Observasjoner fra G : Y N(, σ, j=,,...,n j Tester H 0: = =...=. Alternatvet tl H 0 rommer en ree mulgheter. Dersom f.es. =3, an alle forventnngene være forsjellge, eller så er to le og den tredje forsjellg fra de to. Generelt uttryt er testen: ' H :, ' mot H 0: = =... = for mnst ett par, '. I tlfelle forastnng av H 0, blr det neste å fnne ut hva avvet fra H 0 består av. Dette sal v omme tlbae tl senere. Enves ANOVA, modell V har følgende modell: Y = + e = + α + e j Y j er j-te observasjon gruppe er forventnngen gruppe er forventnngen tl alle Y j -ene samlet sett, "grand mean". α er avvet -te gruppes forventnng fra "grand mean". Hver enelt observasjon består av en onstant, et gruppespesft tllegg (eller fradrag α og et stoasts tllegg (fradrag e. e-ene antas normalfordelte og uavhengge med forventnng null og varans σ. Dette medfører E Y α H H0 : α = α =... = α = 0 Alternatvene blr H : α 0 for mnst én. ( j = = + og at 0 : = =... = er evvalent med Notasjoner, gjennomsntt og vadratsummer n Y = j n Y, gjennomsnttet av alle observasjonene gruppe j= N = n, totalt antall observasjoner = n Y = N Yj, gjennomsnttet av alle observasjonene = j= n ( Yj Y, Total Sums of Squares, (Total SS SS Tot = j= n ( Yj Y = j= n ( Y Y = ny ( Y = j= =, Wthn Sums of Squares, (Wthn SS SS Wthn SS E, Between Sums of Squares, (Between SS SS Between Det an vses at Total SS=Wthn SS + Between SS 3 4
Varabltet B 5 6 ANOVA-tabellen F-test av forventnngene Klde tl varasjon Kvadratsum (SS df SS F p MS = df Under H 0 : = =... = har v at Between (grupper mellom n = j= ( Y Y - Between MS = Between SS 0 F = Between MS Wthn MS F0 = Between MS F(, N Wthn MS Wthn (nnen grupper, resdual Total n = j= n = j= ( Y Y j ( Y Y j N- N- Wthn MS = Wthn SS N Det an vses at Wthn MS er en onsstent estmator for σ (varansen tl støyleddene og dermed tl Y. En av forutsetnngen ANOVA-modellen var at varansen var l alle grupper. De fleste programpaer har test for dette. 7 dvs F-fordelt med (-, N- frhetsgrader. Jo større Between MS er forhold tl Wthn MS, desto større blr F. Dersom observert 0 F0 > F, N, α, forastes H 0, og v onluderer at mnst ett par (, ' er forventnngene forsjellge, eller evvalent mnst én α 0. Noe utover det an v foreløpg e uttale oss om. F-testen er m.a.o. global den forstand at den e ser noe om hva en eventuell ulhet mellom forventnngene består. 8
9 0 Esempel Summary statstcs Teste ut 3 ule tlsetnnger (hemmere en jems prosess der utbyttet er Y. Prmært spørsmål: Har noen av hemmerne effet på utbyttet? Seundært spørsmål: I tlfelle effet, hvlen, evt. hvle hemmere har effet, og hvlen har størst effet? Desgn: Balansert desgn, 4 serer á 0 prøver. Én sere uten hemmer (Sere, de 3 andre serer (Sere,3,4 med hver sn type hemmer. Dette er et planlagt forsø der v har ontroll over espermentelle betngelser. Mer at allerede før nnsamlng av dataene har v en plan for hvordan de første omgang sal analyseres! Utbytte,00,00 3,00 4,00 Total N Mean Std. Devaton Std. Error 95% Confdence Interval for Mean Lower Upper Mnmu m Maxmu m 0 5,9000 3,0737,975 3,709 8,097 9,00 9,00 0 9,6000,9546,93333 7,4887,73 6,00 5,00 0,000 3,48967,0353 9,7036 4,6964 7,00 8,00 0 0,0000,9439,93095 7,8940,060 6,00 5,00 40,950 3,9486,6057 0,6698 3,80 6,00 9,00
Box-plott Søyledgram 30,00 30,00 7,50 Utbytte 5,00,50 3 Mean Utbytte 0,00 0,00 0,00 6 7,50 Utlggere?,00,00 3,00 4,00 0,00,00,00 Error bars: +/- SD 3,00 4,00 3 4 ANOVA-tabell Source Between Groups Wthn Groups Total Test for homogen varans Sum of Squares df Mean Square F Sg. 49,875 3 83,9 8,545,000 350,900 36 9,747 600,775 39 Levene Statstc df df Sg.,509 3 36,679 Dependent Varable: Utbytte Mean 95% Confdence Interval (I (J Dfference (I-J Std. Error Sg. Upper Lower LSD,00,00 6,30000(*,3963,000 3,4683 9,37 3,00 3,70000(*,3963,0,8683 6,537 4,00 5,90000(*,3963,000 3,0683 8,737,00,00-6,30000(*,3963,000-9,37-3,4683 3,00 -,60000,3963,07-5,437,37 4,00 -,40000,3963,776-3,37,437 3,00,00-3,70000(*,3963,0-6,537 -,8683,00,60000,3963,07 -,37 5,437 4,00,0000,3963,4 -,637 5,037 4,00,00-5,90000(*,3963,000-8,737-3,0683,00,40000,3963,776 -,437 3,37 3,00 -,0000,3963,4-5,037,637 Dunnett t (-,00,00-6,30000(*,3963,000-9,737 -,8763 sded 3,00,00-3,70000(*,3963,03-7,37 -,763 4,00,00-5,90000(*,3963,000-9,337 -,4763 Mer: SD( = MS Wthn( / n + / n = 9. 747( / 0 + / 0 =. 3963 5 6
Foreløpge onlusjoner Alle tre hemmere har statsts sgnfant effet og 4 er leverdge og ser ut tl å ha større effet enn hemmer 3, men er denne forsjellen statsts sgnfant? Undersøer med en mer onservatv test Ie-planlagte sammenlnnger Multple Comparsons Dependent Varable: Utbytte Tuey HSD Mean Dfference 95% Confdence Interval Lower (I (J (I-J Std. Error Sg. Upper,00,00 6,30000(*,3963,000,5396 0,0604 3,00 3,70000,3963,055 -,0604 7,4604 4,00 5,90000(*,3963,00,396 9,6604,00,00-6,30000(*,3963,000-0,0604 -,5396 3,00 -,60000,3963,6-6,3604,604 4,00 -,40000,3963,99-4,604 3,3604 3,00,00-3,70000,3963,055-7,4604,0604,00,60000,3963,6 -,604 6,3604 4,00,0000,3963,405 -,5604 5,9604 4,00,00-5,90000(*,3963,00-9,6604 -,396,00,40000,3963,99-3,3604 4,604 3,00 -,0000,3963,405-5,9604,5604 * The mean dfference s sgnfcant at the.05 level. 7 8 Homogeneous Subsets Testng ved hjelp av ontrast Tuey HSD Subset for alpha =.05 N,00 0 9,6000 4,00 0 0,0000 3,00 0,000,000 + 4 H 0 : 3 = Contrast Coeffcents Contrast,00,00 3,00 4,00 0,5 -,5,00 0 5,9000 Sg.,6,055 Means for groups n homogeneous subsets are dsplayed. a Uses Harmonc Mean Sample Sze = 0,000. Grupper som opptrer samme undergruppe (subset er e sgnfant forsellge. Contrast Tests Utbytte Assume equal varances Does not assume equal varances Contrast Value of Contrast Std. Error t df Sg. (- taled -,4000,097 -,985 36 0,055 -,4000,8539 -,867 5,576 0,08 9 0
Endelg onlusjon Kan e onludere entydg om gruppe 3 versus og 4. Den lgger en gråsone mellom det å høre tl ontrollgruppen og det å høre tl de to gruppene som med god margn er forsjellge fra ontrollgruppen. Velger enten hemmer fra gruppe eller hemmer fra gruppe 4.