Eves varasaalyse (Oe-way ANOVA, fxed effects model) (Notat tl Kap. Roser) V reaptulerer først t-teste for to uavhegge utvalg. Stuasjoe var at v hadde to grupper, f.es. G og G og et sett uavhegge og dets ormalfordelte observasjoer fra begge. Observasjoer fra G : Observasjoer fra G : j N (, σ ), j=,,..., j N (, σ ), j=,,..., Estmatoree for forvetgee er heholdsvs ˆ = j = og ˆ = j =. j= j= Oppgave er å å teste hypotese H 0 : = mot H :. Forutsatt at varase er de samme begge grupper, får v uder H 0 testobservatore ˆ ˆ T = s / + / der s er estmert felles stadardavv, og v foraster H 0 dersom T > t +, α / I tlfelle H 0 forastes, er olusjoe ete at > eller at <. Hvle at de to alteratvee er bestemt av størrelse på de tlhørede estmatee ˆ og ˆ. V eder således opp med e etydg olusjo. Nå teer v oss at v har flere e to grupper der v sal sammele forvetgee. Dette blr på sett og vs e geeralserg av to-utvalgsteste ovefor. Ata at v har uavhegge grupper, hver med uavhegge og ormalfordelte observasjoer med varas σ, =,,..., og j=,,. V får da: Observasjoer fra G : Observasjoer fra G :... Observasjoer fra G : j j j N(, σ ), j=,,..., j j N(, σ ), j=,,..., N(, σ ), j=,,..., j V sal å teste H 0 : = =...=. Alteratvet tl H 0 rommer e ree mulgheter. Dersom =3, a v f.es. ha at ete er alle forvetgee forsjellge, eller så er to le og de tredje forsjellg fra de to. Geerelt a H formuleres som H : ' for mst ett j
par,. V sal m.a.o. teste mot H 0 : = =... = : ', ' for mst ett par ' H,. Dersom resultatet av teste er forastg av H 0, blr det este å fe ut hva avvet fra H 0 består av. Dette sal v omme tlbae tl seere. V har følgede modell: = + α + e j j j er j-te observasjo gruppe er forvetge tl alle j -ee samlet sett, "grad mea". α er avvet -te gruppes forvetg fra "grad mea". V har mao at hver eelt observasjo består av e ostat, et gruppespesft tllegg (eller fradrag) α og et stoasts tllegg (fradrag) e j. V forutsetter at e j -ee er ormalfordelte med forvetg ull og fra å av samme ujete varasσ, sl at e N(0, σ ) for alle og j j Dessute forutsettes at alle e j -ee er uavhegge. Modelle gr at E ( j ) = = + α. Dette medfører at H 0 : = =... = er evvalet med H 0 : α = α =... = α = 0. Alteratvee blr H : 0 α for mst é. V deferer oe otasjoer tl seere bru: j j= = = = j= = j j, dvs gjeomsttet av alle observasjoee gruppe, dvs summe av alle observasjoee N =, dvs atall observasjoer totalt.. = N, dvs gjeomsttet av alle observasjoee Dersom = for alle (lt atall alle grupper), har v balasert desg, oe som bør tlstrebes ford det gr optmaltet testg. For å largjøre otasjoe samler v alle observasjoee e tabell:
Gruppe Gruppe Gruppe Mer otasjoe. For esempel vl 34 bety observasjo r. 4 gruppe 3, osv. Det a vses at ˆ = er e forvetgsrett estmator for = + α og at σ Var( ˆ )=. Varase σ a prspp estmeres separat e hver gruppe, me det er mer effetvt å estmere de ut fra samtlge data, oe v sal omme tlbae tl. Som regresjosaalyse betrater v å vadratsummer basert på varasjo dataee. De totale vadratsumme er et uttry for dataes (resposvarabeles) varasjo rudt det store gjeomsttet. De del av Total SSsom forlares av modelle, uttryes ved de eelte gruppers varasjo rudt det store gjeomsttet uttryt ved vadratsumme Det som å gjestår av de totale varasjoe, er de som syldes varasjoe e de eelte grupper, oe som v tlsrver de tlfeldge avv og som seere daer grulag for estmerg av varase σ. Kvadratsummee dette represeterer, uttryes som Wth SS = ( ) Total SS = ( ) = j= Betwee SS = ( ) = j= = j j Det a vses at Total SS=Betwee SS + Wth SS V ser at jo mer ett eller flere av gruppegjeomsttee avver fra det totale gjeomstt, desto større blr adele av modellforlart varasjo forhold tl total varasjo, oe som treer retg av at ullhypotese må forastes. Me for å ue ta e formell beslutg, må v ostruere e testobservator med jet fordelg år H 0 gjelder. Som regresjosaalyse samler v resultatee e ANOVA-tabell: 3
Klde tl varasjo Kvadratsum (SS) df SS MS = df F p Betwee (grupper mellom) Wth (e grupper, resdual) Total Betwee SS = ( ) = Wth SS = ( ) = j= Total SS = ( ) = j= j j - N- N- Betwee SS Betwee MS = Wth SS Wth MS = N F = 0 Betwee MS Wth MS Det a vses at Wth MS er e osstet estmator for σ, varase tl støyleddee og dermed tl. E av forutsetge ANOVA-modelle var at varase var l alle grupper. De fleste programpaer har test for dette. Uder H 0 har v at Betwee MS F0 = F(, N ) Wth MS dvs F-fordelt med (-, N-) frhetsgrader. Dersom observert F0 > F, N, α, forastes H 0, og v oluderer at mst ett par, er forsjellge, eller evvalet, mst é α 0. Noe utover det a v foreløpg e uttale oss om. Etter ANOVA ANOVA-alulasjoee tester ullhypotese at alle observasjoee fra alle gruppee stammer fra fordelger med samme forvetg. Å teste dee hypotese alee er sjelde formålet med e stude. Heste er som regel å vurdere gruppee seg mellom, for esempel å sammele grupper parvs eller gruppesammesetg mot e ae gruppesammesetg. Multple sammelger er e fellesbetegelse for dette. Dersom F-teste ovefor e gr sgfat resultat, er sae avgjort: De observerte data gr e gru tl å hevde at gruppeforvetgee er forsjellge, og v stopper der. Slår dermot teste sgfat ut, må v gå vdere og fe ut hva avvet fra H 0 består. Me her fs ge automat. Ata at v har 5 grupper beteget A, B, C, D og F. Prspelt a v tee oss 4 stuasjoer:. Alle mulge sammelger, også gjeomstt eller evt. vede gjeomstt av grupper. For esempel a det være teressat å sammele gjeomsttet av gruppe A og B mot gjeomsttet av gruppe C, D og E. Eller sammele A mot gjeomsttet av B, C og D osv. Tl dette formålet e Scheffé s test de rette.. Alle mulge parvse sammelger. Har v g grupper, utgjør dette alt 4
gg ( )/ eelttester. Tl dette formålet beyttes Tuey eller Newma-Keuls test. 3. Alle mot é otroll. Dersom gruppe A er otroll, sal det testes mot gruppe B, C, D, E og F. Her beytter Duett s test. 4. Bare oe få sammelger bestemt på forhåd ut fra vtesapelge rterer. For esempel gruppe A mot B og C, og det et alt. He beyttes Boferro s test. Multple sammelger betyr at det utføres flere sammelger samtdg sl som alle 4 stuasjoer ovefor. Post hoc- test brues stuasjoer der ma etter å ha studert de atuelle data avgjør hvle tester som sal utføres. Ma treger e å plalegge på forhåd. Stuasjo ovefor er åpebart post hoc-testg. Stuasjo og 3 rever at det gjøres oe beslutger basert på orete problemstllger. Hvs ma for esempel sammeler alle par av grupper, har ma mplstt besluttet e å utføre alle de geerelle sammelger evt put. I stuasjo 3 har ma besluttet e å sammele alle grupper seg mellom, bare å sammele mot é otroll. Ford brue av dsse testee rever beslutger foretatt før dataee observeres, er stuasjo og 3 stregt tatt e post hoc-tester. Plalagte sammelger forutsetter at ma osetrerer seg om et fåtall vtesapelg baserte problemstllger. Det er e tllatt å la dataee tale for seg og på det grulag velge ut hva som sal sammeles. Hva som sal testes, må være bestemt på forhåd som ledd desg av e stude eller et espermet vd forstad. Stuasjo 4 er et typs esempel på dette. Termologe ovefor er e alltd brut osstet. Tester for multple sammelger brues ofte syoymt med post hoc-tester. Stregt tatt utgjør sstevte tester e udergruppe av multple sammelger og beyttes de tlfeller der ma etter å ha observert dataee bestemmer seg for hvle sammelger som sal gjøres. I sle tfeller stlles det høyere rav tl testvået for e å begå fel av Type I. Alle multple sammelgstester er forsjellge fra ordære t-tester. Selv ved sammelg av to og to grupper, der e stadard toutvalgs t-test vlle være ærlggede, bruer teste et varasestmat basert på data fra alle gruppee, også fra de gruppee som e er drete volverte hypotese. Ata at v har g grupper og sal teste H 0 : = mot H 0 :. V har da at og V foraster H 0 dersom σ N(, ) σ N( ', ) ( ) > t Wth MS / + / N g, α / 5
Mer at varaseσ estmeres med Wth MS fra ANOVA-tabelle. Dette gr flere frhetsgrader og derved et pressere estmat e u å brue dataee fra de to gruppee v sammeler. Det gr mdre sgfassasylghet (lavere p-verd) og større teststyre. Geerelt gjelder det statst at e bør tlstrebe å brue mest mulg tlgjegelg formasjo. I esemplet ovefor er det beyttet formasjo fra grupper som selv e er atuelle for sammelg, me som bdrar med formasjo om varase. Det adre aspetet ved multple sammelger er forsøet på å opprettholde sgfasvået for hele famle av sammelger sarere e vået tl de eelte sammelgstest. Det betyr at dersom alle gruppee vrelghete hadde de samme forvetgsverd, er sasylghete α for at e hvle som helst eller flere av sammelgee vlle få e statsts sgfat olusjo ved re tlfeldghet. For å oppå dette må metodee for multple sammelger beytte e mer strt defsjo av sgfas. E eel orresjo for sle multple t-tester er å stramme vået for de eelte t-test tl α / m, der α er vået F-teste og m er atall parsammelger. Dette alles Boferro-orresjo. Metode er mdlertd oservatv de forstad at det mage tlfeller stlles uødg strege rav tl vået tl de eelte test. Eelte statstere abefaler e å orrgere for multple sammelger år ma bare utfører et fåtall, opptl g-, plalagte sammelger. Begruelse er at ma sal få e slags bous som beløg for å ha plalagt e målrettet stude. Argumetet er dette: Ata at det på forhåd plalegges tre sammelger ett og samme espermet. Alteratvet er å utføre tre separate espermeter. I så tlfelle tregte ma e å justere for multple sammelger, me hvorfor gjøre det dersom ma plala på forhåd og utførte sammelgee som del av ett og samme espermet desget tl det bestemte formålet? Adre statstere meer at ma alltd sal justere for multple sammelger. Ettersom sae er otroversell, er det ødvedg at ma besrver s problemstllg og metode detaljert. Harald Johse, februar 008 6
7