STAT111 Statstkk Metoder ushu.l@ub.o Forelesg 14 + 15 Eves ANOVA 1. troduksjo a. Z-, t- test Uka 1: tester for forvetgsdfferase to populasjoer (grupper) b. ANOVA (aalyss of varace): tester om det er forskjeller mellom forvetgee flere e to populasjoer (grupper), speselt år gruppee er utsatt tl oe behadlger (treatmets). begge tlfeller, sammelger v gjeomstt av stkkprøver fra hver populasjo. Sasylghete for at det er sgfkate forskjeller mellom populasjosforvetger øker år forskjeller mellom gjeomsttee av stkkprøver øker. Ata at v har uavhegge grupper fra populasjoer og forvetge tl de te populasjoe er, 1,,...,. Hver gruppe har observasjoer fra uavhegge og ormalfordelte S. V. med samme varas. V skal å teste H : 1... H : det er forskjell på mst ett par av s Dersom H forkastes, blr det este å fe ut hva avvket fra H består av (uka 13, Multple sammelkger) La j betege de j te S.V. de te gruppe ( y j er tlsvarede observasjo) 1,,..., ; j 1,,...,. Da har v: te gruppe gjeomstt j1 j : gjeomstt av S.V. gruppe, =1,,, Totall gjeomstt j 1 j1 1 : gjeomstt av alle S.V Hvs H er sa, da har v E1j E j... Ej ; j 1,,..., og observerte gruppe gjeomsttee y1, y,..., y vl ærmer hveradre. V ka derfor sammelge varasjoer mellom dsse gjeomsttee (betwee-group varato) med varasjoer e hver gruppe (wth-group varato), og gjeomføre vdere aalyse. Varasjoer dataee ka måles ved bruk av kvadratsummer.
STAT111 Statstkk Metoder ushu.l@ub.o. ANOVA tabell og F test.1) ANOVA tabell ANOVA er e type av varas aalyse eller varasjo aalyse. Resultatet av e varas aalyse oppsummeres ANOVA tabell (Tabelle 11. på boke) *Treatmets betyder populasjoer eller grupper a. Kvadratsummee (sum of squares) (1) SSTr = ( ) (treatmet sum of squares): kvadratsum mellom grupper, 1 de måler varasjoer mellom gruppe gjeomsttee (betwee-group varato) Z1... Z (*V ka teke på å sette Z, da blr Z, og ( ) ( Z Z ) 1 1 ) () SSE = ( j ) (error sum of squares): kvadratsum e grupper, de 1 j1 måler varasjoe e grupper (wth-group varato). () V har allerede at: hvs X 1, X, X 3, N(, ). X ( ) 1 1 X X X 1..., da er X er uavhegge stokastske varabler fra X X X X 1... (sample mea) og 1 S X X (sample varace) uavhegge. Dessute ( 1) S / ( 1) Eks 1. Bevs a) b) hvs H er sa SSTr/ ( 1) uasett om H er sa eller fel SSE/ ( ( 1))
STAT111 Statstkk Metoder ushu.l@ub.o V har å at: SSTr c) E(SSTr/ ) 1 E( ) 1 d) SSE E(SSE/ ) ( -1) E( ) ( 1) hvs H er sa uasett om H er sa eller fel (3) SST = 1 j1 ( ) j : total kvadratsum, alla dataes varasjo rudt det store gjeomsttet. V bruker SST for å måle de totale varasjoe dataee Eks. Bevs SST = SSTr + SSE og hvs H er sa SST/ ( 1) V har å at: SST E(SST/ ) 1 E( ) 1 hvs H er sa b. Frhetsgrader df (degree of freedom) Tallet v dvderer kvadratsummee med for å få varasestmatee kalles frhetsgrader dfg = -1: frhetsgrader mellom grupper, atall grupper mus 1 dfe = (-1): frhetsgrader tl e grupper, atall observasjoer totalt mus atall grupper dft = 1: totalt atall frhetsgrader, atall observasjoer totalt mus 1 V ka se med egag at dft = dfg + dfe c. Mea square for treatmets (MSTr) og Mea square for error () MSTr = SSTr 1 : e forvetgsrett estmator for, hvs H er sa (fra a, c)). Samme som SSTr, måler MSTr varasjo mellom grupper = SSE ( 1) : e forvetgsrett estmator for, uasett om H er sa eller fel (fra a, d)). Samme som SSE, måler varasjo e gruppe d. Varasjos rato f f = MSTr : varasjo mellom grupper / varasjo e gruppe
STAT111 Statstkk Metoder ushu.l@ub.o Fra c, har v at hvs H er sa, 1. E() Eks 3. Bevs hvs H kke er sa Ht: V har allerede j1 j, j 1 j1 1 1 V har også: SSTr ( ) ( ) 1 1 ( ) ( ) 1 1 1 La 1 ( ) ( ) ( ) 1 1 1 1, Eks 3. betyr også at hvs MSTr/ er stor, er det stor varasjo mellom gruppee, og v forkaster H : jo mer ett eller flere av gruppegjeomsttee j1 j avvker 1 fra det totale gjeomstt, desto større blr adele av behadlgers (treatmets) varasjo forhold tl totalvarasjo, oe som atyder på at H må forkastes.. F test Fra Uka 6, har v at hvs U ( m), V ( ) og U, V er uavhegge. Da er varabele U / m F V / Fsher-fordelt med m og frhetsgrader: F F ( m, ). Eks 4. Bevs F = MSTr F( 1, ( 1)) hvs H er sa Hvs H er sa, har v 1 og vl F-verd ærme 1. E()
STAT111 Statstkk Metoder ushu.l@ub.o Hvs H er fel, vl varasjo mellom gruppee være stor forhold tl de varasjoe e gruppe, og F-verde blr større e 1. Hvs F-verde er større e krtsk verd (gtt et sgfkasvå og frhetsgrader), vl e forkaste H, og kokluderer at mst ett par av s er forskjellge Eks 5. De følgede data kommer fra et ekspermet som sammelger grade av tlsmussg (Degree of Solg) for stoff kopolymersert med tre forskjellge bladger (Mxture) av metakrylsyre. Test om de grade av tlsmussger er detsk for de tre bladger, ved sgfkasvå.1. *Abefalt hjemlesg: pp. 56 Testg for the assumpto of equal varaces 3. Mer om eves ANOVA 3.1) Fast effekt modell (fxed effects model) seksjoee 1 og, er j S.V. og Ej 1,,..., ; j 1,,...,. V ka faktsk omskrve j som j j, j N(, ), j s uavhegge med hveradre: La 1, j j, j N(, ) og 1, da bl test: 1 H 1 :... H : mst ett av, 1,,..., V ka betrakte som «felles forvetg» tl alle gruppee, og er avvket te gruppes forvetg fra. Hvs et eller flere er betydelg større e, skal H forkastes. Eks 6. Bevs 1 1
STAT111 Statstkk Metoder ushu.l@ub.o 3.) Tlfeldg effekt modell (radom effect model) Seksjo 3.1) betrakter som determstsk avvk te gruppes forvetg fra. mage tlfeller, ka det skje at de gruppee teste er tlfeldge valgt fra N grupper og N er betydelg større e, med er «felles forvetg» tl alle N gruppee. dsse tlfellee, ka ka å omskrve j som betraktes være tlfeldg og v betege de som j j, j (, ) A, A N, 1,,..., ; j 1,,...,, j s og Og å H : 1... blr A s uavhegge med hveradre varabltet avvkee mellom ulke grupper. Eks 7. Bevs 1 A : A A N. V (, A) H, som betyr at det fes ge Både Eks 6. og Eks 7. vser at hvs H er sa, har v 1 og vl F= E() MSTr MSTr ærme 1, ellers vl F= samme F - teste seksjo. sgfkat større e 1. V ka bruke de 3.3) Eves ANOVA med forskjellg utvalgsstørrelser V atar å at v har uavhegge grupper fra behadlger, og forvetge tl de te gruppe er, 1,,...,. De te gruppe har observasjoer fra uavhegge og ormalfordelte S.V. med samme varas, 1... ANOVA dee sammehege. 3.4) Flere kommetarer tl ANOVA: a. Som valg, foretrekker v flere observasjoer test, for å øke stykke teste b. ANOVA er fleksbelt tl ær-ormal fordelger, me hvs dataee er tydelg skjevfordelte, eller det er stor forskjell på varaser mellom gruppee, skal v prøve å ugå ANOVA. (V ka bruke kke-parametrsk metoder seere forelesgee).
STAT111 Statstkk Metoder ushu.l@ub.o c. Når =, ANOVA F test og terpolert t-test (pooled t-test) er samme. Me v foretrekker t test (ot pooled) år v kke ka skker på varaser begge gruppe er samme. tllegg, t test har flere alteratve hypoteser, H :, H :, H : `, mes ANOVA F test har bare e alteratv 1 1 1 hypotese: H : 1 *Abefalt hjemlesg: pp. 574 for the F test