MOT310 Statistiske metoder 1, høsten 2011 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 30. oktober, 2011 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 15 -tabell Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 2 / 15
Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely Randomized Design 13.13 Potential Misconceptions... (13.4 13.12 er ikke med i pensum.) Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 3 / 15 Enveis variansanalyse -tabell En-veis variansanalyse: undersøker eventuell effekt av én faktor. sammenligner flere (>2) grupper (undersøker om forventningene er ulike i gruppene) Eksempel: Bremselengde; fire ulike dekktyper. Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 4 / 15
Enveis variansanalyse, modell -tabell gruppe 1 2 k y 11 y 21 y k1.. y 1n1 y 2n2 y knk gj.sn. y 1 y 2 y k y. Her er: y i = 1 ni n i j=1 y ij, y = 1 k N i=1 (og N = n 1 + + n k ) ni j=1 y ij Modell: Y ij N(μ i,σ 2 ), og alle Y ij uavhengige. Eller: Y ij = μ i + ɛ ij, der ɛ ij N(0,σ 2 )... antakelsene er...? Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 5 / 15 Enveis variansanalyse, modell reformulert -tabell Modell: Y ij = μ i + ɛ ij, der ɛ ij N(0,σ 2 ) Antar at ɛ ij ene 1) er uavhengige, 2) er normalfordelte og 3) har samme varians (og null forventing). Modellen kan også skrives: Y ij = μ + α i + ɛ ij, der μ = 1 k k i=1 μ i er et felles nivå og α i er gruppe nr i sitt eventuelle avvik fra dette nivået. Hypotesen: H 0 : μ 1 = μ 2 = = μ k mot H 1 : minst én μ i ulik de andre er da ekvivalent med Hypotesen: H 0 : α 1 = α 2 = = α k =0mot H 1 : minst én α i ulik null Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 6 / 15
Hypotesetest -tabell Aktuell hypotese: H 0 : μ 1 = μ 2 = = μ k mot H 1 : minst én μ i ulik de andre Dersom variasjonen mellom y 1, y 2,...,y k er stor, indikerer dette at H 1 er riktig. k Mål på denne variasjonen ( mellom gruppene ): n i (y i y ) 2 Denne variasjonen bør sees i forhold til tilfeldig variasjon målt ved variasjonen innen gruppene ; hvor mye y i1,y i2,...,y ini varierer. i=1 Mål på denne ( innen gruppene ): k n i (y ij y i ) 2. i=1 j=1 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 7 / 15 Hypotesetest -tabell Utskrift fra EXCEL (dekkdata): Vi har videre: Totalt gjennomsnitt: y =25.92, og SUMMARY Groups Count Sum Average Variance dekk 1 5 127,8 25,56 2,713 dekk 2 5 136,9 27,38 1,592 dekk 3 5 125,6 25,12 1,257 dekk 4 5 128,1 25,62 1,947 SSA ( mellom gruppene, A for Average): k n i (y i y ) 2 =5(25.56 25.92) 2 + +5(25.62 25.92) 2 =14.956 i=1 SSE ( innen gruppene ): n k i (y ij y i ) 2 = =30.036 i=1 j=1 Hvordan sammenligne SSA og SSE?? Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 8 / 15
Inferens -tabell Dataene, y ij ene, betraktes som utfall av: Y ij = μ i + ɛ ij Definer: ni SST = k i=1 j=1 (Y ij Y ) 2, total variasjon SSE = k ni i=1 j=1 (Y ij Y i ) 2, tilf. variasjon innen grupper og SSA = k i=1 n i(y i Y ) 2, variasjon mellom grupper. Vi kan vise at (Theorem 13.1): SST = SSE + SSA Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 9 / 15 Inferens -tabell Vi har at: SSE σ 2 χ 2 N k Under H 0 : α 1 = = α k =0, gjelder: ( ) SSE og derfor at E = σ 2 N k (uansett H 0 eller ei) ( ) SSA Theorem 13.2 (s. 515): E = σ 2 + N k 1 k 1 k i=1 SSA σ 2 α 2 i χ 2 k 1 Derfor er det naturlig å forkaste H 0 dersom SSA/ (k 1) SSE / (N k) blir stor. (Størrelsen er F (k 1,N k)-fordelt under H 0.) Se også s. 36 i tabellheftet; Q 0 =SSE og Q 1 =SSA, osv.... Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 10 / 15
Inferens -tabell Forkast H 0 dersom: F = Dekkdataene: SSA / σ (k 1) 2 SSE / = σ (N k) 2 Utfall av F : 14.956/(4 1) 30.036/(20 4) =2.6557 <f 0.05,3,16 =3.24 Dvs. Behold H 0 det er ikke grunnlag for å hevde at det er forskjell mellom dekktypene. SSA / (k 1) SSE / (N k) = MSA MSE f α,k 1,N k Kommentar: det kan se ut som om type 2 er dårligere enn de andre. Men det er litt for få data til å fastslå dette (signifikant). Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 11 / 15 -tabell -tabell -tabell, struktur: Kilde SK fg GK F p-verdi Source SS df MS F p-value Faktor (mellom grupper) SSA k 1 Tilfeldig (innen grupper) SSE N k Total SST N 1 SSA k 1 SSE N k MSA MSE P (F >f obs ) -tabell, for dekkdataene: Source of Variation SS df MS F P-value F crit Between Groups 14,956 3 4,9853 2,6557 0,0837 3,2389 Within Groups 30,036 16 1,8773 Total 44,992 19 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 12 / 15
Sjekk av -tabell Modellantakelsene sjekkes vha. å studere egenskapene til residualene (tilsvarende det vi gjør i regresjonsanalyse). plott rådata (y ij ene) for hver grupppe plott residualene, e ij = y ij y i Skal være utfall av uavhnegige N(0,σ 2 )-variabler histogram, også ev. gruppevis (normalitet) normalplott (normalitet) prikkdiagram gruppevis (lik varians) Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 13 / 15 Kp. 13: Enveis variansanalyse -tabell Alternativ modellformulering (jf. kp. 14): Y ij = μ + α i + ɛ ij, der ɛ ij N(0,σ 2 ),ogα 1 + α 2 + + α k =0 Tilsvarende hypoteser: H 0 : α 1 = α 2 = = α k =0mot H 1 : minst én α i 0 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 14 / 15
Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely Randomized Design 13.13 Potential Misconceptions... (13.4 13.12 er ikke med i pensum.) Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 15 / 15