MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) Modell: Oppgave 4. (4.4:) Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i er effekt av temperatur, β j er effekt av ovn, (αβ) ij er samspillseffekten og ε ijk er feilleddet (tilfeldig variasjon). 3 i= α i = 0, 4 j= β j = 0, 3 i= (αβ) ij = 0, 4j= (αβ) ij = 0. Variansanalysetabell (ANOVA): Kilde SS df MS F p verdi Temperatur SSA a SSA/(a ) MSA/MSE P (F f obs ) Ovn SSB b SSB/(b ) MSB/MSE P (F f obs ) Samspill SS(AB) (a )(b ) SS(AB)/(a )(b ) MS(AB)/MSE P (F f obs ) Feil SSE ab(n ) SSE/ab(n ) = S Total SST abn SST = a i= bj= nk= (Y ijk Ȳ ), SSA = bn a i= (Ȳi Ȳ ), SSB = an b j= (Ȳ j Ȳ ), SS(AB) = n a i= bj= (Ȳij Ȳi Ȳ j + Ȳ ), og SSE = a i= bj= nk= (Y ijk Ȳij ), og SST = SSA + SSB + SS(AB) + SSE. a) H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hvert temperaturnivå er store i forhold til den tilfeldige feilen, mer presist dersom: SSA/(a ) SSE/ab(n ) = MSA MSE f α,a,ab(n ) = f 0.05,, = 3.89 Fra datautskriften ser vi at f obs = 8.3, dvs vi forkaster H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.0059<0.05. Temperatur har betydning for levetiden til komponenten. b) H 0 : β = β = β 3 = β 4 = 0 mot H : minst en β i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hver ovn er store i forhold til den tilfeldige feilen, mer presist dersom: SSB/(b ) SSE/ab(n ) = MSB MSE f α,b,ab(n ) = f 0.05,3, = 3.49 Fra datautskriften ser vi at f obs = 5.79, dvs vi forkaster H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.059<0.05. Ovn har betydning for levetiden til komponenten.
MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) c) H 0 : (αβ) = = (αβ) 34 = 0 mot H : minst en 0 Vi forkaster H 0 dersom kvadratsummen for samspill er stor i forhold til den tilfeldige feilen, mer presist dersom: SS(AB)/(a )(b ) SSE/ab(n ) = MS(AB) MSE f α,(a )(b ),ab(n ) = f 0.05,6, = 3.00 Fra datautskriften ser vi at f obs =.63, dvs vi forkaster ikke H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.>0.05. Det er ingen samspillseffekt. Kommentar: Vi burde strengt tatt sjekket ev. samspill før vi gjorde testet for hovedeffektene! Oppgave 4. (4.4:) Samme type modell og oppsett som i forrige oppgave. Responsen er nå vitamin C innhold og faktorene er merke og lagringstid. Vi har a = b = 3 og n = 4. a) H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hvert merke er store i forhold til den tilfeldige feilen, mer presist dersom: SSA/(a ) SSE/ab(n ) = MSA MSE f α,a,ab(n ) = f 0.05,,7 = 3.35 Fra datautskriften ser vi at f obs =.736, dvs vi forkaster ikke H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.95>0.05. Merke har ikke betydning for vitamin C innholdet. b) H 0 : β = β = β 3 = 0 mot H : minst en β i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hver lagringstid er store i forhold til den tilfeldige feilen, mer presist dersom: SSB/(b ) SSE/ab(n ) = MSB MSE f α,b,ab(n ) = f 0.05,,7 = 3.35 Fra datautskriften ser vi at f obs =.043, dvs vi forkaster H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.0008<0.05. Lagringstid har betydning for vitamin C innholdet. c) H 0 : (αβ) = = (αβ) 33 = 0 mot H : minst en 0 Vi forkaster H 0 dersom kvadratsummen for samspill er stor i forhold til den tilfeldige feilen, mer presist dersom:
MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 3) SS(AB)/(a )(b ) SSE/ab(n ) = MS(AB) MSE f α,(a )(b ),ab(n ) = f 0.05,4,7 =.73 Fra datautskriften ser vi at f obs = 0.459, dvs vi forkaster ikke H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.765>0.05. Det er ingen samspillseffekt. Kommentar: Vi burde strengt tatt sjekket ev. samspill før vi gjorde testet for hovedeffektene! Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon). Alternativt: Y ij = µ + α i + ε ij, der ε ij uavh. N(0, σ ) der µ er gjennomsnittlig forventa kopperinnhold, α i er effekten av legering i, 4 i= α i = 0 og ε ij er feilleddet (tilfeldig variasjon). Residual: e ij = y ij ȳ i. Fra det første plottet av residualene får vi en sjekk av om variansen er lik i alle grupper (alle legeringer). Det ser ut til å være oppfylt her da residualene ser ut til å ha lik spredning i alle tilfellene. Fra det andre plottet av residualene får vi en sjekk av antagelsen om normalfordeling. Denne antagelsen ser også ut til å være oppfylt da residualene ligger noenlunde langs en rett linje. b) Fra plottet kan det se ut som at legering og 4 tenderer til å ha noe lavere kopperinnhold enn legering og 3. Kilde SS df M S F Legering 0.0773 3 0.0059077 6.58 Feil 0.08853 0.0008978 Total 0.036576 4 H 0 : µ = µ = µ 3 = µ 4 mot H : minst en ulik Vi forkaster H 0 dersom F f 0.05,3, = 3.07. Dvs med de observerte dataene forkaster vi H 0 på 5% nivå. Forventet kopperinnhold er ulikt ved de ulike legeringene. c) Vi antar at Y,..., Y n er N(µ, σ )-fordelte og at Y,..., Y n er N(µ, σ )-fordelte og at alle observasjoner er uavhengige. Hva vi velger å anta om variansen avgjør hvordan vi går frem videre. De finnes tre muligheter (det er tilstrekkelig å gjøre oppgaven på en av de tre måtene).
MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 4) ) Antar at σ = σ = σ (lik varians): Konfidensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) = Ȳ Ȳ (µ µ ) = σ + σ Ȳ Ȳ (µ µ ) σ N(0, ) Her er σ ukjente, estimeres ved Spooled = ( )S +( )S + og når σ erstattes med S pooled har vi fra pensum at T = Ȳ Ȳ (µ µ ) S t pooled + n + P ( t α/,n + T t α/,n + ) = α P ( t α/,n + Ȳ Ȳ (µ µ ) S pooled t α/,n + ) = α P ( t α/,n + S pooled Ȳ Ȳ (µ µ ) t α/,n + S pooled ) = α P (Ȳ Ȳ t α/,n + S pooled µ µ Ȳ Ȳ + t α/,n + S pooled ) = α Dvs med t α/,n + = t 0.05,3 =.60, ȳ = 83.043, ȳ = 8.993 og s pooled = (7 0.004 + 6 0.00056)/(8 + 7 ) = 0.095 får vi følgende 95% konfidensintervall for µ µ : [83.043 8.993.60 0.095 8 + 7, 83.043 8.993 +.60 0.095 8 + 7 ] = [0.07, 0.083] ) Antar at σ σ (ulik varians): Konfidensintervall for µ µ : Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) ˆµ ˆµ = Ȳ Ȳ = Ȳ Ȳ (µ µ ) N(0, ) σ + σ Når σ og σ erstattes med estimatorene S og S har vi fra pensum at T = Ȳ Ȳ (µ µ ) S + S t ν der
MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 5) ν = (s / + s / ) (s /) + (s /) = (0.004/8 + 0.00056/7) (0.004/8) + (0.00056/7) 7 6 =.48 P ( t α/,ν T t α/,ν ) = α S P (Ȳ Ȳ t α/,ν + S S µ µ n Ȳ Ȳ + t α/,ν + S ) = α. Dvs med t α/,ν = t 0.05, =.79, ȳ = 83.043, ȳ = 8.993, s = 0.004 og s = 0.00056 får vi følgende 95% konfidensintervall for µ µ : [83.043 8.993.79 0.004 8 + 0.00056 7, 83.043 8.993 +.79 0.004 8 + 0.00056 7 ] = [0.07, 0.083] 3) Dersom vi også antar at observasjonenene fra de to andre legeringene er normalfordelte og antar at alle har samme varians kan variansen estimeres ved ˆσ = SSE/(N k) = SSE/(5 4) (generelt er N = k i= n i og k antall grupper). Siden SSE/σ χ N k får vi at når vi erstatter σ i Z = Ȳ Ȳ (µ µ ) σ N(0, ) med estimatoren ˆσ vil T = Ȳ Ȳ (µ µ ) S pooled t N k P ( t α/,n k T t α/,n k ) = α P (Ȳ Ȳ t α/,n kˆσ + µ µ n Ȳ Ȳ + t α/,n kˆσ + ). = α Dvs med t α/,n k = t 0.05,5 4 = t 0.05, =.080, ȳ = 83.043, ȳ = 8.993, ˆσ = 0.0008978 = 0.0996 får vi følgende 95% konfidensintervall for µ µ : [83.043 8.993.080 0.0996 8 + 7, 83.043 8.993 +.080 0.0996 8 + 7 ] = [0.08, 0.08] SSE/ = Uansett hvilken fremgangsmåte vi bruker så får vi et konfidensintervall som ikke inneholder 0, dette viser at det er forskjell i forventet kopperinnhold i de to legeringerne. Legering har høyrere forventet kopperinnhold. (P.g.a. at 0 ikke er inneholdt i 95% konfidensintervallet vil vil forkaste H 0 : µ = µ mot H : µ µ på 5% nivå.)
MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 6) a) Modell: Oppgave Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i er effekt av gjødseltype, β j er effekt av hvetesort, (αβ) ij er samspillseffekten og ε ijk er feilleddet (tilfeldig variasjon). 3 i= α i = 0, 3 j= β j = 0, 3 i= (αβ) ij = 0 og 3 j= (αβ) ij = 0. b) c). Kilde SS df M S F Gjødsel 880. 440.0555.65 Hvetesort 6.778 80.889.33 Samspill 06.889 4 6.7 0.768 Feil 33.000 9 34.778 Total 46.778 7 H 0 : (αβ) = = (αβ) 33 = 0 mot H : minst en 0 Siden f obs = 0.768 < f 0.0,4,9 = 6.4 forkaster vi ikke H 0. Dvs, det er ikke samspill mellom faktorene.. H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Siden f obs =.65 > f 0.0,,9 = 8.0 forkaster vi H 0. Dvs, gjødseltype har betydning. 3. H 0 : β = β = β 3 = 0 mot H : minst en β i 0 Siden f obs =.33 < f 0.0,,9 = 8.0 forkaster vi ikke H 0. Dvs, hvetesort har ikke betydning.