MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon). Alternativt: Y ij = µ + α i + ε ij, der ε ij uavh. N(0, σ ) der µ er gjennomsnittlig forventa kopperinnhold, α i er eekten av legering i, 4 i= α i = 0 og ε ij er feilleddet (tilfeldig variasjon). Residual: e ij = y ij ȳ i. Fra det første plottet av residualene får vi en sjekk av om variansen er lik i alle grupper (alle legeringer). Det ser ut til å være oppfylt her da residualene ser ut til å ha lik spredning i alle tilfellene. Fra det andre plottet av residualene får vi en sjekk av antagelsen om normalfordeling. Denne antagelsen ser også ut til å være oppfylt da residualene ligger noenlunde langs en rett linje. b) Fra plottet kan det se ut som at legering og 4 tenderer til å ha noe lavere kopperinnhold enn legering og 3. Kilde SS df M S F Legering 0.03 3 0.00590 6.58 Feil 0.08853 0.000898 Total 0.03656 4 H 0 : µ = µ = µ 3 = µ 4 mot H : minst en ulik Vi forkaster H 0 dersom F f 0.05,3, = 3.0. Dvs med de observerte dataene forkaster vi H 0 på 5% nivå. Forventet kopperinnhold er ulikt ved de ulike legeringene. c) Vi antar at Y,..., Y n er N(µ, σ)-fordelte og at Y,..., Y n er N(µ, σ)-fordelte og at alle observasjoner er uavhengige. Hva vi velger å anta om variansen avgjør hvordan vi går frem videre. De nnes tre muligheter (det er tilstrekkelig å gjøre oppgaven på en av de tre måtene). ) Antar at σ = σ = σ (lik varians): Kondensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) = Ȳ Ȳ (µ µ ) = σ + σ Ȳ Ȳ (µ µ ) σ N(0, ) + Her er σ ukjente, estimeres ved Spooled = ( )S +( )S + og når σ erstattes med S pooled har vi fra pensum at T = Ȳ Ȳ (µ µ ) S t pooled + n +
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) P ( t α/,n + T t α/,n + ) = α P ( t α/,n + Ȳ Ȳ (µ µ ) S pooled + t α/,n + ) = α P ( t α/,n + S pooled + Ȳ Ȳ (µ µ ) t α/,n + S pooled + ) = α P (Ȳ Ȳ t α/,n + S pooled + µ µ Ȳ Ȳ + t α/,n + S pooled + ) = α Dvs med t α/,n + = t 0.05,3 =.60, ȳ = 83.043, ȳ = 8.993 og s pooled = ( 0.004 + 6 0.00056)/(8 + ) = 0.095 får vi følgende 95% kondensintervall for µ µ : [83.043 8.993.60 0.095 8 +, 83.043 8.993 +.60 0.095 8 + ] = [0.0, 0.083] ) Antar at σ σ (ulik varians): Kondensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) Når σ og σ erstattes med estimatorene S og S = Ȳ Ȳ (µ µ ) N(0, ) σ + σ har vi fra pensum at T = Ȳ Ȳ (µ µ ) S + S t ν der ν = (s / + s / ) (s /) + (s /) = (0.004/8 + 0.00056/) (0.004/8) + (0.00056/) 6 =.48 P ( t α/,ν T t α/,ν ) = α S P (Ȳ Ȳ t α/,ν + S S µ µ n Ȳ Ȳ + t α/,ν + S ) = α. Dvs med t α/,ν = t 0.05, =.9, ȳ = 83.043, ȳ = 8.993, s = 0.004 og s = 0.00056 får vi følgende 95% kondensintervall for µ µ : [83.043 8.993.9 0.004 8 + 0.00056, 83.043 8.993 +.9 0.004 8 + 0.00056 ] = [0.0, 0.083]
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. 3) 3) Dersom vi også antar at observasjonenene fra de to andre legeringene er normalfordelte og antar at alle har samme varians kan variansen estimeres ved ˆσ = SSE/(N k) = SSE/(5 4) (generelt er N = k i= n i og k antall grupper). Siden SSE/σ χ N k får vi at når vi erstatter σ i Z = Ȳ Ȳ (µ µ ) σ N(0, ) + med estimatoren ˆσ vil T = Ȳ Ȳ (µ µ ) S pooled + t N k P ( t α/,n k T t α/,n k ) = α P (Ȳ Ȳ t α/,n kˆσ + µ µ n Ȳ Ȳ + t α/,n kˆσ + ). = α Dvs med t α/,n k = t 0.05,5 4 = t 0.05, =.080, ȳ = 83.043, ȳ = 8.993, ˆσ = 0.000898 = 0.0996 får vi følgende 95% kondensintervall for µ µ : [83.043 8.993.080 0.0996 8 +, 83.043 8.993 +.080 0.0996 8 + ] = [0.08, 0.08] SSE/ = Uansett hvilken fremgangsmåte vi bruker så får vi et kondensintervall som ikke inneholder 0, dette viser at det er forskjell i forventet kopperinnhold i de to legeringerne. Legering har høyrere forventet kopperinnhold. (P.g.a. at 0 ikke er inneholdt i 95% kondensintervallet vil vil forkaste H 0 : µ = µ mot H : µ µ på 5% nivå.) Oppgave a) Modell for y ij = elastisitetsmodul for måling nr. j av ståltype nr. i (i = : er A, i = : er B og i = 3 : er C). Y ij = µ i + ε ij, der ε ij uavh. N (0, σ ) der µ i er forventet elastisitetsmodul for måling nr. j av ståltype nr. i og ε ij er feilleddet (tilfeldig variasjon).
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. 4) Diagram av dataene: 9 5 3 3 Gjennomsnitt for hver ståltype indikert med rød strek. b) Variansanalysetabell (ANOVA): Kilde SS df MS F p verdi Ståltype (mellom grupper) SSA k SSA/(k ) MSA/MSE P (F f obs ) Feil (innen grupper) SSE N k SSE/(N k) = S Total SST N SST = k ni i= j=(y ij Y ), SSA = k i= n i (Y i Y ) og SSE = k ni i= j=(y ij Y i ), og SST = SSA + SSE. Vi har her at utregnede verdier av SSA = 3 i= n i (Y i Y ), er: 5( 5) + 3(3 5) + 4(4 5) = 36 Siden SSE = SST - SSA, får vi at utregnet verdi av SSE er: 54-36 = 8. Fullstendig ANOVA-tabell: Kilde SS df MS F p verdi Ståltype (mellom grupper) 36 8 9 (0.00) Feil (innen grupper) 8 9 Total 54 (Det forventes ikke at p-verdien skal beregnes i dette tilfellet.) c) Vil teste H 0 : µ = µ = µ 3 mot H : minst en ulik Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi i hver gruppe er stor i forhold til den tilfeldige feilen, mer presist dersom: F = SSA/(k ) SSE/(N k) = MSA MSE f α,k,n k = f 0.05,,9 = 4.6 Fra variansanlysetabellen får vi at f obs = 9, dvs vi forkaster H 0 på 5% nivå. Konklusjonen blir at det er forskjell på forventet elastisitetsmodul til de ulike ståltypene.
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. 5) Oppgave 3 a) Modell: Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseekten, α i er eekt av gjødseltype, β j er eekt av hvetesort, (αβ) ij er samspillseekten og ε ijk er feilleddet (tilfeldig variasjon). 3 i= α i = 0, 3 j= β j = 0, 3 i= (αβ) ij = 0 og 3 j= (αβ) ij = 0. b) Kilde SS df M S F Gjødsel 880. 440.0555.65 Hvetesort 6.8 80.889.33 Samspill 06.889 4 6. 0.68 Feil 33.000 9 34.8 Total 46.8 c). H 0 : (αβ) = = (αβ) 33 = 0 mot H : minst en 0 Siden f obs = 0.68 < f 0.0,4,9 = 6.4 forkaster vi ikke H 0. Dvs, det er ikke samspill mellom faktorene.. H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Siden f obs =.65 > f 0.0,,9 = 8.0 forkaster vi H 0. Dvs, gjødseltype har betydning. 3. H 0 : β = β = β 3 = 0 mot H : minst en β i 0 Siden f obs =.33 < f 0.0,,9 = 8.0 forkaster vi ikke H 0. Dvs, hvetesort har ikke betydning.