Oppgave 14.1 (14.4:1)

Like dokumenter
Oppgave 1. Kilde SS df M S F Legering Feil Total

Løsningsforslag eksamen 27. februar 2004

Oppgave 13.1 (13.4:1)

MOT310 Statistiske metoder 1, høsten 2010 Løsninger til regneøving nr. 11 (s. 1) der

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag eksamen 25. november 2003

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

Oppgave N(0, 1) under H 0. S t n 3

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

LØSNINGSFORSLAG ) = Dvs

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

MOT310 Statistiske metoder 1, høsten 2011

HØGSKOLEN I STAVANGER

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

HØGSKOLEN I STAVANGER

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

UNIVERSITETET I OSLO

Kp. 9.8 Forskjell mellom to forventninger

STK Oppsummering

TMA4240 Statistikk 2014

Løsningsforslag: STK2120-v15.

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-

Fasit og løsningsforslag STK 1110

Tilleggsoppgaver for STK1110 Høst 2015

Statistisk analyse av data fra planlagte forsøk

TMA4240 Statistikk Høst 2009

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

TMA4240 Statistikk Høst 2007

Norske hoppdommere og Janne Ahonen

Kp. 13. Enveis ANOVA

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

Kp. 12 Multippel regresjon

EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

TMA4240 Statistikk Høst 2015

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

TMA4240 Statistikk H2010

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen desember 2016

STK juni 2016

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

HØGSKOLEN I STAVANGER

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsning eksamen desember 2016

TMA4240 Statistikk Høst 2016

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

TMA4240 Statistikk H2010

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2015

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2018

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

EKSAMENSOPPGAVER STAT100 Vår 2011

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

TMA4240 Statistikk H2010 (20)

Løsningsforslag, eksamen statistikk, juni 2015

EKSTRAOPPGAVER I STK1110 H2017

UNIVERSITETET I OSLO

Løsningsforslag til oppgaver brukt i STA100

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen august 2014

Fasit for tilleggsoppgaver

TMA4240 Statistikk Høst 2016

EKSAMEN I TMA4255 ANVENDT STATISTIKK

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up!

ST1201 Statistiske metoder

UNIVERSITETET I OSLO

ECON240 VÅR / 2016 BOKMÅL

Eksamensoppgave i TMA4255 Anvendt statistikk

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Kap. 8: Utvalsfordelingar og databeskrivelse

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

10.1 Enkel lineær regresjon Multippel regresjon

UNIVERSITETET I OSLO

Transkript:

MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) Modell: Oppgave 4. (4.4:) Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i er effekt av temperatur, β j er effekt av ovn, (αβ) ij er samspillseffekten og ε ijk er feilleddet (tilfeldig variasjon). 3 i= α i = 0, 4 j= β j = 0, 3 i= (αβ) ij = 0, 4j= (αβ) ij = 0. Variansanalysetabell (ANOVA): Kilde SS df MS F p verdi Temperatur SSA a SSA/(a ) MSA/MSE P (F f obs ) Ovn SSB b SSB/(b ) MSB/MSE P (F f obs ) Samspill SS(AB) (a )(b ) SS(AB)/(a )(b ) MS(AB)/MSE P (F f obs ) Feil SSE ab(n ) SSE/ab(n ) = S Total SST abn SST = a i= bj= nk= (Y ijk Ȳ ), SSA = bn a i= (Ȳi Ȳ ), SSB = an b j= (Ȳ j Ȳ ), SS(AB) = n a i= bj= (Ȳij Ȳi Ȳ j + Ȳ ), og SSE = a i= bj= nk= (Y ijk Ȳij ), og SST = SSA + SSB + SS(AB) + SSE. a) H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hvert temperaturnivå er store i forhold til den tilfeldige feilen, mer presist dersom: SSA/(a ) SSE/ab(n ) = MSA MSE f α,a,ab(n ) = f 0.05,, = 3.89 Fra datautskriften ser vi at f obs = 8.3, dvs vi forkaster H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.0059<0.05. Temperatur har betydning for levetiden til komponenten. b) H 0 : β = β = β 3 = β 4 = 0 mot H : minst en β i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hver ovn er store i forhold til den tilfeldige feilen, mer presist dersom: SSB/(b ) SSE/ab(n ) = MSB MSE f α,b,ab(n ) = f 0.05,3, = 3.49 Fra datautskriften ser vi at f obs = 5.79, dvs vi forkaster H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.059<0.05. Ovn har betydning for levetiden til komponenten.

MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) c) H 0 : (αβ) = = (αβ) 34 = 0 mot H : minst en 0 Vi forkaster H 0 dersom kvadratsummen for samspill er stor i forhold til den tilfeldige feilen, mer presist dersom: SS(AB)/(a )(b ) SSE/ab(n ) = MS(AB) MSE f α,(a )(b ),ab(n ) = f 0.05,6, = 3.00 Fra datautskriften ser vi at f obs =.63, dvs vi forkaster ikke H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.>0.05. Det er ingen samspillseffekt. Kommentar: Vi burde strengt tatt sjekket ev. samspill før vi gjorde testet for hovedeffektene! Oppgave 4. (4.4:) Samme type modell og oppsett som i forrige oppgave. Responsen er nå vitamin C innhold og faktorene er merke og lagringstid. Vi har a = b = 3 og n = 4. a) H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hvert merke er store i forhold til den tilfeldige feilen, mer presist dersom: SSA/(a ) SSE/ab(n ) = MSA MSE f α,a,ab(n ) = f 0.05,,7 = 3.35 Fra datautskriften ser vi at f obs =.736, dvs vi forkaster ikke H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.95>0.05. Merke har ikke betydning for vitamin C innholdet. b) H 0 : β = β = β 3 = 0 mot H : minst en β i 0 Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi for hver lagringstid er store i forhold til den tilfeldige feilen, mer presist dersom: SSB/(b ) SSE/ab(n ) = MSB MSE f α,b,ab(n ) = f 0.05,,7 = 3.35 Fra datautskriften ser vi at f obs =.043, dvs vi forkaster H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.0008<0.05. Lagringstid har betydning for vitamin C innholdet. c) H 0 : (αβ) = = (αβ) 33 = 0 mot H : minst en 0 Vi forkaster H 0 dersom kvadratsummen for samspill er stor i forhold til den tilfeldige feilen, mer presist dersom:

MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 3) SS(AB)/(a )(b ) SSE/ab(n ) = MS(AB) MSE f α,(a )(b ),ab(n ) = f 0.05,4,7 =.73 Fra datautskriften ser vi at f obs = 0.459, dvs vi forkaster ikke H 0 på 5% nivå. Dette ser vi også fra at p-verdien=0.765>0.05. Det er ingen samspillseffekt. Kommentar: Vi burde strengt tatt sjekket ev. samspill før vi gjorde testet for hovedeffektene! Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon). Alternativt: Y ij = µ + α i + ε ij, der ε ij uavh. N(0, σ ) der µ er gjennomsnittlig forventa kopperinnhold, α i er effekten av legering i, 4 i= α i = 0 og ε ij er feilleddet (tilfeldig variasjon). Residual: e ij = y ij ȳ i. Fra det første plottet av residualene får vi en sjekk av om variansen er lik i alle grupper (alle legeringer). Det ser ut til å være oppfylt her da residualene ser ut til å ha lik spredning i alle tilfellene. Fra det andre plottet av residualene får vi en sjekk av antagelsen om normalfordeling. Denne antagelsen ser også ut til å være oppfylt da residualene ligger noenlunde langs en rett linje. b) Fra plottet kan det se ut som at legering og 4 tenderer til å ha noe lavere kopperinnhold enn legering og 3. Kilde SS df M S F Legering 0.0773 3 0.0059077 6.58 Feil 0.08853 0.0008978 Total 0.036576 4 H 0 : µ = µ = µ 3 = µ 4 mot H : minst en ulik Vi forkaster H 0 dersom F f 0.05,3, = 3.07. Dvs med de observerte dataene forkaster vi H 0 på 5% nivå. Forventet kopperinnhold er ulikt ved de ulike legeringene. c) Vi antar at Y,..., Y n er N(µ, σ )-fordelte og at Y,..., Y n er N(µ, σ )-fordelte og at alle observasjoner er uavhengige. Hva vi velger å anta om variansen avgjør hvordan vi går frem videre. De finnes tre muligheter (det er tilstrekkelig å gjøre oppgaven på en av de tre måtene).

MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 4) ) Antar at σ = σ = σ (lik varians): Konfidensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) = Ȳ Ȳ (µ µ ) = σ + σ Ȳ Ȳ (µ µ ) σ N(0, ) Her er σ ukjente, estimeres ved Spooled = ( )S +( )S + og når σ erstattes med S pooled har vi fra pensum at T = Ȳ Ȳ (µ µ ) S t pooled + n + P ( t α/,n + T t α/,n + ) = α P ( t α/,n + Ȳ Ȳ (µ µ ) S pooled t α/,n + ) = α P ( t α/,n + S pooled Ȳ Ȳ (µ µ ) t α/,n + S pooled ) = α P (Ȳ Ȳ t α/,n + S pooled µ µ Ȳ Ȳ + t α/,n + S pooled ) = α Dvs med t α/,n + = t 0.05,3 =.60, ȳ = 83.043, ȳ = 8.993 og s pooled = (7 0.004 + 6 0.00056)/(8 + 7 ) = 0.095 får vi følgende 95% konfidensintervall for µ µ : [83.043 8.993.60 0.095 8 + 7, 83.043 8.993 +.60 0.095 8 + 7 ] = [0.07, 0.083] ) Antar at σ σ (ulik varians): Konfidensintervall for µ µ : Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) ˆµ ˆµ = Ȳ Ȳ = Ȳ Ȳ (µ µ ) N(0, ) σ + σ Når σ og σ erstattes med estimatorene S og S har vi fra pensum at T = Ȳ Ȳ (µ µ ) S + S t ν der

MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 5) ν = (s / + s / ) (s /) + (s /) = (0.004/8 + 0.00056/7) (0.004/8) + (0.00056/7) 7 6 =.48 P ( t α/,ν T t α/,ν ) = α S P (Ȳ Ȳ t α/,ν + S S µ µ n Ȳ Ȳ + t α/,ν + S ) = α. Dvs med t α/,ν = t 0.05, =.79, ȳ = 83.043, ȳ = 8.993, s = 0.004 og s = 0.00056 får vi følgende 95% konfidensintervall for µ µ : [83.043 8.993.79 0.004 8 + 0.00056 7, 83.043 8.993 +.79 0.004 8 + 0.00056 7 ] = [0.07, 0.083] 3) Dersom vi også antar at observasjonenene fra de to andre legeringene er normalfordelte og antar at alle har samme varians kan variansen estimeres ved ˆσ = SSE/(N k) = SSE/(5 4) (generelt er N = k i= n i og k antall grupper). Siden SSE/σ χ N k får vi at når vi erstatter σ i Z = Ȳ Ȳ (µ µ ) σ N(0, ) med estimatoren ˆσ vil T = Ȳ Ȳ (µ µ ) S pooled t N k P ( t α/,n k T t α/,n k ) = α P (Ȳ Ȳ t α/,n kˆσ + µ µ n Ȳ Ȳ + t α/,n kˆσ + ). = α Dvs med t α/,n k = t 0.05,5 4 = t 0.05, =.080, ȳ = 83.043, ȳ = 8.993, ˆσ = 0.0008978 = 0.0996 får vi følgende 95% konfidensintervall for µ µ : [83.043 8.993.080 0.0996 8 + 7, 83.043 8.993 +.080 0.0996 8 + 7 ] = [0.08, 0.08] SSE/ = Uansett hvilken fremgangsmåte vi bruker så får vi et konfidensintervall som ikke inneholder 0, dette viser at det er forskjell i forventet kopperinnhold i de to legeringerne. Legering har høyrere forventet kopperinnhold. (P.g.a. at 0 ikke er inneholdt i 95% konfidensintervallet vil vil forkaste H 0 : µ = µ mot H : µ µ på 5% nivå.)

MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. 6) a) Modell: Oppgave Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i er effekt av gjødseltype, β j er effekt av hvetesort, (αβ) ij er samspillseffekten og ε ijk er feilleddet (tilfeldig variasjon). 3 i= α i = 0, 3 j= β j = 0, 3 i= (αβ) ij = 0 og 3 j= (αβ) ij = 0. b) c). Kilde SS df M S F Gjødsel 880. 440.0555.65 Hvetesort 6.778 80.889.33 Samspill 06.889 4 6.7 0.768 Feil 33.000 9 34.778 Total 46.778 7 H 0 : (αβ) = = (αβ) 33 = 0 mot H : minst en 0 Siden f obs = 0.768 < f 0.0,4,9 = 6.4 forkaster vi ikke H 0. Dvs, det er ikke samspill mellom faktorene.. H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Siden f obs =.65 > f 0.0,,9 = 8.0 forkaster vi H 0. Dvs, gjødseltype har betydning. 3. H 0 : β = β = β 3 = 0 mot H : minst en β i 0 Siden f obs =.33 < f 0.0,,9 = 8.0 forkaster vi ikke H 0. Dvs, hvetesort har ikke betydning.