Løsningsforslag eksamen 27. februar 2004

Like dokumenter
Oppgave 1. Kilde SS df M S F Legering Feil Total

Oppgave 14.1 (14.4:1)

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag eksamen 25. november 2003

Oppgave N(0, 1) under H 0. S t n 3

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2015

LØSNINGSFORSLAG ) = Dvs

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

HØGSKOLEN I STAVANGER

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

TMA4240 Statistikk 2014

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Kp. 9.8 Forskjell mellom to forventninger

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2009

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

TMA4240 Statistikk Høst 2009

Tilleggsoppgaver for STK1110 Høst 2015

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

TMA4240 Statistikk 2014

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2016

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

TMA4240 Statistikk Høst 2018

Eksamensoppgave i TMA4245 Statistikk

Løsningsforslag til oppgaver brukt i STA100

TMA4240 Statistikk Høst 2009

STK Oppsummering

Norske hoppdommere og Janne Ahonen

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up!

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk H2010

TMA4245 Statistikk Eksamen august 2014

Løsningsforslag: STK2120-v15.

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

UNIVERSITETET I OSLO

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk Høst 2015

Fasit for tilleggsoppgaver

TMA4240 Statistikk H2010

Kapittel 9 og 10: Hypotesetesting

EKSTRAOPPGAVER I STK1110 H2017

Løsningsforslag, eksamen statistikk, juni 2015

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2011

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Kapittel 2: Hendelser

Kp. 12 Multippel regresjon

Fasit og løsningsforslag STK 1110

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

TMA4240 Statistikk Høst 2015

UNIVERSITETET I OSLO

TMA4240 Statistikk Eksamen desember 2015

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4245 Statistikk Eksamen august 2014

Oppgave 13.1 (13.4:1)

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

STK juni 2016

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

TMA4240 Statistikk Høst 2016

i x i

UNIVERSITETET I OSLO

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

TMA4240 Statistikk H2010 (20)

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-

Eksamensoppgåve i TMA4245 Statistikk

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Transkript:

MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon) Alternativt: Y ij = µ + α i + ε ij, der ε ij uavh N(0, σ ) der µ er gjennomsnittlig forventa kopperinnhold, α i er effekten av legering i, 4 i= α i = 0 og ε ij er feilleddet (tilfeldig variasjon) Residual: e ij = y ij ȳ i Fra det første plottet av residualene får vi en sjekk av om variansen er lik i alle grupper (alle legeringer) Det ser ut til å være oppfylt her da residualene ser ut til å ha lik spredning i alle tilfellene Fra det andre plottet av residualene får vi en sjekk av antagelsen om normalfordeling Denne antagelsen ser også ut til å være oppfylt da residualene ligger noenlunde langs en rett linje b) Fra plottet kan det se ut som at legering og 4 tenderer til å ha noe lavere kopperinnhold enn legering og 3 Kilde SS df M S F Legering 00773 3 00059077 658 Feil 008853 00008978 Total 0036576 4 H 0 : µ = µ = µ 3 = µ 4 mot H : minst en ulik Vi forkaster H 0 dersom F f 005,3, = 307 Dvs med de observerte dataene forkaster vi H 0 på 5% nivå Forventet kopperinnhold er ulikt ved de ulike legeringene c) Vi antar at Y,, Y n er N(µ, σ )-fordelte og at Y,, Y n er N(µ, σ )-fordelte og at alle observasjoner er uavhengige Hva vi velger å anta om variansen avgjør hvordan vi går frem videre De finnes tre muligheter ) Antar at σ = σ = σ (lik varians): Konfidensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Var(Ȳ Ȳ ) = Ȳ Ȳ (µ µ ) = σ n + σ n Ȳ Ȳ (µ µ ) σ + n n N(0, )

Her er σ ukjente, estimeres ved Spooled = (n )S +(n )S n +n og når σ erstattes med Spooled har vi fra pensum at T = Ȳ Ȳ (µ µ ) t S pooled n + n +n n P ( t α/,n +n T t α/,n +n ) = α P ( t α/,n +n Ȳ Ȳ (µ µ ) S pooled n + n t α/,n +n ) = α P ( t α/,n +n S pooled n + n Ȳ Ȳ (µ µ ) t α/,n +n S pooled n + n ) = α P (Ȳ Ȳ t α/,n +n S pooled n + n µ µ Ȳ Ȳ + t α/,n +n S pooled n + n ) = α Dvs med t α/,n +n = t 005,3 = 60, ȳ = 83043, ȳ = 8993 og s pooled = (7 0004 + 6 000056)/(8 + 7 ) = 0095 får vi følgende 95% konfidensintervall for µ µ : [83043 8993 60 0095 8 + 7, 83043 8993 + 60 0095 8 + 7 ] = [007, 0083] ) Antar at σ σ (ulik varians): Konfidensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Var(Ȳ Ȳ ) = Ȳ Ȳ (µ µ ) N(0, ) σ n + σ n Når σ og σ erstattes med estimatorene S og S har vi fra pensum at T = Ȳ Ȳ (µ µ ) S n + S n t ν der ν = (s /n + s /n ) (s /n ) n + (s /n ) n = (0004/8 + 000056/7) (0004/8) 7 + (000056/7) 6 = 48

P ( t α/,ν T t α/,ν ) α S P (Ȳ Ȳ t α/,ν + S S µ µ n n Ȳ Ȳ + t α/,ν + S ) α n n Dvs med t α/,ν = t 005, = 79, ȳ = 83043, ȳ = 8993, s = 0004 og s = 000056 får vi følgende (tilnærmede) 95% konfidensintervall for µ µ : [83043 8993 79 0004 8 + 000056 7, 83043 8993 + 79 0004 8 + 000056 7 ] = [007, 0083] 3) Dersom vi også antar at observasjonenene fra de to andre legeringene er normalfordelte og antar at alle har samme varians kan variansen estimeres ved ˆσ = SSE/(N k) = SSE/(5 4) (generelt er N = k i= n i og k antall grupper) Siden SSE/σ χ N k får vi at når vi erstatter σ i Z = Ȳ Ȳ (µ µ ) σ + N(0, ) n n med estimatoren ˆσ vil T = Ȳ Ȳ (µ µ ) ˆσ n + n t N k P ( t α/,n k T t α/,n k ) = α P (Ȳ Ȳ t α/,n kˆσ + µ µ n n Ȳ Ȳ + t α/,n kˆσ + ) n n = α Dvs med t α/,n k = t 005,5 4 = t 005, = 080, ȳ = 83043, ȳ = 8993, ˆσ = SSE/ = 00008978 = 00996 får vi følgende 95% konfidensintervall for µ µ : [83043 8993 080 00996 8 + 7, 83043 8993 + 080 00996 8 + 7 ] = [008, 008] Uansett hvilken fremgangsmåte vi bruker så får vi et konfidensintervall som ikke inneholder 0, dette viser at det er forskjell i forventet kopperinnhold i de to legeringerne Legering har høyrere forventet kopperinnhold (Pga at 0 ikke er inneholdt i 95% konfidensintervallet vil vil forkaste H 0 : µ = µ mot H : µ µ på 5% nivå) 3

Oppgave a) Når σ er ukjent har vi fra pensum at: H 0 : µ = mot H : µ T = X µ 0 S/ n t n under H 0 Med α = 0 og n = forkaster vi nullhypotesen dersom T t α/,n = t 005, = 796 eller T t α/,n = t 005, = 796 Observert: x = 465/ = 054, s = ni= n (x i x) = 037/ = 0097363, dvs s = 074 og dermed 054 0 t obs = 074/ = 08 Dataene gir ingen grunn for å påstå at forvent- Dvs, vi forkaster ikke H 0 på 0% nivå ningsverdien er ulik b) En god estimator skal være forventningsrett og ha så liten varians som mulig Fra resultatene i formelsamling får vi at nˆσ σ = n σ (X i µ) χ n og i= (n )S σ = n σ (X i X) χ n i= som sammen med resultatet at i en χ ν-fordeling er forventningsverdien ν og variansen ν gir oss: E(ˆσ ) = σ E(nˆσ n σ ) = σ n n = σ E(S σ )S ) = E((n n σ ) = σ (n ) = σ n Var(ˆσ ) = Var( σ n nˆσ σ ) = σ4 Var(nˆσ n σ ) = σ4 n Var(S ) = Var( σ (n )S n σ ) = σ4 n = n σ 4 )S Var((n (n ) σ ) = σ 4 σ4 (n ) = (n ) n Dvs begge estimatorene er forventningsrette, men ˆσ har minst varians og er derfor å foretrekke c) Vi bruker ˆσ og resultatet at og får: n ˆσ σ = n i= (X i µ) σ χ n P (χ α/,n n ˆσ σ χ α/,n ) = α ( χ α/,n P nˆσ ) σ χ α/,n nˆσ = α ( ) nˆσ P σ nˆσ = α χ α/,n χ α/,n 4

Observert: n = og nˆσ = n ni= n (x i µ) = i= (x i ) = 0363 og med α = 005 χ 005, = 3337 og χ 0975,3 = 4404 gir dette 95% konfidensintervall for σ: Oppgave 3 a) Y = Xβ + E der [ ] 0363 3337, 0363 = [006, 008] 4404 Y = Y Y n, X = x x x 3 x x x 3 x n x n x 3n X =, β = 49 39 54 4 75 55 7 7 054 β 0 β β β 3 og E = E E n Fra datautskriften ser vi at: ŷ = b 0 +b x +b x +b 3 x 3 = 570 0349x 0008x + 0955x 3 som spesielt gir ŷ(5, 50, 0) = 570 0349 5 0008 50 + 0955 0 = 569 b) H 0 : β = β = β 3 = 0 mot H : minst en β i 0 Vi forkaster H 0 dersom F f 005,3, = 305, dvs med f obs = 8380 forkaster vi H 0 på 5% nivå De 3 variablene har samlet sett innflytelse på ph-verdien Fra datautskriften ser vi at vi på 5% nivå vil forkaste H 0 : β i = 0 mot H : β i 0 for både β, β og β 3 (alle p verdier mindre enn 005), dvs alle variablene har betydning c) Vi har at H 0 : β 3 = mot H : β 3 Z = B 3 E(B 3 ) Var(B3 ) = B 3 β 3 Var(B3 ) = B 3 Var(B3 ) = B 3 Var(B3 ) N(0, ) under H 0 og med ukjent varians får vi at T = B 3 = B 3 Var(B 3 ) ŜD(B 3 ) t n 4 under H 0 Vi forkaster H 0 dersom T t α/,n 4 = t 005, = 074 eller T t α/,n 4 = 074 Observert: t obs = 0955 0076 = 059 Dvs, vi forkaster ikke H 0 på 5% nivå, dataene gir ikke grunnlag for å hevde at påstanden er gal 5

d) Tar utgangspunkt i: Ŷ 0 Y 0 = ˆµ Y x0 Y 0 der Y 0 er den nye målingen Når x 0 = (, 5, 50, ) T får vi Tallsvar: E(Ŷ0 Y 0 ) = E(ˆµ Y x0 ) E(Y 0 ) = µ Y x0 µ Y x0 = 0 Var(Ŷ0 Y 0 ) uavh = Var(Ŷ0) + Var(Y 0 ) = 007σ + σ = 07σ T = Ŷ0 Y 0 S 07 t n 4 P ( t α/,n 4 T t α/,n 4 ) = α P ( t 005, Ŷ0 Y 0 S 07 t 005,) = 095 P (Ŷ0 t 005, S 07 Y 0 Ŷ0 + t 005, S 07) = 095 Innsatt ŷ 0 = b 0 + b x 0 + b x 0 + b 3 x 30 = 570 0349 5 0008 50 + 0955 0 = 569, s = 007 = 07 og t 005, = 074 gir dette følgende 95% prediksjonsintervall: [569 074 07 07, 569 + 074 07 07] = [545, 593] 6