Oppgave 1. Kilde SS df M S F Legering Feil Total

Like dokumenter
Oppgave 14.1 (14.4:1)

Løsningsforslag eksamen 27. februar 2004

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

Løsningsforslag eksamen 25. november 2003

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Oppgave N(0, 1) under H 0. S t n 3

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Oppgave 13.1 (13.4:1)

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

LØSNINGSFORSLAG ) = Dvs

MOT310 Statistiske metoder 1, høsten 2011

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

MOT310 Statistiske metoder 1, høsten 2010 Løsninger til regneøving nr. 11 (s. 1) der

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Kp. 9.8 Forskjell mellom to forventninger

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

STK Oppsummering

STK juni 2016

Kp. 13. Enveis ANOVA

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

TMA4240 Statistikk Høst 2009

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

TMA4240 Statistikk Høst 2007

Tilleggsoppgaver for STK1110 Høst 2015

Statistisk analyse av data fra planlagte forsøk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2009

HØGSKOLEN I STAVANGER

TMA4240 Statistikk 2014

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Kp. 12 Multippel regresjon

Løsningsforslag: STK2120-v15.

EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk Høst 2015

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Fasit og løsningsforslag STK 1110

UNIVERSITETET I OSLO

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk H2010

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk 2014

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2009

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010 (20)

ST1201 Statistiske metoder

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2018

Kap. 8: Utvalsfordelingar og databeskrivelse

Eksamensoppgave i TMA4245 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

vekt. vol bruk

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag til oppgaver brukt i STA100

EKSAMEN I TMA4255 ANVENDT STATISTIKK

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

TMA4245 Statistikk Eksamen august 2014

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up!

UNIVERSITETET I OSLO

Fasit for tilleggsoppgaver

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

EKSAMENSOPPGAVER STAT100 Vår 2011

TMA4240 Statistikk Høst 2015

EKSTRAOPPGAVER I STK1110 H2017

TMA4240 Statistikk Høst 2015

ECON240 VÅR / 2016 BOKMÅL

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

ST0202 Statistikk for samfunnsvitere

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Kapittel 9 og 10: Hypotesetesting

Transkript:

MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon). Alternativt: Y ij = µ + α i + ε ij, der ε ij uavh. N(0, σ ) der µ er gjennomsnittlig forventa kopperinnhold, α i er eekten av legering i, 4 i= α i = 0 og ε ij er feilleddet (tilfeldig variasjon). Residual: e ij = y ij ȳ i. Fra det første plottet av residualene får vi en sjekk av om variansen er lik i alle grupper (alle legeringer). Det ser ut til å være oppfylt her da residualene ser ut til å ha lik spredning i alle tilfellene. Fra det andre plottet av residualene får vi en sjekk av antagelsen om normalfordeling. Denne antagelsen ser også ut til å være oppfylt da residualene ligger noenlunde langs en rett linje. b) Fra plottet kan det se ut som at legering og 4 tenderer til å ha noe lavere kopperinnhold enn legering og 3. Kilde SS df M S F Legering 0.03 3 0.00590 6.58 Feil 0.08853 0.000898 Total 0.03656 4 H 0 : µ = µ = µ 3 = µ 4 mot H : minst en ulik Vi forkaster H 0 dersom F f 0.05,3, = 3.0. Dvs med de observerte dataene forkaster vi H 0 på 5% nivå. Forventet kopperinnhold er ulikt ved de ulike legeringene. c) Vi antar at Y,..., Y n er N(µ, σ)-fordelte og at Y,..., Y n er N(µ, σ)-fordelte og at alle observasjoner er uavhengige. Hva vi velger å anta om variansen avgjør hvordan vi går frem videre. De nnes tre muligheter (det er tilstrekkelig å gjøre oppgaven på en av de tre måtene). ) Antar at σ = σ = σ (lik varians): Kondensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) = Ȳ Ȳ (µ µ ) = σ + σ Ȳ Ȳ (µ µ ) σ N(0, ) + Her er σ ukjente, estimeres ved Spooled = ( )S +( )S + og når σ erstattes med S pooled har vi fra pensum at T = Ȳ Ȳ (µ µ ) S t pooled + n +

MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) P ( t α/,n + T t α/,n + ) = α P ( t α/,n + Ȳ Ȳ (µ µ ) S pooled + t α/,n + ) = α P ( t α/,n + S pooled + Ȳ Ȳ (µ µ ) t α/,n + S pooled + ) = α P (Ȳ Ȳ t α/,n + S pooled + µ µ Ȳ Ȳ + t α/,n + S pooled + ) = α Dvs med t α/,n + = t 0.05,3 =.60, ȳ = 83.043, ȳ = 8.993 og s pooled = ( 0.004 + 6 0.00056)/(8 + ) = 0.095 får vi følgende 95% kondensintervall for µ µ : [83.043 8.993.60 0.095 8 +, 83.043 8.993 +.60 0.095 8 + ] = [0.0, 0.083] ) Antar at σ σ (ulik varians): Kondensintervall for µ µ : ˆµ ˆµ = Ȳ Ȳ Z = Ȳ Ȳ E(Ȳ Ȳ ) Ȳ Ȳ ) Når σ og σ erstattes med estimatorene S og S = Ȳ Ȳ (µ µ ) N(0, ) σ + σ har vi fra pensum at T = Ȳ Ȳ (µ µ ) S + S t ν der ν = (s / + s / ) (s /) + (s /) = (0.004/8 + 0.00056/) (0.004/8) + (0.00056/) 6 =.48 P ( t α/,ν T t α/,ν ) = α S P (Ȳ Ȳ t α/,ν + S S µ µ n Ȳ Ȳ + t α/,ν + S ) = α. Dvs med t α/,ν = t 0.05, =.9, ȳ = 83.043, ȳ = 8.993, s = 0.004 og s = 0.00056 får vi følgende 95% kondensintervall for µ µ : [83.043 8.993.9 0.004 8 + 0.00056, 83.043 8.993 +.9 0.004 8 + 0.00056 ] = [0.0, 0.083]

MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. 3) 3) Dersom vi også antar at observasjonenene fra de to andre legeringene er normalfordelte og antar at alle har samme varians kan variansen estimeres ved ˆσ = SSE/(N k) = SSE/(5 4) (generelt er N = k i= n i og k antall grupper). Siden SSE/σ χ N k får vi at når vi erstatter σ i Z = Ȳ Ȳ (µ µ ) σ N(0, ) + med estimatoren ˆσ vil T = Ȳ Ȳ (µ µ ) S pooled + t N k P ( t α/,n k T t α/,n k ) = α P (Ȳ Ȳ t α/,n kˆσ + µ µ n Ȳ Ȳ + t α/,n kˆσ + ). = α Dvs med t α/,n k = t 0.05,5 4 = t 0.05, =.080, ȳ = 83.043, ȳ = 8.993, ˆσ = 0.000898 = 0.0996 får vi følgende 95% kondensintervall for µ µ : [83.043 8.993.080 0.0996 8 +, 83.043 8.993 +.080 0.0996 8 + ] = [0.08, 0.08] SSE/ = Uansett hvilken fremgangsmåte vi bruker så får vi et kondensintervall som ikke inneholder 0, dette viser at det er forskjell i forventet kopperinnhold i de to legeringerne. Legering har høyrere forventet kopperinnhold. (P.g.a. at 0 ikke er inneholdt i 95% kondensintervallet vil vil forkaste H 0 : µ = µ mot H : µ µ på 5% nivå.) Oppgave a) Modell for y ij = elastisitetsmodul for måling nr. j av ståltype nr. i (i = : er A, i = : er B og i = 3 : er C). Y ij = µ i + ε ij, der ε ij uavh. N (0, σ ) der µ i er forventet elastisitetsmodul for måling nr. j av ståltype nr. i og ε ij er feilleddet (tilfeldig variasjon).

MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. 4) Diagram av dataene: 9 5 3 3 Gjennomsnitt for hver ståltype indikert med rød strek. b) Variansanalysetabell (ANOVA): Kilde SS df MS F p verdi Ståltype (mellom grupper) SSA k SSA/(k ) MSA/MSE P (F f obs ) Feil (innen grupper) SSE N k SSE/(N k) = S Total SST N SST = k ni i= j=(y ij Y ), SSA = k i= n i (Y i Y ) og SSE = k ni i= j=(y ij Y i ), og SST = SSA + SSE. Vi har her at utregnede verdier av SSA = 3 i= n i (Y i Y ), er: 5( 5) + 3(3 5) + 4(4 5) = 36 Siden SSE = SST - SSA, får vi at utregnet verdi av SSE er: 54-36 = 8. Fullstendig ANOVA-tabell: Kilde SS df MS F p verdi Ståltype (mellom grupper) 36 8 9 (0.00) Feil (innen grupper) 8 9 Total 54 (Det forventes ikke at p-verdien skal beregnes i dette tilfellet.) c) Vil teste H 0 : µ = µ = µ 3 mot H : minst en ulik Vi forkaster H 0 dersom forskjellene i gjennomsnittsverdi i hver gruppe er stor i forhold til den tilfeldige feilen, mer presist dersom: F = SSA/(k ) SSE/(N k) = MSA MSE f α,k,n k = f 0.05,,9 = 4.6 Fra variansanlysetabellen får vi at f obs = 9, dvs vi forkaster H 0 på 5% nivå. Konklusjonen blir at det er forskjell på forventet elastisitetsmodul til de ulike ståltypene.

MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. 5) Oppgave 3 a) Modell: Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseekten, α i er eekt av gjødseltype, β j er eekt av hvetesort, (αβ) ij er samspillseekten og ε ijk er feilleddet (tilfeldig variasjon). 3 i= α i = 0, 3 j= β j = 0, 3 i= (αβ) ij = 0 og 3 j= (αβ) ij = 0. b) Kilde SS df M S F Gjødsel 880. 440.0555.65 Hvetesort 6.8 80.889.33 Samspill 06.889 4 6. 0.68 Feil 33.000 9 34.8 Total 46.8 c). H 0 : (αβ) = = (αβ) 33 = 0 mot H : minst en 0 Siden f obs = 0.68 < f 0.0,4,9 = 6.4 forkaster vi ikke H 0. Dvs, det er ikke samspill mellom faktorene.. H 0 : α = α = α 3 = 0 mot H : minst en α i 0 Siden f obs =.65 > f 0.0,,9 = 8.0 forkaster vi H 0. Dvs, gjødseltype har betydning. 3. H 0 : β = β = β 3 = 0 mot H : minst en β i 0 Siden f obs =.33 < f 0.0,,9 = 8.0 forkaster vi ikke H 0. Dvs, hvetesort har ikke betydning.