n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Like dokumenter
TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2009

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk Høst 2009

EKSAMEN I FAG TMA4240 STATISTIKK

TMA4240 Statistikk 2014

TMA4245 Statistikk Vår 2015

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2018

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2009

i x i

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

HØGSKOLEN I STAVANGER

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2015

ST0202 Statistikk for samfunnsvitere

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2015

UNIVERSITETET I OSLO

LØSNINGSFORSLAG ) = Dvs

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4245 Statistikk

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgåve i TMA4240 Statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Løsningsforslag eksamen 27. februar 2004

HØGSKOLEN I STAVANGER

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

10.1 Enkel lineær regresjon Multippel regresjon

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

UNIVERSITETET I OSLO

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

TMA4240 Statistikk Høst 2007

Eksamensoppgave i TMA4245 Statistikk

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

TMA4240 Statistikk Høst 2009

Eksamensoppgåve i TMA4245 Statistikk

Løsningsforslag eksamen 25. november 2003

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

TMA4240 Statistikk Høst 2016

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

EKSAMEN I TMA4240 Statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

TMA4240 Statistikk Høst 2015

Fasit og løsningsforslag STK 1110

Oppgave N(0, 1) under H 0. S t n 3

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

TMA4240 Statistikk H2010 (20)

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Om eksamen. Never, never, never give up!

UNIVERSITETET I OSLO

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Om eksamen. Never, never, never give up!

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Tilleggsoppgaver for STK1110 Høst 2015

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

UNIVERSITETET I OSLO

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

HØGSKOLEN I STAVANGER

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk Høst 2012

Fasit for tilleggsoppgaver

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

LØSNING: Eksamen 22. mai 2018

vekt. vol bruk

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Transkript:

TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant annet om å estimere modellparametre, tolke tilpassede modeller, og predikere fremtidige observasjoner. Oppgave 1 Figuren viser vinnertidene på 800 m løping for menn i alle Olympiske Leker (OL). Totalt er det n = 28 vinnertider. Vi lar Y i være vinnertiden i OL nummer i, og x i årstallet for OL nummer i. Vi antar følgende regresjonsmodell for vinnertidene: Y i = α + βx i + ɛ i, ɛ i N(0, σ 2 ). I tillegg antas at støyleddene ɛ 1,..., ɛ n er uavhengige. a) Gi en kort forklaring av minste kvadraters metode (også kalt minste kvadratsums metode eller method of least squares) for linjetilpasning. Vis at denne metoden gir estimatorer: ˆα = Ȳ ˆβ x, ˆβ = i=1 x iy i n xȳ i=1 x2 i n x2 der gjennomsnittene er Ȳ = 1 n i=1 Y i og x = 1 n i=1 x i. En alternativ skrivemåte for estimatoren av stigningstallet er ˆβ = i=1 (x i x)y i n i=1 (x i x) 2. Det oppgis at Ȳ = 109.26, x = 1954.5, i=1 (x i x)y i = 5942 og i=1 (x i x) 2 = 36517. Et estimat på variansen til støyleddene er s 2 = 3.40 2. b) Det kan vises at T = ( ˆβ β) s/ i=1 (x i x) 2 t n 2 Bruk dette resultatet til å utlede et 95 prosent konfidensintervall for β. Regn ut konfidensintervallet ved bruk av tall oppgitt over. Vi vil predikere vinnertiden i neste OL: 2016 i Brasil. c) Regn ut predikert vinnertid i 2016. Finn et 95 prosent prediksjonsintervall for vinnertiden i 2016. anb12-oppg-b 10. april 2016 Side 1

135 130 125 Time (Seconds) 120 115 110 105 100 1880 1900 1920 1940 1960 1980 2000 2020 Year d) Bruk modellen til å anslå året da 90-sekundersgrensen brytes, altså det første året da vinnertiden er under 90 sekunder. Vurder modellantakelsene som gjøres. Hvilke metoder kan brukes for å undersøke antakelsene? Oppgave 2 Når prøver fra ett og samme sted i en sølvåre analyseres med hensyn på sølvinnholdet, fåes analyseresultater som vi skal anta er uavhengige og normalfordelte med forventning µ (g/tonn) og varians σ 2. a) Anta i dette punktet at µ = 500 og at σ = 80. La Y betegne en slik måling. Hva blir sannsynligheten for at Y skal overskride 550? La Y 1 og Y 2 være 2 slike målinger. Hvor stor er sannsynligheten for at disse skal avvike fra hverandre med minst 80 g/tonn. Den nevnte sølvåren er 40 meter lang og rettlinjet og går fra vest mot øst. Det er av interesse å anslå hvor mye sølv som finnes i sølvåren. Erfaringer fra andre sølvårer av tilsvarende type tilsier at sølvinnholdet i store trekk endrer seg lineært fra den ene enden av sølvåren til den andre. La Y j betegne målt sølvinnhold i en prøve som er tatt x j meter fra den vestlige enden, j = 1, 2,..., n. Vi skal anta at Y 1,..., Y n er uavhengige og normalfordelte med samme ukjente varians σ 2 og forventningsverdi E(Y j ) = α + βx j der α og β er ukjente konstanter. Minste kvadratsums-estimatorene for α og β er da gitt ved,

henholdsvis (du skal ikke vise dette): B = j=1 (x j x)y j j=1 (x j x) 2 der x = 1 n j=1 x j og Ȳ = 1 n j=1 Y j. A = Ȳ B x Av praktiske årsaker bestemmer en seg for å ta 5 prøver av sølvinnholdet i hver ende av sølv åren. La Y 1,..., Y 5 betegne målt sølvinnhold i den vestre enden (x i = 0) og Y 6,..., Y 10 betegne målt sølvinnhold i den østre enden (x i = 40). b) Vis at da er 10 j=6 B = Y j 5 j=1 Y j 200 Hva blir det tilsvarende uttrykket for A? Finn variansen til B uttrykt ved σ 2. Resultatet av de 10 målingene i g/tonn er gitt nedenfor: x i 0 0 0 0 0 40 40 40 40 40 y i 248 176 52 98 76 682 854 870 838 806 La ȳ V være gjennomsnittet av målingene i den vestre enden og ȳ E være gjennomsnittet av målingene i den østre enden. Til hjelp for videre utregninger får du opplyst at ȳ V = 130, ȳ E = 810, 5 (y j ȳ V ) 2 = 26064, j=1 10 j=6 (y j ȳ E ) 2 = 22720 c) Finn et estimat for σ 2 basert på disse dataene. Fra erfaring med andre sølvårer med relativt lite sølv i den ene enden, blir det fra økonomisk hold uttalt at β nok må være større enn 12 for at sølvåren skal være lønnsom. Gir dataene grunnlag for å påstå at β > 12? Formuler spørsmålsstillingen som en hypotesetest og utfør testingen. Hva blir konklusjonen når signifikansnivået settes til 5%? d) En av personene i ledelsen for firmaet som eier sølvåren, hevder at det hadde blitt et sikrere estimat for β om de 10 prøvene hadde blitt tatt med noenlunde jevne mellomrom langs sølvåren. Anta at dette hadde blitt gjort, og at en fremdeles hadde x = 20. Ville variansen til estimatoren for β i den gitte modellen da blitt mindre? Begrunn svaret. Personen insisterte på at det måtte tas en ekstra prøve midt i sølvåren, dvs. for x = 20. Resultatet av denne ble 600 g/tonn. Vurder om denne verdien er rimelig ut i fra modellen ved å se om den er inneholdt i et 95% prediksjonsintervall for en slik prøve. Du får opplyst at ( ) V ar(y 0 Ŷ0) = σ 2 1 + 1 n + (x 0 x) 2 n j=1 (x j x) 2 der Y 0 er en ny observasjon for sølvinnholdet i et punkt x 0, Ŷ0 = A+Bx 0, og n er antall observasjonspunkter som estimeringen er basert på.

Oppgave 3 En viktig vitenskapelig oppdagelse fant sted i 1929 da Edwin Hubble oppdaget at universet er ekspanderende. Hubble s tallmateriale bestod blant annet av; x i = avstanden til galakse i (målt i millioner lysår), og y i = hastigheten til galakse i (målt i 1000 km/s). Verdiene Hubble benyttet i en av sine analyser er som følger: Navn Avstand, x i Hastighet, y i Virgo 22 1.2 Pegasus 68 3.8 Perseus 108 5.1 Coma Berenices 137 7.5 Ursa Major 1 255 14.9 Leo 315 19.2 Corona Borealis 390 21.4 Gemini 405 23.0 Bootes 685 39.2 Ursa Major 2 700 41.6 Hydra 1100 60.8 Det oppgis her at 11 i=1 x i = 4185, 11 i=1 y i = 237.7, 11 i=1 x2 i = 2685141 og 11 i=1 x iy i = 152224. Hubble foreslo en modell for hastighet som funksjon av avstand på formen y = βx, der β senere har blitt kalt Hubble s konstant. En statistisk versjon av ligningen kan gis ved: Y i = βx i + ε i, i = 1,..., 11, (3.1) der ε i, i = 1,..., 11, er uavhengige og normalfordelte stokastiske variabler med forventning 0 og varians σ 2. a) Vi vil i første omgang finne en estimator for β. Bruk minste kvadraters metode (method of least squares) til å estimere β med utgangspunkt i ligning (3.1), og vis at estimatoren for β da blir gitt ved ˆβ = estimatet for β basert på dataene over. Finn også forventning og varians til ˆβ. 11 i=1 x iy i 11 i=1 x2 i b) Anta at en annen galakse befinner seg en avstand x 0 = 900 millioner lysår borte. Finn predikert hastighet, ŷ 0, til denne galaksen.. Regn ut Utled et 95% prediksjonsintervall for en måling av hastigheten til denne galaksen. Det oppgis at 11 i=1 (y i ŷ i ) 2 = 9.87, der ŷ i = ˆβx i. Fasit 1. b) [ 0.199, 0.126] c) 99.3,[91.8, 106.7] d) 2073 2. a) 0.266, 0.48 b) σ 2 /4000 c) s 2 = 6098 d) [281.1, 658.9]

3. a) 0.0567 b) 51.03, (48.5,53.5)