TMA4240 Statistikk Høst 2015

Like dokumenter
TMA4245 Statistikk. Øving nummer 12, blokk II Løsningsskisse. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk 2014

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2015

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

TMA4245 Statistikk Vår 2015

TMA4245 Statistikk Eksamen 20. desember 2012

TMA4245 Statistikk Eksamen mai 2017

ST1201 Statistiske metoder

TMA4240 Statistikk Eksamen desember 2015

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

TMA4245 Statistikk Eksamen 9. desember 2013

TMA4240 Statistikk Høst 2015

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

TMA4240 Statistikk Høst 2009

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

TMA4240 Statistikk Høst 2016

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

TMA4245 Statistikk Eksamen august 2015

TMA4240 Statistikk Høst 2016

n 2 +1) hvis n er et partall.

Løsningsforslag Oppgave 1

TMA4240 Statistikk 2014

Løsningsforslag til eksamen i STK desember 2010

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

ECON240 Statistikk og økonometri

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Til nå, og så videre... TMA4240 Statistikk H2010 (25) Mette Langaas. Foreleses mandag 15.november, 2010

STK1100 våren 2017 Estimering

TMA4240/4245 Statistikk 11. august 2012

LØSNING: Eksamen 28. mai 2015

TMA4245 Statistikk Eksamen 9. desember 2013

TMA4240 Statistikk Høst 2009

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

ST1201 Statistiske metoder

f(x)dx = F(x) = f(u)du. 1 (4u + 1) du = 3 0 for x < 0, 2 + for x [0,1], 1 for x > 1. = 1 F 4 = P ( X > 1 2 X > 1 ) 4 X > 1 ) =

TMA4245 Statistikk Eksamen august 2014

Lineær regresjonsanalyse (13.4)

MOT310 Statistiske metoder 1, høsten 2011

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Gir vi de resterende 2 oppgavene til én prosess vil alle sitte å vente på de to potensielt tidskrevende prosessene.

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

TMA4240 Statistikk Høst 2009

MOT310 Statistiske metoder 1, høsten 2012

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Estimering 1 -Punktestimering

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Estimering 1 -Punktestimering

UNIVERSITETET I OSLO

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Continuity. Subtopics

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

TMA4245 Statistikk. Øving nummer b5. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Oppgaver fra boka: X 2 X n 1

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

UNIVERSITETET I OSLO

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

Tentative solutions to TMA4240 Statistics, December 18, 2010

Estimering 2. -Konfidensintervall

TMA4240 Statistikk Høst 2013

Kapittel 8: Estimering

Slope-Intercept Formula

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Deskriptiv statistikk for sentrum og spredning i fordelingen. Gjennomsnitt og standardavvik. eller

Løsningsforslag andre obligatoriske oppgave i STK 1110 høsten 2014

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

TMA4245 Statistikk Eksamen 21. mai 2013

Mer om utvalgsundersøkelser

Kap. 9: Inferens om én populasjon

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

11,7 12,4 12,8 12,9 13,3.

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

TMA4240 Statistikk Høst 2016

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

Løsningsforslag ST2301 øving 3

TMA4100 Matematikk 1 Høst 2014

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsning TALM1005 (statistikkdel) juni 2017

UNIVERSITETET I OSLO

Statistikk og økonomi, våren 2017

To-utvalgstest (def 8.1) vs ettutvalgstest: Hypotesetesting, to utvalg (Kapitel 8) Longitudinell studie (oppfølgingsstudie) - eqn 8.1. Eksempel 8.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Physical origin of the Gouy phase shift by Simin Feng, Herbert G. Winful Opt. Lett. 26, (2001)

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Transkript:

Høst 205 Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Øvig ummer 2, blokk II Løsigsskisse Oppgave a - β agir biles besiforbruk i liter/mil - Rimelig med α 0 fordi med x 0 ige kjørig brukes ige besi - e tur av legde x x ka tekes sammesatt av to turer på x 2 x/2 og x 3 x/2. La Y, Y 2, Y 3 være tilhørede besiforbruk. Det er da rimelig å kreve at VarY VarY 2 + VarY 3. Dette oppås ved å velge VarY xσ 2 b β 0.75, x 5.0, σ 2 0. 2 Dette betyr at Y y; βx, xσ 2 y; 3.75, 0.05 Ser så på to kjøreturer P Y > 4 P Y 4 P Y y; 3.75, 0.05 og Y 2 y; 7.5, 0. Φ.2 0.869 0.3 Y 3.75 4 3.75 0.05 0.05 P.g.a. uavhegighet har vi at Z Y + Y 2 z; 3.75 + 7.5, 0.05 + 0.0. P Z < 2 P 0.974 z.25 2.25 Φ.94 0.5 0.5 U Y 2 2Y z; 0, 0. + 4 0.05 P Y 2 2Y > 0 P U > 0 0.5 Side fordelige til U er symmetrisk om u 0. ov2-lsf-b 25. ovember 205 Side

Høst 205 c Studerer to estimatorer ˆβ og β E ˆβ E Y i E Y i EY i β β β Var ˆβ Var Y i Var Y i 2 σ 2 2 σ2 VarY i 2 σ 2 E β E Var β Var 2 β Y i E Yi β β x i β 2 Var σ 2 x 2 i Y i σ2 2 x i Yi EY i 2 VarY i x 2 i Vi ser at begge estimatoree er forvetigsrette. Vi foretrekker de med mist varias. Med oppitte tall for ee får vi Var ˆβ σ 2 0.00299 og Var β σ 2 0.007 Det vil si at vi foretrekker ˆβ d H 0 : β 0.56 mot H : β > 0.56 ˆβ blir ormalfordelt side de er e lieærkombiasjo av uavhegige, ormalfordelte variabler. Uder H 0 vil e ha at E ˆβ 0.56 og Var ˆβ Vi beytter testobservatore U ˆβ 0.56 σ 2 σ2 u; 0, uder H 0 Vi forkaster H 0 dersom U > k, der k bestemmes fra kravet P Forkast H 0 år H 0 er riktig 0.05 ov2-lsf-b 25. ovember 205 Side 2

Høst 205 det vil si at k u 0.05.645 Isatt observasjoee: ˆβ 0.584 σ 2 0. 2 335 U 0.584 0.56 0. 2 335 4.38 > k Det vil si Forkast H 0. Vi vil da påstå at bile bruker mer besi e forhadlere sier. e Vet at V ˆβ β σ 2 v; 0, P ˆβ u 0.025 σ P u 0.025 V u 0.025 0.95 P u 0.025 ˆβ β u σ 2 0.025 0.95 x β ˆβ + u 0.025 σ x 0.95 Vi fier da et 95% kofidesitervall for β [ ] ˆβ u 0.025 σ x, ˆβ + u 0.025 σ x Isatt for tallverdiee ˆβ 0.584, σ 0., 335 og u 0.025.96 får vi da [0.573, 0.595] Oppgave 2 a Miste kvadraters metode miimerer SSEβ y i β 2. Dette tilsvarer: y i β x2 i Isettig gir ˆβ 0.0567. dβ 0 y i β x 2 i 0 som gir svaret. ov2-lsf-b 25. ovember 205 Side 3

Høst 205 Forvetig og varias blir V ar[ ˆβ] E[ ˆβ] x ie[y i ] x2 i x2 i V ar[y i] x2 i 2 b Predikert verdi er ŷ 0 x 0 ˆβ 900 0.0567 5.03. x2 i β x2 i x2 i σ2 x2 i β σ2 2 x2 i Merk at ŷ 0 er predikert verdi som vi fier ved å følge regresjoslija medd x x 0 isatt estimatet for β basert på observasjoee i oppgave. ŷ 0 er e realisasjo av de stokastiske variable Ŷ0 ˆβx 0, der ˆβ er de stokastiske estimatore for β. Videre er y 0 de sae hastighete til galakse, som er e realisasjo av de stokastiske variabele Y 0, og vi har atatt at Y 0 er gitt ved Y 0 βx 0 + ε. Vi har at forskjelle ŷ 0 y 0 er e realiserig av forskjelle mellom de to stokastiske variablee; Ŷ0 Y 0. Videre er EŶ0 Y 0 E ˆβx 0 βx 0 + ε βx 0 βx 0 0 0. VarŶ0 Y 0 Var ˆβx 0 βx 0 + ε Var ˆβx 0 ε x2 0 σ2 x2 i Et estimat for σ er s 0 9.87 0.993. Vi har at T Ŷ 0 Y 0 s + σ 2, + 9002 x2 i t 0. Da blir et 95% prediksjositervall for dee sae hastighete y 0 gitt ved ŷ 0 t 0,0.025 s + 9002, ŷ 0 + t 0,0.025 s + 9002, x2 i x2 i der t 0.025,0 2.23. Isettig gir 48.5, 53.5. Oppgave 3 a TIPS: se otat til øvig 2 på hjemmeside for utledig av adre likhetsteg x i xy i ȳ x 2 xy i x i x ˆβ y i x i y i x2 i 2 2 752 667 35 727 y i x y i x2 i x 24 925 7 94 24 5. 9252 ˆβ 0 y i ˆβ 7 94 24 5 925 24 465. We have Var ˆβ σ 2 / x 2. Kommetar: Vi har fått spm om å vise tydeligere hvorda dee variase reges ut. Først må vi ov2-lsf-b 25. ovember 205 Side 4

Høst 205 huske at ˆβ 5 som vi reget ut over er et estimat for parametere. Nå ser vi på ˆβ som e estimator og da bytter vi ut observasjoer av stokastiske variabler y i med de stokastiske variablee Y i. Merk at alltid er kostate. Vi tar varias ved å bruke formele for ˆβ, og husker at VaraY a 2 V ary, der a er e kostat og Y er e stokastisk variabel. Vi bruker at VarY i Varɛ i σ 2. Se otatet på hjemmeside for hedige omskriviger av formele for ˆβ, me merk at alle riktige uttrykk for ˆβ vil gi riktig resultat. Vi har Var ˆβ Var xy i Ȳ x 2 Var x i xy i x 2 x 2 VarY i x 2 2 σ 2 x 2 x 2 2 σ 2 x 2 The T ˆβ β s b, where s b s x 2 s. x2 i / 2 Based o the t-distributio P t 2,α/2 < T < t 2,α/2 α. This gives: P ˆβ t 2,α/2 s b < β < ˆβ + t 2,α/2 s b α. Usig t 22,0.025 2.07 we get: 5 ± 2.07 94/ 35727 /24925 2, 5 ± 46 69, 6. b Predictio at week 40: ŷ 0 ˆβ 0 + ˆβ 40 465 + 5 40 335. Ŷ 0 Y 0 is Gaussia distributed. Because of ubiased estimates ˆβ 0 ad ˆβ, we have mea EŶ0 β 0 + β 40. We also have EY 0 β 0 + β 40. This meas EŶ0 Y 0 0. We ext use that Ŷ0 ˆβ 0 + ˆβ x 0 Ȳ + ˆβ x 0 x. Recall that Ȳ ad ˆβ have zero covariace, i.e. CovȲ, ˆβ 0 you do ot have to show this. The mea of the data is x /24925 38.5. The variace is VarŶ0 Y 0 VarŶ0 + VarY 0 VarȲ + 40 x2 Var ˆβ + VarY 0 σ 2 / + σ 2 40 x 2 x 2 + σ2 ov2-lsf-b 25. ovember 205 Side 5

Høst 205 We estimate σ 2 with s 2 ad we get s 0 s + 40 x2 + x 2 94 + 24 + 40 38.5 2 35727 /24925 2 20 ad get a statistic with a T-distributio: Ŷ 0 Y 0 s 0 t 2. The, ad this gives: P t 2,α/2 < Ŷ0 Y 0 s 0 < t 2,α/2 α, P Ŷo t 2,α/2 s 0 < Y 0 < Ŷ0 + t 2,α/2 s 0 α. The sigificace level α 0. meas we set t 22,0.95.72. This gives predictio iterval 335 ±.72 20 2 789, 3 48. The iterval at week 42 has the same form, but ow we have a term 42 38.5 2 istead of 40 38.5 2 i the variace. 42 38.5 2 This gives oly a small icrease i the width sice 0.6 ad 35727 /24925 2 0.0296 are both relatively small compared with. We get width at week 40: ad width at week 42: 2.72 94 + /24 + 0.03 690, 2.72 94 + /24 + 0.6 732. The predictio iterval is arrowest at the mea of the week data, i.e., at week 39. 40 38.5 2 35727 /24925 2 c From the plot we clearly see that boys are heavier tha girls o average. The icrease with gestatioal weeks seem similar, ad for this reaso we fit the same slope. The error level seems to be about the same for boys ad girls, ad there is o reaso to use a differet variace. The model would predict a o-zero itercept term ad differet weight for boys ad girls at 0 weeks, which is utatural. Perhaps a model with differet slopes ad itercept 0 would be more appropriate. The agai the liear regressio model is valid oly withi the regio where data is available. b SSE y i β b β 2 + i b + y i β g β 2 We differetiatig this expressio ad set the derivative equal to 0. dβ g dβ b b b y i β b β b β b + β + y i 0 i b + y i β g β g β g + β i b + + b i b + y i 0 ov2-lsf-b 25. ovember 205 Side 6

Høst 205 From these two first expressios we have: b b ˆβ b / b y i ˆβ b / b ˆβ g / g y i ˆβ / g i b + i b + Here, g b 2. We have to isert these ito the expressio for β to solve for the slope: dβ b y i β b β i b + y i β g β dβ b y i + β b + β g Now, isertig for the solutio to the slopes we get: i b + + β x 2 i dβ a + β b 0, ˆβ a/b where a b y i / b b y i / g y i i b + i b + b b x 2 i / b 2 / g 2 i b + Isertig umbers we have: a 2 752 667 /2 36 258 460 /2 34 936 465 9 007, b 35 737 /2 460 2 /2 465 2 75. Fially, ˆβ 9 007/75 20.22. ˆβ b 36 258/2 20.22 /2 460 587. ˆβ g 34 936/2 20.22 /2 465 747. ov2-lsf-b 25. ovember 205 Side 7