Høst 205 Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Øvig ummer 2, blokk II Løsigsskisse Oppgave a - β agir biles besiforbruk i liter/mil - Rimelig med α 0 fordi med x 0 ige kjørig brukes ige besi - e tur av legde x x ka tekes sammesatt av to turer på x 2 x/2 og x 3 x/2. La Y, Y 2, Y 3 være tilhørede besiforbruk. Det er da rimelig å kreve at VarY VarY 2 + VarY 3. Dette oppås ved å velge VarY xσ 2 b β 0.75, x 5.0, σ 2 0. 2 Dette betyr at Y y; βx, xσ 2 y; 3.75, 0.05 Ser så på to kjøreturer P Y > 4 P Y 4 P Y y; 3.75, 0.05 og Y 2 y; 7.5, 0. Φ.2 0.869 0.3 Y 3.75 4 3.75 0.05 0.05 P.g.a. uavhegighet har vi at Z Y + Y 2 z; 3.75 + 7.5, 0.05 + 0.0. P Z < 2 P 0.974 z.25 2.25 Φ.94 0.5 0.5 U Y 2 2Y z; 0, 0. + 4 0.05 P Y 2 2Y > 0 P U > 0 0.5 Side fordelige til U er symmetrisk om u 0. ov2-lsf-b 25. ovember 205 Side
Høst 205 c Studerer to estimatorer ˆβ og β E ˆβ E Y i E Y i EY i β β β Var ˆβ Var Y i Var Y i 2 σ 2 2 σ2 VarY i 2 σ 2 E β E Var β Var 2 β Y i E Yi β β x i β 2 Var σ 2 x 2 i Y i σ2 2 x i Yi EY i 2 VarY i x 2 i Vi ser at begge estimatoree er forvetigsrette. Vi foretrekker de med mist varias. Med oppitte tall for ee får vi Var ˆβ σ 2 0.00299 og Var β σ 2 0.007 Det vil si at vi foretrekker ˆβ d H 0 : β 0.56 mot H : β > 0.56 ˆβ blir ormalfordelt side de er e lieærkombiasjo av uavhegige, ormalfordelte variabler. Uder H 0 vil e ha at E ˆβ 0.56 og Var ˆβ Vi beytter testobservatore U ˆβ 0.56 σ 2 σ2 u; 0, uder H 0 Vi forkaster H 0 dersom U > k, der k bestemmes fra kravet P Forkast H 0 år H 0 er riktig 0.05 ov2-lsf-b 25. ovember 205 Side 2
Høst 205 det vil si at k u 0.05.645 Isatt observasjoee: ˆβ 0.584 σ 2 0. 2 335 U 0.584 0.56 0. 2 335 4.38 > k Det vil si Forkast H 0. Vi vil da påstå at bile bruker mer besi e forhadlere sier. e Vet at V ˆβ β σ 2 v; 0, P ˆβ u 0.025 σ P u 0.025 V u 0.025 0.95 P u 0.025 ˆβ β u σ 2 0.025 0.95 x β ˆβ + u 0.025 σ x 0.95 Vi fier da et 95% kofidesitervall for β [ ] ˆβ u 0.025 σ x, ˆβ + u 0.025 σ x Isatt for tallverdiee ˆβ 0.584, σ 0., 335 og u 0.025.96 får vi da [0.573, 0.595] Oppgave 2 a Miste kvadraters metode miimerer SSEβ y i β 2. Dette tilsvarer: y i β x2 i Isettig gir ˆβ 0.0567. dβ 0 y i β x 2 i 0 som gir svaret. ov2-lsf-b 25. ovember 205 Side 3
Høst 205 Forvetig og varias blir V ar[ ˆβ] E[ ˆβ] x ie[y i ] x2 i x2 i V ar[y i] x2 i 2 b Predikert verdi er ŷ 0 x 0 ˆβ 900 0.0567 5.03. x2 i β x2 i x2 i σ2 x2 i β σ2 2 x2 i Merk at ŷ 0 er predikert verdi som vi fier ved å følge regresjoslija medd x x 0 isatt estimatet for β basert på observasjoee i oppgave. ŷ 0 er e realisasjo av de stokastiske variable Ŷ0 ˆβx 0, der ˆβ er de stokastiske estimatore for β. Videre er y 0 de sae hastighete til galakse, som er e realisasjo av de stokastiske variabele Y 0, og vi har atatt at Y 0 er gitt ved Y 0 βx 0 + ε. Vi har at forskjelle ŷ 0 y 0 er e realiserig av forskjelle mellom de to stokastiske variablee; Ŷ0 Y 0. Videre er EŶ0 Y 0 E ˆβx 0 βx 0 + ε βx 0 βx 0 0 0. VarŶ0 Y 0 Var ˆβx 0 βx 0 + ε Var ˆβx 0 ε x2 0 σ2 x2 i Et estimat for σ er s 0 9.87 0.993. Vi har at T Ŷ 0 Y 0 s + σ 2, + 9002 x2 i t 0. Da blir et 95% prediksjositervall for dee sae hastighete y 0 gitt ved ŷ 0 t 0,0.025 s + 9002, ŷ 0 + t 0,0.025 s + 9002, x2 i x2 i der t 0.025,0 2.23. Isettig gir 48.5, 53.5. Oppgave 3 a TIPS: se otat til øvig 2 på hjemmeside for utledig av adre likhetsteg x i xy i ȳ x 2 xy i x i x ˆβ y i x i y i x2 i 2 2 752 667 35 727 y i x y i x2 i x 24 925 7 94 24 5. 9252 ˆβ 0 y i ˆβ 7 94 24 5 925 24 465. We have Var ˆβ σ 2 / x 2. Kommetar: Vi har fått spm om å vise tydeligere hvorda dee variase reges ut. Først må vi ov2-lsf-b 25. ovember 205 Side 4
Høst 205 huske at ˆβ 5 som vi reget ut over er et estimat for parametere. Nå ser vi på ˆβ som e estimator og da bytter vi ut observasjoer av stokastiske variabler y i med de stokastiske variablee Y i. Merk at alltid er kostate. Vi tar varias ved å bruke formele for ˆβ, og husker at VaraY a 2 V ary, der a er e kostat og Y er e stokastisk variabel. Vi bruker at VarY i Varɛ i σ 2. Se otatet på hjemmeside for hedige omskriviger av formele for ˆβ, me merk at alle riktige uttrykk for ˆβ vil gi riktig resultat. Vi har Var ˆβ Var xy i Ȳ x 2 Var x i xy i x 2 x 2 VarY i x 2 2 σ 2 x 2 x 2 2 σ 2 x 2 The T ˆβ β s b, where s b s x 2 s. x2 i / 2 Based o the t-distributio P t 2,α/2 < T < t 2,α/2 α. This gives: P ˆβ t 2,α/2 s b < β < ˆβ + t 2,α/2 s b α. Usig t 22,0.025 2.07 we get: 5 ± 2.07 94/ 35727 /24925 2, 5 ± 46 69, 6. b Predictio at week 40: ŷ 0 ˆβ 0 + ˆβ 40 465 + 5 40 335. Ŷ 0 Y 0 is Gaussia distributed. Because of ubiased estimates ˆβ 0 ad ˆβ, we have mea EŶ0 β 0 + β 40. We also have EY 0 β 0 + β 40. This meas EŶ0 Y 0 0. We ext use that Ŷ0 ˆβ 0 + ˆβ x 0 Ȳ + ˆβ x 0 x. Recall that Ȳ ad ˆβ have zero covariace, i.e. CovȲ, ˆβ 0 you do ot have to show this. The mea of the data is x /24925 38.5. The variace is VarŶ0 Y 0 VarŶ0 + VarY 0 VarȲ + 40 x2 Var ˆβ + VarY 0 σ 2 / + σ 2 40 x 2 x 2 + σ2 ov2-lsf-b 25. ovember 205 Side 5
Høst 205 We estimate σ 2 with s 2 ad we get s 0 s + 40 x2 + x 2 94 + 24 + 40 38.5 2 35727 /24925 2 20 ad get a statistic with a T-distributio: Ŷ 0 Y 0 s 0 t 2. The, ad this gives: P t 2,α/2 < Ŷ0 Y 0 s 0 < t 2,α/2 α, P Ŷo t 2,α/2 s 0 < Y 0 < Ŷ0 + t 2,α/2 s 0 α. The sigificace level α 0. meas we set t 22,0.95.72. This gives predictio iterval 335 ±.72 20 2 789, 3 48. The iterval at week 42 has the same form, but ow we have a term 42 38.5 2 istead of 40 38.5 2 i the variace. 42 38.5 2 This gives oly a small icrease i the width sice 0.6 ad 35727 /24925 2 0.0296 are both relatively small compared with. We get width at week 40: ad width at week 42: 2.72 94 + /24 + 0.03 690, 2.72 94 + /24 + 0.6 732. The predictio iterval is arrowest at the mea of the week data, i.e., at week 39. 40 38.5 2 35727 /24925 2 c From the plot we clearly see that boys are heavier tha girls o average. The icrease with gestatioal weeks seem similar, ad for this reaso we fit the same slope. The error level seems to be about the same for boys ad girls, ad there is o reaso to use a differet variace. The model would predict a o-zero itercept term ad differet weight for boys ad girls at 0 weeks, which is utatural. Perhaps a model with differet slopes ad itercept 0 would be more appropriate. The agai the liear regressio model is valid oly withi the regio where data is available. b SSE y i β b β 2 + i b + y i β g β 2 We differetiatig this expressio ad set the derivative equal to 0. dβ g dβ b b b y i β b β b β b + β + y i 0 i b + y i β g β g β g + β i b + + b i b + y i 0 ov2-lsf-b 25. ovember 205 Side 6
Høst 205 From these two first expressios we have: b b ˆβ b / b y i ˆβ b / b ˆβ g / g y i ˆβ / g i b + i b + Here, g b 2. We have to isert these ito the expressio for β to solve for the slope: dβ b y i β b β i b + y i β g β dβ b y i + β b + β g Now, isertig for the solutio to the slopes we get: i b + + β x 2 i dβ a + β b 0, ˆβ a/b where a b y i / b b y i / g y i i b + i b + b b x 2 i / b 2 / g 2 i b + Isertig umbers we have: a 2 752 667 /2 36 258 460 /2 34 936 465 9 007, b 35 737 /2 460 2 /2 465 2 75. Fially, ˆβ 9 007/75 20.22. ˆβ b 36 258/2 20.22 /2 460 587. ˆβ g 34 936/2 20.22 /2 465 747. ov2-lsf-b 25. ovember 205 Side 7