ST Statistiske metoder Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Løsigsforslag - Eksame desember Oppgave a) Dette er e ANOVA-tabell for k-utvalg med k 4 og j 6 for j,,3,4. De fullstedige ANOVA-tabelle blir der og Kilde df SS MS F Betog k 3 473.3 5734.38.9 Error 6 4 4 867.5 5433.58 Total 6 4 3 55874.63 SSTR MSTR 3 473.4, MSE SSE 86.5 5433.58, SSTOT SSTR+SSE 473.3+867.5 55874.63 F MSTR MSE 5734.38 5433.58.9. Testobservatore F relaterer seg til hypotesee H : µ µ µ 3 µ 4 mot H : ikke slik, der µ i, for i,,3,4, er forvetet opptatt fuktighet for betog av type ummer i. Når H er riktig er F Fisher fordelt med 3 og frihetsgrader. Fier kritisk verdi for α.5 fra tabell til å være f.5,3, 3.. Beslutigsregele blir dermed at vi skal forkaste H år F > 3.. Betogdataee gav F.9 < 3. slik at koklusjoe blir at vi skal ikke forkaste H. eksdesl August, Side
ST Statistiske metoder b) E to-utvalgt-test baserer seg på at ma har observasjoer av stokastiske variablerx,...,x og Y,...,Y m der alle X i -er og Y i er uavhegige av hveradre, Ma beytter da testobervatore X i Nµ X,σ ) og Y i Nµ Y,σ ). T X Ȳ Sp + m) som er Studet t-fordelt med +m frihetsgrader år H : µ X µ Y er riktig. Variasestimatore SP er gitt ved formele S p )S X +m )S Y +m Vi lar X i -ee og Y i -ee være heholdsvis data for betog av type 3 og 4. Ved å beytte oppgitte verdier for SX og S Y i tabelle på første side av oppgavesettet får ma s P 5 3593.5+5 374.7 3648.89, t. 3663 6 94 6 3648.89 6 + 6 ) 3.53. Ma må her beytte e tosidig test slik at kritisk verdi blir tα,+m t.5,.8. Beslutigsregele blir dermed at ma skal forkaste H dersom T <.8 eller T >.8. Vi observerte t 3.53 >.8, slik at koklusjoe blir at vi forkaster H. Det er ikke urimelig at vi i pukt a) kokluderer med at det ikke er sigifikat forskjell mellom forvetigsverdiee til de fire utvalgee, mes vi her i pukt b) kokluderer med at det er sigifikat forskjell mellom forvetigsverdiee til utvalg 3 og 4. Vi ka spesielt legge merke til at vi her i pukt b) sammeliger de to av de fire utvalgee som har størst avvik i gjeomsittsverdi. Vi ka også legge merke til at empirisk varias for utvalg ummer er betydelig større e for de adre tre utvalgee. ANOVA-aalyse baserer seg som kjet på atagelse om lik varias for alle utvalg. De store empiriske variase for utvalg ummer vil dermed føre til at estimatert pooled ) varias i ANOVA-aalyse blir betydelig større e tilsvarede størrelse i t-teste. Oppgave a) Rimelighetsfuksjoe blir her Lp) f Y y;p) m y ) p y p) m y. eksdesl August, Side
ST Statistiske metoder Log-rimelilighetsfuksjoe blir dermed m lp) llp) l y ) +y lp+m y)l p). Deriverer og setter lik ull: l p) + y p +m y p ) y p m y p y p) pm y) y yp pm py p y m. Dermed får vi at SME blir p Y m. Side vi ku har e parameter vi skal estimaere, og ku har e observasjo, fier ma mometestimatore ved å sette forvetet verdi for Y lik observert verdi for Y. Side EY mp får vi m p Y p Y m. b) E estimator θ for e parameter θ er e beste estimator hvis de er forvetigsrett og har mist like lite varias som ehver ae forvetigsrett estimator. For å vise at e estimator er e beste estimator ka ma sjekke at de er forvetigsrett og sjekke at variase til estimatore er lik Cramér-Raos edre grese for forveitigsrette estimatorer. For p har vi Y E p E EY m m mp m p, og Y VarY Var p Var m m mp p) m p p) m. Reger ut Cramér-Raos edre grese, Starter med ) m lf Y y;p) l +y lp+m y)l p). y Deriverer to gager med hesy på p: lf Y y;p) p y p + m y p ) y p m y p, lf Y y;p) p y p m y m y ) p) p) y p. eksdesl August, Side 3
ST Statistiske metoder Tar forvetigsverdie, lfy y;p) m y E E p p) y p m EY p) EY p m mp p) mp p m p m p m p+p) p p) m p p). Cramé-Raos edre grese for varias av forvetigsrette estimatorer blir dermed hvor vi beytter at p er basert på ku stokastiske variabler), { E lf Y Y;θ) θ } p p) m. Vi ser dermed at p var forvetigsrett og at variase for p er lik Cramér-Raos edre grese. Dermed er p e beste estimator for p. c) Vi ser at θ er forvetigsskjev fordi E θ E Y Y EY EY m m mp mp p)+mp) m Vi ser at θ er assymptotisk forvetigsrett fordi m lim θ E lim m m m θ mp VarY+EY m mp p p)+mp m )p p) m m θ θ. Vi ser at vi får e forvetigsrett estimator med å dele θ på m )/m. De forvetigsrette estimatore blir dermed Oppgave 3 a) Rimelighetsfuksjoe blir Lα,β) θ θ m m θ. my Y ). m m { exp } π σ σ y i α βx i x)). eksdesl August, Side 4
ST Statistiske metoder Logrimelighetsfuksjoe blir lα,β) lπ) lσ σ y i α βx i x)) lπ) lσ σ y i α βx i x)). Partiellderiverer med hesy på α og setter lik ull, l α σ y i α βx i x)) ) y i α β x i x) α y i, hvor vi har beyttet at x i x). Partiellderiverer så med hesy på β og setter lik ull, l β σ y i α βx i x)) x i x)) y i x i x) α x i x) β x i x) β x i x)y i x i x), hvor vi igje har beyttet at x i x). Sasylighetsmaksimerigsestimoree for α og β er dermed gitt ved α Ȳ Y i og β x i x)y i x i x). Ved å beytte at Y,...,Y er uavhegige får vi Var β Var x i x)y i x i x) Var x i x)y i x i x) ) Varx i x)y i x i x) ) x i x) VarY i x i x) ) x i x) σ x i x) ) σ x i x) x i x) ) σ x i x). eksdesl August, Side 5
ST Statistiske metoder b) β er e lieærkombiasjo avy i -ee som er uavhegige og ormalfordelte variabler. Dermed blir også β ormalfordelt, dvs. σ β ) N β, x i x). Dermed har vi også at slik at β β P z a β β N,) σ x i x) za σ x i x) a Løser hver ulikhet med hesy på β. Starter med de første, za β β σ β za σ x i x) β β σ +za x i x) β x i x) β β za σ x i x) β β +za Må dermed også ha at σ P β za x i x) β β +za σ x i x) β β za σ x i x) ) a. Et a) % kofidesitervall for β blir dermed σ β za x i x),β +z σ a x i x). σ x i x) c) For å fie et prediksjositervall tar vi utgagspukt i α+ βx x) Y. eksdesl August, Side 6
ST Statistiske metoder Dee vil være ormalfordelt fordi det er e lieærkombiasjo av uavhegige ormalfordelte variabler, emlig Y,...,Y og Y. Dette ka vi se ved å sette i i uttrykket over hva vi i pukt a) fat for α og β. Forvetigsverdie til dette uttrykket blir E α+ βx x) Y E α+e β x x) EY α+βx x) α+βx x)). Side Y åpebart er uavhegig av α og β får vi for tilhørede varias Var α+ βx x) Y Var α+ βx x) + VarY ut Cov får vi at Var α+var βx x) Var α+x x) Var β +Cov α, βx x) +x x)cov Fra oppgavetekste har vi uttrykk for Var α og Var β α, β α, β + VarY + VarY, og VarY σ. Treger å rege. Ved å beytte at CovY i,y j VarY i σ dersom i j og lik hvis i j x i x) Dermed får vi at Var α+ βx x) Y og dermed også Cov α, β Cov x i x) x i x) Y i, j j j x j x)y j x i x) CovY i,x j x)y j x j x)covy i,y j x i x)σ σ x i x) x i x). σ + σ x x) x i x) +σ σ + + x x) ) x i x), α+ βx x) Y N,σ + + x x) )) x i x) og σ α+ βx x) Y ) N,), + + x x) x i x) eksdesl August, Side 7
ST Statistiske metoder slik at P z a α+ βx x) Y ) z a + + x x) a. x i x) σ Løser så hver ulikhet hver for seg med hesy på Y og setter deretter ulikhetee samme igje med Y alee i midte, og får P α+ βx x) za σ + + x x) ) x i x) Y α+ βx x)+za Et a) % prediksjositervall for Y blir dermed α+ βx x) za σ σ + + x x) x i x) ) ) a. + + x x) ), α+ x i x) βx x)+za σ + + x x) ) x i x). Vi ser at prediksjositervallet blir kortest år x x, dvs. år x x. eksdesl August, Side 8