UNIVERSITETET I OSLO

Like dokumenter
UNIVERSITETET I OSLO

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

TMA4245 Statistikk Eksamen mai 2017

Løsningsforslag til eksamen i STK desember 2010

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

UNIVERSITETET I OSLO

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

Estimering 1 -Punktestimering

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk Eksamen august 2015

Løsningsforslag ST2301 øving 3

Løsningsforslag Oppgave 1

ST1201 Statistiske metoder

Estimering 2. -Konfidensintervall

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

UNIVERSITETET I OSLO

Estimering 1 -Punktestimering

TMA4240 Statistikk Eksamen desember 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ST1201 Statistiske metoder

TMA4245 Statistikk Vår 2015

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

TMA4240 Statistikk Høst 2015

UNIVERSITETET I OSLO

ECON240 Statistikk og økonometri

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2016

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

UNIVERSITETET I OSLO

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

TMA4240/4245 Statistikk 11. august 2012

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

Løsning TALM1005 (statistikkdel) juni 2017

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Statistikk og økonomi, våren 2017

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

MOT310 Statistiske metoder 1, høsten 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Kap. 9: Inferens om én populasjon

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Hypotesetesting, del 4

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk Eksamen 9. desember 2013

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Kapittel 8: Estimering

Kap. 9: Inferens om én populasjon

TMA4240 Statistikk Høst 2016

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Econ 2130 Forelesning uke 11 (HG)

EKSAMEN I TMA4245 Statistikk

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4240 Statistikk 2014

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

Lineær regresjonsanalyse (13.4)

n 2 +1) hvis n er et partall.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

UNIVERSITETET I OSLO

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Oppsummering av STK2120. Geir Storvik

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Oversikt over konfidensintervall i Econ 2130

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Ekstraoppgaver for STK2120

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Oversikt over konfidensintervall i Econ 2130

Transkript:

UNIVERSITETET I OSLO Det matematisk-aturviteskapelige fakultet Eksame i STK2120 Statistiske metoder og dataaalyse 2 Eksamesdag: Madag 6. jui 2011. Tid for eksame: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tabeller for ormal- og t-fordelig. Tillatte hjelpemidler: Lærebok: Moore & McCabe Itroductio to the practice of Oppgave 1 (a) Modell: Kotroller at oppgavesettet er komplett før du begyer å besvare spørsmålee. X ijk = µ + α i + β j + γ ij + ε ijk der ε ijk er uavhegige, ormalfordelte med forvetig 0 og varias σ 2. For å ugå overparametriserig, har vi begresigee α i = β j = γ ij = γ ij = 0 j j i j der de to siste gjelder for alle j og alle i, heholdsvis. Estimat på variase er 5.99 i dette tilfellet, (MS for residuals). (b) Tredje lije svarer til H 0 : γ ij = 0, for alle i, j. Naturlig å først teste dee hypotese. Her vil vi ikke forkaste hypotese (med P-verdi lik 0.251). Gitt at vi ikke fikk sigifikate iteraksjosledd, er det foruftig å gå videre og teste hovedeffekter. Første lije svarer til H 0 : α i = 0 for alle i. Forkastes med P-verdi lik 0.0018 Adre lije svarer til H 0 : β j = 0,for alle j. Forkastes med P-verdi tilærmet lik 0. E ka da forekle modelle til X ijk = µ + α i + β j + ε ijk dvs ige iteraksjosledd. (Fortsettes på side 2.)

Eksame i STK2120, Madag 6. jui 2011. Side 2 Oppgave 2 (a) For å bruke χ 2 teste bør e ha e forvetet verdi på mist 5 for hver kategori. De to siste kategoriee har mye midre forvetiger, me hvis vi slår de samme med de 3. kategorie, vil alle kategorier tilfredsstille dette. Med 3 kategorier og e fri parameter har vi 3-1-1=1 frihetsgrad. Dette betyr at vi vil forkaste H 0 : Data følger Poisso fordelige hvis χ 2 > χ 2 α,1 = 3.841 hvis α = 0.05. I dette tilfellet er testobservatore lagt større og vi får dermed forkastig. Side også χ 2 > χ 2 0.001,1 = 10.82, så er P-verdie midre e 0.001. Vi ka dermed kokludere med at vi ka forkaste hypotese om at dataee følger e Poisso fordelig på sigifikasivå 0.05 (P-verdi < 0.001). (b) Da θ = Pr(Y = 0t), må vi ha 0 θ 1. For θ = e λ blir Pr(Y = y) = λy e λ y! for alle y, som svarer til Poisso fordelige. (c) Vi har at L(θ) = = Dermed blir l(θ) = p(y i ) = i=1 i=1 p(y) P i=1 I(y i=y) = N y log(p(y)) =N 0 log(p(0)) + p(y) I(y i=y) p(y) Ny. N y log(p(y)) =N 0 log(θ)+ N y [log(1 θ) + λ log( 1) + y log(λ) λ log(y!)] =Kost + N 0 log(θ) + ( N 0 ) log(1 θ) ( N 0 ) log( 1) + log(λ) yn y. (Fortsettes på side 3.)

Eksame i STK2120, Madag 6. jui 2011. Side 3 (d) Score-fuksjoe er de deriverte av log-likelihood fuksjoe mhp parametree. Vi har at s 1 (θ) = θ l(θ) og = N 0 θ N 0 1 θ s 2 (θ) = λ l(θ) = ( N 0 ) 1 + 1 λ yn y Videre er E[s 1 (θ)] = θ θ θ 1 θ = 0. Tilsvarede er E[s 2 (θ)] = ( θ) 1 + (1 θ)1 λ 1 λ = (1 θ)[ 1 eλ 1 ] = 0 De geerelle teorie sier også at forvetige skal være ull. Mellomregig, ikke krevd i oppgave Merk at side s 1 ikke avheger av λ, så er kryss-leddee i iformasjosmatrisee lik 0. 2 θ 2l(θ) =N 0 θ 2 + N 0 (1 θ) 2 med forvetig mes E[ 2 θ2l(θ)] =θ θ + θ 2 (1 θ) = 2 θ + 1 θ 2 λ 2l(θ) = ( N 0) ( 1) + 1 2 λ 2 med forvetig λ yn y E[ 2 e λ2l(θ)] = ( θ) ( 1) + 1 2 λ 2(1 θ) 1 λ [ 1 =(1 θ) 1 λ 1 ] 1 (Fortsettes på side 4.)

Eksame i STK2120, Madag 6. jui 2011. Side 4 (e) Et problem med Newto-Raphso algoritme er at J ikke behøver å være positiv defiit. Hvis de ikke er det, vil de kvadratiske tilærmige ikke ha et maksimumspukt, og oppdaterige ka gi e dårligere gjett på makspuktet e forrige verdi. Scorig-algoritme er e modifikasjo av N-R, ved at J erstattes med des forvetig, I. Side I er kovariasmatrise til scorig fuksjoe, vil de alltid være positivt defiit, og dermed løse dee svakhete ved N-R. At iformasjosmatrisee er diagoale, betyr at de to parametree oppdateres uavhegige av hveradre oe som både forekler og ka gi raskere koverges (dette har vi ikke diskutert i kurset). (f) Vi har at θ (s+1) =θ (s) + N 0 N 0 θ (s) 1 θ (s) θ (s) 1 θ (s) =θ (s) + N 0(1 θ (s) ) ( N 0 )θ (s) (1 θ (s) ) θ (s) =θ (s) + N 0 θ(s) = N 0 Dee verdie avheger ikke av θ (s) slik at vi vil få de samme verdie på hver eeste iterasjo. (g) Ka løse s 1 (θ) = 0 direkte. Gir N 0 θ N 0 1 θ = 0 N 0 (1 θ) ( N 0 )θ = 0 θ = N 0 Ka dermed sette dee løsige i direkte og behøver ku å optimere likelihood fuksjoe mhp é parameter. Dette gir som regel mye raskere koverges til max-pukt. Dette er et rimelig estimat side θ er sasylighete for y = 0 og N 0 / er adele med y = 0. Ved å sette i dette estimatet direkte kue e bruke dimesjosreduksjo i optimerig som da ville gi e eklere algoritme. (Fortsettes på side 5.)

Eksame i STK2120, Madag 6. jui 2011. Side 5 (h) Side iformasjosmatrisee er diagoale, er også de iverse diagoale. Dermed vil de asymptotiske kovariasmatrisee være diagoale og estimatee ˆθ og ˆλ er tilærmet uavhegige. Et 95% kofidesitervall for θ er [ˆθ ± z 0.025 sˆθ. Med z 0.025 = 1.960 og sˆθ = 1/I 11 = 0.0289, får vi et itervall [0.696, 0.810]. Et 95% kofidesitervall for λ er [ˆλ ± z 0.025 sˆλ]. Med z 0.025 = 1.960 og sˆλ = 1/I 22 = 0.164, får vi et itervall [0.651, 1.294]. (i) Parametrisk bootstrappig. Bootstrap itervall for θ: δ L = 0.695 0.753 = 0.058, δ U = 0.812 0.753 = 0.059 som gir itervallet [0.695, 0.812]. Bootstrap itervall for λ: δ L = 0.656 0.972 = 0.316, δ U = 1.298 0.972 = 0.326 som gir itervallet [0.646, 1.288]. Svært like itervaller. Idikerer at ormaltilærmig er rimelig. (j) Øsker å teste H 0 : θ = exp( λ). Ka lage et bootstrap kofidesitervall for θ exp( λ). Hvis dette ikke dekker 0, betyr det at θ er sigifikat forskjellig fra exp( λ) og vi ka forkaste H 0.