UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-aturviteskapelige fakultet Eksame i STK2120 Statistiske metoder og dataaalyse 2 Eksamesdag: Madag 6. jui 2011. Tid for eksame: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tabeller for ormal- og t-fordelig. Tillatte hjelpemidler: Lærebok: Moore & McCabe Itroductio to the practice of Oppgave 1 (a) Modell: Kotroller at oppgavesettet er komplett før du begyer å besvare spørsmålee. X ijk = µ + α i + β j + γ ij + ε ijk der ε ijk er uavhegige, ormalfordelte med forvetig 0 og varias σ 2. For å ugå overparametriserig, har vi begresigee α i = β j = γ ij = γ ij = 0 j j i j der de to siste gjelder for alle j og alle i, heholdsvis. Estimat på variase er 5.99 i dette tilfellet, (MS for residuals). (b) Tredje lije svarer til H 0 : γ ij = 0, for alle i, j. Naturlig å først teste dee hypotese. Her vil vi ikke forkaste hypotese (med P-verdi lik 0.251). Gitt at vi ikke fikk sigifikate iteraksjosledd, er det foruftig å gå videre og teste hovedeffekter. Første lije svarer til H 0 : α i = 0 for alle i. Forkastes med P-verdi lik 0.0018 Adre lije svarer til H 0 : β j = 0,for alle j. Forkastes med P-verdi tilærmet lik 0. E ka da forekle modelle til X ijk = µ + α i + β j + ε ijk dvs ige iteraksjosledd. (Fortsettes på side 2.)

Eksame i STK2120, Madag 6. jui 2011. Side 2 Oppgave 2 (a) For å bruke χ 2 teste bør e ha e forvetet verdi på mist 5 for hver kategori. De to siste kategoriee har mye midre forvetiger, me hvis vi slår de samme med de 3. kategorie, vil alle kategorier tilfredsstille dette. Med 3 kategorier og e fri parameter har vi 3-1-1=1 frihetsgrad. Dette betyr at vi vil forkaste H 0 : Data følger Poisso fordelige hvis χ 2 > χ 2 α,1 = 3.841 hvis α = 0.05. I dette tilfellet er testobservatore lagt større og vi får dermed forkastig. Side også χ 2 > χ 2 0.001,1 = 10.82, så er P-verdie midre e 0.001. Vi ka dermed kokludere med at vi ka forkaste hypotese om at dataee følger e Poisso fordelig på sigifikasivå 0.05 (P-verdi < 0.001). (b) Da θ = Pr(Y = 0t), må vi ha 0 θ 1. For θ = e λ blir Pr(Y = y) = λy e λ y! for alle y, som svarer til Poisso fordelige. (c) Vi har at L(θ) = = Dermed blir l(θ) = p(y i ) = i=1 i=1 p(y) P i=1 I(y i=y) = N y log(p(y)) =N 0 log(p(0)) + p(y) I(y i=y) p(y) Ny. N y log(p(y)) =N 0 log(θ)+ N y [log(1 θ) + λ log( 1) + y log(λ) λ log(y!)] =Kost + N 0 log(θ) + ( N 0 ) log(1 θ) ( N 0 ) log( 1) + log(λ) yn y. (Fortsettes på side 3.)

Eksame i STK2120, Madag 6. jui 2011. Side 3 (d) Score-fuksjoe er de deriverte av log-likelihood fuksjoe mhp parametree. Vi har at s 1 (θ) = θ l(θ) og = N 0 θ N 0 1 θ s 2 (θ) = λ l(θ) = ( N 0 ) 1 + 1 λ yn y Videre er E[s 1 (θ)] = θ θ θ 1 θ = 0. Tilsvarede er E[s 2 (θ)] = ( θ) 1 + (1 θ)1 λ 1 λ = (1 θ)[ 1 eλ 1 ] = 0 De geerelle teorie sier også at forvetige skal være ull. Mellomregig, ikke krevd i oppgave Merk at side s 1 ikke avheger av λ, så er kryss-leddee i iformasjosmatrisee lik 0. 2 θ 2l(θ) =N 0 θ 2 + N 0 (1 θ) 2 med forvetig mes E[ 2 θ2l(θ)] =θ θ + θ 2 (1 θ) = 2 θ + 1 θ 2 λ 2l(θ) = ( N 0) ( 1) + 1 2 λ 2 med forvetig λ yn y E[ 2 e λ2l(θ)] = ( θ) ( 1) + 1 2 λ 2(1 θ) 1 λ [ 1 =(1 θ) 1 λ 1 ] 1 (Fortsettes på side 4.)

Eksame i STK2120, Madag 6. jui 2011. Side 4 (e) Et problem med Newto-Raphso algoritme er at J ikke behøver å være positiv defiit. Hvis de ikke er det, vil de kvadratiske tilærmige ikke ha et maksimumspukt, og oppdaterige ka gi e dårligere gjett på makspuktet e forrige verdi. Scorig-algoritme er e modifikasjo av N-R, ved at J erstattes med des forvetig, I. Side I er kovariasmatrise til scorig fuksjoe, vil de alltid være positivt defiit, og dermed løse dee svakhete ved N-R. At iformasjosmatrisee er diagoale, betyr at de to parametree oppdateres uavhegige av hveradre oe som både forekler og ka gi raskere koverges (dette har vi ikke diskutert i kurset). (f) Vi har at θ (s+1) =θ (s) + N 0 N 0 θ (s) 1 θ (s) θ (s) 1 θ (s) =θ (s) + N 0(1 θ (s) ) ( N 0 )θ (s) (1 θ (s) ) θ (s) =θ (s) + N 0 θ(s) = N 0 Dee verdie avheger ikke av θ (s) slik at vi vil få de samme verdie på hver eeste iterasjo. (g) Ka løse s 1 (θ) = 0 direkte. Gir N 0 θ N 0 1 θ = 0 N 0 (1 θ) ( N 0 )θ = 0 θ = N 0 Ka dermed sette dee løsige i direkte og behøver ku å optimere likelihood fuksjoe mhp é parameter. Dette gir som regel mye raskere koverges til max-pukt. Dette er et rimelig estimat side θ er sasylighete for y = 0 og N 0 / er adele med y = 0. Ved å sette i dette estimatet direkte kue e bruke dimesjosreduksjo i optimerig som da ville gi e eklere algoritme. (Fortsettes på side 5.)

Eksame i STK2120, Madag 6. jui 2011. Side 5 (h) Side iformasjosmatrisee er diagoale, er også de iverse diagoale. Dermed vil de asymptotiske kovariasmatrisee være diagoale og estimatee ˆθ og ˆλ er tilærmet uavhegige. Et 95% kofidesitervall for θ er [ˆθ ± z 0.025 sˆθ. Med z 0.025 = 1.960 og sˆθ = 1/I 11 = 0.0289, får vi et itervall [0.696, 0.810]. Et 95% kofidesitervall for λ er [ˆλ ± z 0.025 sˆλ]. Med z 0.025 = 1.960 og sˆλ = 1/I 22 = 0.164, får vi et itervall [0.651, 1.294]. (i) Parametrisk bootstrappig. Bootstrap itervall for θ: δ L = 0.695 0.753 = 0.058, δ U = 0.812 0.753 = 0.059 som gir itervallet [0.695, 0.812]. Bootstrap itervall for λ: δ L = 0.656 0.972 = 0.316, δ U = 1.298 0.972 = 0.326 som gir itervallet [0.646, 1.288]. Svært like itervaller. Idikerer at ormaltilærmig er rimelig. (j) Øsker å teste H 0 : θ = exp( λ). Ka lage et bootstrap kofidesitervall for θ exp( λ). Hvis dette ikke dekker 0, betyr det at θ er sigifikat forskjellig fra exp( λ) og vi ka forkaste H 0.