Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Løsigsforsalg til første sett med obligatoriske oppgaver i STK1110 høste 2015 Oppgave 1 (a Et 100(1 α% kofidesitervall for forvetigsverdie µ er gitt ved formel (8.15 på side 403 i læreboka. For situasjoe i oppgave har vi 19 og α 0.10. Et 90% kofidesiterval for aldere til bergarte er dermed gitt som x ± t 0.05,18 s 19 For de 19 aldersmåligee har vi at x 276.9 og s 27.1. Av tabell A.5 på side 789 i læreboka har vi at t 0.05,18 1.734. Kofidesitervallet blir dermed dvs. 276.9 ± 1.734 27.1 19 276.9 ± 10.8 Et 90% kofidesitervall er altså fra 266.1 millioer år til 287.7 millioer år. (b Et estimat for måleusikkerhete er s 27.1 millioer år. Vi får et 100(1 α% kofidesitervall for σ ved å bruke framgagsmåte beskrevet på side 403 i læreboka. For situasjoe i oppgave blir et 90% kofidesitervall ( 18 18 s, s χ 2 0.05,18 χ 2 0.95,18 Av tabell A.7 på side 791 i læreboka har vi at χ 2 0.95,18 9.390 og χ 2 0.05,18 28.869. Kofidesitervallet blir dermed ( 18 18 27.1 28.869, 27.1 9.390 dvs. fra 21.4 millioer år til 37.5 millioer år. (c Kofidesitervallee i puktee (a og (b forutsetter at måligee er uavhegige og ormalfordelte. (Som vi vil se i oppgave 2 er dee forutsetige spesielt viktig for kofidesitervallet i pukt (b. For å sjekke atagelse om ormalfordelig, ka vi lage et ormalfordeligsplott (jf. avsitt 4.6 i læreboka. Plottet blir som vist på este side. 1

Side ormalfordeligsplottet er oelude som e rett lije, er atagelse om ormalfordelte måliger rimelig. Oppgave 2 (a Fra (1 i oppgavetekste har vi at P ( t α/2, 1 < X µ S/ < t α/2, 1 1 α der t α/2, 1 er gitt som på sidee 402 i læreboka. Vi omformer ulikhetee og fier S S P ( t α/2, 1 < X µ < t α/2, 1 1 α eller S S P (X t α/2, 1 < µ < X + t α/2, 1 1 α Dermed har vi at et 100(1 α% kofidesitervall for µ er: (X t α/2, 1 S, X + t α/2, 1 S (b Fra (2 i oppgavetekste har vi at P (χ 21 α/2, 1 ( 1S2 < < χ 2 σ 2 α/2, 1 1 α der χ 2 1 α/2, 1 og χ2 α/2, 1 er gitt som på sidee 409 i læreboka. Vi omformer ulikhetee og fier ( ( 1S 2 P < σ 2 ( 1S2 < 1 α χ 2 α/2, 1 χ 2 1 α/2, 1 eller ( 1 P S χ 2 α/2, 1 1 < σ < S 1 α χ 2 1 α/2, 1 2

Dermed har vi at et 100(1 α% kofidesitervall for σ er: ( 1 1 S, S χ 2 α/2, 1 χ 2 1 α/2, 1 (c Vi geererer B 1000 datasett av størrelse 10 fra N(1, 1-fordelige, bereger kofidesitervallee i puktee a og b for hvert datasett og teller opp hvor mage av datasettee som ieholder de sae verdiee µ 1 og σ 1. R-kode: # D e f i e r e r v a r i a b l e 10 B1000 m1 s1 low.mup.mrep (0,B low. sup. srep (0,B # Geererer B1000 o r m a l f o r d e l t e d a t a s e t t av s t o r r e l s e 10 # og bestemme edre og ovre grese av k o f i d e s i t e r v a l l e e ( 1 og ( 2 f o r ( i i 1 :B { xrorm (,m, s low.m[ i ]mea( x qt ( 0. 9 7 5, 1 sd ( x / s q r t ( up.m[ i ]mea( x+qt ( 0. 9 7 5, 1 sd ( x / s q r t ( low. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 9 7 5, 1 up. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 0 2 5, 1 } # Fier adel k o f i d e s i t e r v a l l som i e h o l d e r de sae v e r d i e e mea ( ( low.m<1&(up.m>1 mea ( ( low. s <1&(up. s >1 (d Vi gjetar simulerigee for datasett av størrelse 25, 50 og 100. Resultatet av simulerigee er gitt i tabell 1. (Merk at resultatet vil variere litt fra e simulerig til e ae, så du vil ikke få øyaktig samme resultat hvis du gjetar simulerigee. Tabell 1: Adel kofidesitervall som ieholder de sae verdiee av parametree år vi geererer datasettee fra ormalfordelige. Parameter 10 25 50 100 µ 0.949 0.954 0.940 0.945 σ 0.958 0.954 0.942 0.965 3

Vi ser at både kofidesitervallet for µ og kofidesitervallet for σ ieholder de sae verdie av parametere for omtret 95% av de 1000 geererte datasettee for alle verdier av. At atallee avviker oe fra 95% skyldes tilfeldigheter i simulerigee. (Atall kofidesitervall som ieholder de sae verdie av parametere er biomisk fordelt. (e Vi gjør tilsvarede simuleriger som i puktee (c og (d, me å geererer vi datasettee fra gammafordelige med forvetigsverdi 1 og stadardavvik 1. # Geererer B1000 gammafordelte d a t a s e t t av s t o r r e l s e 10 # og bestemme edre og ovre grese av k o f i d e s i t e r v a l l e e ( 1 og ( 2 f o r ( i i 1 :B { xrgamma(, shape 1, s c a l e 1 low.m[ i ]mea( x qt ( 0. 9 7 5, 1 sd ( x / s q r t ( up.m[ i ]mea( x+qt ( 0. 9 7 5, 1 sd ( x / s q r t ( low. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 9 7 5, 1 up. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 0 2 5, 1 } (f Resultatet av disse simulerigee er gitt i tabell 2. Tabell 2: Adel kofidesitervall som ieholder de sae verdiee av parametree år vi geererer datasettee fra gammafordelige. Parameter 10 25 50 100 µ 0.907 0.924 0.928 0.941 σ 0.774 0.719 0.706 0.691 Når vi geererer datasettee fra gammafordelige, gjelder ikke (1 og (2 i oppgavetekste. Dette fører til at adele kofidesitervall som ieholder de sae verdie av parametere vil avvike e del fra 0.95. Det er imidlertid e viktig forskjell mellom kofidesitervallet for µ og kofidesitervallet for σ. Kofidesitervallet for µ ieholder de sae verdie µ 1 for få gager år er lite. Me år øker blir situasjoe bedre, og for 100 ieholder kofidesitervallet de sae verdie av µ for 94% av de geererte datasettee. Kofidesitervallet for σ ieholder de sae verdie σ 1 for uder 80% av de geererte datasetee år 10, og situasjoe blir bare værre år øker. Koklusjoe av dette er at vi ka bruke kofidesitervallet i pukt (a hvis er rimelig stor selv om dataee ikke er ormalfordelte, mes kofidesitervallet i pukt (b bare ka brukes år dataee er (tilærmet ormalfordelte. 4

Oppgave 3 (a For x > κ blir de kumulative sasylighetsfordelige til X: F (x x f(udu x κ θκ θ u θ 1 du θκ θ ( θ 1 [u θ ] x κ 1 κ θ x θ. For x κ blir F (x x 0 dx 0. Dermed har vi at: 1 ( κ θ x for x > κ, F (x 0 ellers. Media årsitekt µ er gitt ved F ( µ 1/2. Av det fier vi at: ( θ κ 1 1 µ 2 ( θ κ 1 µ 2 µ θ 2 κ θ µ 2 1/θ κ (b Forvetet itekt er: E(X x f(xdx κ x θκ θ x θ 1 dx θκ θ x θ dx θκ θ ( θ + 1 1 [x θ+1 ] κ κ θκ θ 1 (c For y > 0 blir de kumulative sasylighetsfordelige til Y : G(y P (Y y P (2θ[l(X l(κ] y P (l(x l(κ y/2θ P (l (X/κ y/2θ P (X κ exp (y/2θ F (κ exp (y/2θ ( θ κ 1 1 (exp ( y/2θ θ κ exp (y/2θ 1 exp ( y/2 5

For y 0 blir kumulative sasylighetsfordelige G(y 0. Dermed har vi at: { 1 exp ( y/2 for y > 0, G(y 0 ellers. Sasylighetstetthete til Y er g(y G (y. Det gir: g(y { 1 2 exp ( y/2 for y > 0, 0 ellers. Ved å sammelige med kjikvadrat tetthete på side 315 i læreboka, ser vi at Y er kjikvadrat fordelt med 2 frihetsgrader. (d Ved å bruke resultatet i pukt b, har vi at momet estimatore for θ er løsige av ligige X θκ θ 1 Momet estimatore m er dermed gitt ved: X m X m κ m (X κ X m X X κ (e Ved å bruke (3 i oppgavetekste, får vi likelihoode (år alle x i > κ: ( θ+1 1 f(x 1,..., x ; θ θκ θ θ κ θ x (θ+1 i. x i Det gir log-likelihoode: l[f(x 1,..., x ; θ] l(θ + θ l(κ (θ + 1 l(x i Vi deriverer m.h.p. θ og løser ligige vi får år de deriverte settes lik ull: θ + l(κ l(x i 0 θ θ l(x i l(κ l(x i l(κ 6

Vi setter i X i for x i og fier at maksimum likelihood estimatore er: l(x i l(κ (f Vi har at: ( 2θ 2θ l(x i l(κ 2θ [l(x i l(κ] Vi ka altså skrive 2θ/ som e sum av uavhegige stokastiske variable som hver er kjikvadrat fordelt med 2 frihetsgrader (jf. pukt c. Resultatet på side 316 i læreboka gir dermed at 2θ/ er kjikvadrat fordelt med 2 frihetsgrader. (g Ved å bruke (5 i oppgavetekste, resultatet i pukt f og egeskaper for gammafuksjoe (jf. side 190 i læreboka, får vi at: [ (2θ ] 1 E 2 1 Γ ( 2 1 2 Γ ( Γ ( 1 Γ ( 1 2 2 Γ ( 2( 1 Γ ( 1 1 2( 1 2 og [ (2θ ] 2 E 2 2 Γ ( 2 2 2 Γ ( 2 2 1 4( 1( 2. Γ ( 2 4 Γ ( Γ ( 2 4( 1( 2 Γ ( 2 Forvetige til maksimum likelihood estimatore blir dermed: [ ( ] [ 1 (2θ ] 1 2θ 1 E( E 2θ 2θ E 2θ 2( 1 θ 1 Videre fier vi at [ E( 2 E 4 2 θ 2 ( 2θ ] [ 2 (2θ ] 2 4 2 θ 2 E 4 2 θ 2 1 4( 1( 2 2 θ 2 ( 1( 2 Variase blir dermed: V ( E( 2 (E( 2 ( 2 θ 2 2 θ ( 1( 2 1 7 2 θ 2 ( 1 2 ( 2

(h Vi har at E( θ/( 1 θ. Dermed er ikke maksimum likelihood estimatore forvetigsrett. E forvetigsrett estimator er u 1 1 l(x i l(κ. Variase til dee estimatore blir: ( ( 2 ( 2 1 V ( u V 1 1 2 θ 2 V ( ( 1 2 ( 2 Oppgave 4 (a Vi har videre at θ 2 2 L(λ λ e λ x i ka maksimeres ved å se på log-likelihoode l(λ l(λ λ Videre har vi at d dλ l(λ λ x i x i og hvis vi setter de deriverte til å bli ull, får vi ˆλ / x i. Vi bør også sikre oss at det er et maks-pukt. Vi har at d 2 dλ 2 l(λ λ 2 som alltid er egativ og dermed har vi et maksimumspukt. For de gitte data, blir ˆλ 0.237. (b Vi har at E 2tλX λ 0 0 e 2tλx λe λx dx e 2tλx e λx(1 2t dx λ λ(1 2t [ e λx[1 2t] ] 0 1 (1 2t som svarer til de mometgeererede fuksjoe til χ 2 2. 8

(c Vi har geerelt at summe av uavhegige kjikvadratfordelte variable er kjikvadratfordelt med summe av frihetsgradee, som gir resultatet. (d Fra eksempel 8.5 i boka har vi at 2λ X i er χ 2 2. Dermed er Pr(χ 2 1 α/2;2 < 2λ X i < χ 2 α/2;2 1 α Pr( χ2 1 α/2;2 2 < λ < χ2 α/2;2 X i 2 1 α X i som gir at [ χ2 1 α/2;2 2, χ2 α/2;2 X i 2 ] er et 100(1 α% kofidesitervall for α. Hvis vi X i bruker α 0.05, får vi at χ 2 1 α/2;2 46.979 og χ2 α/2;2 16.791 som da gir kofidesitervallet [0.133, 0.372]. Side λ 0 0.35 er med i kofidesitervallet forkaster vi ikke hypotese om at λ 0 0.35 på sigifikasivå α 0.05. Edrer vi til α 0.1, får vi kofidesitervall [0.146, 0.346]. Side λ 0 0.35 ikke er med i kofidesitervallet forkaster vi hypotese om at λ 0 0.35 på sigifikasivå α 0.1. (e Vi har at P-verdie er det miste sigifikasivå som forkaster H 0. Side vi forkaster for α 0.1, ka ikke P-verdie være større e 0.1. Side vi ikke forkaster for α 0.05, må P-verdie være større e 0.05. Ved å prøve ut ulike verdier av α får e at P-verdie blir 0.09. (f Vi ka å skrive hypotesee som H 0 : λ Ω 0 mot H a : λ Ω a der Ω 0 {0.35} og Ω a {λ; λ > 0, λ 0.35} og videre Ω Ω 0 Ω a {λ; λ > 0} Vi har at f(x 1,..., x ; λ λe λx i λ e λ x i. Uder H 0, har vi at L(Ω 0 λ 0e λ 0 x i mes hvis vi bruker resultatet fra (a er og dermed L( Ω ˆλ e ˆλ x i LR λ 0e λ 0 x i ˆλ e ˆλ x i ( λ0 ˆλ e (ˆλ λ 0 x i 2 l(lr 2 l(ˆλ 2 l(λ 0 2(ˆλ λ 0 9 x i

Isatt observasjoee får vi 2 l(lr 2.587. Vi har at 2 l(lr χ 2 1. Videre er χ 2 0.05;1 3.841 mes χ 2 0.1;1 2.706 som gir at vi ikke forkaster H 0 på oe av ivåee. (g P-verdie ka i dette tilfellet fies ved de opprielige defiisjoe. Her er e mer ekstrem verdi at 2 l(lr er større e de observerte verdie. Vi får at Pr( 2 l(lr > 2.587 Pr(χ 2 1 > 2.587 0.108. (h Vi får litt ulike koklusjoer år vi bruker de to forskjelle testee. Imidlertid er de to P-verdiee vi får svært like, i begge tilfeller er det lite bevisbyrde i data for å forkaste H 0. 10