Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Like dokumenter
Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

Estimering 1 -Punktestimering

Estimering 1 -Punktestimering

Løsningsforslag Oppgave 1

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

TMA4245 Statistikk Eksamen mai 2017

Løsningsforslag til eksamen i STK desember 2010

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

TMA4240 Statistikk Eksamen desember 2015

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Estimering 2. -Konfidensintervall

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

MOT310 Statistiske metoder 1, høsten 2011

Statistikk og økonomi, våren 2017

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

TMA4245 Statistikk Eksamen august 2015

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

ST1201 Statistiske metoder

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

Kapittel 8: Estimering

TMA4240 Statistikk Høst 2016

TMA4240/4245 Statistikk 11. august 2012

Hypotesetesting, del 4

Løsningsforslag ST2301 øving 3

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Oppgaver fra boka: X 2 X n 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

Kap. 9: Inferens om én populasjon

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

Kap. 9: Inferens om én populasjon

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

ST1201 Statistiske metoder

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

TMA4240 Statistikk Høst 2015

UNIVERSITETET I OSLO

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Mer om utvalgsundersøkelser

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

TMA4240 Statistikk Høst 2009

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

STK1100 våren 2017 Estimering

ECON240 Statistikk og økonometri

TMA4245 Statistikk Eksamen 9. desember 2013

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

Oversikt over konfidensintervall i Econ 2130

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

f(x)dx = F(x) = f(u)du. 1 (4u + 1) du = 3 0 for x < 0, 2 + for x [0,1], 1 for x > 1. = 1 F 4 = P ( X > 1 2 X > 1 ) 4 X > 1 ) =

TMA4245 Statistikk Vår 2015

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Oversikt over konfidensintervall i Econ 2130

Løsning TALM1005 (statistikkdel) juni 2017

TMA4240 Statistikk 2014

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

Econ 2130 Forelesning uke 11 (HG)

TMA4240 Statistikk Høst 2015

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Forelesning Moment og Momentgenererende funksjoner

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

TMA4240 Statistikk H2010

Sammendrag i statistikk

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Kapittel 7: Noen viktige sannsynlighetsfordelinger

LØSNING: Eksamen 28. mai 2015

Transkript:

Løsigsforsalg til første sett med obligatoriske oppgaver i STK1110 høste 2015 Oppgave 1 (a Et 100(1 α% kofidesitervall for forvetigsverdie µ er gitt ved formel (8.15 på side 403 i læreboka. For situasjoe i oppgave har vi 19 og α 0.10. Et 90% kofidesiterval for aldere til bergarte er dermed gitt som x ± t 0.05,18 s 19 For de 19 aldersmåligee har vi at x 276.9 og s 27.1. Av tabell A.5 på side 789 i læreboka har vi at t 0.05,18 1.734. Kofidesitervallet blir dermed dvs. 276.9 ± 1.734 27.1 19 276.9 ± 10.8 Et 90% kofidesitervall er altså fra 266.1 millioer år til 287.7 millioer år. (b Et estimat for måleusikkerhete er s 27.1 millioer år. Vi får et 100(1 α% kofidesitervall for σ ved å bruke framgagsmåte beskrevet på side 403 i læreboka. For situasjoe i oppgave blir et 90% kofidesitervall ( 18 18 s, s χ 2 0.05,18 χ 2 0.95,18 Av tabell A.7 på side 791 i læreboka har vi at χ 2 0.95,18 9.390 og χ 2 0.05,18 28.869. Kofidesitervallet blir dermed ( 18 18 27.1 28.869, 27.1 9.390 dvs. fra 21.4 millioer år til 37.5 millioer år. (c Kofidesitervallee i puktee (a og (b forutsetter at måligee er uavhegige og ormalfordelte. (Som vi vil se i oppgave 2 er dee forutsetige spesielt viktig for kofidesitervallet i pukt (b. For å sjekke atagelse om ormalfordelig, ka vi lage et ormalfordeligsplott (jf. avsitt 4.6 i læreboka. Plottet blir som vist på este side. 1

Side ormalfordeligsplottet er oelude som e rett lije, er atagelse om ormalfordelte måliger rimelig. Oppgave 2 (a Fra (1 i oppgavetekste har vi at P ( t α/2, 1 < X µ S/ < t α/2, 1 1 α der t α/2, 1 er gitt som på sidee 402 i læreboka. Vi omformer ulikhetee og fier S S P ( t α/2, 1 < X µ < t α/2, 1 1 α eller S S P (X t α/2, 1 < µ < X + t α/2, 1 1 α Dermed har vi at et 100(1 α% kofidesitervall for µ er: (X t α/2, 1 S, X + t α/2, 1 S (b Fra (2 i oppgavetekste har vi at P (χ 21 α/2, 1 ( 1S2 < < χ 2 σ 2 α/2, 1 1 α der χ 2 1 α/2, 1 og χ2 α/2, 1 er gitt som på sidee 409 i læreboka. Vi omformer ulikhetee og fier ( ( 1S 2 P < σ 2 ( 1S2 < 1 α χ 2 α/2, 1 χ 2 1 α/2, 1 eller ( 1 P S χ 2 α/2, 1 1 < σ < S 1 α χ 2 1 α/2, 1 2

Dermed har vi at et 100(1 α% kofidesitervall for σ er: ( 1 1 S, S χ 2 α/2, 1 χ 2 1 α/2, 1 (c Vi geererer B 1000 datasett av størrelse 10 fra N(1, 1-fordelige, bereger kofidesitervallee i puktee a og b for hvert datasett og teller opp hvor mage av datasettee som ieholder de sae verdiee µ 1 og σ 1. R-kode: # D e f i e r e r v a r i a b l e 10 B1000 m1 s1 low.mup.mrep (0,B low. sup. srep (0,B # Geererer B1000 o r m a l f o r d e l t e d a t a s e t t av s t o r r e l s e 10 # og bestemme edre og ovre grese av k o f i d e s i t e r v a l l e e ( 1 og ( 2 f o r ( i i 1 :B { xrorm (,m, s low.m[ i ]mea( x qt ( 0. 9 7 5, 1 sd ( x / s q r t ( up.m[ i ]mea( x+qt ( 0. 9 7 5, 1 sd ( x / s q r t ( low. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 9 7 5, 1 up. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 0 2 5, 1 } # Fier adel k o f i d e s i t e r v a l l som i e h o l d e r de sae v e r d i e e mea ( ( low.m<1&(up.m>1 mea ( ( low. s <1&(up. s >1 (d Vi gjetar simulerigee for datasett av størrelse 25, 50 og 100. Resultatet av simulerigee er gitt i tabell 1. (Merk at resultatet vil variere litt fra e simulerig til e ae, så du vil ikke få øyaktig samme resultat hvis du gjetar simulerigee. Tabell 1: Adel kofidesitervall som ieholder de sae verdiee av parametree år vi geererer datasettee fra ormalfordelige. Parameter 10 25 50 100 µ 0.949 0.954 0.940 0.945 σ 0.958 0.954 0.942 0.965 3

Vi ser at både kofidesitervallet for µ og kofidesitervallet for σ ieholder de sae verdie av parametere for omtret 95% av de 1000 geererte datasettee for alle verdier av. At atallee avviker oe fra 95% skyldes tilfeldigheter i simulerigee. (Atall kofidesitervall som ieholder de sae verdie av parametere er biomisk fordelt. (e Vi gjør tilsvarede simuleriger som i puktee (c og (d, me å geererer vi datasettee fra gammafordelige med forvetigsverdi 1 og stadardavvik 1. # Geererer B1000 gammafordelte d a t a s e t t av s t o r r e l s e 10 # og bestemme edre og ovre grese av k o f i d e s i t e r v a l l e e ( 1 og ( 2 f o r ( i i 1 :B { xrgamma(, shape 1, s c a l e 1 low.m[ i ]mea( x qt ( 0. 9 7 5, 1 sd ( x / s q r t ( up.m[ i ]mea( x+qt ( 0. 9 7 5, 1 sd ( x / s q r t ( low. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 9 7 5, 1 up. s [ i ] sd ( x s q r t ( ( 1/ qchisq ( 0. 0 2 5, 1 } (f Resultatet av disse simulerigee er gitt i tabell 2. Tabell 2: Adel kofidesitervall som ieholder de sae verdiee av parametree år vi geererer datasettee fra gammafordelige. Parameter 10 25 50 100 µ 0.907 0.924 0.928 0.941 σ 0.774 0.719 0.706 0.691 Når vi geererer datasettee fra gammafordelige, gjelder ikke (1 og (2 i oppgavetekste. Dette fører til at adele kofidesitervall som ieholder de sae verdie av parametere vil avvike e del fra 0.95. Det er imidlertid e viktig forskjell mellom kofidesitervallet for µ og kofidesitervallet for σ. Kofidesitervallet for µ ieholder de sae verdie µ 1 for få gager år er lite. Me år øker blir situasjoe bedre, og for 100 ieholder kofidesitervallet de sae verdie av µ for 94% av de geererte datasettee. Kofidesitervallet for σ ieholder de sae verdie σ 1 for uder 80% av de geererte datasetee år 10, og situasjoe blir bare værre år øker. Koklusjoe av dette er at vi ka bruke kofidesitervallet i pukt (a hvis er rimelig stor selv om dataee ikke er ormalfordelte, mes kofidesitervallet i pukt (b bare ka brukes år dataee er (tilærmet ormalfordelte. 4

Oppgave 3 (a For x > κ blir de kumulative sasylighetsfordelige til X: F (x x f(udu x κ θκ θ u θ 1 du θκ θ ( θ 1 [u θ ] x κ 1 κ θ x θ. For x κ blir F (x x 0 dx 0. Dermed har vi at: 1 ( κ θ x for x > κ, F (x 0 ellers. Media årsitekt µ er gitt ved F ( µ 1/2. Av det fier vi at: ( θ κ 1 1 µ 2 ( θ κ 1 µ 2 µ θ 2 κ θ µ 2 1/θ κ (b Forvetet itekt er: E(X x f(xdx κ x θκ θ x θ 1 dx θκ θ x θ dx θκ θ ( θ + 1 1 [x θ+1 ] κ κ θκ θ 1 (c For y > 0 blir de kumulative sasylighetsfordelige til Y : G(y P (Y y P (2θ[l(X l(κ] y P (l(x l(κ y/2θ P (l (X/κ y/2θ P (X κ exp (y/2θ F (κ exp (y/2θ ( θ κ 1 1 (exp ( y/2θ θ κ exp (y/2θ 1 exp ( y/2 5

For y 0 blir kumulative sasylighetsfordelige G(y 0. Dermed har vi at: { 1 exp ( y/2 for y > 0, G(y 0 ellers. Sasylighetstetthete til Y er g(y G (y. Det gir: g(y { 1 2 exp ( y/2 for y > 0, 0 ellers. Ved å sammelige med kjikvadrat tetthete på side 315 i læreboka, ser vi at Y er kjikvadrat fordelt med 2 frihetsgrader. (d Ved å bruke resultatet i pukt b, har vi at momet estimatore for θ er løsige av ligige X θκ θ 1 Momet estimatore m er dermed gitt ved: X m X m κ m (X κ X m X X κ (e Ved å bruke (3 i oppgavetekste, får vi likelihoode (år alle x i > κ: ( θ+1 1 f(x 1,..., x ; θ θκ θ θ κ θ x (θ+1 i. x i Det gir log-likelihoode: l[f(x 1,..., x ; θ] l(θ + θ l(κ (θ + 1 l(x i Vi deriverer m.h.p. θ og løser ligige vi får år de deriverte settes lik ull: θ + l(κ l(x i 0 θ θ l(x i l(κ l(x i l(κ 6

Vi setter i X i for x i og fier at maksimum likelihood estimatore er: l(x i l(κ (f Vi har at: ( 2θ 2θ l(x i l(κ 2θ [l(x i l(κ] Vi ka altså skrive 2θ/ som e sum av uavhegige stokastiske variable som hver er kjikvadrat fordelt med 2 frihetsgrader (jf. pukt c. Resultatet på side 316 i læreboka gir dermed at 2θ/ er kjikvadrat fordelt med 2 frihetsgrader. (g Ved å bruke (5 i oppgavetekste, resultatet i pukt f og egeskaper for gammafuksjoe (jf. side 190 i læreboka, får vi at: [ (2θ ] 1 E 2 1 Γ ( 2 1 2 Γ ( Γ ( 1 Γ ( 1 2 2 Γ ( 2( 1 Γ ( 1 1 2( 1 2 og [ (2θ ] 2 E 2 2 Γ ( 2 2 2 Γ ( 2 2 1 4( 1( 2. Γ ( 2 4 Γ ( Γ ( 2 4( 1( 2 Γ ( 2 Forvetige til maksimum likelihood estimatore blir dermed: [ ( ] [ 1 (2θ ] 1 2θ 1 E( E 2θ 2θ E 2θ 2( 1 θ 1 Videre fier vi at [ E( 2 E 4 2 θ 2 ( 2θ ] [ 2 (2θ ] 2 4 2 θ 2 E 4 2 θ 2 1 4( 1( 2 2 θ 2 ( 1( 2 Variase blir dermed: V ( E( 2 (E( 2 ( 2 θ 2 2 θ ( 1( 2 1 7 2 θ 2 ( 1 2 ( 2

(h Vi har at E( θ/( 1 θ. Dermed er ikke maksimum likelihood estimatore forvetigsrett. E forvetigsrett estimator er u 1 1 l(x i l(κ. Variase til dee estimatore blir: ( ( 2 ( 2 1 V ( u V 1 1 2 θ 2 V ( ( 1 2 ( 2 Oppgave 4 (a Vi har videre at θ 2 2 L(λ λ e λ x i ka maksimeres ved å se på log-likelihoode l(λ l(λ λ Videre har vi at d dλ l(λ λ x i x i og hvis vi setter de deriverte til å bli ull, får vi ˆλ / x i. Vi bør også sikre oss at det er et maks-pukt. Vi har at d 2 dλ 2 l(λ λ 2 som alltid er egativ og dermed har vi et maksimumspukt. For de gitte data, blir ˆλ 0.237. (b Vi har at E 2tλX λ 0 0 e 2tλx λe λx dx e 2tλx e λx(1 2t dx λ λ(1 2t [ e λx[1 2t] ] 0 1 (1 2t som svarer til de mometgeererede fuksjoe til χ 2 2. 8

(c Vi har geerelt at summe av uavhegige kjikvadratfordelte variable er kjikvadratfordelt med summe av frihetsgradee, som gir resultatet. (d Fra eksempel 8.5 i boka har vi at 2λ X i er χ 2 2. Dermed er Pr(χ 2 1 α/2;2 < 2λ X i < χ 2 α/2;2 1 α Pr( χ2 1 α/2;2 2 < λ < χ2 α/2;2 X i 2 1 α X i som gir at [ χ2 1 α/2;2 2, χ2 α/2;2 X i 2 ] er et 100(1 α% kofidesitervall for α. Hvis vi X i bruker α 0.05, får vi at χ 2 1 α/2;2 46.979 og χ2 α/2;2 16.791 som da gir kofidesitervallet [0.133, 0.372]. Side λ 0 0.35 er med i kofidesitervallet forkaster vi ikke hypotese om at λ 0 0.35 på sigifikasivå α 0.05. Edrer vi til α 0.1, får vi kofidesitervall [0.146, 0.346]. Side λ 0 0.35 ikke er med i kofidesitervallet forkaster vi hypotese om at λ 0 0.35 på sigifikasivå α 0.1. (e Vi har at P-verdie er det miste sigifikasivå som forkaster H 0. Side vi forkaster for α 0.1, ka ikke P-verdie være større e 0.1. Side vi ikke forkaster for α 0.05, må P-verdie være større e 0.05. Ved å prøve ut ulike verdier av α får e at P-verdie blir 0.09. (f Vi ka å skrive hypotesee som H 0 : λ Ω 0 mot H a : λ Ω a der Ω 0 {0.35} og Ω a {λ; λ > 0, λ 0.35} og videre Ω Ω 0 Ω a {λ; λ > 0} Vi har at f(x 1,..., x ; λ λe λx i λ e λ x i. Uder H 0, har vi at L(Ω 0 λ 0e λ 0 x i mes hvis vi bruker resultatet fra (a er og dermed L( Ω ˆλ e ˆλ x i LR λ 0e λ 0 x i ˆλ e ˆλ x i ( λ0 ˆλ e (ˆλ λ 0 x i 2 l(lr 2 l(ˆλ 2 l(λ 0 2(ˆλ λ 0 9 x i

Isatt observasjoee får vi 2 l(lr 2.587. Vi har at 2 l(lr χ 2 1. Videre er χ 2 0.05;1 3.841 mes χ 2 0.1;1 2.706 som gir at vi ikke forkaster H 0 på oe av ivåee. (g P-verdie ka i dette tilfellet fies ved de opprielige defiisjoe. Her er e mer ekstrem verdi at 2 l(lr er større e de observerte verdie. Vi får at Pr( 2 l(lr > 2.587 Pr(χ 2 1 > 2.587 0.108. (h Vi får litt ulike koklusjoer år vi bruker de to forskjelle testee. Imidlertid er de to P-verdiee vi får svært like, i begge tilfeller er det lite bevisbyrde i data for å forkaste H 0. 10