Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Like dokumenter
Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Løsningsforslag til eksamen i STK desember 2010

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

TMA4245 Statistikk Eksamen mai 2017

Løsningsforslag Oppgave 1

Statistikk og økonomi, våren 2017

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Estimering 1 -Punktestimering

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Estimering 1 -Punktestimering

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

TMA4245 Statistikk Eksamen august 2015

TMA4240 Statistikk Eksamen desember 2015

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

TMA4240 Statistikk Høst 2016

MOT310 Statistiske metoder 1, høsten 2011

ST1201 Statistiske metoder

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2016

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Estimering 2. -Konfidensintervall

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Løsningsforslag ST2301 øving 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

TMA4240 Statistikk Høst 2015

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Hypotesetesting, del 4

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Oppgaver fra boka: X 2 X n 1

Kap. 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ECON240 Statistikk og økonometri

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

Kapittel 8: Estimering

TMA4240/4245 Statistikk 11. august 2012

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Kap. 9: Inferens om én populasjon

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

TMA4240 Statistikk Høst 2009

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Mer om utvalgsundersøkelser

STK1100 våren 2017 Estimering

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

TMA4245 Statistikk Eksamen 9. desember 2013

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Løsning TALM1005 (statistikkdel) juni 2017

TMA4245 Statistikk Vår 2015

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

f(x)dx = F(x) = f(u)du. 1 (4u + 1) du = 3 0 for x < 0, 2 + for x [0,1], 1 for x > 1. = 1 F 4 = P ( X > 1 2 X > 1 ) 4 X > 1 ) =

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ST1201 Statistiske metoder

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

TMA4240 Statistikk Høst 2015

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4240 Statistikk H2010

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Econ 2130 Forelesning uke 11 (HG)

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Oversikt over konfidensintervall i Econ 2130

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

Oversikt over konfidensintervall i Econ 2130

Sammendrag i statistikk

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag andre obligatoriske oppgave i STK 1110 høsten 2014

Transkript:

Løsigsforsalg til første sett med obligatoriske oppgaver i STK1110 høste 2018 Oppgave 1 (a Et 100(1 α% kofidesitervall for forvetigsverdie µ er gitt ved formel (8.15 på side 403 i læreboka. For situasjoe i oppgave har vi = 19 og α = 0.10. Et 90% kofidesiterval for aldere til bergarte er dermed gitt som x ± t 0.05,18 s 19 For de 19 aldersmåligee har vi at x = 276.9 og s = 27.1. Av tabell A.5 på side 789 i læreboka har vi at t 0.05,18 = 1.734. Kofidesitervallet blir dermed dvs. 276.9 ± 1.734 27.1 19 276.9 ± 10.8 Et 90% kofidesitervall er altså fra 266.1 millioer år til 287.7 millioer år. (b Et estimat for måleusikkerhete er s = 27.1 millioer år. Vi får et 100(1 α% kofidesitervall for σ ved å bruke framgagsmåte beskrevet på side 403 i læreboka. For situasjoe i oppgave blir et 90% kofidesitervall ( 18 18 s, s χ 2 0.05,18 χ 2 0.95,18 Av tabell A.7 på side 791 i læreboka har vi at χ 2 0.95,18 = 9.390 og χ 2 0.05,18 = 28.869. Kofidesitervallet blir dermed ( 18 18 27.1 28.869, 27.1 9.390 dvs. fra 21.4 millioer år til 37.5 millioer år. (c Kofidesitervallee i puktee (a og (b forutsetter at måligee er uavhegige og ormalfordelte. (Som vi vil se i oppgave 2 er dee forutsetige spesielt viktig for kofidesitervallet i pukt (b. For å sjekke atagelse om ormalfordelig, ka vi lage et ormalfordeligsplott (jf. avsitt 4.6 i læreboka. Side ormalfordeligsplottet er oelude som e rett lije, er atagelse om ormalfordelte måliger rimelig. 1

(e For å teste H 0 : µ = 265 mot H a : µ < 265 beyttes testobservator t = x 265 s/ som blir lite år de alterative hypotese er rimelig, dvs. år x er klart midre e 265. Når ullhypotese holder er testobservatore t-fordelt med 1 = 18 frihetsgrader. Her er x = 276.9 (merk at x > 265 og s = 27.1, oe som gir e testobservator lik -1.914 og vi får e P-verdi lik 0.964 = P(T > 1.914 år T er t-fordelt med 1 = 18 frihetsgrader (bruk fuksjoe pt for kumulativ t-fordelig i R. Side P-verdie er (mye større e ivået satt til α = 0.05 så forkastes ikke ullhypotese. For å teste mot alterativet H a : µ 265 beyttes testobservator x 265 s/ som dermed blir lik 1.914. P-verdie for dee teste blir 2P(T > 1.914 = 0.072 der T fortsatt er t-fordelt med 18 frihetsgrader. Dee P-verdie er også større e ivået på 0.05 og heller ikke dee ullhypotese forkastes. Merk at µ = 265 ligger utefor 90% kofidesitervallet fra pukt a. Dette svarer til at vi ville forkastet ullhypotese med tosidig alterativ hvis ivået var valgt til 10% som jo er større e P-verdie 0.072. Oppgave 2 (a Fra (1 i oppgavetekste har vi at ( P t α/2, 1 < X µ S/ < t α/2, 1 = 1 α der t α/2, 1 er gitt som på sidee 402 i læreboka. Vi omformer ulikhetee og fier S S P ( t α/2, 1 < X µ < t α/2, 1 = 1 α eller S S P (X t α/2, 1 < µ < X + t α/2, 1 = 1 α Dermed har vi at et 100(1 α% kofidesitervall for µ er: (X t α/2, 1 S, X + t α/2, 1 S (b Fra (2 i oppgavetekste har vi at P (χ 21 α/2, 1 ( 1S2 < < χ 2 σ 2 α/2, 1 = 1 α der χ 2 1 α/2, 1 og χ2 α/2, 1 er gitt som på sidee 409 i læreboka. Vi omformer ulikhetee og fier ( ( 1S 2 P < σ 2 ( 1S2 < = 1 α χ 2 α/2, 1 χ 2 1 α/2, 1 2

eller ( 1 P S χ 2 α/2, 1 1 < σ < S = 1 α χ 2 1 α/2, 1 Dermed har vi at et 100(1 α% kofidesitervall for σ er: ( 1 1 S, S χ 2 α/2, 1 χ 2 1 α/2, 1 (c Vi geererer B = 1000 datasett av størrelse = 10 fra N(1, 1-fordelige, bereger kofidesitervallee i puktee a og b for hvert datasett og teller opp hvor mage av datasettee som ieholder de sae verdiee µ = 1 og σ = 1. R-kode: # D e f i e r e r v a r i a b l e =10 B=1000 m=1 s=1 low.m=up.m=rep (0,B low. s=up. s=rep (0,B # Geererer B=1000 o r m a l f o r d e l t e d a t a s e t t av s t o r r e l s e =10 # og bestemme edre og ovre grese av k o f i d e s i t e r v a l l e e ( 1 og ( 2 f o r ( i i 1 :B { x=rorm (,m, s low.m[ i ]=mea( x qt ( 0. 9 7 5, 1 sd ( x / s q r t ( up.m[ i ]=mea( x+qt ( 0. 9 7 5, 1 sd ( x / s q r t ( low. s [ i ]= sd ( x s q r t ( ( 1/ qchisq ( 0. 9 7 5, 1 up. s [ i ]= sd ( x s q r t ( ( 1/ qchisq ( 0. 0 2 5, 1 } # Fier adel k o f i d e s i t e r v a l l som i e h o l d e r de sae v e r d i e e mea ( ( low.m<1&(up.m>1 mea ( ( low. s <1&(up. s >1 (d Vi gjetar simulerigee for datasett av størrelse = 25, = 50 og = 100. Resultatet av simulerigee er gitt i tabell 1. (Merk at resultatet vil variere litt fra e simulerig til e ae, så du vil ikke få øyaktig samme resultat hvis du gjetar simulerigee. Tabell 1: Adel kofidesitervall som ieholder de sae verdiee av parametree år vi geererer datasettee fra ormalfordelige. 3

Parameter = 10 = 30 = 200 µ 0.946 0.947 0.956 σ 0.942 0.945 0.954 Vi ser at både kofidesitervallet for µ og kofidesitervallet for σ ieholder de sae verdie av parametere for omtret 95% av de 1000 geererte datasettee for alle verdier av. At atallee avviker oe fra 95% skyldes tilfeldigheter i simulerigee. (Atall kofidesitervall som ieholder de sae verdie av parametere er biomisk fordelt. (e Vi gjør tilsvarede simuleriger som i puktee (c og (d, me å geererer vi datasettee fra ekspoesialfordelige med forvetigsverdi 1 (og stadardavvik 1. # Geererer B=1000 e k s p o e s i a l f o r d e l t e d a t a s e t t av s t o r r e l s e =10 # og bestemme edre og ovre grese av k o f i d e s i t e r v a l l e e ( 1 og ( 2 f o r ( i i 1 :B { x=rexp (, r a t e =1 low.m[ i ]=mea( x qt ( 0. 9 7 5, 1 sd ( x / s q r t ( up.m[ i ]=mea( x+qt ( 0. 9 7 5, 1 sd ( x / s q r t ( low. s [ i ]= sd ( x s q r t ( ( 1/ qchisq ( 0. 9 7 5, 1 up. s [ i ]= sd ( x s q r t ( ( 1/ qchisq ( 0. 0 2 5, 1 } (f Resultatet av disse simulerigee er gitt i tabell 2. Tabell 2: Adel kofidesitervall som ieholder de sae verdiee av parametree år vi geererer datasettee fra gammafordelige. Parameter = 10 = 30 = 200 µ 0.906 0.921 0.944 σ 0.778 0.734 0.677 Når vi geererer datasettee fra ekspoesialfordelige, gjelder ikke (1 og (2 i oppgavetekste. Dette fører til at adele kofidesitervall som ieholder de sae verdie av parametere vil avvike e del fra 0.95. Det er imidlertid e viktig forskjell mellom kofidesitervallet for µ og kofidesitervallet for σ. Kofidesitervallet for µ ieholder de sae verdie µ = 1 for få gager år er lite. Me år øker blir situasjoe bedre, og for = 100 ieholder kofidesitervallet de sae verdie av µ for 94% av de geererte datasettee. Kofidesitervallet for σ ieholder de sae verdie σ = 1 for uder 80% av de geererte datasetee år = 10, og situasjoe blir bare værre år øker. Koklusjoe av dette er at vi ka bruke kofidesitervallet i pukt (a hvis er rimelig stor selv om dataee ikke er 4

ormalfordelte, mes kofidesitervallet i pukt (b bare ka brukes år dataee er (tilærmet ormalfordelte. Oppgave 3 (a For x > κ blir de kumulative sasylighetsfordelige til X: F (x = x f(udu = x κ θκ θ u θ 1 du = θκ θ ( θ 1 [u θ ] x κ = 1 κ θ x θ. For x κ blir F (x = x 0 dx = 0. Dermed har vi at: F (x = 1 ( κ x θ for x > κ, 0 ellers. Media årsitekt µ er gitt ved F ( µ = 1/2. Av det fier vi at: ( θ κ 1 = 1 µ 2 ( θ κ = 1 µ 2 µ θ = 2 κ θ µ = 2 1/θ κ (b Forvetet itekt er: E(X = x f(xdx = κ x θκ θ x θ 1 dx = θκ θ x θ dx = θκ θ ( θ + 1 1 [x θ+1 ] κ κ = θκ θ 1 5

(c For y > 0 blir de kumulative sasylighetsfordelige til Y : G(y = P (Y y = P (2θ[l(X l(κ] y = P (l(x l(κ y/2θ = P (l (X/κ y/2θ = P (X κ exp (y/2θ = F (κ exp (y/2θ ( θ κ = 1 = 1 (exp ( y/2θ θ κ exp (y/2θ = 1 exp ( y/2 For y 0 blir kumulative sasylighetsfordelige G(y = 0. Dermed har vi at: { 1 exp ( y/2 for y > 0, G(y = 0 ellers. Sasylighetstetthete til Y er g(y = G (y. Det gir: g(y = { 1 2 exp ( y/2 for y > 0, 0 ellers. Ved å sammelige med kjikvadrat tetthete på side 315 i læreboka, ser vi at Y er kjikvadrat fordelt med 2 frihetsgrader. (d Ved å bruke resultatet i pukt b, har vi at momet estimatore for θ er løsige av ligige X = θκ θ 1 Momet estimatore m er dermed gitt ved: X m X = m κ m (X κ = X m = X X κ (e Ved å bruke (3 i oppgavetekste, får vi likelihoode (år alle x i > κ: f(x 1,..., x ; θ = ( θ+1 1 θκ θ = θ κ θ x i x (θ+1 i. 6

Det gir log-likelihoode: l[f(x 1,..., x ; θ] = l(θ + θ l(κ (θ + 1 l(x i Vi deriverer m.h.p. θ og løser ligige vi får år de deriverte settes lik ull: θ + l(κ l(x i = 0 θ = θ = l(x i l(κ l(x i l(κ Vi setter i X i for x i og fier at maksimum likelihood estimatore er: = l(x i l(κ (f Vi har at: ( 2θ = 2θ l(x i l(κ = 2θ [l(x i l(κ] Vi ka altså skrive 2θ/ som e sum av uavhegige stokastiske variable som hver er kjikvadrat fordelt med 2 frihetsgrader (jf. pukt c. Resultatet på side 316 i læreboka gir dermed at 2θ/ er kjikvadrat fordelt med 2 frihetsgrader. (g Ved å bruke (5 i oppgavetekste, resultatet i pukt f og egeskaper for gammafuksjoe (jf. side 190 i læreboka, får vi at: [ (2θ ] 1 E = 2 1 Γ ( 2 1 2 Γ ( Γ ( 1 Γ ( 1 = = 2 2 Γ ( 2( 1 Γ ( 1 = 1 2( 1 2 og [ (2θ ] 2 E = 2 2 Γ ( 2 2 2 Γ ( = 2 2 = 1 4( 1( 2. 7 Γ ( 2 4 Γ ( = Γ ( 2 4( 1( 2 Γ ( 2

Forvetige til maksimum likelihood estimatore blir dermed: [ ( ] [ 1 (2θ ] 1 2θ 1 E( = E 2θ = 2θ E = 2θ 2( 1 = θ 1 Videre fier vi at [ E( 2 = E 4 2 θ 2 ( 2θ ] [ 2 (2θ ] 2 = 4 2 θ 2 E = 4 2 θ 2 1 4( 1( 2 = 2 θ 2 ( 1( 2 Variase blir dermed: V ( = E( 2 (E( 2 = ( 2 θ 2 2 θ ( 1( 2 = 1 2 θ 2 ( 1 2 ( 2 (h Vi har at E( = θ/( 1 θ. Dermed er ikke maksimum likelihood estimatore forvetigsrett. E forvetigsrett estimator er u = 1 = 1 l(x i l(κ. Variase til dee estimatore blir: V ( u = V ( 1 = ( 2 ( 2 1 1 2 θ 2 V ( = ( 1 2 ( 2 = θ 2 2 8