Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Like dokumenter
TMA4240 Statistikk Høst 2015

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Høst 2009

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Løsningsforslag eksamen 27. februar 2004

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2007

TMA4245 Statistikk Eksamen desember 2016

Løsningsforslag, eksamen statistikk, juni 2015

TMA4240 Statistikk Høst 2016

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Om eksamen. Never, never, never give up!

LØSNINGSFORSLAG ) = Dvs

Om eksamen. Never, never, never give up!

Fasit for tilleggsoppgaver

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

HØGSKOLEN I STAVANGER

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Løsning eksamen desember 2017

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

TMA4240 Statistikk 2014

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Eksamensoppgave i TMA4240 Statistikk

Kapittel 9 og 10: Hypotesetesting

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk Eksamen desember 2016

Kapittel 2: Hendelser

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Løsning eksamen desember 2016

TMA4240 Statistikk Høst 2009

Regneøvelse 22/5, 2017

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag: STK2120-v15.

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

UNIVERSITETET I OSLO

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Kap. 8: Utvalsfordelingar og databeskrivelse

Forslag til endringar

TMA4240 Statistikk Eksamen desember 2015

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO

Løsningsforslag statistikkeksamen desember 2014

Eksamensoppgåve i TMA4240 Statistikk

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2016

i x i

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

TMA4240 Statistikk H2010

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Norske hoppdommere og Janne Ahonen

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Emnenavn: Deleksamen i Statistikk. Eksamenstid: Faglærer: Tore August Kro. Oppgaven er kontrollert:

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

HØGSKOLEN I STAVANGER

Løsningsforslag til oppgaver brukt i STA100

HØGSKOLEN I STAVANGER

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

ST0202 Statistikk for samfunnsvitere

TMA4245 Statistikk Eksamen august 2014

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Utvalgsfordelinger (Kapittel 5)

EKSAMEN I TMA4240 Statistikk

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Hypotesetesting av λ og p. p verdi.

La U og V være uavhengige standard normalfordelte variable og definer

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Transkript:

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Oppgave 1 a) En god estimator er forventningsrett og har liten varians. Vi tester forventningsretthet: E[ˆµ] E[Y ] µ E[ µ] E[ 1 2 X + 1 2 Y ] 1 2 E[X] + 1 2 E[Y ] 1 2 µ + 1 2 µ µ E[µ ] E[ 1 5 X + 4 5 Y ] 1 5 E[X] + 4 5 E[Y ] 1 5 µ + 4 5 µ µ. Alle tre estimatorene er altså forventningsrette. Vi sammenligner variansene: Var[ˆµ] Var[Y ] σ 2 A 0.01 Var[ µ] Var[ 1 2 X + 1 2 Y ] 1 2 2 Var[X] + 1 2 2 Var[Y ] 1 4 σ A 2 + 1 4 σ2 B 0.0125 Var[µ ] Var[ 1 5 X + 4 5 Y ] 1 42 Var[X] + 52 5 Var[Y ] 1 2 25 σ2 A + 16 25 σ2 B 0.008. Her bruker vi at X og Y er uavhengige. Vi ser at µ har minst varians, og foretrekker denne som estimator for µ. b) µ er normalfordelt siden den er en lineærkombinasjon av to uavhengige normalfordelte variabler. Forventningen og variansen er beregnet i oppgave a), og gir at µ Nµ, 0.008). 90%-konfidensintervall for µ finnes da fra at ) 0.90 P z 0.05 < µ µ < z 0.05 0.008 ) P µ z 0.05 0.008 < µ < µ + z 0.05 0.008,

der z 0.05 1.645 er 5%-kvantilen i standard normalfordelingen, slik at µ 1.645 0.008, µ + 1.645 ) 0.008 µ 0.15, µ + 0.15) er et 90%-konfidensintervall for µ. Oppgave 2 a) Vi har at A Personen har sykdommen B Prøven indikerer at personen har sykdommen Sannsynlighetene som er oppgitt kan skrives som PB A) 9 10, PBc A) 1 10 PB A c ) 1 20, PBc A c ) 19 20 PA) α, og Venn-diagrammet er gitt i figur 1. A B Figur 1: Venn-diagram i oppgave 2a). Sannsynligheten for at en tilfeldig valgt person både har sykdommen og at prøven slår ut: PA B) PB A)PA) 9 10 α.

Sannsynligheten for at prøven til en tilfeldig valgt person slår ut: PB) PA B) + PA c B) PA B) + PB A c )PA c ) 9 10 α + 1 α + 1 1 α). 20 20 b) ˆα er SME for α og er gitt ved den α [0, 1] som maksimerer rimelighetsfunksjonen til den binomiske fordelingen ) ) X ) n X n α + 1 19 α Lα), k 20 20 og siden ln-funksjonen er monotont stigende, blir dette det samme som å finne maksimum til funksjonen lα) lnlα)) konst + X ln α + 1) + n X) ln 19 α). lα) har et lokalt maksimum i α hvis X l α) α + 1 α 1 ) 20X n 1, n X ) 19 α og hvis 0 < α < 1. Dette er tilfellet når n < X < 18n. Når X er i dette intervallet har vi 20 20 dessuten at α er et maksimumspunkt siden l α) skifter fortegn fra positiv til negativ i α. Hvis lα) ikke har et lokalt maksimum på intervallet 0, 1), må maksimum ligge i et av endepunktene. 0 Når X < n 20, har lα) maksimum i 0 siden l α) er negativ på hele 0, 1)). Når X > 18n 20, har lα) maksimum i 1 siden l α) er positiv på hele 0, 1)). Dermed følger det oppgitte uttrykket for ˆα. c)

Forventning til α 1 20X n 1) : E[ α] E [ 1 )] 20X n 1 1 1 ) 20nα + 1)/20 1 n 20 E[X] n α, ) 1 siden E[X] np nα + 1)/20. Variansen er gitt ved Var[ α] Var [ )] 1 20X n 1 1 [ ] 20X Var 2 n 1 202 202 n Var [X] α + 1)19 α) n 2 2 n 2 2 202 1 α + 1 ) ) 19 n α, siden Var[X] np1 p) nα + 1)19 α)/20 2. d) Sentralgrenseteorem sier at hvis X er gjennomsnittet til et tilfeldig utvalg av størrelse n fra en populasjon med forventningsverdi µ og standardavvik σ, så vil fordelingen til Z X µ σ/ n 1) gå mot en standard normalfordeling når n går mot uendelig. Dette betyr at når n er stor vil Z gitt over være tilnærmet standard normalfordelt. Siden X µ + Zσ/ n er en lineær funksjon av Z vil dermed også X være tilnærmet normalfordelt. I vårt tilfelle er X/n gjennomsnittet av en binomisk forsøksrekke der hvert forsøk resulterer i verdien 0 eller 1. X/n er derfor ifølge sentralgrenseteoremet tilnærmet normalfordelt når n er stor. Dessuten har vi at α 1 20nX/n) 1), dvs at α er en lineær funksjon av X/n. En linær funksjon av en normalfordelt variabel er også normalfordelt, og dermed er α tilnærmet normalfordelt med den forventning og varians som ble regnet ut i oppgave c).

e) Undersøkelsene som er gjort i Trøndelag gir en observasjon X som er binomisk fordelt X Binn, α + 1)/20). α er imidlertid ukjent, og det er den vi vil forsøke å si noe om. Når vi formulerer en hypotesetest, lar vi nullhypotesen H 0 være en konservativ oppfatning av verden, mens den alternative hypotesen H 1 er formulert slik at en bekreftelse av den, fører til at vi kan påvise forskjeller av et eller annet slag. I dette tilfellet har vi før forsøket er utført ingen grunn til å anta at det er mer hyppighet av sykdommen i Trøndelag enn andre steder. Derfor må vi anta at som H 0 at α 0.053, i Trøndelag som ellers i landet. H 0 : α 0.053 H 1 : α > 0.053 Vi bruker α som observator og velger å forkaste H 0 hvis α blir mye større enn 0.0053, siden det tyder på at α er større enn 0.0053. ) Vi vet fra 2c) at α er tilnærmet normalfordelt, med forventning α og varians 1 n α + 1 19 α), slik at en tilnærmet standard normalfordelt størrelse er Under H 0 er dermed Z 1 n α α α + 1 ) 19 α) α 0.053 0.345 n, når α 0.053 under H 0. Z α 0.053 0.345/ n N 0, 1) og vi forkaster H 0 hvis Z får verdi større enn z 0.05 1.645 siden det tilsvarer at α er uforholdsmessig stor. Hvis vi setter inn de oppgitte verdiene, får vi at α 1 ) 20 101 1000 1 0.060 Z 0.060 0.053 0.345/ 1000 0.64, og siden Z < z 0.05 1.645, forkaster vi ikke H 0.

Oppgave 3 a) Fra formelsamlingen ser vi at både X og Y er eksponensialfordelte variable: X Expβ 1 ) E[X] β 1 Y Expβ 2 ) E[Y ] β 2, og vi får at E[X] E[Y ] β 1 β 2. b) Først gjør vi et variabelskifte der X UV og Y V slik at U X/Y er den variabelen vi er ute etter. Deretter finner vi simultantettheten til U og V, før vi til slutt bruker denne til å finne marginaltettheten til U. Vi vet at simultantettheten til U og V er gitt ved der Jacobideterminanten J er gitt ved x x u v J Dermed blir f U,V u, v) f U,V u, v) f X,Y xu, v), yu, v)) J, y u y v v u 0 1 v. { 1 β 1 e uv/β1 1 β 2 e v/β2 v u, v > 0 Marginaltettheten til U finner vi ved f U u) f U,V u, v)dv 0 ellers v β 1 β 2 e u + v 1 β 1 β 2 u, v > 0 0 ellers. v 0 β 1 β 2 e u + 1 β 1 β 2 β dv 1 β 2 β 1 +β 2 u) 2 u > 0 0 ellers.

c) E[U] u f U u)du 0 β 1 β 2 u β 1 + β 2 u) 2 du β 1 1 β 2 1 s 1 ) ds, s 2 hvor vi bruker substitusjonen β 1 s β 1 + β 2 u i siste linje.