betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Like dokumenter
UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Fasit for tilleggsoppgaver

TMA4240 Statistikk Høst 2015

Løsningskisse for oppgaver til undervisningsfri uke 14 (6.-9. april)

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Econ 2130 uke 16 (HG)

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2016

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Eksamen i. MAT110 Statistikk 1

Løsningskisse seminaroppgaver uke 15

Løsningskisse seminaroppgaver uke 11 ( mars)

ECON2130 Kommentarer til oblig

TMA4245 Statistikk Eksamen desember 2016

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

i x i

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag, eksamen statistikk, juni 2015

TMA4240 Statistikk Høst 2018

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Regneøvelse 22/5, 2017

TMA4240 Statistikk Eksamen desember 2015

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

EKSAMEN I TMA4240 Statistikk

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

TMA4240 Statistikk H2010 (22)

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Kort overblikk over kurset sålangt

Eksamensoppgave i TMA4245 Statistikk

ST0202 Statistikk for samfunnsvitere

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen august 2014

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240 Statistikk Høst 2009

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Hogskoleni Østfold EKSAMEN. Eksamenstid: kl til k

Løsningsforslag til obligatorisk oppgave i ECON 2130

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Hypotesetesting. mot. mot. mot. ˆ x

Løsning eksamen desember 2017

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Formelsamling i medisinsk statistikk

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4240 Statistikk

Kapittel 9 og 10: Hypotesetesting

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

HØGSKOLEN I STAVANGER

Emnenavn: Eksamenstid: Faglærer: Hans Kristian Bekkevard

Utvalgsfordelinger (Kapittel 5)

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

6.2 Signifikanstester

TMA4245 Statistikk Eksamen august 2014

Løsning eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren

Eksamensoppgave i ST0103 Brukerkurs i statistikk

STK1100 våren 2019 Mere om konfidensintevaller

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4245 Statistikk Eksamen desember 2016

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Hypergeometrisk modell

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

HØGSKOLEN I STAVANGER

Transkript:

ECON30: EKSAMEN 06v SENSORVEILEDNING. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << Grensen til bestått bør ligge på ca 30-33%. Oppgave I en urne er det 0 kuler hvorav 5 er røde, 4 er blå og er hvit. Kulene er ellers like store og tunge. Det trekkes ut et rent tilfeldig utvalg på kuler fra urnen som betr at alle mulige (ikke-ordnete) utvalg på kuler er like sannsnlige. Det kan vises (som du ikke trenger å gjøre) at utvalget blir rent tilfeldig hvis kulene trekkes en og en slik at alle de 0 kulene i urnen har samme sjanse for å bli trukket i første trekning, mens alle de 9 gjenværende kulene har samme sjanse for å bli trukket i annen trekning. A. La, R, B, H betegne begivenhetene at den første kulen som blir trukket er henholdsvis rød, blå eller hvit. La R, B, H betegne de tilsvarende begivenhetene for den andre kulen som blir trukket ut. For eksempel, R H betr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B B betr at både første og andre kule som blir trukket ut er blå. B betr at den første kulen som blir trukket ut ikke er blå. Finn de 5 sannsnlighetene, P( B ), P( B ), P( B B ), P( B B ), P( B B ) << Svar: 4 3 4 P( B ) 0.4, P( B ) P( B ) 0.6, P( B B ) 0.33..., P( B B ) 0.44... 0 9 9 4 3 P( B B ) P( B ) P( B B ) 0.33... 0 9 B. La Y være antall blå kuler i et rent tilfeldig utvalg på kuler. i. Forklar hvorfor Y er hpergeometrisk fordelt og sett opp et uttrkk for sannsnlighetsfordelingen. ii. Beregn sannsnlighetene P( Y ), 0,,. [Hint. Vis først at 0 45. ] iii. Beregn E( Y ), var( Y ) ved, for eksempel, å bruke formlene for forventning og varians i en hpergeometrisk fordeling.

<< Svar: i: Populasjonen består av N 0 kuler hvorav M 4 er blå. Det trekkes et rent tilfeldig utvalg på n kuler hvorav Y er blå. Siden utvalget er rent tilfeldig, blir Y hpergeometrisk fordelt med punktsannsnligheter ii. Vi har 4 6 P( Y ), 0,, 0 0 0 9 45 og sannsnligheter gitt i tabellen 4 6 0 5 4 6 6 P( Y ) 5 0.33... 45 4 0.533... 45 6 0.33... 45 iii: M 4 M M N n 0 E( Y ) n 0.8, var( Y ) n (0.4)(0.6) 0.467 N 0 N N N 9 C. La X være antall røde kuler i utvalget. Det kan vises (som du ikke trenger å gjøre) at den simultane fordelingen for X og Y er gitt i tabell. Tabell Den simultane fordelingen for X og Y gitt ved f ( x, ) P( X x Y ) x 0 Sum 0 0 4 45 6 45 0 45 5 45 0 45 0 5 45 0 45 0 0 0 45 Sum 5 45 4 45 6 45 i. Er X og Y stokastisk uavhengige? Begrunn svaret ditt. ii. Vis at kovariansen mellom X og Y er cov( XY, ) 0.3556.

3 iii. Finn sannsnlighetene P( Y X 0) og P( Y X ). << Svar: i: De marginale fordelingene finnes i margen i tabellen. X og Y er ikke uavhengige hvis det fins en kombinasjon ( x, ) slik at P( X x Y ) P( X x) P( Y ). Dette gjelder f.eks. for kombinasjonen (0,0) siden P( X 0Y 0) 0, mens P( X 0) P( Y 0) 0 i følge tabellen. Noen vil vise til at X og Y må være avhengige siden kovariansen er 0, som bør godtas. ii: Vi har X Y E XY E X E Y E XY cov(, ) ( ) ( ) 0.8, og tabellen gir 0 E XY xf ( x, ) 0.4444..., som gir cov( XY, ) 0.4444 0.8 0.3556. x 45 f (0,) 4 45 4 iii: P( Y X 0) 0.4 PX ( 0) 0 45 0 f (,) 0 45 0 P( Y X ) 0.8 PX ( ) 5 45 5 D. Mot å betale en spilleavgift på 0 kr. blir Jens tilbudt et spill som består i å trekke kuler fra urnen som beskrevet i innledningen. For hver blå kule i utvalget får Jens 40 kr, men må betale 5 kr. for hver rød kule i utvalget. Hvis det dukker opp en hvit kule i utvalget, får ikke Jens noe for denne, men slipper også å betale noe. Fortjenesten til Jens, V, for et spill kan dermed uttrkkes som V 40Y 5X 0. De mulige fortjenestene som kan inntreffe i et enkelt spill er angitt i tabell. Tabell Mulige fortjenester for et spill med utfall ( x, ) x 0 0 --- 30 70 35 5 --- 60 --- --- i. Finn sannsnligheten for at Jens får positiv fortjeneste i et spill (dvs. finn PV ( 0) ). ii. Finn forventet fortjeneste i et spill, EV ( ). Forklar kort hvordan du ville tolke dette resultatet. iii. Vis at variansen til fortjenesten i et spill er, var( V ) 67.556. [Hint. Variansen til X, som du ikke trenger å beregne her, oppgis til 49 ]

4 << Svar: i: Positiv fortjeneste skjer ved utfallene, (0,), (0,) og (,), som har 4 6 0 30 sannsnlighet PV ( 0). 45 45 3 ii: Regel 4. i boka (utg.3) gir E( V) 40 E( Y ) 5 E( X ) 0 40(0.8) 50 3 5 0 3. Siden forventet fortjeneste er et uttrkk for gjennomsnittlig fortjeneste i det lange løp når Jens spiller mange ganger, viser resultatet at Jens vil tape på spillet i lengden. iii: Regel 4.5 i boka (utg.3) gir var( V ) 40 var( Y ) ( 5) var( X ) 40 5cov( X, Y ) 600(0.467) 65(4 9) 000( 0.3556) 67.556 E. Jens spiller spillet i punkt D 30 ganger. La V i betegne fortjenesten i spill nr. i, i,,,30. Den totale fortjenesten er T V V V30, der V, V,, V 30 antas å være uavhengige og identisk fordelte (uid) med samme fordeling som V. i. Finn sannsnligheten tilnærmet for at T blir positiv (dvs. finn PT ( 0) tilnærmet). [Hint. Du trenger bl.a. EV ( ). Hvis du ikke fant denne i punkt D, gjett på en verdi og bruk denne verdien i beregningen.] ii. Anta at sannsnligheten for at et enkelt spill gir positiv fortjeneste er 3. La U være antall ganger i løpet 30 spill V i blir positiv ( Vi 0). Finn sannsnligheten tilnærmet for at U blir minst 0 (dvs. finn PU ( 0) tilnærmet). << Svar: i. I følge sentralgrenseteoremet er T tilnærmet normalfordelt, N (30 E ( V ), 30 SD ( V )) N 90, 30 67.556 N ( 90, 3.9345), hvorav (der G( z) P( Z z) for Z ~ N (0,) ): T 90 90 90 P( T 0) P G G(0.40) 0.6554 0.3446 3.9345 3.9345 3.9345 ii: Enkeltspillene kan ses på som uavhengige binomiske forsøk med suksessbegivenhet S ( V i 0) og konstant sannsnlighet p 3. U blir dermed binomisk fordelt, 0 U ~ bin(30, 3), som har en varians var( U) 30 5. Dette, ifølge regel 5.0 i 3 3 3 boka, garanterer akseptabel tilnærmelse til normalfordelingen, tilnærmet ~ U N np, np( p) N(0,.580). Dermed (uten heltallskorreksjon): 9 0 P( U 0) P( U 9) PZ PZ 0.39 0.3483 0.657..58 Noen vil foretrekke heltallskorreksjon siden variansen ligger nær tilnærmelses-kriteriet, som vel bør berømmes. Dette gir

5 9.5 0 P( U 0) P( U 9) P( U 9.5) PZ.58 P Z 0.9 0.447 0.5753 Oppgave Tabell 3 viser antall trafikkulkker med personskade i Norge for to perioder, mai 05 (periode ) og juni-juli 05 (periode ). Tabell 3 Periode Mai 05 Juni juli 05 Sum Antall trafikkulkker med personskade 577 74 85 La X betegne antall trafikkulkker i mai og Y summen av antall ulkker i juni og juli der X og Y er sett på som stokastiske variable. Anta at X og Y er uavhengige og poissonfordelte med forventninger, og henholdsvis (kort skrevet: X ~ Pois( ), Y ~ Pois( ) ), der tolkes som forventet ulkkesrate pr. måned som antas å være den samme i de tre månedene i perioden mai juli. For enkelthets skld, bortsett fra i punkt D nedenfor, antar vi også at de tre månedene er like lange, for eksempel 30 dager hver. X og Y gir to uavhengige og forventningsrette estimatorer for, nemlig ˆ X og ˆ Y. * A. i. Hvis V ~ Pois( t ) for en periode på t måneder, forklar kort hvorfor Vt er en forventningsrett estimator for med varians, * var( ) t. ii. Det foreslås to estimatorer for basert på ˆ ˆ og : ˆ ˆ ˆ ˆ ˆ og 3 Vis at både ˆ og er forventningsrette og at ˆ har minst varians lik 3. iii. Beregn de to estimatene for basert på ˆ og og velg det estimatet du mener er best. Angi hvorfor du mener valget ditt er best. << Svar: i: Siden E( V ) var( V) t *, får vi E( ) E V t E( V ) t ( t) t Kilde SSB.

6 var( V) t * og var( ) var Vt t t t ii: Siden både ˆ ˆ og er forventningsrette med varianser henholdsvis, og, får vi ˆ ˆ ˆ ˆ ˆ E( ) E( ) 3 E( ) E 3 3 3 ˆ ˆ E( ˆ ˆ ) E( ) E( ) E ˆ ˆ ˆ ˆ 4 ˆ 4 3 var( ) var var( ) var( ) 3 9 9 9 9 9 3 ˆ ˆ ˆ ˆ var( ) var( ) 3 var( ) var var( ˆ ) 4 4 8 8 3 iii: Estimater: ˆ X Y 577 74 X Y 577 637 67, 607 3 3 For to forventningsrette estimatorer foretrekkes den med minst varians. Dermed blir det mest troverdige estimatet det første, 67. B. Det kan vises (som du ikke trenger å gjøre) at normalfordelt (N(0, )) uansett. ˆ er tilnærmet standard ˆ 3 i. Bruk dette til å utlede et konfidensintervall for med konfidensgrad tilnærmet 0.90, basert på ˆ. ii. Beregn det erverte konfidensintervallet basert på data i tabell 3. << Svar: i: Hvis U ~ N (0,), er P(.645 U.645) 0.90, der.645 z0.05 er 5% kvantilen i N(0, ). Dermed ˆ ˆ ˆ 0.90.645.645 ˆ P P.645 ˆ.645, som gir et ˆ 3 3 3 ˆ tilnærmet 90% konfidensintervall: ˆ.645. 3 ii: Observert: ˆ ˆ 67.645 67.645 67 3.59 [593, 64] 3 3

7 C. Vi ønsker å sjekke antakelsen om konstant ulkkesrate i hele tre-månedsperioden mai juli med en statistisk test. For å få til dette utvider vi modellen litt ved å anta at forventet ulkkesrate for mai er og for juni-juli, der og ikke behøver å være like. Vi ønsker å teste nullhpotesen at og er like, dvs. H0 : 0 mot H : 0. Innfører vi parameteren, kan vi skrive hpotesen vi ønsker å teste som H0: 0 mot H: 0 Forventningsrette estimatorer, ˆ og ˆ, er gitt i innledningen. La betegne variansen til ˆ ˆ ˆ som avhenger av de ukjente og. Estimatoren ˆ er dannet ved å erstatte de ukjente og med sine respektive estimatorer. i. Forklar kort hvorfor ˆ ˆ ˆ er tilnærmet normalfordelt. ˆ ii. Det kan vises (som du ikke trenger å gjøre) at Z er tilnærmet standard ˆ normalfordelt, N(0, ), dersom (dvs. 0 ). Bruk dette til å sette opp et forkastningskriterium for en test for H 0 med signifikansnivå tilnærmet 0.05. iii. Gjennomfør testen i ii. og formuler en konklusjon. << Svar: i: I følge regel 5.0 i boka er både X og Y tilnærmet normalfordelte med varianser godt over 5 som er tommelfingerkriteriet for normaltilnærmelsen. Siden en lineærkombinasjon av uavhengige normalfordelte variable selv er normalfordelt, må ˆ ˆ ˆ Y X være tilnærmet normalfordelt. ii: Forkast H 0 hvis Z.96 eller Z.96, der.96 z0.05 er.5%-kvantilen i N(0, ). ˆ ˆ ˆ 637 577 60 var( ˆ ) var ˆ ˆ og ˆ ˆ ˆ Y 4 X iii: Y X Observert: ˆ Y 4 X 74 4 577 9.95 60 Z.0 Konklusjon: Forkast H 0. Dvs. på 5% (tilnærmet) nivå er 9.95 det evidens i data for at antakelsen om konstant ulkkesrate er feil. D. Til tross for eventuell forkastning av H 0 i punkt C., går vi nå tilbake til den opprinnelige modellen med konstant forventet ulkkesrate pr. tidsenhet i hele tremånedsperioden, men ønsker å justere for at månedslengden varierer i perioden. I alt omfatter perioden 9 dager siden mai og juli har 3 dager hver. Istedenfor vil vi nå estimere definert som forventet ulkkesrate pr. 30 dager uansett måned. En måte å gjøre dette på er ved å forutsette at T X Y er poisson-fordelt med forventning 9, der 30 er forventet ulkkesrate pr. dag som antas å være konstant i perioden.

8 i. Sett opp en forventningsrett estimator, ˆ, for og finn et uttrkk for variansen til denne. ii. iii. Beregn estimatet basert på ˆ og standardfeilen, SE( ˆ ) (som betr estimert standardavvik for ˆ ). ˆ Beregn også et tilnærmet 95% konfidensintervall basert på at er tilnærmet SE( ˆ ) standard normalfordelt (som du ikke trenger å begrunne her). << Svar: i: En forventningsrett estimator for er ˆ T 9 med varians 9. Siden 30, blir ˆ 30 ˆ 30T 9 forventningsrett med varians ˆ 30 var( ) 900var( ˆ ) 900 9 30 (309) (eller 900 som også bør godtas ). 9 9 30 30 85 ii: Estimat: ˆ T 603.6 9 9 30 30 Standardfeil = ˆ 9 9 603.6 4.09 iii: Konfidensintervallet blir ˆ.96 SE( ˆ ). Observert: 603.6 (.96)(4.09) [576, 63]