ECON30: EKSAMEN 06v SENSORVEILEDNING. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << Grensen til bestått bør ligge på ca 30-33%. Oppgave I en urne er det 0 kuler hvorav 5 er røde, 4 er blå og er hvit. Kulene er ellers like store og tunge. Det trekkes ut et rent tilfeldig utvalg på kuler fra urnen som betr at alle mulige (ikke-ordnete) utvalg på kuler er like sannsnlige. Det kan vises (som du ikke trenger å gjøre) at utvalget blir rent tilfeldig hvis kulene trekkes en og en slik at alle de 0 kulene i urnen har samme sjanse for å bli trukket i første trekning, mens alle de 9 gjenværende kulene har samme sjanse for å bli trukket i annen trekning. A. La, R, B, H betegne begivenhetene at den første kulen som blir trukket er henholdsvis rød, blå eller hvit. La R, B, H betegne de tilsvarende begivenhetene for den andre kulen som blir trukket ut. For eksempel, R H betr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B B betr at både første og andre kule som blir trukket ut er blå. B betr at den første kulen som blir trukket ut ikke er blå. Finn de 5 sannsnlighetene, P( B ), P( B ), P( B B ), P( B B ), P( B B ) << Svar: 4 3 4 P( B ) 0.4, P( B ) P( B ) 0.6, P( B B ) 0.33..., P( B B ) 0.44... 0 9 9 4 3 P( B B ) P( B ) P( B B ) 0.33... 0 9 B. La Y være antall blå kuler i et rent tilfeldig utvalg på kuler. i. Forklar hvorfor Y er hpergeometrisk fordelt og sett opp et uttrkk for sannsnlighetsfordelingen. ii. Beregn sannsnlighetene P( Y ), 0,,. [Hint. Vis først at 0 45. ] iii. Beregn E( Y ), var( Y ) ved, for eksempel, å bruke formlene for forventning og varians i en hpergeometrisk fordeling.
<< Svar: i: Populasjonen består av N 0 kuler hvorav M 4 er blå. Det trekkes et rent tilfeldig utvalg på n kuler hvorav Y er blå. Siden utvalget er rent tilfeldig, blir Y hpergeometrisk fordelt med punktsannsnligheter ii. Vi har 4 6 P( Y ), 0,, 0 0 0 9 45 og sannsnligheter gitt i tabellen 4 6 0 5 4 6 6 P( Y ) 5 0.33... 45 4 0.533... 45 6 0.33... 45 iii: M 4 M M N n 0 E( Y ) n 0.8, var( Y ) n (0.4)(0.6) 0.467 N 0 N N N 9 C. La X være antall røde kuler i utvalget. Det kan vises (som du ikke trenger å gjøre) at den simultane fordelingen for X og Y er gitt i tabell. Tabell Den simultane fordelingen for X og Y gitt ved f ( x, ) P( X x Y ) x 0 Sum 0 0 4 45 6 45 0 45 5 45 0 45 0 5 45 0 45 0 0 0 45 Sum 5 45 4 45 6 45 i. Er X og Y stokastisk uavhengige? Begrunn svaret ditt. ii. Vis at kovariansen mellom X og Y er cov( XY, ) 0.3556.
3 iii. Finn sannsnlighetene P( Y X 0) og P( Y X ). << Svar: i: De marginale fordelingene finnes i margen i tabellen. X og Y er ikke uavhengige hvis det fins en kombinasjon ( x, ) slik at P( X x Y ) P( X x) P( Y ). Dette gjelder f.eks. for kombinasjonen (0,0) siden P( X 0Y 0) 0, mens P( X 0) P( Y 0) 0 i følge tabellen. Noen vil vise til at X og Y må være avhengige siden kovariansen er 0, som bør godtas. ii: Vi har X Y E XY E X E Y E XY cov(, ) ( ) ( ) 0.8, og tabellen gir 0 E XY xf ( x, ) 0.4444..., som gir cov( XY, ) 0.4444 0.8 0.3556. x 45 f (0,) 4 45 4 iii: P( Y X 0) 0.4 PX ( 0) 0 45 0 f (,) 0 45 0 P( Y X ) 0.8 PX ( ) 5 45 5 D. Mot å betale en spilleavgift på 0 kr. blir Jens tilbudt et spill som består i å trekke kuler fra urnen som beskrevet i innledningen. For hver blå kule i utvalget får Jens 40 kr, men må betale 5 kr. for hver rød kule i utvalget. Hvis det dukker opp en hvit kule i utvalget, får ikke Jens noe for denne, men slipper også å betale noe. Fortjenesten til Jens, V, for et spill kan dermed uttrkkes som V 40Y 5X 0. De mulige fortjenestene som kan inntreffe i et enkelt spill er angitt i tabell. Tabell Mulige fortjenester for et spill med utfall ( x, ) x 0 0 --- 30 70 35 5 --- 60 --- --- i. Finn sannsnligheten for at Jens får positiv fortjeneste i et spill (dvs. finn PV ( 0) ). ii. Finn forventet fortjeneste i et spill, EV ( ). Forklar kort hvordan du ville tolke dette resultatet. iii. Vis at variansen til fortjenesten i et spill er, var( V ) 67.556. [Hint. Variansen til X, som du ikke trenger å beregne her, oppgis til 49 ]
4 << Svar: i: Positiv fortjeneste skjer ved utfallene, (0,), (0,) og (,), som har 4 6 0 30 sannsnlighet PV ( 0). 45 45 3 ii: Regel 4. i boka (utg.3) gir E( V) 40 E( Y ) 5 E( X ) 0 40(0.8) 50 3 5 0 3. Siden forventet fortjeneste er et uttrkk for gjennomsnittlig fortjeneste i det lange løp når Jens spiller mange ganger, viser resultatet at Jens vil tape på spillet i lengden. iii: Regel 4.5 i boka (utg.3) gir var( V ) 40 var( Y ) ( 5) var( X ) 40 5cov( X, Y ) 600(0.467) 65(4 9) 000( 0.3556) 67.556 E. Jens spiller spillet i punkt D 30 ganger. La V i betegne fortjenesten i spill nr. i, i,,,30. Den totale fortjenesten er T V V V30, der V, V,, V 30 antas å være uavhengige og identisk fordelte (uid) med samme fordeling som V. i. Finn sannsnligheten tilnærmet for at T blir positiv (dvs. finn PT ( 0) tilnærmet). [Hint. Du trenger bl.a. EV ( ). Hvis du ikke fant denne i punkt D, gjett på en verdi og bruk denne verdien i beregningen.] ii. Anta at sannsnligheten for at et enkelt spill gir positiv fortjeneste er 3. La U være antall ganger i løpet 30 spill V i blir positiv ( Vi 0). Finn sannsnligheten tilnærmet for at U blir minst 0 (dvs. finn PU ( 0) tilnærmet). << Svar: i. I følge sentralgrenseteoremet er T tilnærmet normalfordelt, N (30 E ( V ), 30 SD ( V )) N 90, 30 67.556 N ( 90, 3.9345), hvorav (der G( z) P( Z z) for Z ~ N (0,) ): T 90 90 90 P( T 0) P G G(0.40) 0.6554 0.3446 3.9345 3.9345 3.9345 ii: Enkeltspillene kan ses på som uavhengige binomiske forsøk med suksessbegivenhet S ( V i 0) og konstant sannsnlighet p 3. U blir dermed binomisk fordelt, 0 U ~ bin(30, 3), som har en varians var( U) 30 5. Dette, ifølge regel 5.0 i 3 3 3 boka, garanterer akseptabel tilnærmelse til normalfordelingen, tilnærmet ~ U N np, np( p) N(0,.580). Dermed (uten heltallskorreksjon): 9 0 P( U 0) P( U 9) PZ PZ 0.39 0.3483 0.657..58 Noen vil foretrekke heltallskorreksjon siden variansen ligger nær tilnærmelses-kriteriet, som vel bør berømmes. Dette gir
5 9.5 0 P( U 0) P( U 9) P( U 9.5) PZ.58 P Z 0.9 0.447 0.5753 Oppgave Tabell 3 viser antall trafikkulkker med personskade i Norge for to perioder, mai 05 (periode ) og juni-juli 05 (periode ). Tabell 3 Periode Mai 05 Juni juli 05 Sum Antall trafikkulkker med personskade 577 74 85 La X betegne antall trafikkulkker i mai og Y summen av antall ulkker i juni og juli der X og Y er sett på som stokastiske variable. Anta at X og Y er uavhengige og poissonfordelte med forventninger, og henholdsvis (kort skrevet: X ~ Pois( ), Y ~ Pois( ) ), der tolkes som forventet ulkkesrate pr. måned som antas å være den samme i de tre månedene i perioden mai juli. For enkelthets skld, bortsett fra i punkt D nedenfor, antar vi også at de tre månedene er like lange, for eksempel 30 dager hver. X og Y gir to uavhengige og forventningsrette estimatorer for, nemlig ˆ X og ˆ Y. * A. i. Hvis V ~ Pois( t ) for en periode på t måneder, forklar kort hvorfor Vt er en forventningsrett estimator for med varians, * var( ) t. ii. Det foreslås to estimatorer for basert på ˆ ˆ og : ˆ ˆ ˆ ˆ ˆ og 3 Vis at både ˆ og er forventningsrette og at ˆ har minst varians lik 3. iii. Beregn de to estimatene for basert på ˆ og og velg det estimatet du mener er best. Angi hvorfor du mener valget ditt er best. << Svar: i: Siden E( V ) var( V) t *, får vi E( ) E V t E( V ) t ( t) t Kilde SSB.
6 var( V) t * og var( ) var Vt t t t ii: Siden både ˆ ˆ og er forventningsrette med varianser henholdsvis, og, får vi ˆ ˆ ˆ ˆ ˆ E( ) E( ) 3 E( ) E 3 3 3 ˆ ˆ E( ˆ ˆ ) E( ) E( ) E ˆ ˆ ˆ ˆ 4 ˆ 4 3 var( ) var var( ) var( ) 3 9 9 9 9 9 3 ˆ ˆ ˆ ˆ var( ) var( ) 3 var( ) var var( ˆ ) 4 4 8 8 3 iii: Estimater: ˆ X Y 577 74 X Y 577 637 67, 607 3 3 For to forventningsrette estimatorer foretrekkes den med minst varians. Dermed blir det mest troverdige estimatet det første, 67. B. Det kan vises (som du ikke trenger å gjøre) at normalfordelt (N(0, )) uansett. ˆ er tilnærmet standard ˆ 3 i. Bruk dette til å utlede et konfidensintervall for med konfidensgrad tilnærmet 0.90, basert på ˆ. ii. Beregn det erverte konfidensintervallet basert på data i tabell 3. << Svar: i: Hvis U ~ N (0,), er P(.645 U.645) 0.90, der.645 z0.05 er 5% kvantilen i N(0, ). Dermed ˆ ˆ ˆ 0.90.645.645 ˆ P P.645 ˆ.645, som gir et ˆ 3 3 3 ˆ tilnærmet 90% konfidensintervall: ˆ.645. 3 ii: Observert: ˆ ˆ 67.645 67.645 67 3.59 [593, 64] 3 3
7 C. Vi ønsker å sjekke antakelsen om konstant ulkkesrate i hele tre-månedsperioden mai juli med en statistisk test. For å få til dette utvider vi modellen litt ved å anta at forventet ulkkesrate for mai er og for juni-juli, der og ikke behøver å være like. Vi ønsker å teste nullhpotesen at og er like, dvs. H0 : 0 mot H : 0. Innfører vi parameteren, kan vi skrive hpotesen vi ønsker å teste som H0: 0 mot H: 0 Forventningsrette estimatorer, ˆ og ˆ, er gitt i innledningen. La betegne variansen til ˆ ˆ ˆ som avhenger av de ukjente og. Estimatoren ˆ er dannet ved å erstatte de ukjente og med sine respektive estimatorer. i. Forklar kort hvorfor ˆ ˆ ˆ er tilnærmet normalfordelt. ˆ ii. Det kan vises (som du ikke trenger å gjøre) at Z er tilnærmet standard ˆ normalfordelt, N(0, ), dersom (dvs. 0 ). Bruk dette til å sette opp et forkastningskriterium for en test for H 0 med signifikansnivå tilnærmet 0.05. iii. Gjennomfør testen i ii. og formuler en konklusjon. << Svar: i: I følge regel 5.0 i boka er både X og Y tilnærmet normalfordelte med varianser godt over 5 som er tommelfingerkriteriet for normaltilnærmelsen. Siden en lineærkombinasjon av uavhengige normalfordelte variable selv er normalfordelt, må ˆ ˆ ˆ Y X være tilnærmet normalfordelt. ii: Forkast H 0 hvis Z.96 eller Z.96, der.96 z0.05 er.5%-kvantilen i N(0, ). ˆ ˆ ˆ 637 577 60 var( ˆ ) var ˆ ˆ og ˆ ˆ ˆ Y 4 X iii: Y X Observert: ˆ Y 4 X 74 4 577 9.95 60 Z.0 Konklusjon: Forkast H 0. Dvs. på 5% (tilnærmet) nivå er 9.95 det evidens i data for at antakelsen om konstant ulkkesrate er feil. D. Til tross for eventuell forkastning av H 0 i punkt C., går vi nå tilbake til den opprinnelige modellen med konstant forventet ulkkesrate pr. tidsenhet i hele tremånedsperioden, men ønsker å justere for at månedslengden varierer i perioden. I alt omfatter perioden 9 dager siden mai og juli har 3 dager hver. Istedenfor vil vi nå estimere definert som forventet ulkkesrate pr. 30 dager uansett måned. En måte å gjøre dette på er ved å forutsette at T X Y er poisson-fordelt med forventning 9, der 30 er forventet ulkkesrate pr. dag som antas å være konstant i perioden.
8 i. Sett opp en forventningsrett estimator, ˆ, for og finn et uttrkk for variansen til denne. ii. iii. Beregn estimatet basert på ˆ og standardfeilen, SE( ˆ ) (som betr estimert standardavvik for ˆ ). ˆ Beregn også et tilnærmet 95% konfidensintervall basert på at er tilnærmet SE( ˆ ) standard normalfordelt (som du ikke trenger å begrunne her). << Svar: i: En forventningsrett estimator for er ˆ T 9 med varians 9. Siden 30, blir ˆ 30 ˆ 30T 9 forventningsrett med varians ˆ 30 var( ) 900var( ˆ ) 900 9 30 (309) (eller 900 som også bør godtas ). 9 9 30 30 85 ii: Estimat: ˆ T 603.6 9 9 30 30 Standardfeil = ˆ 9 9 603.6 4.09 iii: Konfidensintervallet blir ˆ.96 SE( ˆ ). Observert: 603.6 (.96)(4.09) [576, 63]