Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel. Det er i flere av oppgavene flere fremgangsmåter. Om din måte var riktig burde komme frem i rettingen. A Både X og Y tilfredsstiller hver for seg Definisjon 5.1 «Binomisk forsøksrekke» 1. Hvert av kastene har to interessante utfall. For X er det om det blir sekser eller ikke og for Y er det om det blir ener eller ikke. 2. Sannsynligheten for suksess P(sekser) for X, P(ener) for Y, er lik i hvert delforsøk. 3. Delforsøkene er statistisk uavhengige. Utfallet av ett kast påvirker ikke det neste. Siden X og Y er binomisk fordelte variabler med n = 3 og p = 1/6 har de samme sannsynlighetsfordeling: Det gir sannsynlighetene: Dette stemmer med de marginale sannsynlighetsfordelingene. B

[ ] Siden X og Y er identisk fordelte vil E(Y) = E(X) = 1/2 og Var(Y) = Var(X) = 5/12 En åpenbar snarvei vil være å bruke informasjonen fra A om at X og Y er binomisk fordelte med n = 3 og p = 1/6. Da vet vi at E(X) = np = 3*1/6 = 1/2 = E(Y) og Var(X) = np(1-p) = 3*(1/6)*(1-1/6) = 5/12 (Jeg har droppet alle leddene som blir 0) C For tilbyderen er fortjenesten V så D Lager en tabell over mulige verdier for X og Y og hvilke verdier de gir for V. x y v P(V=v) 3 0 500 1/216 2 0 300 1/18 2 1 280 1/72 1 0 100 2/9 1 1 80 1/9 1 2 60 1/72

-160-140 -120-100 -80-60 -40-20 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500 0 0-100 8/27 0 1-120 2/9 0 2-140 1/18 0 3-160 1/216 Ved hjelp av tabellen over er det lett å finne sannsynligheten for at V blir større enn 50 kr. E v -160-140 -120-100 60 80 100 280 300 500 h(v)=p(v=v) 1/216 1/18 2/9 8/27 1/72 1/9 2/9 1/72 1/18 1/216 En av tingene som er viktige når vi lager et histogram er at x-aksen dekker hele intervallet. Her [-160, 500]. Intervallbredde på en vil gi oss et klarest inntrykk av sannsynlighetsfordelingen, men ser kanskje ikke like pent ut. Et annet godt valg av intervallbredde kan være 20, det ser litt bedre ut, men man mister litt informasjon. 7/20 3/10 1/4 1/5 3/20 1/10 1/20 Sannsynlighetshistogram for V 0 F ( )

Her har jeg brukt Regel 4.12 (Forventing til en sum av variabler) Her har jeg brukt Regel 4.17 (Varians av sum av uavhengige variabler) ( ) ( ) G Bruker Descriptive Statistics i Data Analysis Ser at gjennomsnittet (Mean) av de 500 genererte observasjonene av U er - 196.68 som er veldig nært den teoretiske verdien 200. Standardavviket på 614 er heller ikke langt unna den teoretiske verdien 591.6. Store talls lov sier at gjennomsnittet vil gå mot E(U) når n går mot uendelig.

Tetthet Intervall opp tom Frekvens Rel. Frekv Søylebredde Søyleareal Søylehøyde X-akse midtpu nkt -1950 1 0,002 250 0,002 0,000008-2075 -1700 1 0,002 250 0,002 0,000008-1825 -1450 6 0,012 250 0,012 0,000048-1575 -1200 17 0,034 250 0,034 0,000136-1325 -950 25 0,05 250 0,05 0,0002-1075 -700 58 0,116 250 0,116 0,000464-825 -450 61 0,122 250 0,122 0,000488-575 -200 89 0,178 250 0,178 0,000712-325 50 78 0,156 250 0,156 0,000624-75 300 62 0,124 250 0,124 0,000496 175 550 40 0,08 250 0,08 0,00032 425 800 30 0,06 250 0,06 0,00024 675 1050 22 0,044 250 0,044 0,000176 925 1300 6 0,012 250 0,012 0,000048 1175 1550 4 0,008 250 0,008 0,000032 1425 Legg merke til kolonnen X-aske midtpunkt som jeg har konstruert siden Excel er liker å ha verdiene under søylene i histogrammet. Verdiene i altså midtpunktet i intervallet som ender i tallet på samme rad. Jeg endrer X-label til disse etter at jeg har konstruert histogrammet ved hjelp av Intervall opp tom og Søylehøyde 0.0008 Histogram for observasjoner av U 0.0007 0.0006 0.0005 0.0004 0.0003 0.0002 0.0001 0-2075 -1825-1575 -1325-1075 -825-575 -325-75 175 425 675 925 1175 1425 u H Å tegne klokkekurven inn sammen med histogrammet var vanskelig å få til i Excel så jeg valgte å bruke R. Så lenge det er noe som er ganske likt er det helt OK selv om det er tegnet for hånd. Her har jeg også generert nye observasjoner av U.

Density 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 7e-04 Histogram med normalfordelingskurve -2000-1000 0 1000 2000 u I mitt tilfelle passer søylene ganske godt til kurven. Om jeg hadde endret på intervallene er det mulig de ville passet enda bedre. For de spesielt interesserte er dette koden jeg brukte i R: > x <- c(-160, -140, -120, -100, 60, 80, 100, 280, 300, 500) > p <- c(1/216, 1/18, 2/9, 8/27, 1/72, 1/9,2/9,1/72,1/18,1/216) > v <- sample(x,10000,replace=true,prob=p) > V <- matrix(unlist(v),ncol=20) > U <- rowsums(v) > b <- c(-1880, -1630, -1380, -1130, -880, -630, -380, -130, 120, 370, 620, 870, 1120, 1370, 1620, 1870) > hist(u,breaks=b, freq=false,main='histogram med normalfordelingskurve',xlab='u') > curve(dnorm(x,-200,591.6),-2000,2000,add=t,col="blue")

I Ved å bruke funksjonen FREQUENCY(data_array;bins_array) kan vi sjekke hvor mange av observasjonene som er innenfor et intervall. Ved å markere alle observasjonene av U som argumentet data_array og en lav verdi nært null som for eksempel -0.1 for bins_array får vi hvor mange observasjoner opp til og med -0.1. I mitt tilfelle ble det 313. Den relative frekvensen er da 313/500=0.626 som er nært sannsynligheten som ble regnet ut i oppgave F (0.6331) der vi antok at U var tilnærmet normalfordelt. Resultatet mitt gir ingen grunn til å tvile på tilnærmingen. J i) Hvor E(V) = -10 og Var(V) = 17500 ( ) ( ) ( ) ( ) ii) Finner c 1 ogc 2 : Altså er c 1 =-9866 og c 2 =-134 {

dnorm(x, -5000, 2958) 0.00000 0.00004 0.00008 0.00012-15000 -10000-5000 0 5000 u Vi skal finne det mest sannsynlige variansjonsområdet for U. Altså det minste intervallet som oppfyller at det er 90 %(gitt i oppgaven) sannsynlig for en observasjon av U i intervallet. Vi vet at normalfordelingskurven er entoppet og symmetrisk. Vi vil finne det minste intervallet av u som gir et areal på 0.9. Da er det naturlig å begynne der kurven har maksimumspunkt og så gå symmetrisk til hver side inntil arealet blir 0.9. Da blir arealet til kurven på hver side av intervallet 0.05, P(U<c 1 ) = 0.05 og P(c 2 <U) = 0.05 = 1 - P(U c 2 ). Så bruker vi videre at for den standardiserte normalfordelingen: Hvor i vårt tilfelle. Har du spørsmål, kommentarer eller finner feil ta kontakt med meg (Jonas) (jonasschenkel@gmail.com) eller Kristoffer (kristoffberg@gmail.com)