Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

Like dokumenter
ECON2130 Kommentarer til oblig

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Seksjon 1.3 Tetthetskurver og normalfordelingen

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Statistikk 1 kapittel 5

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Binomisk sannsynlighetsfunksjon

Statistikk 1 kapittel 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Kap. 7 - Sannsynlighetsfordelinger

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Kontinuerlige sannsynlighetsfordelinger.

ST0202 Statistikk for samfunnsvitere

Statistikk 1 kapittel 5

TMA4240 Statistikk Høst 2015

Seksjon 1.3 Tetthetskurver og normalfordelingen

Statistikk 1 kapittel 5

ØVINGER 2017 Løsninger til oppgaver. Øving 1

Sannsynlighet og statistikk

Kontinuerlige sannsynlighetsfordelinger.

Medisinsk statistikk Del I høsten 2009:

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Løsningsforslag til obligatorisk oppgave i ECON 2130

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

ST0103 Brukerkurs i statistikk Høst 2014

Sannsynlighet og statistikk S2 Løsninger

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

TMA4240 Statistikk Høst 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Forelening 1, kapittel 4 Stokastiske variable

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk 2014

Oppgaver fra 8.3, 8.4, , 8.51, 8.52, 8.231, 8.232, 8.250, 8.252

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Fasit for tilleggsoppgaver

Utvalgsfordelinger (Kapittel 5)

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Eksempel på data: Karakterer i «Stat class» Introduksjon

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

TMA4245 Statistikk Eksamen desember 2016

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

TMA4240 Statistikk Høst 2016

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Bernoulli forsøksrekke og binomisk fordeling

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

ÅMA110 Sannsynlighetsregning med statistikk, våren

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Sannsynlighet og statistikk S2 Oppgaver

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

Beskrivende statistikk.

Regneregler for forventning og varians

STK Oppsummering

Løsningskisse seminaroppgaver uke 15

Ekstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Regneøvelse 22/5, 2017

Kapittel 4.3: Tilfeldige/stokastiske variable

LØSNING: Eksamen 22. mai 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ØVINGER 2017 Løsninger til oppgaver. Lineærkombinasjonen Z = 5X + 8Y har forventningsverdi

HØGSKOLEN I STAVANGER

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

UNIVERSITETET I OSLO Matematisk Institutt

Formelsamling i medisinsk statistikk

Geogebra hjelp - S2. Funksjonsanalyse. Innhold. Kommando. Funksjonsanalyse 1. Undersøke om dataene er normalfordelt 1.

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

UNIVERSITETET I OSLO

Hypergeometrisk modell

Forelesning 3. april, 2017

QED Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

TMA4240 Statistikk Høst 2009

Løsningsforslag til oppgaver brukt i STA100

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Løsningsforslag statistikkeksamen desember 2014

Løsningsforslag Eksamen S2, høsten 2016 Laget av Tommy Odland Dato: 27. januar 2017

Statistikk 1 kapittel 4

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Transkript:

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel. Det er i flere av oppgavene flere fremgangsmåter. Om din måte var riktig burde komme frem i rettingen. A Både X og Y tilfredsstiller hver for seg Definisjon 5.1 «Binomisk forsøksrekke» 1. Hvert av kastene har to interessante utfall. For X er det om det blir sekser eller ikke og for Y er det om det blir ener eller ikke. 2. Sannsynligheten for suksess P(sekser) for X, P(ener) for Y, er lik i hvert delforsøk. 3. Delforsøkene er statistisk uavhengige. Utfallet av ett kast påvirker ikke det neste. Siden X og Y er binomisk fordelte variabler med n = 3 og p = 1/6 har de samme sannsynlighetsfordeling: Det gir sannsynlighetene: Dette stemmer med de marginale sannsynlighetsfordelingene. B

[ ] Siden X og Y er identisk fordelte vil E(Y) = E(X) = 1/2 og Var(Y) = Var(X) = 5/12 En åpenbar snarvei vil være å bruke informasjonen fra A om at X og Y er binomisk fordelte med n = 3 og p = 1/6. Da vet vi at E(X) = np = 3*1/6 = 1/2 = E(Y) og Var(X) = np(1-p) = 3*(1/6)*(1-1/6) = 5/12 (Jeg har droppet alle leddene som blir 0) C For tilbyderen er fortjenesten V så D Lager en tabell over mulige verdier for X og Y og hvilke verdier de gir for V. x y v P(V=v) 3 0 500 1/216 2 0 300 1/18 2 1 280 1/72 1 0 100 2/9 1 1 80 1/9 1 2 60 1/72

-160-140 -120-100 -80-60 -40-20 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500 0 0-100 8/27 0 1-120 2/9 0 2-140 1/18 0 3-160 1/216 Ved hjelp av tabellen over er det lett å finne sannsynligheten for at V blir større enn 50 kr. E v -160-140 -120-100 60 80 100 280 300 500 h(v)=p(v=v) 1/216 1/18 2/9 8/27 1/72 1/9 2/9 1/72 1/18 1/216 En av tingene som er viktige når vi lager et histogram er at x-aksen dekker hele intervallet. Her [-160, 500]. Intervallbredde på en vil gi oss et klarest inntrykk av sannsynlighetsfordelingen, men ser kanskje ikke like pent ut. Et annet godt valg av intervallbredde kan være 20, det ser litt bedre ut, men man mister litt informasjon. 7/20 3/10 1/4 1/5 3/20 1/10 1/20 Sannsynlighetshistogram for V 0 F ( )

Her har jeg brukt Regel 4.12 (Forventing til en sum av variabler) Her har jeg brukt Regel 4.17 (Varians av sum av uavhengige variabler) ( ) ( ) G Bruker Descriptive Statistics i Data Analysis Ser at gjennomsnittet (Mean) av de 500 genererte observasjonene av U er - 196.68 som er veldig nært den teoretiske verdien 200. Standardavviket på 614 er heller ikke langt unna den teoretiske verdien 591.6. Store talls lov sier at gjennomsnittet vil gå mot E(U) når n går mot uendelig.

Tetthet Intervall opp tom Frekvens Rel. Frekv Søylebredde Søyleareal Søylehøyde X-akse midtpu nkt -1950 1 0,002 250 0,002 0,000008-2075 -1700 1 0,002 250 0,002 0,000008-1825 -1450 6 0,012 250 0,012 0,000048-1575 -1200 17 0,034 250 0,034 0,000136-1325 -950 25 0,05 250 0,05 0,0002-1075 -700 58 0,116 250 0,116 0,000464-825 -450 61 0,122 250 0,122 0,000488-575 -200 89 0,178 250 0,178 0,000712-325 50 78 0,156 250 0,156 0,000624-75 300 62 0,124 250 0,124 0,000496 175 550 40 0,08 250 0,08 0,00032 425 800 30 0,06 250 0,06 0,00024 675 1050 22 0,044 250 0,044 0,000176 925 1300 6 0,012 250 0,012 0,000048 1175 1550 4 0,008 250 0,008 0,000032 1425 Legg merke til kolonnen X-aske midtpunkt som jeg har konstruert siden Excel er liker å ha verdiene under søylene i histogrammet. Verdiene i altså midtpunktet i intervallet som ender i tallet på samme rad. Jeg endrer X-label til disse etter at jeg har konstruert histogrammet ved hjelp av Intervall opp tom og Søylehøyde 0.0008 Histogram for observasjoner av U 0.0007 0.0006 0.0005 0.0004 0.0003 0.0002 0.0001 0-2075 -1825-1575 -1325-1075 -825-575 -325-75 175 425 675 925 1175 1425 u H Å tegne klokkekurven inn sammen med histogrammet var vanskelig å få til i Excel så jeg valgte å bruke R. Så lenge det er noe som er ganske likt er det helt OK selv om det er tegnet for hånd. Her har jeg også generert nye observasjoner av U.

Density 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 7e-04 Histogram med normalfordelingskurve -2000-1000 0 1000 2000 u I mitt tilfelle passer søylene ganske godt til kurven. Om jeg hadde endret på intervallene er det mulig de ville passet enda bedre. For de spesielt interesserte er dette koden jeg brukte i R: > x <- c(-160, -140, -120, -100, 60, 80, 100, 280, 300, 500) > p <- c(1/216, 1/18, 2/9, 8/27, 1/72, 1/9,2/9,1/72,1/18,1/216) > v <- sample(x,10000,replace=true,prob=p) > V <- matrix(unlist(v),ncol=20) > U <- rowsums(v) > b <- c(-1880, -1630, -1380, -1130, -880, -630, -380, -130, 120, 370, 620, 870, 1120, 1370, 1620, 1870) > hist(u,breaks=b, freq=false,main='histogram med normalfordelingskurve',xlab='u') > curve(dnorm(x,-200,591.6),-2000,2000,add=t,col="blue")

I Ved å bruke funksjonen FREQUENCY(data_array;bins_array) kan vi sjekke hvor mange av observasjonene som er innenfor et intervall. Ved å markere alle observasjonene av U som argumentet data_array og en lav verdi nært null som for eksempel -0.1 for bins_array får vi hvor mange observasjoner opp til og med -0.1. I mitt tilfelle ble det 313. Den relative frekvensen er da 313/500=0.626 som er nært sannsynligheten som ble regnet ut i oppgave F (0.6331) der vi antok at U var tilnærmet normalfordelt. Resultatet mitt gir ingen grunn til å tvile på tilnærmingen. J i) Hvor E(V) = -10 og Var(V) = 17500 ( ) ( ) ( ) ( ) ii) Finner c 1 ogc 2 : Altså er c 1 =-9866 og c 2 =-134 {

dnorm(x, -5000, 2958) 0.00000 0.00004 0.00008 0.00012-15000 -10000-5000 0 5000 u Vi skal finne det mest sannsynlige variansjonsområdet for U. Altså det minste intervallet som oppfyller at det er 90 %(gitt i oppgaven) sannsynlig for en observasjon av U i intervallet. Vi vet at normalfordelingskurven er entoppet og symmetrisk. Vi vil finne det minste intervallet av u som gir et areal på 0.9. Da er det naturlig å begynne der kurven har maksimumspunkt og så gå symmetrisk til hver side inntil arealet blir 0.9. Da blir arealet til kurven på hver side av intervallet 0.05, P(U<c 1 ) = 0.05 og P(c 2 <U) = 0.05 = 1 - P(U c 2 ). Så bruker vi videre at for den standardiserte normalfordelingen: Hvor i vårt tilfelle. Har du spørsmål, kommentarer eller finner feil ta kontakt med meg (Jonas) (jonasschenkel@gmail.com) eller Kristoffer (kristoffberg@gmail.com)