Andre obligatoriske oppgave stk 1100

Like dokumenter
Oblig 1 i MAT2400. Oppgave 1. Tor Hedin Brønner. a) Vi tar integralet av f X (x) fra til x: = 1. Medianen, µ, finner vi ved å sette.

STK1100 Oblig 2. Øyvind Kolbu Gruppe februar 2007

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Normalfordeling. Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke 7

Løsningsforslag, eksamen statistikk, juni 2015

Bernoulli forsøksrekke og binomisk fordeling

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

TMA4240 Statistikk Høst 2016

Løsningsforslag statistikkeksamen desember 2014

Forelesning 3. april, 2017

Løsningsforslag oblig 1 STK1110 høsten 2014

Binomisk sannsynlighetsfunksjon

TMA4240 Statistikk Høst 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Dagens tekst. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk Høst 2015

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Kap. 8: Utvalsfordelingar og databeskrivelse

TMA4240 Statistikk Høst 2009

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Gammafordelingen og χ 2 -fordelingen

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

STK Oppsummering

Forelening 1, kapittel 4 Stokastiske variable

Løsningsforslag til obligatorisk oppgave i ECON 2130

Kontinuerlige sannsynlighetsfordelinger.

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Forslag til endringar

ÅMA110 Sannsynlighetsregning med statistikk, våren

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Bootstrapping og simulering Tilleggslitteratur for STK1100

3.1 Stokastisk variabel (repetisjon)

Bootstrapping og simulering

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

6.1 Kontinuerlig uniform fordeling

Medisinsk statistikk Del I høsten 2009:

Kontinuerlige sannsynlighetsfordelinger.

Fasit for tilleggsoppgaver

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

TMA4240 Statistikk H2015

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Statistikk 1 kapittel 4

Oppfriskning av blokk 1 i TMA4240

Kapittel 2: Hendelser

TMA4245 Statistikk Eksamen desember 2016

Løsningsforslag Eksamen S2, høsten 2017 Laget av Tommy O. Sist oppdatert: 26. november 2017

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Regneregler for forventning og varians

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

6.5 Normalapproksimasjon til. binomisk fordeling

Kapittel 4: Matematisk forventning

ST0202 Statistikk for samfunnsvitere

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Kap. 7 - Sannsynlighetsfordelinger

Regneøvelse 22/5, 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2015

ST0202 Statistikk for samfunnsvitere

Seksjon 1.3 Tetthetskurver og normalfordelingen

TMA4240 Statistikk Eksamen desember 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Kapittel 4.4: Forventning og varians til stokastiske variable

Seksjon 1.3 Tetthetskurver og normalfordelingen

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

TMA4245 Statistikk Høst 2016

TMA4240 Statistikk H2015

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Transkript:

Andre obligatorise oppgave st 11 John Miael Modin 17. april 8 Oppgave 1 X er årsinteten til en tilfeldig valgt person i en befolningsgruppe. Sansynlighetstettheten til X er gitt ved { θ f X (x) = θ x θ 1 for x > ellers Hvor er minste inteten i befolningsgruppen og θ > avhenger av lønnsforsjellene. a) Den umulative fordelingen F X (x) til en ontinuerlig stoastis variabel X finner man ved å integrere tetthetsfunsjonen f X fra til x. F X (x) = = x f X (t)dt { x θθ t θ 1 dt for x > ellers x θ θ t θ 1 dt = θ x t θ 1 dt = θ [ t θ ] x θ = θ ( x θ θ) = 1 θ x θ For x < er f X = og dt = (c c) =. Dette betyr at F X(x) er gitt ved { 1 F X (x) = θ x θ for x > ellers La M være median årsintet. Da har vi at F X (M) = 1 M = F 1 X (1 ) 1

b) 1 1 1 θ = F X (M) = 1 θ M θ = θ M θ = M θ θ log log = θ log M log + log θ = log M M = e log θ Den mediane årsinteten M er altså e log θ. Forventningen E(X) er gitt x f X(x) dx. Men siden f X (x) = for x < bruer jeg som nedre integrajsons grense. c) E(X) = x θ θ x θ 1 dx = θ θ x θ dx = lim b = lim b θ θ [ x θ+1 ] b 1 θ θ θ ( ) θ θ ( 1 θ b1 θ θ+1 ) 1 θ Siden θ > har vi at lim b b 1 θ = som gir ( ) θ θ ( θ+1 E(X) = ) = θ 1 θ θ 1 Vi har = roner og θ =.5. Median årsintet M er da e log.5 = 6391. Forventet årsintet E er da.5 1.5 = 333333. Medianen ligger ganse nærme minsteinnteten, mens forventningen er en del større. Dette tyder på at mange har ganse lav inntet, mens noen har veldig høy. Derfor gir medianen et bedre uttry for den typise innteten i befolningen. d) Vi har at variansen til X er gitt ved Var(X) = E(X ) (E(X)). Jeg begynner med å finne E(X ).

E(X ) = x f X (x) dx b = lim θ θ x θ+1 dx b θ θ [ = lim x θ+ ] b b θ Har at θ > lim b b θ =. Sitter da igjenn med θθ θ θ+ = θ θ. Var(X) = ( ) θ θ θ θ 1 = θ θ θ (θ 1) ( ) = θ 1 θ θ (θ 1) ( θ = θ θ + 1 ( θ θ ) ) (θ )(θ 1) = θ (θ )(θ 1) Standardavviet til X er gitt σ = Var(X). Standandardavviet σ er da θ σ = (θ )(θ 1) θ = (θ )(θ 1) θ = θ 1 θ Der jeg har antatt at, siden er minste innteten i en befolning. e) Har gitt Y = θ log (X/). For å finne sansynlighetstettheten f Y finner jeg først F Y. F Y (y) = P(Y y) = P(θ log (X/) y). Siden θ > blir ie uliheten forandret av å dele på θ. Vi har da at F Y (y) = P(X e y θ ) = FX (e y θ ). For y er y θ e y θ 1 e y θ. For y har vi da F X (e y θ ) = 1 θ ( e y θ ) θ = 1 e y f Y (y) = (1 e y ) = e y 3

For y < er F X (e y θ ) =, f Y = () =. Altså er f Y (y) gitt { e y for y f Y (y) = ellers. Dette er er esponentialtettheten med λ = 1. Oppgave Har at X 1, X,..., X n er uavhengige identis fordelte stoastise variabler. Definerer µ = E(X i ) og σ = Var(X i ).Innfører gjennomsnittet X n = 1 n og det standardiserte gjennomsnittet n i=1 X i X Z n = n µ σ/ n Har også oppgitt at E( X n ) = µ, og Var( X n ) = σ n a) X Bruer at E(aX+b) = ae(x)+b. Det gir at E(Z n ) = E( n µ σ/ n ) = 1 σ/ n E( X n ) µ σ/ n = µ σ/ n µ σ/ n =. For å finne Var(X n) bruer jeg at Var(aX + b) = ( ) ( ) a X Var(X). Det gir at Var(Z n ) = Var( n µ σ/ 1 σ ( ) = Var( X) n σ / n = n ) n σ = 1. b) Sal se på det standardiserte gjennomsnittet når de stoastise variablene X 1, X,...X n har tre forsjellige fordelinger. Her sal jeg finne forventning, varians og standardavviet til de forsjellige fordelingene. 1) Jeg begynner med å se på X i når X i er uniformt fordelt. { 1 for x f Xi = ellers Var(X i ) = E(X i ) = 1 1 xdx = [ x ]1 = 1 x dx E(X i ) = 1 3 1 4 = 1 1 σ = Var(X i ) = 1 1 = 1 3 4

) Ser nå på X i når X i er esponensiellt fordelt. { e x for x f Xi = ellers E(X i ) = xe x dx = [ xe x e x ] = 1 E(Xi ) = x e x dx = [ x e x xe x e x ] = Var(X i ) = E(X i ) E(X i ) = 1 = 1 σ = Var(X i ) = 1 = 1 3) Til sist ser jeg på X i når X i er Bernoulli-fordelt. p Xi (x) = 1 for x =, 1 E(X i ) = 1 + 1 1 = 1 Var(X i ) = ( 1 ) 1 + (1 1 ) 1 = 1 8 + 1 8 = 1 4 c) σ = 1 4 = 1 Anta at vi har en stoastis variabel X som har en eller annen fordeling. Vi gjør m forsø der vi noterer utfallet. Arealet til bosene i det normerte histogramet til X, er bredden på intervallet ganger den relative frevensen av utfall i hver bos. Når m voser går den relative frevensen mot sansynligheten, og arealet av bosene vil gå mot arealet av en stripe av sansynlighetstettheten til X. Lar vi samtidig bredden på bosene rympe, vil stripene bli smalerere, og histogrammet vil gå mot sansynlighetestettheten til X. Dette gjelder også for Z n, og etter 1 forsø vil den relative frevensen være tilnærmet sansynligheten til Z n. d) Treer n=3 uniformt fordelte variable på (,1), 1 ganger, og tar gjennomsnittet. n = 3; X = unifrnd (,1,n,1); meanx = mean(x) ; Z = sqrt (3) (meanx.5) sqrt (3); Ser av figur 1 at histogrammet har en form som ligner på grafen til normalfordelingen. Flere treninger gjør ansje at den nærmer seg mer. 5

1 Figur 1: Z n uniformt fordelt, n = 3 9 8 7 6 5 4 3 1 4 3 1 1 3 4 e) Sal finne sansynlighetene for at den standard-normalfordelte stoastise variabelen Z ligger i de forsjellige intervallene (,.5), [.5, ), [, 1.5), [ 1.5, 1), [ 1,.5), [.5, ), [,.5), [.5, 1), [1, 1.5), [1.5, ), [,.5), [.5, ). Jeg bruer at alle normalfordelinger er symmetrise om µ, dvs at fordelingen til Z er symmetris om. P( Z <.5)=.6915.5=.1915 P(.5 Z < 1)=.8413.6915=.1498 P(1 Z < 1.5)=.933.8413=.919 P(1.5 Z < )=.977.933=.44 P( Z <.5)=.9938.977=.166 P(.5 Z < )= 1..9938=.6 Tilsvarende sansynligheter gjelder da for de tilsvarende intervallene på den negative siden av. f) Finner de relative frevensene av verdiene til Z n e de samme intervallene som i e). n = 3; int = [ Inf,.5,, 1.5, 1,.5,,.5,1,1.5,,.5, Inf ] ; ant = histc (Z, int ) ; ant (1:1)/1. 6. 177. 519. 17. 1479. 1815. 185. 159. 944. 48. 171. 1 Ser at de relative frevensene passer ganse bra med standardnormalfordelingen, men verdiene nærme er litt for lave, mens de er litt for høye halvveis ut til.5. g) Gjør d) og f) om igjenn med hhv. n=1 og n=3 uniformt fordelte variable på (,1). 6

1 Figur : Z n uniformt fordelt, n= 1 1 8 6 4 4 3 1 1 3 4 1 Figur 3: Z n uniformt fordelt, n= 3 1 8 6 4 5 4 3 1 1 3 4 5 n = 1; ant (1:1)/1. 61. 167. 461. 93. 146. 1916. 1931. 1498. 88. 469. 176. 56 n = 3; ant (1:1)/1. 55. 169. 44. 98. 1538. 189. 1918. 154. 915. 437. 154. 66 De relatative frevensene nærmer seg sansynlighetene for stantardnormalfordelingen, men det er ie så stor forsjell fra n= 1, til n= 3. Ser av figur og figur 3 at histogrammet nærmer seg grafen til standardnormalfordelingen, men forandringen fra n= 1 til 3 er ie slående. Dette ommer no av at histogrammet var så nær allerede for n=3. h) Gjentar d), f) og g), men lar variablene være esponensiellt fordelt. 7

Figur 4: Z n esponentialfordelt, n= 3 14 1 1 8 6 4 4 3 1 1 3 4 5 6 n = 3; X = exprnd (1,n,1); meanx = mean(x) ; Z = sqrt (3) (meanx 1)/1; hist (Z, 3:.5:3) print deps oppgave h exp n =3. eps int = [ Inf,.5,, 1.5, 1,.5,,.5,1,1.5,,.5, Inf ] ; ant = histc (Z, int ) ; ant (1:1)/1. 68. 113. 33. 166. 175. 18. 659. 378. 19. 16 n = 1; ant (1:1)/1. 53. 39. 177. 1798. 37. 1765. 189. 785. 451. 186. 167 n = 3; ant (1:1)/1. 1. 1. 4. 11. 1643. 1986. 1919. 1334. 83. 438. 198. 113 De relative frevensene går mot sansynlighetene til standarnormalfordelingen, men ie så fort. Vi an se både på de relative frevensene for n= 3, n=1 og figur 4 og 5, at histogrammet er struet ut mot høyre. Når n = 3 an man tydelig se de at relative frevensene går mot sansynlighetene til standardnormalfordelingen. Dette an også sees på figur 6, histogrammet har blit mere symmetris. i) Gjentar h), men lar variablene være Bernoulli-fordelt. 8

Figur 5: Z n esponentialfordelt, n= 1 1 1 8 6 4 4 3 1 1 3 4 5 6 Figur 6: Z n esponentialfordelt, n= 3 1 1 8 6 4 4 3 1 1 3 4 5 n = 3; X = binornd (1,.5,n,1); meanx = mean(x) ; Z = sqrt (n) (meanx.5)/.5; hist (Z, 3:.5:3) print deps oppgave i bino n =3. eps ant = histc (Z, int ) ; ant (1:1)/1. 169. 3683. 3796. 15 n = 1;. 14. 456. 13. 46. 395. 6. 1186. 414. 19 n = 3;. 76. 114. 45. 175. 114. 134. 835. 1174. 1335. 89. 13. 79 Både på figur 7 og de relative frevensene for n=3, an vi se at det er mye hullrom mellom verdiene av de relative frevensene. Dette er pga. at gjennomsnittett, for n=3, bare an anta 4 forsjellige verdier, nemlig, 1 3, 3 og 1. Bortsett fra det stemmer de relative frevensene bra med sansynlighetene til standardnormalfordelingen. Det samme gjelder for n=1, og n=3, men hullrommene 9

4 Figur 7: Z n Bernoulli-fordelt, n= 3 35 3 5 15 1 5 4 3 1 1 3 4 5 Figur 8: Z n Bernoulli-fordelt, n= 1 15 1 5 4 3 1 1 3 4 blir stadig ferre siden gjennomsnittet an anta flere verdier. j) Vi an se av alle histogrammene at Bernoulli-fordelingen, og den uniforme fordelingen nærmer seg standardnormalfordelingen for lave n. Esponentialfordelingen derimot trenger større n før den nærmer seg. Dette an ha å gjøre med at symmetrien i både Bernoulli-fordelingen og den uniforme fordelingen, er helt fraværende i esponentialfordelingen. Esponentialfordelingen er mer avhengig av symmetrien i forventingen, som den får mer av, når n voser. 15 Figur 9: Z n Bernoulli-fordelt, n= 3 1 5 4 3 1 1 3 4 1