Andre obligatorise oppgave st 11 John Miael Modin 17. april 8 Oppgave 1 X er årsinteten til en tilfeldig valgt person i en befolningsgruppe. Sansynlighetstettheten til X er gitt ved { θ f X (x) = θ x θ 1 for x > ellers Hvor er minste inteten i befolningsgruppen og θ > avhenger av lønnsforsjellene. a) Den umulative fordelingen F X (x) til en ontinuerlig stoastis variabel X finner man ved å integrere tetthetsfunsjonen f X fra til x. F X (x) = = x f X (t)dt { x θθ t θ 1 dt for x > ellers x θ θ t θ 1 dt = θ x t θ 1 dt = θ [ t θ ] x θ = θ ( x θ θ) = 1 θ x θ For x < er f X = og dt = (c c) =. Dette betyr at F X(x) er gitt ved { 1 F X (x) = θ x θ for x > ellers La M være median årsintet. Da har vi at F X (M) = 1 M = F 1 X (1 ) 1
b) 1 1 1 θ = F X (M) = 1 θ M θ = θ M θ = M θ θ log log = θ log M log + log θ = log M M = e log θ Den mediane årsinteten M er altså e log θ. Forventningen E(X) er gitt x f X(x) dx. Men siden f X (x) = for x < bruer jeg som nedre integrajsons grense. c) E(X) = x θ θ x θ 1 dx = θ θ x θ dx = lim b = lim b θ θ [ x θ+1 ] b 1 θ θ θ ( ) θ θ ( 1 θ b1 θ θ+1 ) 1 θ Siden θ > har vi at lim b b 1 θ = som gir ( ) θ θ ( θ+1 E(X) = ) = θ 1 θ θ 1 Vi har = roner og θ =.5. Median årsintet M er da e log.5 = 6391. Forventet årsintet E er da.5 1.5 = 333333. Medianen ligger ganse nærme minsteinnteten, mens forventningen er en del større. Dette tyder på at mange har ganse lav inntet, mens noen har veldig høy. Derfor gir medianen et bedre uttry for den typise innteten i befolningen. d) Vi har at variansen til X er gitt ved Var(X) = E(X ) (E(X)). Jeg begynner med å finne E(X ).
E(X ) = x f X (x) dx b = lim θ θ x θ+1 dx b θ θ [ = lim x θ+ ] b b θ Har at θ > lim b b θ =. Sitter da igjenn med θθ θ θ+ = θ θ. Var(X) = ( ) θ θ θ θ 1 = θ θ θ (θ 1) ( ) = θ 1 θ θ (θ 1) ( θ = θ θ + 1 ( θ θ ) ) (θ )(θ 1) = θ (θ )(θ 1) Standardavviet til X er gitt σ = Var(X). Standandardavviet σ er da θ σ = (θ )(θ 1) θ = (θ )(θ 1) θ = θ 1 θ Der jeg har antatt at, siden er minste innteten i en befolning. e) Har gitt Y = θ log (X/). For å finne sansynlighetstettheten f Y finner jeg først F Y. F Y (y) = P(Y y) = P(θ log (X/) y). Siden θ > blir ie uliheten forandret av å dele på θ. Vi har da at F Y (y) = P(X e y θ ) = FX (e y θ ). For y er y θ e y θ 1 e y θ. For y har vi da F X (e y θ ) = 1 θ ( e y θ ) θ = 1 e y f Y (y) = (1 e y ) = e y 3
For y < er F X (e y θ ) =, f Y = () =. Altså er f Y (y) gitt { e y for y f Y (y) = ellers. Dette er er esponentialtettheten med λ = 1. Oppgave Har at X 1, X,..., X n er uavhengige identis fordelte stoastise variabler. Definerer µ = E(X i ) og σ = Var(X i ).Innfører gjennomsnittet X n = 1 n og det standardiserte gjennomsnittet n i=1 X i X Z n = n µ σ/ n Har også oppgitt at E( X n ) = µ, og Var( X n ) = σ n a) X Bruer at E(aX+b) = ae(x)+b. Det gir at E(Z n ) = E( n µ σ/ n ) = 1 σ/ n E( X n ) µ σ/ n = µ σ/ n µ σ/ n =. For å finne Var(X n) bruer jeg at Var(aX + b) = ( ) ( ) a X Var(X). Det gir at Var(Z n ) = Var( n µ σ/ 1 σ ( ) = Var( X) n σ / n = n ) n σ = 1. b) Sal se på det standardiserte gjennomsnittet når de stoastise variablene X 1, X,...X n har tre forsjellige fordelinger. Her sal jeg finne forventning, varians og standardavviet til de forsjellige fordelingene. 1) Jeg begynner med å se på X i når X i er uniformt fordelt. { 1 for x f Xi = ellers Var(X i ) = E(X i ) = 1 1 xdx = [ x ]1 = 1 x dx E(X i ) = 1 3 1 4 = 1 1 σ = Var(X i ) = 1 1 = 1 3 4
) Ser nå på X i når X i er esponensiellt fordelt. { e x for x f Xi = ellers E(X i ) = xe x dx = [ xe x e x ] = 1 E(Xi ) = x e x dx = [ x e x xe x e x ] = Var(X i ) = E(X i ) E(X i ) = 1 = 1 σ = Var(X i ) = 1 = 1 3) Til sist ser jeg på X i når X i er Bernoulli-fordelt. p Xi (x) = 1 for x =, 1 E(X i ) = 1 + 1 1 = 1 Var(X i ) = ( 1 ) 1 + (1 1 ) 1 = 1 8 + 1 8 = 1 4 c) σ = 1 4 = 1 Anta at vi har en stoastis variabel X som har en eller annen fordeling. Vi gjør m forsø der vi noterer utfallet. Arealet til bosene i det normerte histogramet til X, er bredden på intervallet ganger den relative frevensen av utfall i hver bos. Når m voser går den relative frevensen mot sansynligheten, og arealet av bosene vil gå mot arealet av en stripe av sansynlighetstettheten til X. Lar vi samtidig bredden på bosene rympe, vil stripene bli smalerere, og histogrammet vil gå mot sansynlighetestettheten til X. Dette gjelder også for Z n, og etter 1 forsø vil den relative frevensen være tilnærmet sansynligheten til Z n. d) Treer n=3 uniformt fordelte variable på (,1), 1 ganger, og tar gjennomsnittet. n = 3; X = unifrnd (,1,n,1); meanx = mean(x) ; Z = sqrt (3) (meanx.5) sqrt (3); Ser av figur 1 at histogrammet har en form som ligner på grafen til normalfordelingen. Flere treninger gjør ansje at den nærmer seg mer. 5
1 Figur 1: Z n uniformt fordelt, n = 3 9 8 7 6 5 4 3 1 4 3 1 1 3 4 e) Sal finne sansynlighetene for at den standard-normalfordelte stoastise variabelen Z ligger i de forsjellige intervallene (,.5), [.5, ), [, 1.5), [ 1.5, 1), [ 1,.5), [.5, ), [,.5), [.5, 1), [1, 1.5), [1.5, ), [,.5), [.5, ). Jeg bruer at alle normalfordelinger er symmetrise om µ, dvs at fordelingen til Z er symmetris om. P( Z <.5)=.6915.5=.1915 P(.5 Z < 1)=.8413.6915=.1498 P(1 Z < 1.5)=.933.8413=.919 P(1.5 Z < )=.977.933=.44 P( Z <.5)=.9938.977=.166 P(.5 Z < )= 1..9938=.6 Tilsvarende sansynligheter gjelder da for de tilsvarende intervallene på den negative siden av. f) Finner de relative frevensene av verdiene til Z n e de samme intervallene som i e). n = 3; int = [ Inf,.5,, 1.5, 1,.5,,.5,1,1.5,,.5, Inf ] ; ant = histc (Z, int ) ; ant (1:1)/1. 6. 177. 519. 17. 1479. 1815. 185. 159. 944. 48. 171. 1 Ser at de relative frevensene passer ganse bra med standardnormalfordelingen, men verdiene nærme er litt for lave, mens de er litt for høye halvveis ut til.5. g) Gjør d) og f) om igjenn med hhv. n=1 og n=3 uniformt fordelte variable på (,1). 6
1 Figur : Z n uniformt fordelt, n= 1 1 8 6 4 4 3 1 1 3 4 1 Figur 3: Z n uniformt fordelt, n= 3 1 8 6 4 5 4 3 1 1 3 4 5 n = 1; ant (1:1)/1. 61. 167. 461. 93. 146. 1916. 1931. 1498. 88. 469. 176. 56 n = 3; ant (1:1)/1. 55. 169. 44. 98. 1538. 189. 1918. 154. 915. 437. 154. 66 De relatative frevensene nærmer seg sansynlighetene for stantardnormalfordelingen, men det er ie så stor forsjell fra n= 1, til n= 3. Ser av figur og figur 3 at histogrammet nærmer seg grafen til standardnormalfordelingen, men forandringen fra n= 1 til 3 er ie slående. Dette ommer no av at histogrammet var så nær allerede for n=3. h) Gjentar d), f) og g), men lar variablene være esponensiellt fordelt. 7
Figur 4: Z n esponentialfordelt, n= 3 14 1 1 8 6 4 4 3 1 1 3 4 5 6 n = 3; X = exprnd (1,n,1); meanx = mean(x) ; Z = sqrt (3) (meanx 1)/1; hist (Z, 3:.5:3) print deps oppgave h exp n =3. eps int = [ Inf,.5,, 1.5, 1,.5,,.5,1,1.5,,.5, Inf ] ; ant = histc (Z, int ) ; ant (1:1)/1. 68. 113. 33. 166. 175. 18. 659. 378. 19. 16 n = 1; ant (1:1)/1. 53. 39. 177. 1798. 37. 1765. 189. 785. 451. 186. 167 n = 3; ant (1:1)/1. 1. 1. 4. 11. 1643. 1986. 1919. 1334. 83. 438. 198. 113 De relative frevensene går mot sansynlighetene til standarnormalfordelingen, men ie så fort. Vi an se både på de relative frevensene for n= 3, n=1 og figur 4 og 5, at histogrammet er struet ut mot høyre. Når n = 3 an man tydelig se de at relative frevensene går mot sansynlighetene til standardnormalfordelingen. Dette an også sees på figur 6, histogrammet har blit mere symmetris. i) Gjentar h), men lar variablene være Bernoulli-fordelt. 8
Figur 5: Z n esponentialfordelt, n= 1 1 1 8 6 4 4 3 1 1 3 4 5 6 Figur 6: Z n esponentialfordelt, n= 3 1 1 8 6 4 4 3 1 1 3 4 5 n = 3; X = binornd (1,.5,n,1); meanx = mean(x) ; Z = sqrt (n) (meanx.5)/.5; hist (Z, 3:.5:3) print deps oppgave i bino n =3. eps ant = histc (Z, int ) ; ant (1:1)/1. 169. 3683. 3796. 15 n = 1;. 14. 456. 13. 46. 395. 6. 1186. 414. 19 n = 3;. 76. 114. 45. 175. 114. 134. 835. 1174. 1335. 89. 13. 79 Både på figur 7 og de relative frevensene for n=3, an vi se at det er mye hullrom mellom verdiene av de relative frevensene. Dette er pga. at gjennomsnittett, for n=3, bare an anta 4 forsjellige verdier, nemlig, 1 3, 3 og 1. Bortsett fra det stemmer de relative frevensene bra med sansynlighetene til standardnormalfordelingen. Det samme gjelder for n=1, og n=3, men hullrommene 9
4 Figur 7: Z n Bernoulli-fordelt, n= 3 35 3 5 15 1 5 4 3 1 1 3 4 5 Figur 8: Z n Bernoulli-fordelt, n= 1 15 1 5 4 3 1 1 3 4 blir stadig ferre siden gjennomsnittet an anta flere verdier. j) Vi an se av alle histogrammene at Bernoulli-fordelingen, og den uniforme fordelingen nærmer seg standardnormalfordelingen for lave n. Esponentialfordelingen derimot trenger større n før den nærmer seg. Dette an ha å gjøre med at symmetrien i både Bernoulli-fordelingen og den uniforme fordelingen, er helt fraværende i esponentialfordelingen. Esponentialfordelingen er mer avhengig av symmetrien i forventingen, som den får mer av, når n voser. 15 Figur 9: Z n Bernoulli-fordelt, n= 3 1 5 4 3 1 1 3 4 1