Notasjon. Løsninger. Problem. Kapittel 7

Like dokumenter
TMA4240 Statistikk H2015

Dagens tekst. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Kapittel 2: Hendelser

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Funksjoner av stokastiske variable.

TMA4240 Statistikk Høst 2009

FORMELSAMLING TIL STK1100 OG STK1110

Funksjoner av stokastiske variable.

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

TMA4240 Statistikk H2010

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

UNIVERSITETET I OSLO

Bernoulli forsøksrekke og binomisk fordeling

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

TMA4240 Statistikk Høst 2015

FORMELSAMLING TIL STK1100 OG STK1110

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Oppfriskning av blokk 1 i TMA4240

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Høst 2008

TMA4240 Statistikk Høst 2016

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

6.1 Kontinuerlig uniform fordeling

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Transformasjoner av stokastiske variabler

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

TMA4240 Statistikk H2015

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

DEL 1 GRUNNLEGGENDE STATISTIKK

Foreleses onsdag 8. september 2010

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

UNIVERSITETET I OSLO

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

TMA4240 Statistikk Høst 2015

Kapittel 4: Matematisk forventning

Midtveiseksamen i STK1100 våren 2017

TMA4240 Statistikk. Øving nummer 7. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk Høst 2009

Om eksamen. Never, never, never give up!

Regneregler for forventning og varians

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Fasit for tilleggsoppgaver

TMA4245 Statistikk Eksamen desember 2016

Regneøvelse 22/5, 2017

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

6.5 Normalapproksimasjon til. binomisk fordeling

STK Oppsummering

Om eksamen. Never, never, never give up!

Eksamensoppgave i TMA4240 Statistikk

Kontinuerlige sannsynlighetsfordelinger.

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

Forelesning 13. mars, 2017

Kap. 6, Kontinuerlege Sannsynsfordelingar

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk H2010

Forelesning 27. mars, 2017

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

Eksempel: kast med to terninger

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240 Statistikk Eksamen desember 2015

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

TMA4240 Statistikk H2015

Kap. 6, Kontinuerlege Sannsynsfordelingar

Binomisk sannsynlighetsfunksjon

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

EKSAMEN I EMNE SIF5072 STOKASTISKE PROSESSER Lørdag 16. august 2003 Tid: 09:00 14:00

Utvalgsfordelinger (Kapittel 5)

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2015

Foreleses onsdag 13.oktober, 2010

TMA4240 Statistikk Høst 2007

ST0202 Statistikk for samfunnsvitere

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2015

To-dimensjonale kontinuerlige fordelinger

Formelsamling i medisinsk statistikk

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk Høst 2009

Om fordelingen tilx +Y

Transkript:

3 Notasjon Kapittel 7 Funksjoner av stokastiske variabler Har n stokastiske variabler, X 1, X 2,..., X n, med kjent fordeling f( 1, 2,..., n ) og kumulativ fordeling F( 1, 2,..., n ). Ser på Y = u(x 1, X 2,..., X n ), der u er kjent funksjon. Hva er fordelingen til Y? TMA4240 H2006: Eirik Mo 2 4 Problem Hovedkarakter NTNU: I hvert fag fordeler karakterer seg i forhold til en sannsynlighetsfordeling. Hovedkarakter er et vektet gjennomsnitt av karakterer i alle fag. Hvilken fordeling har hovedkarakteren? Gass: Vi har en ideell gass i en tett beholder, pv = nrt. Vi har målt trykk (p), volum (V ) og temperatur (T ) med usikkerhet og vil vite fordelingen til antall mol av gassen (n). Vindmølle: Vi skal konstruere en vindølle for energiproduksjon. Vindmøllen må tåle kraftige vinder (og produsere maksimal med energi). Hvor kraftige vinder må vindmøllen tåle? Snølast: Hvilken foredeling har årsekstrem for snølast? Jeg skal fra stripa opp i 12 etasje i sentralbygg 2. Det er tre heiser, men en er avstengt pga. reparasjon. Jeg trykker på at jeg skal opp på begge de to heisene. Hvor mye korter ventetid ville jeg hatt hvis alle tre heisene var i funksjon? Løsninger 1. Fra kumulativ fordeling [Notat om Ordningsvariabler og ekstremvariabler]: Jobber med kumulativ fordeling P(Y y), og finner derifra fordeling g(y) (derivere eller ta differanser). Gjør dette for ekstremvariabler (når X-ene er uavhengige). Kan bli mye regning for generell situasjon. 2. Transformasjonsformler [kap. 7.2]: Jobber direkte med fordelingen g(y), for generell avhengighetsstruktur. Vi bruker det mest for en-til-en funksjon av EN stokastisk variabel. Formel i formelsamlingen.

5 7 Løsninger Maksimum Uavhengige stokastiske variabler: X 1, X 2,..., X n med kumulativ fordelingsfunksjon F X () = P(X ) og fordeling f X (). 1. Fra kumulativ fordeling [Notat om Ordningsvariabler og ekstremvariabler]: 2. Transformasjonsformler [kap. 7.2]: 3. Momentgenererende funksjoner [kap. 7.3]: En transformasjon som tar oss over i et annet rom (ligner på Laplace og Fourier-transform som dere møter i Matematikk 4N). Der er det enkelt å finne fordelingen til Y = lineær kombinasjon av uavhengige stokastiske variabler. Kan også enkelt finne momenter til Y. V = ma(x 1, X 2,..., X n ) Kumulativ fordelingsfunksjon for maksimum: F V (v) = [F X (v)] n Hvis maksimum er mindre enn v må alle være mindre enn v. Sannsynlighetstetthet (hvis X-ene er kontinuerlige) Eksempler: f V (v) = n[f X (v)] n 1 f X (v) Parallellsystem Ventetid til siste gjest ankommer (forlater) festen. Største årlige snølast og vindhastighet. 6 8 Ordningsvariabler Minimum Stokastiske variabler: X 1, X 2,..., X n Sorterer etter størrelse: X (1) X (2) X (n). Velger variabel basert på hvor i følgen den kommer Minimum X (1) = min(x 1, X 2,..., X n ) Maksimum X (n) = ma(x 1, X 2,..., X n ) kte ordningsvariabel: X (k) ) Median { X X = ((n+1)/2) hvis n er oddetall 1 2 (X (n/2) + X (n/2+1) ) hvis n er partall Variasjonsbredden X (n) X (1). Uavhengige stokastiske variabler: X 1, X 2,..., X n med kumulativ fordelingsfunksjon F X () = P(X ) og fordeling f X (). U = min(x 1, X 2,..., X n ) Kumulativ fordelingsfunksjon for minimum F U (v) = 1 [1 F X (u)] n Hvis minimum er større enn u, må alle være større enn u. Sannsynlighetstetthet (hvis X-ene er kontinuerlige) f U (u) = n[1 F X (u)] n 1 f X (u) Eksempler: Seriesystem, f.eks juletrelys Ventetid til første heis (av n) mulige kommer. Minimum av eksponensialfordelte størrelser er også eksponensialfordelt. Ditto for Weibull.

9 kte ordningsvariabel Ser på X (k) : F X(k) () = P(k eller flere X i -er er ) Vi har en binomisk situasjon: n forsøk i hver forsøk (nummer i) registerer vi om X i eller ikke P(X i ) = F X () for alle forsøkene og de n forsøkene er uavhengige. n ( ) n F X(k) () = P(k eller flere X i -er er ) = [F X ()] j [1 F X ()] n j j Når X-ene er kontinuerlige kan sannsynlighetstettheten finnes ved å derivere m.h.p. og etter noe mellomregning kan den skrives: ( ) n 1 f X(k) () = n [F X ()] k 1 [1 F X ()] n k f X () k 1 j=k 11 7.2 Transformasjoner: u() og w(y) y = u() er en transformasjon fra til y. Når y = u() er en-til-en, også kalt en-entydig, betyr det at en verdi av er knyttet til bare en verdi av (og omvendt). Ønsker å finne som en funksjon av y: Løser y = u(). Løsningen kaller vi = w(y). Vi kaller u() og w(y) for inverse (omvendte) funksjoner. 10 Eksponentialfordeling Blå (midterst) F X (), rød (øverst) min F U (), grønn (nederst) ma F V (). 12 Inverse funksjoner 2 * 0 1 2 3 4 5 y=2 ^2 ^2 0 1 2 3 4 5 0.5 * 0 1 2 3 4 5 y=0.5 sqrt() y=sqrt() 0 1 2 3 4 5

13 en diskret variabel TEO 7.1: Anta at X er en diskret stokastisk variabel med fordeling f(). La Y = u(x) være en en-til-en transformasjon mellom verdiene av X og verdiene av Y, slik at ligningen y = u() har en unik løsning, kall den = w(y). Da er fordelingen til Y gitt som g(y) = f[w(y)]. g(y) = P(Y = y) = P[u(X) = y] = P[X = w(y)] = f[w(y)]. 15 Fordeling til funksjon av SV 1. Fra kumulativ fordeling [Notat om Ordningsvariabler og ekstremvariabler]: 2. Transformasjonsformler [kap. 7.2]: Jobber direkte med fordelingen g(y), for generell avhengighetsstruktur. Vi bruker det mest for en-til-en funksjon av EN stokastisk variabel. Formel i formelsamlingen. 3. Momentgenererende funksjoner [kap. 7.3]: En transformasjon som tar oss over i et annet rom (ligner på Laplace og Fourier-transform som dere møter i Matematikk 4N). Der er det enkelt å finne fordelingen til Y = lineær kombinasjon av uavhengige stokastiske variabler. Kan også enkelt finne momenter til Y. 14 to diskrete variabler TEO 7.2: Anta at X 1 og X 2 er diskrete stokastisk variabler med simultan fordeling f( 1, 2 ). La Y 1 = u 1 (X 1, X 2 ) og Y 2 = u 2 (X 1, X 2 ) være en en-til-en transformasjon mellom punktene ( 1, 2 ) og (y 1, y 2 ), slik at ligningene y 1 = u 1 ( 1, 2 ) y 2 = u 2 ( 1, 2 ) har en unik løsning for 1 og 2 som funksjoner av y 1 og y 2, kall dem 1 = w 1 (y 1, y 2 ) og 2 = w 2 (y 1, y 2 ). Da er den simultane fordelingen til Y 1 og Y 2 gitt som g(y 1, y 2 ) = f[w 1 (y 1, y 2 ), w 2 (y 1, y 2 )]. g(y 1, y 2 ) = P(Y 1 = y 1, Y 2 = y 2 ) = P(u 1 (X 1, X 2 ) = y 1, u 2 (X 1, X 2 ) = y 2 ) = P(X 1 = w 1 (y 1, y 2 ), X 2 = w 2 (y 1, y 2 )) = f[w 1 (y 1, y 2 ), w 2 (y 1, y 2 )] 16 7.2 Transformasjoner: u() og w(y) y = u() er en transformasjon fra til y. Når y = u() er en-til-en, også kalt en-entydig, betyr det at en verdi av er knyttet til bare en verdi av (og omvendt). Ønsker å finne som en funksjon av y: Løser y = u(). Løsningen kaller vi = w(y). Vi kaller u() og w(y) for inverse (omvendte) funksjoner. ^2 ^2 sqrt() y=sqrt()

17 en diskret variabel TEO 7.1: Anta at X er en diskret stokastisk variabel med fordeling f(). La Y = u(x) være en en-til-en transformasjon mellom verdiene av X og verdiene av Y, slik at ligningen y = u() har en unik løsning, kall den = w(y). Da er fordelingen til Y gitt som g(y) = f[w(y)]. g(y) = P(Y = y) = P[u(X) = y] = P[X = w(y)] = f[w(y)]. Ikke en-entydig: dele opp i områder med en-entydighet og summere. 19 en kontinuerlig variabel TEO 7.3: Anta at X er en kontinuerlig stokastisk variabel med fordeling f(). La Y = u(x) være en en-til-en transformasjon mellom verdiene av X og verdiene av Y, slik at ligningen y = u() har en unik løsning, kall den = w(y). Da er fordelingen til Y gitt som g(y) = f[w(y)] J. der J = w (y) = dw(y) dy kalles Jakobi-determinanten til transformasjonen. Videre: Generaliseringen til to variabler i Teorem 7.4 er ikke pensum. 18 to diskrete variabler TEO 7.2: Anta at X 1 og X 2 er diskrete stokastisk variabler med simultan fordeling f( 1, 2 ). La Y 1 = u 1 (X 1, X 2 ) og Y 2 = u 2 (X 1, X 2 ) være en en-til-en transformasjon mellom punktene ( 1, 2 ) og (y 1, y 2 ), slik at ligningene y 1 = u 1 ( 1, 2 ) y 2 = u 2 ( 1, 2 ) har en unik løsning for 1 og 2 som funksjoner av y 1 og y 2, kall dem 1 = w 1 (y 1, y 2 ) og 2 = w 2 (y 1, y 2 ). Da er den simultane fordelingen til Y 1 og Y 2 gitt som g(y 1, y 2 ) = f[w 1 (y 1, y 2 ), w 2 (y 1, y 2 )]. g(y 1, y 2 ) = P(Y 1 = y 1, Y 2 = y 2 ) = P(u 1 (X 1, X 2 ) = y 1, u 2 (X 1, X 2 ) = y 2 ) = P(X 1 = w 1 (y 1, y 2 ), X 2 = w 2 (y 1, y 2 )) = f[w 1 (y 1, y 2 ), w 2 (y 1, y 2 )] 20 en kontinuerlig variabel TEO 7.5: Anta at X er en kontinuerlig stokastisk variabel med fordeling f(). La Y = u(x) være en transformasjon mellom verdiene av X og verdiene av Y som ikke er en-til-en. Hvis intervallet som X er definert på kan deles inn i k disjunkte intervaller slik at for hvert intervall så er de inverse funksjonene en-til-en. 1 = w 1 (y), 2 = w 2 (y),... k = w k (y) Da er fordelingsfunksjonen til Y g(y) = k f[w i (y)] J i. i=1 der J i = w i (y) = dw i(y) dy for i = 1,..., k

21 en kontinuerlig variabel 23 Momenter fra momentgenererende funksjoner Viktige resultater: Hvis X er normalfordelt med forventning µ og varians σ 2, så er Z = X µ σ standard normalfordelt (forventning 0 og varians 1). Videre er Z 2 kjikvadrat-fordelt med ν = 1 frihetsgrader. TEO 7.6: La X være en stokastisk variabel med momentgenererende funksjon M X (t). Da er d r M X (t) dt r t=0 = µ r 22 7.3 Momenter og momentgenererende funksjoner DEF 7.1: rte ordens moment til en stokastisk variabel X er gitt som { µ r = E(X r ) = r f() diskret r f()d kontinuerlig DEF 7.2: Den moment-genererende funksjonen til en stokastisk variabel X er gitt ved E(e tx ) og kalles M X (t). Dermed, { M X (t) = E(e tx ) = etx f() diskret etx f()d kontinuerlig M X (t) eksisterer bare hvis summen (evt. intergralet) eksisterer. Formelsamlingen: M X (t) for de fordelingene vi har jobbet med står i formelsamlingen. 24 Fordeling fra momentgenererende funksjoner TEO 7.7: Unikhet La X og Y være to stokastiske variabler med moment-genererende funksjoner M X (t) og M Y (t). Hvis M X (t) = M Y (t) for alle verdier av t, så har X og Y samme fordeling. TEO 7.8: TEO 7.9: M X+b (t) = e bt M X (t) M X+b (t) = E[e t(x+b) ] = e bt E(e tx ) = e bt M X (t) M ax (t) = M X (at) M ax (t) = E[e t(ax) ] = E(e (at)x ) = M X (at)

25 Fordeling fra momentgenererende funksjoner 27 Sum av uavhengige variabler TEO 7.11 Hvis X 1, X 2,..., X n er uavhengige normalfordelte stokastiske variabler med forventninger µ 1, µ 2,..., µ n og varianser σ1 2, σ2 2,..., σ2 n, så er TEO 7.10: Hvis X 1, X 2,..., X n er uavhengige stokastiske variabler med momentgenererende funksjoner M X1 (t), M X2 (t),..., M Xn (t), og la Y = X 1 + X 2 + X n. Da er M Y (t) = M X1 (t) M X2 (t) M Xn (t) Y = a 1 X 1 + a 2 X 2 + + a n X n også normalfordelt med forventning µ Y = a 1 µ 1 + a 2 µ 2 + + a n µ n og varians σ 2 Y = a2 1 σ2 1 + a2 2 σ2 2 + + a2 n σ2 n 26 Sum av uavhengige variabler Binomisk: Hvis X 1,..., X n er uavhengige og binomisk fordelt med parametre m i og p (samme p for alle variabler), så vil n i=1 X i være binomisk fordelt med parametre m = n i=1 m i og p. Poisson: Hvis X 1,..., X n er uavhengige og hver Poisson-fordelt med parameter µ i, så vil n i=1 X i være Poisson-fordelt med parameter µ = n i=1 µ i. 28 Sum av uavhengige kjikvadrat-fordelte variabler TEO 7.12 Hvis X 1, X 2,..., X n er uavhengige kjikvadratfordelte stokastiske variabler med ν 1, ν 2,..., ν n frihetsgrader, så er Y = X 1 + X 2 + + X n en kjikvadratfordelt stokastisk variabel med ν = ν 1 + ν 2 + + ν n frihetsgrader. COR Hvis X 1, X 2,..., X n er uavhengige normalfordelte stokastiske variabler, der alle har forventning µ og varians σ 2, da er den stokastiske variabelen n Y = ( X i µ ) 2 σ i=1 kjikvadratfordelt med ν = n frihetsgrader.

29 BEVIS: Sum uavhengige normal SV X n(; µ, σ) M X (t) = e µt+ 1 2 σ2 t 2, slik at M Xi (t) = e µ i t+ 1 2 σ2 i t 2, i = 1,...,n. M ai X i (t) = M Xi (a i t) = e a iµ i t+ 1 2 a2 i σ 2 i t 2, i = 1,..., n. M Y (t) = M P n i=1 a i X i (t) = M a1 X 1 (t) M a2 X 2 (t) M an X n (t) = e a 1µ 1 t+ 1 2 a2 1 σ2 1 t2 e a 2µ 2 t+ 1 2 a2 2 σ2 2 t2 e a nµ n t+ 1 2 a2 n σ2 n t2 = e P n i=1 a iµ i t + P n i=1 1 2 a2 i σ 2 i t 2 = e (P n i=1 a iµ i )t + 1 2 (P n i=1 a2 i σ 2 i )t 2 Gjenkjenner dette som momentgenererende funksjon for en normalfordelt stokastisk variabel med µ = E(Y) = n i=1 a iµ i og σ 2 = Var(Y) = n i=1 a2 i σ2 i, dvs. Y n(y; µ, σ).