Kontinuerlige sannsynlighetsfordelinger.



Like dokumenter
Kontinuerlige sannsynlighetsfordelinger.

Litt mer om eksponensialfordelingen

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Diskrete sannsynlighetsfordelinger.

Diskrete sannsynlighetsfordelinger.

UNIVERSITETET I OSLO

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

Kap. 6, Kontinuerlege Sannsynsfordelingar

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

TMA4245 Statistikk Vår 2007

TMA4240 Statistikk Høst 2008

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk H2010

Funksjoner av stokastiske variable.

Kap. 6, Kontinuerlege Sannsynsfordelingar

Oppgave 1: Feil på mobiltelefoner

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2016

Funksjoner av stokastiske variable.

Poissonprosesser og levetidsfordelinger

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Kapittel 2: Hendelser

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Høgskolen i Gjøviks notatserie, 2001 nr 5

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Oppfriskning av blokk 1 i TMA4240

6.1 Kontinuerlig uniform fordeling

FORMELSAMLING TIL STK1100 OG STK1110

Gammafordelingen og χ 2 -fordelingen

Bernoulli forsøksrekke og binomisk fordeling

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

UNIVERSITETET I OSLO

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk. Øving nummer 7. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

STK Oppsummering

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

Om eksamen. Never, never, never give up!

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Medisinsk statistikk Del I høsten 2008:

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

ST0103 Brukerkurs i statistikk Høst 2014

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

UNIVERSITETET I OSLO

Om eksamen. Never, never, never give up!

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

EKSAMEN I EMNE TMA4245 STATISTIKK

Medisinsk statistikk Del I høsten 2009:

TMA4240 Statistikk Høst 2015

EKSAMEN I TMA4245 Statistikk

Eksempel: kast med to terninger

Motivasjon for kurset. ÅMA110 Sannsynlighetsregning med statistikk, våren Oppsummering. ÅMA110 Sannsynlighetsregning med statistikk våren 2008

TMA4240 Statistikk H2010

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

TMA4240 Statistikk Høst 2009

ST0202 Statistikk for samfunnsvitere

Løsningsforslag Eksamen S2, høsten 2017 Laget av Tommy O. Sist oppdatert: 26. november 2017

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforslag, eksamen statistikk, juni 2015

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2009

Eksponensielle klasser

Formelsamling i medisinsk statistikk

Kontinuerlige stokastiske variable.

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2015

Kp. 13. Enveis ANOVA

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Transkript:

Kontinuerlige sannsynlighetsfordelinger. Dekkes av kap. 6 og deler av kap. 8.5 i boka. Husk: f(x er sannsynlighetstettheten til en kontinuerlig X dersom:. f(x 0 for alle x R 2. f(xdx = 3. P (a <X<b= b a f(xdx Vi skal nå sepånoenavdemestbrukte kontinuerlige sannsynlighetsfordelingene. (For hver slik fordeling er f(x gitt ved en bestemt parametrisk funksjon. Kontinuerlig uniformfordeling (6. Dersom X kun kan anta verdier i et intervall [a, b], og det er like sannsynlig at X faller i et hvilket som helst område av samme utstrekning innen dette intervallet er X uniformfordelt (f.eks. hvor på en wire et brudd oppstår. Da er f(x = b a, a x b. og det kan vises at E(X = (a+b 2 og Var(X = (b a 2 2. Kontinuerlig uniformfordeling brukes mye i forbindelse med simulering. De fleste randomgeneratorer genererer uniformfordelte tall mellom 0 og. Ved hjelp av transformasjoner o.l. kan man ut fra dette få generert tall fra andre sannsynlighetsfordelinger. 2

Normalfordeling (6.2-6.4 Normalfordelingen er den viktigste og mest brukte av alle sannsynlighetsfordelinger. En lang rekke fenomen i natur, teknologi, økomoni, etc kan modelleres ved en normalfordeling. Normalfordeling er også svært sentral i statistisk teori pga at mange fordelinger under visse betingelser kan tilnærmes til normalfordeling. f(x = ( exp (x μ 2, <x<, 2πσ 2 σ 2 E(X =μ og Var(X =σ 2. X N(μ, σ 2. Vi skriver at Siden f(x er komplisert å integrere, regner vi ut normalfordelingssannsynligheter ved ågjøre transformasjonen Z = X E(X Var(X = X μ σ der Z er standard normalfordelt (sjekk selv at E(Z =0ogVar(Z = og så bruketabell over standard normalfordelingen. F.eks. P (X <a=p ( X μ σ < a μ σ μ =P (Z <a σ der P (Z < a μ σ finnes fra tabellen. (Går ikke nærmere inn på dette da det antas kjent fra før. Sentralgrenseteoremet (8.5 Summer/gjennomsnitt av mange uavh. stok. var. (fra en hvilken som helst fordeling! vil være tilnærmet normalfordelt! La X,...,X n være uavh. variable fra en fordeling med forventning μ og varians σ 2. Vi har da (sjekk selv! at E( X = μ og Var( X =σ 2 /n. Sentralgrenseteoremet (SGT sier nå at Z = X E( X Var( X = X μ σ2 /n Generelt OK tilnærming når n 30. N(0, 3 4

Vi ser at dette også girat n i= Z = X n i nμ i= = X i E( n i= X i nσ 2 Var( n i= X i Dvs, generelt Z = V E(V Var(V N(0, der V = X eller V = n i= X i. Eksempel: Du kaster en terning 50 ganger. Hva er sannsynligheten for at summen av alle terningkastene blir større enn 200? La X i være resultatet av det ite terningkast og Y = 50 i= X i. Vi vet at (se diskret uniform fordeling E(X i =3.5 ogvar(x i =2.92. P (Y >200 = P (Y 200 = P ( Y E(Y Var(Y = P (Z = P (Z 2.07 200 50 3.5 50 2.92 SGT 0.98 = 0.09 N(0, 200 E(Y Var(Y Binomisk fordeling tilnærmet med normalfordeling (6.5 X = antall suksesser i n forsøk er en sum (la suksess = og ikke suksess =0 og kan dermed i følge SGT tilnærmes med normalfordeling. Når X B(n, p huskerviat E(X =np og Var(X =np( p, og vi får dermed at Z = X np np( p N(0, OK tilnærming når np > 5ogn( p > 5. Se figurene 6.22-6.25 i boka. P (a X b P ( = P (Z a 0.5 np np( p X np np( p b +0.5 np np( p P (Z b +0.5 np np( p a 0.5 np np( p Her er -0.5 i nedre grense og +0.5 i øvre grense korreksjoner vi gjør for åfå en bedre tilnærming (se fig. 6.23. 5 6

Poissonfordeling tilnærmet med normalfordeling Også Poisson-fordelte variable kan tilnærmes med normalfordeling. Dersom λt > 5 er P (a X b a 0.5 λt P ( Z λt b +0.5 λt λt en god tilnærming som kan brukes til åforenkle beregninger. (Husk at E(X =Var(X =μ = λt i Poisson-fordeling. Eksempel: Antall visninger av en webside per dag er Poisson-fordelt med forventing 92. Hva er sannsynligheten for at siden har mer enn 00 visninger i løpet av en dag? Hva er sannsynligheten for at siden har mer enn 700 visninger i løpet av en uke? La X= antall visninger per dag og Y = antall visninger per uke. Vi har da at X Poisson(92 og Y Poisson(92 7. P (X >00 = P (X 00 00 + 0.5 92 P (Z 92 = P (Z 0.89 = 0.833 = 0.867 P (Y >700 = P (Y 700 700 + 0.5 92 7 P (Z 92 7 = P (Z 2.23 = 0.987 = 0.029 7 8

Gammafordeling (6.6-6.7 Gammafordelingen er en fleksibel fordelingsklasse for x 0. Gammafordeling brukes bl.a. til å beskrive levetider/funksjonstider både for tekniske systemer og i biologi. Flere mye brukte fordelinger er spesialtilfeller av gammafordelingen. f(x = β α Γ(α xα e x/β, x 0 E(X = αβ og Var(X = αβ 2. Γ(α er gammafunksjonen. Se formelsamlingen side 33. Merk spesielt at Γ(n +=n! dersomn er et heltall. Eksempel: Levetiden til en bestemt type insekt imåneder er beskrevet ved en gammafordeling med parametre α = 2ogβ = 0.5. Hva er sannsynligheten for at et insekt levere i mer enn 2måneder? P (X >2 = P (X 2 2 = 0.5 2 Γ(2 x2 e x/0.5 dx = 4 0 2 0 xe 2x dx = 4 0.227 = 0.092 9 0

Eksponensialfordeling (6.6-6.7 Et viktig spesialtilfelle av gammafordelingen er eksponensialfordelingen som vi får ved å sette α = i gammafordelingen: f(x = β e x/β, x 0, E(X =β og Var(X =β 2 (se øving 2. Merk: Ofte brukes parameteren λ =/β. Eksponensialfordelingen brukes bl.a. til å modellere funksjonstider (bl.a. til elektroniske komponenter, tider til og mellom hendelser, etc. Videre har eksponensialfordelingen en del viktige relasjoner til Poisson-prosser. La T være tid til første hendelse i en Poissonprosess. Vi har da at: P (T >t = P (ingen hendelser i [0,t] = p(0; λt = (λt0 e λt = e λt 0! Dvs F (t =P (T t = e λt,ogdermed blir tettheten for tid til første feil f(t = F (t =λe λt som er en eksponsialfordeling (med λ =/β. Dvs tid til første hendelse i en Poisson-prosess er eksponensialfordelt. Det kan på tilsvarende måte også vises at tid mellom hendelser i en Poisson-prosess er eksponensialfordelt (f.eks. tid mellom visninger av en webside, tid mellom utrykninger fra en brannstasjon osv. Det kan også vises at tid til kte hendelse i en Poisson-prosess er gammafordelt med parametre α = k og β =/λ. Vi skal se litt mer på disse tingene senere. 2

Eksempel: Bussproblemet. Anta at ankomsten av busser til en bussholdeplass kan modelleres som en Poisson-prosess med parameter λ. Tiden mellom hver gang det kommer en buss er da eksponensialfordelt med forventningsverdi /λ. Du ankommer bussholdeplassen. Hva er forventet tid du må vente før det kommer en buss? La U være ventetiden fra du ankommer til det kommer en buss. P (U >t = P (ingen busser i [0,t] = (λt0 0! e λt = e λt dvs E(U =/λ - samme som for tid mellom busser!! χ 2 -fordeling (6.8 Viktig spesialtilfelle av gammafordelingen der α = ν/2 ogβ =2derν er et positivt heltall. Brukes mye i statistisk teori, bl.a. ifbm tester/konfidensintervall for varians. f(x = 2 ν/2 Γ(ν/2 xν/2 e x/2, x 0, E(X = ν og Var(X = 2ν. ν =, 2,... Hvorfor? Når vi ankommer til bussholdeplassen har vi større sannsynlighet for å treffe et stort tidsintervall mellom busser enn et lite. 3 4

Lognormal-fordeling (6.9 X er lognormal-fordelt dersom ln(x ernormalfordelt. Dersom i tillegg E(ln(X = μ og Var(ln(X = σ 2 er f(x = 2πσx exp ( 2 (ln(x μ 2, x > 0, E(X =e μ+σ2 /2 og Var(X =e 2(μ+σ2 e 2μ+σ2. Lognormalfordeling brukes bl.a. som modell for konsentrasjoner, levetider, utmatting, etc Eksempel: Konsentrasjonen (målt i p.p.m. av et forurensende stoff i utslippsvannet fra en kjemisk fabrikk er lognormalfordelt med parametre μ =3.2 ogσ =. Hva er sannsynligheten for at konsentrasjonen overstiger 8? P (X >8 = P (X 8 σ 2 = P (ln(x ln(8 ln(x 3.2 = P ( = P (Z.2 = 0.34 = 0.8686 ln(8 3.2 Weibull-fordeling (6.0 Weibull-fordeling blir bl.a. brukt til å modellere levetider/funksjonstider til komponenter og system. Enklere å regne med en gammafordelingen. f(x =αβx β e αxβ, x 0, E(X =α /β Γ( + β og Var(X =α 2/β [ Γ( + 2 β Γ( + β 2 ]. Merk: β = gir eksponensialfordeling. Eksempel: Oppetiden (i dager for en server kan modelleres ved en Weibull-fordeling med α =0.25 og β =0.5. Hva er sannsynligheten for at serveren har en oppetid på mindre enn 30 dager? P (X <30 = 30 0 0.25 0.5x 0.5 e 0.25x0.5 dx = [ e 0.25x0.5 ] 30 0 = e 0.25 300.5 ( = 0.746 5 6

Til slutt (Litt om tolkning etc... En sannsynlighetsfordeling angir hvordan utfallene vil fordele seg dersom man gjentar et forsøk mange ganger. Man kan tenke på en sannsynlighetsfordeling som et histogram over uendelig mange gjentak av forsøket. Ulike typer sannsynlighetsfordelinger er egnet til å beskrive ulike fenomen. Parametrene i en sannsynlighetsfordeling bestemmer den nøyaktige form og beliggenhet på fordelingen (se f.eks. figur 6.3, 6.4, 6.5, 6.28 og 6.30 i læreboka. Egenskaper ved en fordeling som forventningsverdi og varians vil alltid være en funksjon av parametrene. Når type fordeling og parameterverdier er kjente kan man regne ut alt av interesse (forventning, varians, sannsynligheter, osv. I praksis vil ofte parameterverdiene være ukjente, og da ønsker man ut fra tilgjengelig informasjon å finne et best mulig anslag på verdiene. Estimering, som vi kommer til senere i kurset, handler om dette. Ved diskrete fordelinger kan man ofte avgjøre ut fra informasjon om fenomenet hvilken type fordeling som er den rette. Ved kontinuerlige fordelinger er det ikke alltid like lett å avgjøre hvilken type fordeling som er best egnet til å beskrive fenomenet. I tillegg til fenomenkunnskap etc finnes det bl.a. ulike plott som man kan bruke til å avgjøre ut fra observerte data om en antatt fordelingstype ser ut til å være rimelig (f.eks. normalplott omtalt i avsnitt 8.3. 7 8