6.1 Kontinuerlig uniform fordeling

Like dokumenter
TMA4240 Statistikk H2010

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

6.1 Kontinuerlig uniform fordeling

6.5 Normalapproksimasjon til. binomisk fordeling

TMA4240 Statistikk H2015

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk H2015

Kontinuerlige sannsynlighetsfordelinger.

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Kapittel 2: Hendelser

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk H2015

Oppfriskning av blokk 1 i TMA4240

Foreleses onsdag 8. september 2010

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

FORMELSAMLING TIL STK1100 OG STK1110

TMA4240 Statistikk H2010

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

TMA4240 Statistikk H2015

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Gammafordelingen og χ 2 -fordelingen

FORMELSAMLING TIL STK1100 OG STK1110

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Bernoulli forsøksrekke og binomisk fordeling

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Notasjon. Løsninger. Problem. Kapittel 7

TMA4240 Statistikk Høst 2008

STK juni 2018

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

TMA4245 Statistikk Eksamen desember 2016

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

Kontinuerlige sannsynlighetsfordelinger.

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk. Øving nummer 7. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2012

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2016

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

DEL 1 GRUNNLEGGENDE STATISTIKK

Løsning eksamen desember 2016

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2009

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Eksempel: kast med to terninger

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Utvalgsfordelinger (Kapittel 5)

Eksamensoppgave i TMA4240 Statistikk

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2007

Binomisk sannsynlighetsfunksjon

Funksjoner av stokastiske variable.

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Funksjoner av stokastiske variable.

TMA4240 Statistikk Høst 2009

5.2 Diskret uniform fordeling. Midtveiseksamen (forts.) Kapittel 5. Noen diskrete sannsynlighetsfordelinger. TMA4245 V2007: Eirik Mo

Noen diskrete sannsynlighetsfordelinger. (utarbeidet av Mette Langaas), TMA4245 V2007

Dagens tekst. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

STK Oppsummering

TMA4240 Statistikk H2010

Ekstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

Normal- og eksponentialfordeling.

TMA4240 Statistikk Høst 2015

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Løsning eksamen desember 2017

Medisinsk statistikk Del I høsten 2009:

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren

UNIVERSITETET I OSLO Matematisk Institutt

Løsningsforslag, eksamen statistikk, juni 2015

TMA4240 Statistikk H2017 [15]

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Eksamen desember 2015

To-dimensjonale kontinuerlige fordelinger

Poissonprosesser og levetidsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Om eksamen. Never, never, never give up!

Midtveiseksamen i STK1100 våren 2017

Forelesning 27. mars, 2017

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Prøvemidtveiseksamen TMA4240 Statistikk H2004

Formelsamling i medisinsk statistikk

Transkript:

Kapittel 6 Noen kontinuerlige sannsynlighetsfordelinger TMA4240 H2006: Eirik Mo 2 6.1 Kontinuerlig uniform fordeling Kontinuerlig uniform fordeling: Sannsynlighetstettheten til den kontinuerlige uniforme stokastiske variabelen X på intervallet [A, B] er 1 f(x; A, B) = B A, A x B = 0 ellers. f(x) F(x) µ = E(X) = A + B 2 og σ 2 = Var(X) = (B A)2 12

3 6.2 Normalfordeling Normalfordeling: Sannsynlighetstettheten til en normalfordelt stokastisk variabel, X, med forventning E(X) = µ og varians Var(X) = σ 2, er gitt ved n(x;µ,σ) = 1 e 1 (x µ) 2 2 σ 2, 2 πσ for < x <, der π=3.142 og e 1 = 2.718. 4 Høyde kvinner og menn Frequency 0 5 10 15 150 160 170 180 190 200 210

5 Høyde kvinner og menn Density 0.00 0.02 0.04 0.06 0.08 Density 0.00 0.02 0.04 0.06 0.08 165 170 175 180 185 190 195 hogde, menn 160 165 170 175 180 185 hogde, kvinner 6 Normalfordelingen

7 Utvalg fra normalfordeling Eksempel fra notat av Dimakos & Løland, Norsk Regnesentral 8 Historisk sett Matematisk form av normalfordlingen vist av demoivre i 1733. Laplace brukte normalfordelingen til analyse av måleusikkerhet i eksperimenter rundt 1800. C.F. Gauss publikasjon 1809 matematisk behandling av måleusikkerhet i eksperimenter. Navnet normalfordeling kom rundt 1875 (Peirce, Galton, Lexis) "No scientific discovery is named after its original discoverer."

Cartoon Guide to Statistics 10 Lokasjon og spredning fx1 0.0 0.1 0.2 0.3 0.4 N( 1,1) N(0,1) N(1,1) fx3 0.0 0.2 0.4 0.6 0.8 N(0,0.5) N(0,1) N(0,2) 4 2 0 2 4 4 2 0 2 4 fx1 0.0 0.1 0.2 0.3 0.4 N( 1,1) N(1,2) 4 2 0 2 4 6

Eksempel fra notat av Dimakos & Løland, Norsk Regnesentral 12 IQ Poengsummen fra en IQ-test antas ofte å være normalfordelt, og flere av IQ-testene har en forventningsverdi på 100 og et standardavvik på 16. 140 and over Genius or near genius 120-140 Very superior intelligence 110-120 Superior intelligence 90-110 Normal or average intelligence 80-90 Dullness 70-80 Borderline deficiency Below 70 Definite feeble-mindedness Hva er sannsynligheten for å ha en IQ lavere enn 100? Hva er sannsynligheten for å ha en IQ mellom 80 og 120? For å bli med i Mensa må man oppnå en poengsum høyere enn 98 percentilen i fordelingen for testen. Hvor høy poengsum må man ha for å blir medlem av Mensa?

13 Standard normalfordeling DFF 6.1: Fordelingen til en normalfordelt stokastisk variabel, Z, med forventning E(Z) = 0 og varians Var(Z) = 1 kalles en standard normalfordeling. 0.0 0.1 0.2 0.3 0.4 0.0 0.2 0.4 0.6 0.8 1.0 3 2 1 0 1 2 3 3 2 1 0 1 2 3 f Z (z) = 1 2 π e 1 2σ 2 z2, for < z <, der π=3.142 og e 1 = 2.718. Cartoon Guide to Statistics

15 N(µ, σ) og N(0, 1) X har fordeling n(x;µ,σ) Z = X µ σ har fordeling n(z; 0, 1) P(x 1 < X < x 2 ) = P( x 1 µ σ = F( x 2 µ σ = Φ( x 2 µ σ < Z < x 2 µ ) σ ) F( x 1 µ ) σ ) Φ( x 1 µ ) σ fx 0.0 0.1 0.2 0.3 0.4 Fx 0.0 0.2 0.4 0.6 0.8 1.0 3 2 1 0 1 2 3 x 3 2 1 0 1 2 3 x 16 Fra halesannsynlighet til verdi X er normalfordelt (µ, σ). Finn x slik at P(X x) = α. Gitt α finner vi i tabell for standard normalfordling verdien z som oppfyller P(Z z) = α. Sammenheng mellom Z og X: Z = X µ σ og dermed X = µ + σ Z. Verdi for X finner vi fra x = µ + σ z.

17 Chebyshevs teorem og normalfordelingen Chebyshevs teorem:p(µ kσ < X < µ + kσ) 1 1 k 2 Nøyaktig for normalfordelingen: k=1: P(µ σ < X < µ + σ) = 0.683 mot Chebyshev 0. k=2: P(µ 2σ < X < µ + 2σ) = 0.954 mot Chebyshev 0.75 k=3: P(µ 3σ < X < µ + 3σ) = 0.997 mot Chebyshev 0.89 18 6.5 Normalapproksimasjon til binomisk fordeling TEO 6.2 Hvis X er en binomisk stokastisk variabel med forventning µ = np og varians σ 2 = np(1 p), så vil den stokastiske variabelen Z = X µ σ = X np np(1 p) når n være tilnærmet standard normalfordelt, n(z; 0, 1).

19 6.5 Normalapproksimasjon til binomisk fordeling n= 2, p= 0.1 n= 10, p= 0.1 n= 50, p= 0.1 0.0 0.2 0.4 0.6 0.8 0.0 0.1 0.2 0.3 0.4 0.00 0.05 0.10 0.15 0.5 0.0 0.5 1.0 1.5 2.0 2.5 0 1 2 3 4 0 2 4 6 8 10 12 14 n= 2, p= 0.5 n= 10, p= 0.5 n= 50, p= 0.5 0.0 0.1 0.2 0.3 0.4 0.5 0.00 0.05 0.10 0.15 0.20 0.25 0.00 0.02 0.04 0.06 0.08 0.10 0 1 2 3 4 0 2 4 6 8 10 0 10 20 30 40 20 Regneeksempel fra Cartoon Guide Binomisk med n = 25, p = 0.5. Hva er P(X 14)? 0.00 0.05 0.10 0.15 0 5 10 15 20 25

21 Approksimasjon Figur fra Cartoon Guide to Statistics. 22 Kontinuitetskorreksjon Figur fra Cartoon Guide to Statistics.

23 Togforsinkelsen, forts. La X (minutter) betegne togets forsinkelse på en tilfeldig valgt hverdag. Vi antar at X er en stokastisk variabel med sannsynlighetstetthet { 4xe 2x for x > 0 g(x) = 0 for x 0 Har tidligere regnet ut at P(X > 2) = 0.09. La V være antall ganger i løpet av en måned (= 22 hverdager) at toget er mer enn 2 minutter forsinket. Foreslå en sannsynlighetsfordeling for V og sett opp de forutsetninger som ligger til grunn for denne. Hva er sannsynligheten for at toget er mer enn 2 minutter forsinket minst 2 ganger i løpet av en måned (= 22 hverdager)? Hva er (tilnærmet) sannsynligheten for at toget er mer enn 2 minutter forsinket mer enn 30 ganger i løpet av 220 hverdager? 24 Eksempel: Trafikk-kontroll, mobilbruk Politiet vil aksjonere mot ulovlig mobilbruk i bil, og gjennomfører kontroll ved Lerkendal-rundkjøringen. Antar at antall bilførere som blir bøtelagt i løpet av t timer er Poisson-fordelt med intensitet λ = 5, dvs. med forventning λ t = 5 t. 1. Antall hendelser i disjunkte tidsintervall er uavhengige. 2. Sannsynligheten for at en enkelt hendelse inntreffer innenfor et kort tidsintervall av lengde t er tilnærmet λ t. 3. Sannsynligheten for at mer enn en hendelse skal inntreffe innenfor et kort tidsintervall av lengde t er neglisjerbar. Y=antall hendelser i intervallet [0, t], er Poisson-fordelt p(y; λt) = e λt (λt) y y! y = 0, 1, 2,... hvor λ er gjennomsnittlig antall hendelser per enhet (intervall eller region).

25 Trafikk-kontroll (forts.) La X være tid fra kontrollen starter til første bilfører blir bøtelagt. X=tid til første hendelse, er eksponensialfordelt med forventning E(X) = 1 λ. Tid mellom to påfølgende hendelser har samme fordeling som tid til første hendelse. 26 Eksponensial fordelingen DEF: En kontinuerlig stokastisk variabel X har en eksponentialfordeling med parameter β, hvis sannsynlighetstettheten er gitt ved f(x;β) = { 1 β e x/β, x > 0 0 ellers. hvor β > 0. TEO 6.3, COR 1: Forventing og varians i ekponentialfordelingen er µ = E(X) = β σ 2 = Var(X) = β 2 Annen parameterisering: λ = 1 β brukes også.

27 Eksponensial fordelingen, f(x) f(x;β) for β = 1, 2, 3, 4, 5 (eller λ = 1, 1 2, 1 3, 1 4, 1 5 ) f(x) 0.0 0.2 0.4 0.6 0.8 1.0 beta=1 beta=2 beta=3 beta=4 beta=5 0 2 4 6 8 10 x 28 Eksempel: Trafikk-kontroll (forts.) 1. Hva er forventet tid til første bøtelegging? 2. Hvor sannsynlig er det at første bot blir skrevet ut før det er gått 20 min? 3. Hva er sannynligheten for at det tar mer enn 3 timer til første bot skrives ut? 4. Dersom ingen er bøtelagt etter 20 min., hva er sannsynligheten for at den første bot ikke blir skrevet ut i løpet av de neste 20 min.? 5. Hva er sannsynligheten for at det tar mer enn en time før 2 bøter er skrevet ut?

29 Ingen hukommelse En lyspære har levetid X, som er eksponentialfordelt med parameter β. f(x;β) = { 1 β e x/β, x > 0 0 ellers. Vi vet at lyspæra har virket i s timer, hva er da sannsynligheten for at den virker t timer til? Har at P(X > s + t X > s) = P(X > s + t s) = 1 F(t), der F(t) = P(X t) er kumulativ fordeling for X, innsatt t. 30 Eksempel: Trafikk-kontroll, mobilbruk Løsning: X er eksponensialfordelt med parameter β = 1/λ = 1 5. 1. E(X) = β = 1/λ = 1/5 t = 12 min. 2. P(X 1 3 ) = F(1 3 ) = 1 e 1 β 1 3 = 1 e 5/3 = 1 0.19 = 0.81 3. P(X > 3) = 1 P(X 3) = 1 (1 e 3/β ) = e 3 5 = 0.0000003 4. P(X > 2 3 X > 1 3 ) = P(X > 2 3 1 3 ) = P(X > 1 3 ) = 1 P(X 1 ) = 1 0.81 = 0.19 3

31 Tid til nte hendelse Trafikk-kontroll:Hva er sannsynligheten for at det tar mer enn en time før 2 bøter er skrevet ut? Lyspærer: Jeg kjøper en pakke med 10 lyspærer til stekeovnen min. Hvor lang tid holder de? SMS til basestasjon: Hvor lang til går det til basestasjonen har mottatt 100 SMS? Trafikk-kontroll: Foto-boks står montert i tunnel. Den kan ta 36 bilder (?). Hvor langt tid tar det før veivesenet bør skifte film? Promillekontroll: Hvor lenge må politiet stå på post før de har fått 5 personer som har blåst rødt? 32 Gamma-fordelingen DEF: En kontinuerlig stokastisk variabel X følger en gammafordeling med parametere α og β, hvis sannsynlighetstettheten er gitt ved f(x;α,β) = { hvor α > 0 og β > 0. 1 β α Γ(α) xα 1 e x/β, x > 0 0 ellers. Parametere: α er formparameter, β er skalaparameter. Eksponensial: er Gamma med α = 1. Erlang: er Gamma med α heltall.

33 Gamma fordelingen (forts.) DEF 6.2: Gammafunksjonen er definert som Γ(α) = 0 x α 1 e x dx for α > 0. Γ(1) = 1. For α positivt naturlig tall: Γ(α) = (α 1) (α 2) (α n) Γ(α n). For α positivt heltall: Γ(α) = (α 1)! TEO 6.3: Forventing og varians i gammafordelingen: µ = E(X) = αβ σ 2 = Var(X) = αβ 2 34 Gammafordelingen, f(x) α=1 α=10 β = 1 Eksponensial beta= 1 f(gamma) alpha= 10 beta= 1 fx 0.0 0.2 0.4 0.6 0.8 1.0 fx 0.00 0.02 0.04 0.06 0.08 0.10 0.12 β = 4 0 2 4 6 8 x f(gamma) alpha= 1 beta= 4 0 5 10 15 20 25 x f(gamma) alpha= 10 beta= 4 fx 0.00 0.05 0.10 0.15 0.20 0.25 fx 0.000 0.005 0.010 0.015 0.020 0.025 0.030 0 10 20 30 x 0 20 40 60 80 100 x

35 Trafikk-kontroll, mobilbruk (forts.) Hva er sannsynligheten for at det tar mer enn en time før 2 bøter er skrevet ut? La X være antall timar til andre bøtelegging. X er Gammafordelt med α = 2, β = 1 λ = 1 5. P(X > 1) = 1 P(X 1) P(X 1) = 1 0 = 25 1 ( ) 2 x 1 e 5x dx 1 Γ(2) 1 0 5 xe 5x dx = delvis integrasjon... = 0.96 P(X > 1) = 1 P(X 1) = 1 0.96 = 0.04 36 6.8 Kjikvadrat fordelingen (mer fullstendig sammen med statistisk inferens) DEF En kontinuerlig stokastisk variabel X er kji-kvadrat fordelt parameter ν (kalt frihetgrader), hvis sannsynlighetstettheten er gitt ved f(x;ν) = { hvor ν er et positivt heltall. 1 2 ν/2 Γ(ν/2) xν/2 1 e x/2, x > 0 0 ellers. Kji-kvadrat vs. gamma: Kji-kvadrat er gamma med α = ν/2 og β = 2.

37 Kjikvadrat fordelingen (forts.) Forventing og varians i kji-kvadrat fordelingen er µ = E(X) = ν σ 2 = Var(X) = 2 ν Kjikvadrat 1,5,10,20 0 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0 5 10 15 20 0 38 6.10 Weibull fordelingen (Ikke pensum, men mye brukt!) DEF: En kontinuerlig stokastisk variabel X er Weibull-fordelt, med parametere α og β, med sannsynlighetstetthet gitt ved { αβx f(x) = β 1 e αxβ, x > 0 0 ellers. der α > 0 og β > 0. Eksponensial: spesialtilfelle for β = 1 fx1 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0.0 0.5 1.0 1.5 2.0 x