Noen diskrete sannsynlighetsfordelinger. (utarbeidet av Mette Langaas), TMA4245 V2007

Like dokumenter
5.2 Diskret uniform fordeling. Midtveiseksamen (forts.) Kapittel 5. Noen diskrete sannsynlighetsfordelinger. TMA4245 V2007: Eirik Mo

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

TMA4240 Statistikk H2015

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Bernoulli forsøksrekke og binomisk fordeling

Diskrete sannsynlighetsfordelinger.

Diskrete sannsynlighetsfordelinger.

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Oppfriskning av blokk 1 i TMA4240

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

TMA4240 Statistikk Høst 2008

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Midtveiseksamen i STK1100 våren 2017

TMA4240 Statistikk Høst 2009

Statistikk 1 kapittel 5

TMA4245 Statistikk Eksamen desember 2016

Statistikk 1 kapittel 5

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

6.5 Normalapproksimasjon til. binomisk fordeling

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4240 Statistikk H2010

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

µ = E(X) = Ʃ P(X = x) x

6.1 Kontinuerlig uniform fordeling

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

TMA4240 Statistikk 2014

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Eksamensoppgave i TMA4240 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

ÅMA110 Sannsynlighetsregning med statistikk, våren

HØGSKOLEN I STAVANGER

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Kapittel 2: Hendelser

Betinget sannsynlighet

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

TMA4240 Statistikk Høst 2015

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

TMA4240 Statistikk Eksamen desember 2015

Kapittel 4: Matematisk forventning

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Løsningskisse seminaroppgaver uke 15

FORMELSAMLING TIL STK1100 OG STK1110

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Hypergeometrisk modell

Kapittel 5: Diskrete sannsynsfordelingar TMA4245 Statistikk. 5.2 Diskret uniform fordeling NTNU NTNU NTNU

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Fasit for tilleggsoppgaver

Hogskoleni Østfold EKSAMEN. Eksamenstid: kl til k

Løsningskisse seminaroppgaver uke 11 ( mars)

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

MULTIPLE CHOICE ST0103 BRUKERKURS I STATISTIKK September 2016

Litt mer om den hypergeometriske fordelingen og dens tilnærming av binomisk fordeling.

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk. Øving nummer 7. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

TMA4240 Statistikk Høst 2015

Løsningskisse for oppgaver til undervisningsfri uke 14 (6.-9. april)

Eksamensoppgave i TMA4240 Statistikk

Kontinuerlige sannsynlighetsfordelinger.

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

TMA4245 Statistikk Eksamen desember 2016

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMEN I ST2101 STOKASTISK MODELLERING OG SIMULERING Onsdag 1. juni 2005 Tid: 09:00 14:00

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

HØGSKOLEN I STAVANGER

EKSAMEN I EMNE TMA4265/SIF5072 STOKASTISKE PROSESSER Onsdag 10. august 2005 Tid: 09:00 13:00

Høgskoleni østfold EKSAMEN

Regneregler for forventning og varians

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Løsning eksamen desember 2017

Forelening 1, kapittel 4 Stokastiske variable

DEL 1 GRUNNLEGGENDE STATISTIKK

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Transkript:

Kapittel 5 Noen diskrete sannsynlighetsfordelinger TMA4245 V2007: Eirik Mo 2 5.2 Diskret uniform fordeling Diskret uniform fordeling: Hvis den stokastiske variabelen X antar verdiene x 1, x 2,..., x k med lik sannsynlighet så er X diskret uniformt fordelt med fordeling f(x; k) = 1 k, x = x 1, x 2,..., x k Histogram of x Density 0.0 0.1 0.2 0.3 0.4 1 2 3 4 5 6 0 1 2 3 4 5 6 x TEO 5.1: µ = E(X) = k i=1 x i k og σ 2 = Var(X) = k i=1 (x i µ) 2 k

3 Midtveiseksamen oppg. 1a eksamen 06.08.2004 Høsten 2004 ble det i TMA4240 bli innført tellende skriftlig midtveiseksamen. Denne ble gitt i form av en flervalgsoppgave ( multiple choice ) bestående av n = 20 spørsmål som alle har m svaralternativer. Studentene måtte velge et svaralternativ for hvert spørsmål (det var ikke lov å svare blankt på et spørsmål). For å få karakter bedre enn F (36%) måtte minst 8 spørsmål være korrekt besvart. Studenten Ole vurderte om han skal la være å lese til midtveiseksamen og heller velge tilfeldige svaralternativer på alle spørsmålene (han ville da ikke engang lese oppgaveteksten før han svarte). Før han bestemte seg, ba han en studiekamerat regne ut hvor stor sannsynlighet han da hadde for få bedre enn F. 4 Midtveiseksamen (forts.) La X være antall korrekte svar Ole fikk på de n = 20 spørsmålene. Forklar hvorfor vi kan anta at X er binomisk fordelt med n = 20 og p = 1 m. Finn sannsynligheten for at Ole fikk bedre enn F hvis han valgte å svare tilfeldig på alle spørsmålene, dvs. P(X 8), når antall svaralternativer er m = 2. Finn også P(X 8) for m = 4 og m = 5. Hva blir forventet antall korrekte svar, dvs. E(X), når m = 2, 4, 5?

5 5.3 Binomisk fordeling Bernoulli prosess: Et Bernoulli eksperiment (prosess) har følgende egenskaper: 1. Eksperimentet består av n gjentatte forsøk. 2. Hvert forsøk undersøker man om en hendelse A inntreffer (suksess) eller ikke (A =fiasko). 3. Sannsynligheten for hendelsen A (suksess) kaller vi p, og denne er den samme fra forsøk til forsøk. 4. De n gjentatte forsøkene er uavhengige av hverandre. Dermed: et Bernoulli eksperiment kan resultere i hendelsen A (suksess) med sannsynlighet p og komplementet av hendelsen A (A =fiasko) med sannsynlighet 1 p. 6 5.3 Binomisk fordeling (forts.) La den stokastiske variablen X være antall ganger hendelsen A (suksess) inntreffer på de n uavhengige forsøkene. Sannsynlighetsfordelingen til X kalles binomisk fordeling og er gitt ved ( ) n f(x) = b(x; n, p) = p x (1 p) (n x), x = 0, 1,..., n x Kumulativ fordeling: F(x) = P(X x) finnes ved tabelloppslag. Eksempler: antall defekte enheter i industriell prosess antall pasienter med positiv effekt av medisin

7 Binomisk fordeling forts. n = 10, p = 0.2 n = 10, p = 0.5 n = 10, p = 0.7 Bin(n=10, p=0.2) Bin(n=10, p=0.5) Bin(n=10, p=0.7) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 Bin(n=10, p=0.2) Bin(n=10, p=0.5) Bin(n=10, p=0.7) 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 TEO 5.2: Forventning og varians i binomisk fordeling b(x; n, p) er µ = E(X) = np og σ 2 = Var(X) = np(1 p) 8 Urne med kuler [v1] Definisjon: p = antall røde kuler antall kuler Prosedyre: Utfør n ganger trekk en kule tilfeldig registrer fargen legg kula tilbake Da er antallet røde kuler binomisk fordelt.

9 Urne med kuler [v2] Definisjoner: p 1 = antall hvite kuler antall kuler p 2 = antall sorte kuler antall kuler p 3 = antall blå kuler antall kuler p 4 = antall røde kuler antall kuler Prosedyre: Utfør n ganger trekk en kule tilfeldig og registrer fargen legg kula tilbake Da er antallet hvite kuler og antallet sorte kuler og antallet blå kuler og antallet røde kuler multinomisk fordelt. 10 Multinomisk fordeling Multinomisk fordeling: Et forsøk kan resultere i k mulige utfall A 1, A 2,..., A k, med sannsynligheter p 1, p 2,..., p k. La de stokastiske variablene X 1, X 2,..., X k representere antall ganger utfallene A 1, A 2,..., A k opptrer i n uavhengige forsøk. Sannsynlighetsfordelingen til X 1, X 2,..., X k kalles multinomisk fordeling og er gitt ved ( ) n f(x 1, x 2,..., x k ; p 1, p 2,..., p k, n) = p x 1 1 x 1, x 2,..., x px 2 2 px k k k med k i=1 x i = n, k i=1 p i = 1 og ( n x 1,x 2,...,x k ) = n! x 1!x 2! x k!.

11 Urne med kuler [v3] Definisjon: N=antall kuler k =antall røde kuler Prosedyre: Utfør n ganger trekk en kule tilfeldig registrer fargen legg kula til side Da er antallet røde kuler hypergeometrisk fordelt. 12 Antall fisker i dammen Vi vil anslå størrelsen, N, av en dyreart innenfor et område (metode fra 1896). Gjøre to undersøkelser: 1. finner og merker k individ, og slipper dem ut igjen. 2. finner så n individ, og x av disse er merket. Lukket populasjon: ingen død, fødsel, innflytting, utflytting. Andelen merkede i de to utvalgene bør da være like, bestandsanslag: k N = x n N = k n x X er hypergeometisk fordelt med parametere N, k, n.

13 5.4 Hypergeometrisk fordeling Hypergeometrisk eksperiment: har følgende egenskaper: 1. Vi har en mengde av N enheter. Av de N enhetene så klassifiseres k som hendelsen A (suksess) og N k som komplementet av hendelsen A (A =fiasko). 2. Et tilfeldig utvalg av størrelse n trekkes uten tilbakelegging fra de N enhetene. Antallet ganger, X, som hendelsen A (suksess) inntreffer er da en hypergeometrisk stokastisk variabel. 14 5.4 Hypergeometrisk fordeling (forts.) Hypergeometrisk fordeling: En hypergeometrisk stokastisk variabel, X, angir antallet ganger hendelsen A (suksess) inntreffer i et hypergeometrisk eksperiment der n enheter trekkes fra N enheter, der k av de N enheter er klassifisert som hendelsen A (suksess) og N k som komplementet av hendelsen A (A =fiasko). Sannsynlighetsfordelingen til X kalles en hypergeometrisk fordeling og er gitt ved f(x) = h(x; N, n, k) = ( k N k ) x)( n x ( N x = 0, 1, 2,..., n n)

15 Hypergeometrisk fordeling (forts.) N = 10, k = 5, n = 5 N = 12, k = 5, n = 5 N = 100, k = 50, n = 40 Hyper(N=10, k=5, n= 5) Hyper(N=12, k=5, n= 5) Hyper(N=100, k=50, n= 40) 0.0 0.1 0.2 0.3 0.4 0.0 0.1 0.2 0.3 0.4 0.5 0.00 0.05 0.10 0.15 0.20 0 1 2 3 4 5 0 1 2 3 4 5 0 10 20 30 40 Hyper(N=10, k=5, n= 5) Hyper(N=12, k=5, n= 5) Hyper(N=100, k=50, n= 40) 0 1 2 3 4 5 0 1 2 3 4 5 0 10 20 30 40 TEO 5.3: Forventning og varians i den hypergeometriske fordelingen h(x; N, n, k) er µ = E(X) = nk N og σ2 = Var(X) = N n N 1 n k N (1 k N ) 16 Hypergeometisk og binomisk fordeling Hvis n er liten i forhold til N ( n N 0.05), så vil sammensetningen av de N enhetene endres lite under trekningen. Dermed kan k N sees på som den binomiske sannsynligheten p. Dermed kan binomisk fordeling sees på som en stor populasjon versjon av hypergeometrisk fordeling.

17 Urne med kuler [v4] Definisjoner: N=antall kuler a 1 =antall hvite kuler a 2 =antall sorte kuler a 3 =antall blå kuler a 4 =antall røde kuler Prosedyre: Utfør n ganger trekk en kule tilfeldig og registrer fargen legg kula til side. Da er antallet hvite kuler antallet sorte kuler antallet blå kuler antallet røde kuler multivariat hypergeometrisk fordelt. 18 Multivariabel hypergeometrisk fordeling Multivariabelt hypergeometrisk eksperiment: har følgende egenskaper: 1. Et tilfeldig utvalg av størrelse n trekkes uten tilbakelegging fra N enheter. 2. Av de N enhetene så klassifiseres a 1 i cellen A 1, a 2 i cellen A 2,..., a k i cellen A k. 3. Av de n enhetene så klassifiseres x 1 i cellen A 1, x 2 i cellen A 2,..., a k i cellen A k. Sannsynlighetsfordelingen til X 1, X 2,..., X k kalles multivariabel hypergeometrisk fordeling f(x 1, x 2,..., x k ; a 1, a 2,..., a k, n) = ( a1 x n ) )( a2 ) x 1 x 2 ( an ( N n) med k i=1 x i = n og k i=1 a i = N.

19 Kakelotteri 300 lodd fordelt på 3 farger (100 av hver) 9 vinnerlodd, 3 av hver farge (33,66,99) Vi kjøper 5 lodd. To strategier: trekk 5 lodd blant de 300 loddene trekk 5 lodd av samme farge Hvilken strategi gir størst sjanse for å vinne? 20 Binomisk og negativ binomisk Forsøksrekke, registrerer A (suksess) eller A (fiasko) i hvert forsøk. P(A) = p i hvert forsøk. Forsøkene er uavhengige. Binomisk Bestemmer totalt antall forsøk, n, på forhånd. X =antall suksesser på n forsøk Negativ binomisk Antall forsøk er ikke bestemt på forhånd, men eksperimentet avsluttes når k suksesser er oppnådd. X =antall forsøk til k suksesser er oppnådd.

21 5.5 Negativ binomisk og geometrisk fordeling Kabel: En kabel består av mange uavhengige wires. Kabelen kan overbelastes og P(en wire ødelegges)=p. Ved overlast er det lite sannsynlig at mer enn en wire skades. Kabelen må skiftes når 3 av wirene har feilet. X =antall overbelastninger som kabelen tåler før den må skiftes. Maskin: En maskin feiler med sannsynlighet p hver time. Når den feiler bli den minimalt reparert (dvs. den blir så god som akkurat før den feilet). Når maskinen har feilet k ganger byttes den ut. X=antall timer til maskinen byttes ut. Russisk rulett: En revolver har 6 kammer. En kule settes i ett kammer og kolben snurres. Første person sikter og trekker av. Hvis kulen ikke var i kammeret går revolveren videre til neste mann, som snurrer kolben, sikter og trekker av. X =antall forsøk til k te (helst første) mann finner kulen. 22 Negativ binomisk fordeling Negativ binomisk eksperiment: utføres som et binomisk eksperiment med den forskjell at forsøkene gjentas til et fast antall suksesser inntreffer. Dvs. 1. Eksperimentet består av et på forhånd ukjent antall forsøk. 2. Hvert forsøk: inntreffer hendelsen A (suksess) eller ikke (fiasko). 3. Sannsynligheten for hendelsen A (suksess), P(A) = p, er den samme fra forsøk til forsøk. 4. De gjentatte forsøkene er uavhengige av hverandre. 5. Eksperimentet avsluttet når et bestemt antall, k, av hendelsen A (suksesser) har inntruffet.

23 Negativ binomisk fordeling Negativ binomisk fordeling: Vi ser på gjentatte uavhengige forsøk som kan resultere i hendelsen A (suksess) med sannsynlighet p og komplementet til hendelsen A (A =fiasko) med sannsynlighet 1 p. La den stokastiske variabelen X angi antall forsøk som må gjøres for at hendelsen A (suksess) inntreffer k ganger. X har da en negativ binomisk fordeling med sannsynlighet ( ) x 1 b (x; k, p) = p k (1 p) (x k) k 1 for x = k, k + 1, k + 2,... 24 Negativ binomisk fordeling (forts.) k = 5, p = 0.1 k = 5, p = 0.5 k = 5, p = 0.8 Negbin(k=5, p=0.1) Negbin(k=5, p=0.5) Negbin(k=5, p=0.8) 0.000 0.005 0.010 0.015 0.020 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0 50 100 150 200 5 10 15 20 25 30 35 5 6 7 8 9 10 11 Negbin(k=5, p=0.1) Negbin(k=5, p=0.5) Negbin(k=5, p=0.8) 0 50 100 150 200 0 10 20 30 0 2 4 6 8 10

25 Urne med kuler [v5] Definisjon: p = antall røde kuler antall kuler Prosedyre: Utfør inntil k røde kuler er trukket trekk en kule tilfeldig registrer fargen legg kula tilbake Da er antallet trekninger negativ binomisk fordelt. 26 Geometrisk fordeling Negativ binomisk med k=1: g(x; p) = p(1 p) (x 1) x = 1, 2, 3,... TEO 5.4: Forventning og varians i den geometriske fordelingen g(x; p) er µ = E(X) = 1 p og σ 2 = Var(X) = 1 p p 2 p = 0.1 p = 0.5 p = 0.8 Negbin(k=1, p=0.1) Negbin(k=1, p=0.5) Negbin(k=1, p=0.8) 0.00 0.02 0.04 0.06 0.08 0.10 0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.2 0.4 0.6 0.8 0 20 40 Negbin(k=1, p=0.1) 60 80 100 0 5 Negbin(k=1, p=0.5) 10 15 1 2 3 Negbin(k=1, 4 p=0.8) 5 6 7 0 20 40 60 80 100 0 5 10 15 0 2 4 6

27 Telefonsalg av billettar A-HA skal ha konsert på Lerkendal, og billetter kan kjøpes ved å ringe et bestemt telefonnummer. X = # forsøk inntil en kommer gjennom første gang. X g(x; p), p = P(komme gjennom) = 1 100. 1. Hva er forventet antall ganger en må ringe for å komme gjennom? 2. Hva er sannsynligheten for å komme gjennom dersom en orker å ringe maksimalt 50 ganger? 3. Dersom en har ringt 50 ganger utan å komme gjennom, hva er sannsynligheten for å komme gjennom i neste forsøk? 28 Pyramidespillet, eksamen Des2004 #2a Ole Petter har blitt spurt om å bli med i et pyramidespill (betale inn en viss sum penger, og deretter rekruttere nye personer). Så vil pengene begynne å strømme inn... Ifølge personen som spurte Ole Petter, vil en person som blir spurt om å delta i pyramidespillet ha en sannsynlighet p = 1/3 for å bli med, så det å få fem personer til å bli med, skal ikke være noe problem. Forenkling: La den stokastiske variabelen X angi antall personer Ole Petter må spørre, inntil den første personen blir med i pyramidespillet. Under hvilke antagelser vil X være geometrisk fordelt? I resten av oppgaven kan du anta at X er geometrisk fordelt med punktsannsynlighet f(x) = p(1 p) (x 1) for x = 1, 2,...

29 Pyramidespillet, eksamen Des2004 #2a Dersom Ole Petter bestemmer seg for å delta i pyramidespillet, hva er forventet antall personer han må spørre for å få med en ny person, når p = 1/3? Hva er sannsynligheten for at han må spørre flere enn fem personer for å få en person til å delta i pyramidespillet, når p = 1/3? 30 5.6 Poisson prosess og fordeling Poisson prosess: Vi ser på om en hendelse inntreffer eller ikke innenfor et intervall eller en region. 1. Antall hendelser som inntreffer i et intervall eller i en spesifisert region, er uavhengig av antall hendelser som inntreffer i ethvert annet disjunkt intervall eller region. 2. Sannsynligheten for at en enkelt hendelse inntreffer innenfor et lite intervall eller liten region, er proporsjonal med lengden av intervallet eller størrelsen på regionen, og er ikke avhengig av antallet hendelser som inntreffer utenfor intervallet eller regionen. 3. Sannsynligheten for at mer enn en hendelse skal inntreffe innenfor et kort intervall eller liten region er negliserbar.

31 5.6 Poisson prosess og fordeling Poisson fordeling: La den stokastiske variabelen X representere antallet hendelser i et gitt intervall eller region av størrelse t. Sannsynlighetsfordelingen til X er p(x; λt) = (λt)x x! e λt x = 0, 1, 2,... hvor λ er gjennomsnittlig antall hendelser per enhet intervall eller region (og e = 2.71828). 32 Binomisk- og Poissonfordeling Utledning : Poisson P(X = x) kan utledes ved å dele opp tidsaksen i n bittesmå intervaller av lengde t = t n. Da har vi en binomisk situasjon i n uavhengige intervaller. Lar vi n får vi Poisson P(X = x). Bevis A27 side 713. TEO 5.6 La X være en binomisk stokastisk variabel med sannsynlighetsfordeling b(x; n, p). Når n, p 0, og µ = np holdes konstant, så er b(x; n, p) p(x;µ)

33 Poisson fordeling (forts.) µ = λt = 0.5 µ = λt = 2 µ = λt = 10 Pois(lambda=0.5) Pois(lambda=2) Pois(lambda=10) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.00 0.05 0.10 0.15 0 1 2 3 4 5 6 0 2 4 6 8 0 5 10 15 20 25 Pois(lambda=0.5) Pois(lambda=2) Pois(lambda=10) 0 1 2 3 4 5 6 0 2 4 6 8 0 5 10 15 20 25 TEO 5.45 Forventning og varians i Poissonfordelingen p(x; λt) er begge λt. 34 Poisson situasjoner Alpinulykker (eksamen 5.august 2004, oppgave 3) Sikkerhet er en av de høyest prioriterte oppgavene i norske alpinanlegg. Vi antar at antall alpinulykker som krever legebehandling i alpinanlegget Alpinfjellet i en periode på t skidager, X, er Poisson-fordelt med forventningsverdi µ = λt. Her er λ skadefrekvens pr skidag og t er eksponeringstid i antall skidager. En skidag er definert som en person i alpinanlegget en hel dag. Jordskjelv α-partikler bakgrunnsstråling. Trykkfeil pr. bokside. Antall studenter som sovner pr. forelesningstime (?) Antall aviser som selges ved et utsalgssted.

36 Optimal leveranse av Dagbladet Daglig selges rundt 220 000 eksemplarer av Dagbladet hos tilsammen 11 000 utsalgssteder (tall fra 2000). Dagbladet ønsker å bruke statistiske modeller for å betemme hvor mange eksemplarer som skal leveres til hvert utsalgssted hver salgsdag for at avisen skal tjene mest. Leveres for mange eksemplarer blir noen ikke solgt og er en unødvendig kostnad. Leveres for få eksemplarer gå utsalgsstedet utsolgt og avisen taper salgsinntekter. Økonomer i avisen kan angi en kostnad eksemplar som ikke blir solgt og for eksemplarer som kunne vært solgt (tapt salg). Dette kan våre avhengig av ukedag, type utsalgssted og andre størrelser.

37 Optimal leveranse av Dagbladet Kan vi finne fordelingen til antall aviser som kan selges på hvert salgssted hver salgsdag kan vi optimalt bestemme hvor mange aviser som skal leveres til hvert salgssted hver salgssdag. Et slikt system er implementert ved Dagbladet! 38 Fordelingen til avissalg Dagens salg av Dagbladet i en dagligvareforretning på City Syd (idealisert). 1. Ser vi på salget i to disjunkte tidsintervall så er disse uavhengige. (Har mange aviser og går ikke utsolgt.) 2. Kundene ankommer butikken fordelt over hele åpningstiden. Noen av kundene kjøper Dagbladet, og vi har en underliggende intensitet for kjøp på λ. 3. To salg er ikke fullstendig sammenfallende på tidsaksen. Salget er Poisson-fordelt med forventing λt. Pois(lambda=50) 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0 20 40 60 80

39 Fordelingen til avissalg (forts.) Forventet salg er avhengig av utsalgssted og salgsdag. Klar effekt: Ukedag Sesong, helligdager, høytider, spesielle hendelser, trender over lengre perioder. Type utsalgssted, geografi. Basert på data tilbake i tid (her 3.5 år) kan man anslå forventet salg for hver utsalgssted og hver salgsdag frem i tid. Leveranse kan så bestemmes som en percentil i Poisson-fordelingen med denne forventningen. 40 Fordelingen til avissalg (forts.) Pois(lambda=50) 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0 20 40 60 80 Metoden anbefaler leveringstall på en normaldag, og skaleres i forhold til dagens forside (totalopplaget). Problemer med Poisson: faste kunder, busslast på fjellet.