Hpergeometrisk modell Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk. Da kan vi se på resultatene av uttrekningen som tilnærmet en binomisk forsøksrekke, og X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. 41 Hpergeometrisk modell Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=2) x 0 1 2 P(X=x) 0.1 0.6 0.3 P(Y=x) 0.16 0.48 0.36 Y~B( 2, 0.6 ) M p N 3 5 0.6 42
Hpergeometrisk modell Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=2) Y~B( 2, 0.6 ) x 0 1 2 P(X=x) 0.1 0.6 0.3 P(Y=x) 0.16 0.48 0.36 P(V=x) 0.155 0.49 0.355 V~hperg.(N=50,M=30,n=2) 20 30 M p N 30 50 0.6 43 Hpergeometrisk modell Altså: istedenfor å beregne sannsnligheter fra: hperg.(n=50,m=30,n=2), kan vi bruke tilnærmingene fra: Y~B( 2, 0.6 ) Tilnærmingene er gode dersom n < 0.1 N. x 0 1 2 P(Y=x) 0.16 0.48 0.36 P(V=x) 0.155 0.49 0.355 44
Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) Hpergeometrisk modell (kp. 3.7) Geometrisk modell (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) 45 Geometrisk modell Situasjon: Utgangspunktet er en binomisk forsøksrekke; n uendelig. Delforsøkene må tilfredstille: 1. uavhengige resultat i ulike delforsøk 2. resultatet er enten suksess eller fiasko 3. P( suksess ) er konstant i alle delforsøkene Hvor mange delforsøk til første suksess? 46
Geometrisk modell Eks.: Y=antall kast med terning til sekser første gang Y kan anta: 1, 2, 3,... Terningkastene er delforsøkene (sekser=suksess); tilfredsstiller krav til binomisk forsøksrekke. Da: Y = antall delforsøk til første suksess 47 Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsnlighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) (Man sier ofte at dette er en ventetidsfordeling.) 48
Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling: P(Y 1) P(S ) p 1 P(Y 2) P(F S 1 2 ) uavhengige delforsøk P(F )P(S 1 2 ) (1- p)p P(Y 3) P(F F 1 2 S 3 ) uavhengige delforsøk P(F )P(F 1 2 )P(S 3 ) (1- p) 2 p 49 Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling, generelt: P(Y ) (1- p) -1 p, 1, 2, 3,... E(Y) 1 p og Var(Y) 1 p 2 p 50
Geometrisk modell Obs.: P(Y ) (1- p) -1 p, 1, 2, 3,... E(Y) 1 P(Y ) 1 (1- p) -1 p 1 p 51 Geometrisk modell Eks.: Vi tipper en rekke i LOTTO hver uke framover. La X=antall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p=1/5379616. Forventet antall uker til vi får 7 riktige første gang = E(X) = 1/p = 5379616 uker (!) 52
Geometrisk modell Eks.: La Y=antall terningkast til vi får sekser første gang. Da: Y~geom.(p), p=1/6. Hva er sannsnligheten for å få første sekser innen 10 kast? 53 Geometrisk modell Eks.: Vi er interessert i P(Y 10). Ser generelt på P(Y ): P(Y ) P(minst en sekser innen kast) 1- P(ingen sekser i løpet av kast) 1- (1- p), 1,2,3,... 54
Geometrisk modell Eks.: Diagram over P(Y ) når Y=ant. kast til første sekser. (Vi kaller P(Y ) for den kumulative fordelingsfunksjonen til Y.) Sanns. for første sekser innen... P(Y<=) 1 0,1667 2 0,3056 3 0,4213 4 0,5177 5 0,5981 6 0,6651 7 0,7209 8 0,7674 9 0,8062 10 0,8385 11 0,8654 12 0,8878 1,0 0,8 0,6 0,4 0,2 1 P(Y ) 1- (1- ) 6 0,0 0 10 20 30 40 50 60 Antall kast til første sekser 55 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) Hpergeometrisk modell (kp. 3.7) Geometrisk modell (notater) Poisson-modell (kp. 3.8) 56
Poissonmodell (kp. 3.8) Situasjoner der Poissonfordeling kan være en god beskrivelse: X=antall forekomster av en bestemt begivenhet i et tidsrom (f.eks. antall ulkker pr. måned) eller X=antall forekomster av et bestemt objekt i et bestemt volum eller areal (f.eks. antall bakterier i en vannprøve) 57 Poissonmodell Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0, 1, 2,... Med hvilke sannsnligheter??... P(Y=) =?? 58
Poissonmodell Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0, 1, 2,... I slike situasjoner er det ofte rimelig å anta 1. at antall forekomster i disjunkte intervall er statistisk uavhengig av hverandre, 2. at forventet antall forekomster pr. enhet er konstant, og 3. at sannsnligheten for to eller flere forekomster i samme intervall, går mot null når intervallengden går mot null 59 Poissonmodell Dersom forutsetningene er tilfredsstilt, så kan vi utlede matematisk at sannsnlighetene for Y er gitt ved: For 0,1, 2, 3,... P(Y ) t! e t Her er t forventet (t 1 i eksempelet) antall i t minutt 60
Poissonmodell Eks.: Dersom vi kan forvente 8 innkommende samtaler pr. minutt, har vi: For 0,1, 2, 3,... 0 0,0003 1 0,0027 2 0,0107 3 0,0286 4 0,0573 5 0,0916 6 0,1221 7 0,1396 8 0,1396 9 0,1241 10 0,0993 11 0,0722 12 0,0481 13 0,0296 14 0,0169 15 0,0090 16 0,0045 17 0,0021 18 0,0009 19 0,0004 20 0,0002 21 0,0001 22 0,0000 P(Y ) 8 8! e 0,15 0,10 Poissonfordeling, m/forv. 8 0,05 0,00 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 61 Poissonmodell Obs.: De beskrevne antakelsene + diff.ligninger ++ gir sannsnlighetene. (tids)intervall vs. areal vs. volum gir realistiske sannsnlighetsmodeller i situasjoner der antakelsene helt eller tilnærmelsesvis er tilfredsstilt 62
Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. P( ingen samtaler i ett minutt ) =? P( to eller flere i ett minutt ) =? P( akkurat tre i løpet av to minutt ) =? 63 Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y 0) 1.5 0! 0 e 1.5 e 1.5 0.22 P(to eller flere i ett 1- P(Y 1) 1-{ 1.5 0.22 1! 1 1- minutt) P(Y 2) P(Y 0) P(Y 1) 1.5 t e } 0.45 P(Y ) e t! 64
Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. Poissonfordeling med forventning 1.5: Poissonfordeling, m/forv. 1.5 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 7 8 9 10 65 Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. Dersom X=antall samtaler i to minutt, så vil vi ha at: X er Poissonfordelt med forventning 21.5 3 P(akkurat tre i 3 3 e 3! 3 to minutt) P(X 0.224 3) 1.5 og t 2 : t 1.5 2 3 P(Y ) t t! 66 e
Poissonmodell t Resultat: Dersom Y er Poissonfordelt med parameter, har vi at: E(Y) t og For P(Y ) 0,1, 2, 3,... t t! e Var(Y) t Skrivemåte : Y ~ Poiss. t 67 Poissonmodell Obs.: Når Y ~ Poiss. t, så E(Y) 0 0 P(Y t! ) e -t t For 0,1, 2, 3,... P(Y ) t t! e 68
Poissonmodell Beregne sannsnligheter 1) med formel 2) bruk av tabell (tilgjengelig på nettstedet) 69 Poissonmodell, tabell 70
Poissonmodell, tabell 71 Poissonmodell Eksempler: 1. Antall utrkninger per uke ved brannstasjon 2. Antall stormer per år 72
Antall utrkninger (ved Stavanger brannstasjon) per uke fom. 1. Januar 1996 tom. 31. Desember 1997. Totalt 181 utrkninger; i gjennomsnitt 181/104 per uke. Sammenligning med Poissonfordeling med forventning 181/104 (=1.74). Ant. per uke rel.frek. Sanns. 0 0,21 0,18 1 0,24 0,31 2 0,27 0,27 3 0,19 0,15 4 0,07 0,07 5 0,01 0,02 6 eller flere 0,01 0,01 Utrkninger, relativfrekvenshistogram. relativfrekvens 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 eller flere Antall utrkninger i en uke. rel.frek. Poisson 06.02.2011 990302-Poisson-Brannutrkninger.xls Diagram
Antall stormer (på Sola) per år i årene fom.1957 tom. 1998. Totalt 7 stormer; i gjennomsnitt 7/42 = 1/6 per år. Sammenligning med Poissonfordeling med forventning 7/42=0.167. Ant. per år rel.frek. Sanns. 0 0,857 0 0,846 1 0,119 1 0,141 2 0,024 2 0,012 3 eller flere 0,000 3 eller flere 0,001 Stormer, relativfrekvenshistogram. relativfrekvens 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 0 1 2 3 eller flere Antall stormer i et år. data Poisson 06.02.2011 990302-Poisson-Stormer.xls Ark1