ÅMA0 Sannsnlighetsregning med statistikk, våren 007 Kp. 3 Diskrete tilfeldige variable Noen viktige sannsnlighetsmodeller Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) Noen viktige sannsnlighetsmodeller Først litt mer i forbindelse med binomisk modell. 3
Binomisk modell, forventning og varians; utledninger Vi har slått fast at dersom X ~ B( n, p ), så: E X Var np X np( p) Dette skal vi begrunne (bevise)! 4 Binomisk modell, forventning og varians; utledninger Vi kan skrive : X I I I n, der I j 0,, dersom fiasko i delforsøk nr. dersom suksess i delforsøk nr. j j, j,,..., n Hver I j har fordelingen : i 0 P(I j =i) -p p 5 Binomisk modell, forventning og varians; utledninger Da får vi: E(I j ) 0( p) p p, i 0 P(I j =i) -p p og siden : X I I I, n får vi : E( X ) E( I I p p p np I ) E( I ) E( I ) E( I ) n n 6
Binomisk modell, forventning og varians; utledninger Videre, får vi: E(I j ) som gir : 0 ( p) p p, i 0 P(I j =i) -p p Var(I ) E(I j j ) { E(I j )} p p p( p), 7 Binomisk modell, forventning og varians; utledninger Og da: siden : X I I I n, og I j 'ene er uavhengige får vi : Var( X ) Var( I I I ) Var( I ) Var( I n ) Var( I n ) p( p) p( p) p( p) np( p) Var(I j ) p( p) 8 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) 9
/ hpergeometrisk fordeling Eks.: Vi har fem kuler, tre svarte og to røde i en boks og skal trekke to tilfeldig. La X=ant. svarte blant de to uttrukne. Kan binomisk modell brukes for X? 0 Eks.: Vi har fem kuler, tre svarte og to røde i en boks og skal trekke to tildeldig. La X=ant. svarte blant de to uttrukne. Kan binomisk modell brukes for X? Hver trekning: delforsøk, n= delforsøk, og suksess = svart kule trukket fiasko = rød kule trukket P(svart på første kule) = 3/5 P(svart på andre kule) =?? Eks.: P(svart på første kule) = 3/5 P(svart på andre kule) = 3/5, den også (!) Obs. ubetinget sannsnlighet; betinget på hva som skjer i første trekning vil vi få andre resultat. Dette viser at resultatene i slike delforsøk ikke er uavhengige! Dvs.: binomisk modell kan ikke brukes.
Vi kan enkelt finne fordelingen til X i eksempelet: P(X ) P( en svart, en rød ) 3 3 5 5 4 / 3 5 3 3 Tilsvarende for de andre mulige verdiene: P(X 0) P( ingen svart, to røde ) 3 0 5 54 / 0 P(X ) P( to svarte, ingen røde ) 3 0 3 3 5 54 / 0 x 0 P(X=x) 0. 0.6 0.3 4 Generelt: Vi trekker n stkker fra en populasjon på N objekt; hvert objekt kan kategoriseres som defekt eller ikke-defekt ; det er M defekte blant de N N-M (ikke-defekte) M (defekte) Y = antall defekte i utvalget 5
Generelt: Vi trekker n stkker fra en populasjon på N objekt; hvert objekt kan kategoriseres som defekt eller ikke-defekt ; det er M defekte blant de N N-M (ikke-defekte) M (defekte) Y = antall defekte i utvalget Vi sier da at Y er hpergeometrisk fordelt, (N,M,n) 6 Def.: Når Y er hpergeometrisk fordelt, (N,M,n), er sannsnlighetsfordelingen gitt ved: P(Y ) P( akkurat defekte i utvalget ) M N m n, N n for 0,,,..., n N-M (ikke-defekte) n- N M n M (defekte) M P(Y ) 0, dersom M. 7 Eks.: Meningsmåling. N=3.3 mill. stemmeberettigede M=antall for en bestemt sak. blant de N n=utvalgsstørrelse (omkring 00) N-M (ikke-defekte) M (defekte) Y=antall for i utvalget, er hpergeometrisk fordelt, (N,M,n). 8
Setning: Dersom Y er hpergeometrisk fordelt, (N,M,n), så: E(Y) M n N N-M (ikke-defekte) M (defekte) M M Var(Y) n N N N n N 9 Eks.: Meningsmåling; N=3.3 mill.; Anta at M=.0 mill. (60.6%) er for en bestemt sak. blant de N, og anta at n = utvalgsstørrelse = 00 Forventet antall som er for i utvalget = M.0 E(Y) n 00 666.6 N 3.3 60.6% av utvalget på 00 0 Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk.
Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk. Da kan vi se på resultatene av uttrekningen som tilnærmet en binomisk forsøksrekke, og X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=) Y~B(, 0.6 ) x 0 P(X=x) 0. 0.6 0.3 P(Y=x) 0.6 0.48 0.36 3 Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=) Y~B(, 0.6 ) x 0 P(X=x) 0. 0.6 0.3 P(Y=x) 0.6 0.48 0.36 P(V=x) 0.55 0.49 0.355 V~hperg.(N=50,M=30,n=) 4
Altså: istedenfor å beregne sannsnligheter fra: hperg.(n=50,m=30,n=), kan vi bruke tilnærmingene fra: Y~B(, 0.6 ) x 0 P(Y=x) 0.6 0.48 0.36 P(V=x) 0.55 0.49 0.355 5 Altså: istedenfor å beregne sannsnligheter fra: hperg.(n=50,m=30,n=), kan vi bruke tilnærmingene fra: Y~B(, 0.6 ) Tilnærmingene er gode dersom n < 0. N. x 0 P(Y=x) 0.6 0.48 0.36 P(V=x) 0.55 0.49 0.355 6 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) 7
Situasjon: Utgangspunktet er en binomisk forsøksrekke; n uendelig. Delforsøkene må tilfredstille:. uavhengige resultat i ulike delforsøk. resultatet er enten suksess eller fiasko 3. P( suksess ) er konstant i alle delforsøkene Hvor mange delforsøk til første suksess? 8 Eks.: Y=antall kast med terning til sekser første gang Y kan anta:,, 3,... Terningkastene er delforsøkene (sekser=suksess); tilfredsstiller krav til binomisk forsøksrekke. Da: Y = antall delforsøk til første suksess 9 Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsnlighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) (Man sier ofte at dette er en ventetidsfordeling.) 30
Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling: P(Y ) P(S ) p P(Y ) P(F S ) P(Y 3) P(F F S ) uavhengige delforsøk 3 P(F )P(S ) (- p)p uavhengige delforsøk P(F )P(F )P(S ) 3 (- p) p 3 Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling, generelt: P(Y ) (- p) - p,,, 3,... E(Y) p og p Var(Y) p 3 Obs.: P(Y ) (- p) - p,,, 3,... E(Y) P(Y ) (- p) - p p 33
Eks.: Vi tipper en rekke i LOTTO hver uke framover. La X=antall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p=/537966. Forventet antall uker til vi får 7 riktige første gang = E(X) = 34 Eks.: Vi tipper en rekke i LOTTO hver uke framover. La X=antall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p=/537966. Forventet antall uker til vi får 7 riktige første gang = E(X) = /p = 537966 uker (!) 35 Eks.: La Y=antall terningkast til vi får sekser første gang. Da: Y~geom.(p), p=/6. Hva er sannsnligheten for å få første sekser innen 0 kast? 36
Eks.: Vi er interessert i P(Y 0). Ser generelt på P(Y ): P(Y ) P(minst - P(ingen - en, sekser sekser i innen løpet,,3,... kast) av kast) 37 Eks.: Vi er interessert i P(Y 0). Ser generelt på P(Y ): P(Y ) P(minst en sekser innen kast) - P(ingen sekser i løpet av kast) - (- p),,,3,... (- p) P(Y 0) - (- ) 6 0 0.8385 38 Eks.: Diagram over P(Y ) når Y=ant. kast til første sekser. (Vi kaller P(Y ) for den kumulative fordelingsfunksjonen til Y.) P(Y<=) 0,667 0,3056 3 0,43 4 0,577 5 0,598 6 0,665 7 0,709 8 0,7674 9 0,806 0 0,8385 0,8654 0,8878 Sanns. for første sekser innen...,0 0,8 0,6 0,4 0, 0,0 0 0 0 30 40 50 60 Antall kast til første sekser 39
Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) 40 (kp. 3.8) Situasjoner der Poissonfordeling kan være en god beskrivelse: X=antall forekomster av en bestemt begivenhet i et tidsrom (f.eks. antall ulkker pr. måned) eller X=antall forekomster av et bestemt objekt i et bestemt volum eller areal (f.eks. antall bakterier i en vannprøve) 4 Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0,,,... 4
Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0,,,... Med hvilke sannsnligheter??... P(Y=) =?? 43 Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0,,,... I slike situasjoner er det ofte rimelig å anta. at antall forekomster i disjunkte intervall er statistisk uavhengig av hverandre,. at forventet antall forekomster pr. enhet er konstant, og 3. at sannsnligheten for to eller flere forekomster i samme intervall, går mot null når intervallengden går mot null 44 Dersom forutsetningene er tilfredsstilt, så kan vi utlede matematisk at sannsnlighetene for Y er gitt ved: For 0,,, 3,... P(Y ) t! e t Her er t forventet (t i eksempelet) antall i t minutt 45
Eks.: Dersom vi kan forvente 8 innkommende samtaler pr. minutt, har vi: For 0,,, 3,... 0 0,0003 0,007 0,007 3 0,086 4 0,0573 5 0,096 6 0, 7 0,396 8 0,396 9 0,4 0 0,0993 0,07 0,048 3 0,096 4 0,069 5 0,0090 6 0,0045 7 0,00 8 0,0009 9 0,0004 0 0,000 0,000 0,0000 P(Y ) 8 8! e 0,5 0,0 0,05 Poissonfordeling, m/forv. 8 0,00 0 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 0 46 Obs.: De beskrevne antakelsene + diff.ligninger ++ gir sannsnlighetene (tids)intervall vs. areal vs. volum gir realistiske sannsnlighetsmodeller i situasjoner der antakelsene helt eller tilnærmelsesvis er tilfredsstilt 47 Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P( ingen samtaler i ett minutt ) =? P( to eller flere i ett minutt ) =? P( akkurat tre i løpet av to minutt ) =? 48
Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y 0).5 0! 0 e.5 e.5 0. P(Y ) t t! 49 e Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y 0).5 0! 0 e.5 e.5 0. P(to eller flere i ett minutt) P(Y ) - P(Y ) - P(Y 0) P(Y ).5.5 t t -{ 0. e } 0.45 P(Y ) e!! 50 Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. Poissonfordeling med forventning.5: Poissonfordeling, m/forv..5 0,40 0,35 0,30 0,5 0,0 0,5 0,0 0,05 0,00 0 3 4 5 6 7 8 9 0 5
Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. Dersom X=antall samtaler i to minutt, så vil vi ha at: X er Poissonfordelt med forventning P(akkurat tre i to minutt) P(X 3) 3 3 e 3! 3 0.4.5 3.5 og t : t.5 3 P(Y ) t t! 5 e Resultat: Dersom Y er Poissonfordelt med parameter t, har vi at: E(Y) t og For P(Y ) 0,,, 3,... t t! e Var(Y) t Skrivemåte : Y ~ Poiss. t 53 Obs.:, Når Y ~ Poiss. t så E(Y) P(Y ) 0 0 t! e -t t For 0,,, 3,... P(Y ) t t! e 54
Beregne sannsnligheter ) med formel ) bruk av tabell (tilgjengelig på nettstedet) 55, tabell 56, tabell 57
Eksempler:. Antall utrkninger per uke ved brannstasjon. Antall stormer per år 58