ÅMA Sannsnlighetsregning med statistikk, våren 6 Kp. 3 Diskrete tilfeldige variable Noen viktige sannsnlighetsmodeller Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) Hpergeometrisk modell (kp. 3.7) Geometrisk modell (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) Hpergeometrisk modell Hpergeometrisk modell / hpergeometrisk fordeling Eks.: Vi har fem kuler, tre svarte og to røde i en boks og skal trekke to tildeldig. La Xant. svarte blant de to uttrukne. Kan binomisk modell brukes for X? 3
Hpergeometrisk modell Eks.: Vi har fem kuler, tre svarte og to røde i en boks og skal trekke to tildeldig. La Xant. svarte blant de to uttrukne. Kan binomisk modell brukes for X? Hver trekning: delforsøk, n delforsøk, og suksess svart kule trukket fiasko rød kule trukket P(svart på første kule) 3/5 P(svart på andre kule)?? 4 Hpergeometrisk modell Eks.: P(svart på første kule) 3/5 P(svart på andre kule) 3/5, den også (!) Obs. ubetinget sannsnlighet; betinget på hva som skjer i første trekning vil vi få andre resultat. Dette viser at resultatene i slike delforsøk ikke er uavhengige! Dvs.: binomisk modell kan ikke brukes. 5 Hpergeometrisk modell Vi kan enkelt finne fordelingen til X i eksempelet: P(X ) P( en svart, en rød ) 3 3 3 5 5 4 / 5 3 6
Hpergeometrisk modell Tilsvarende for de andre mulige verdiene: P(X ) P( ingen svart, to røde ) 3 5 5 4 / P(X ) P( to svarte, ingen røde ) 3 3 3 5 5 4 / x P(Xx)..6.3 7 Hpergeometrisk modell Generelt: Vi trekker n stkker fra en populasjon på N objekt; hvert objekt kan kategoriseres som defekt eller ikke-defekt ; det er M defekte blant de N Y antall defekte i utvalget N-M (ikke-defekte) n- N M n M (defekte) M 8 Hpergeometrisk modell Generelt: Vi trekker n stkker fra en populasjon på N objekt; hvert objekt kan kategoriseres som defekt eller ikke-defekt ; det er M defekte blant de N Y antall defekte i utvalget N-M (ikke-defekte) n- N M n M (defekte) M Vi sier da at Y er hpergeometrisk fordelt, (N,M,n) 9 3
Hpergeometrisk modell Def.: Når Y er hpergeometrisk fordelt, (N,M,n), er sannsnlighetsfordelingen gitt ved: P(Y ) P( akkurat defekte i utvalget ) M N m n, for,,,..., n N n N-M (ikke-defekte) n- N M n M (defekte) M ( P(Y ), dersom > M. ) Hpergeometrisk modell Eks.: Meningsmåling. N3.3 mill. stemmeberettigede Mantall for en bestemt sak. blant de N nutvalgsstørrelse (omkring ) Yantall for i utvalget, er hpergeometrisk fordelt, (N,M,n). N-M (ikke-defekte) n- N M n M (defekte) M Hpergeometrisk modell Setning: Dersom Y er hpergeometrisk fordelt, (N,M,n), så: E(Y) n M N M M N n Var(Y) n N N N N-M (ikke-defekte) n- N M n M (defekte) M 4
Hpergeometrisk modell Eks.: Meningsmåling; N3.3 mill.; Anta at M. mill. (6.6%) er for en bestemt sak. blant de N, og anta at nutvalgsstørrelse Forventet antall som er for i utvalget M. E(Y) n 666.6 N 3.3 ( 6.6% av utvalget på ) 3 Hpergeometrisk modell Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk. 4 Hpergeometrisk modell Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk. Da kan vi se på resultatene av uttrekningen som tilnærmet en binomisk forsøksrekke, og Xantall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med pm/n. 5 5
Hpergeometrisk modell Tilnærming til binomisk fordeling Xantall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med pm/n. Eks.: X~hperg.(N5,M3,n) x P(Xx)..6.3 P(Yx).6.48.36 Y~B(,.6 ) 6 Hpergeometrisk modell Tilnærming til binomisk fordeling Xantall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med pm/n. Eks.: X~hperg.(N5,M3,n) x P(Xx)..6.3 P(Yx).6.48.36 Y~B(,.6 ) P(Vx).55.49.355 V~hperg.(N5,M3,n) 7 Hpergeometrisk modell Altså: istedenfor å beregne sannsnligheter fra: hperg.(n5,m3,n), kan vi bruke tilnærmingene fra: Y~B(,.6 ) x P(Yx).6.48.36 P(Vx).55.49.355 8 6
Hpergeometrisk modell Altså: istedenfor å beregne sannsnligheter fra: hperg.(n5,m3,n), kan vi bruke tilnærmingene fra: Y~B(,.6 ) Tilnærmingene er gode dersom n <. N. x P(Yx).6.48.36 P(Vx).55.49.355 9 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) Hpergeometrisk modell (kp. 3.7) Geometrisk modell (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) Geometrisk modell Situasjon: Utgangspunktet er en binomisk forsøksrekke; n uendelig. Delforsøkene må tilfredstille:. uavhengige resultat i ulike delforsøk. resultatet er enten suksess eller fiasko 3. P( suksess ) er konstant i alle delforsøkene Hvor mange delforsøk til første suksess? 7
Geometrisk modell Eks.: Yantall kast med terning til sekser første gang Y kan anta:,, 3,... Terningkastene er delforsøkene (seksersuksess); tilfredsstiller krav til binomisk forsøksrekke. Da: Y antall delforsøk til første suksess Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsnlighet p, der pp(suksess). Vi skriver: Y ~ geom.(p) (Man sier ofte at dette er en ventetidsfordeling.) 3 Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der pp(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling: P(Y ) P(S ) p P(Y ) P(F S ) P(Y 3) P(F F S ) uavhengige delforsøk 3 P(F )P(S ) (- p)p uavhengige delforsøk P(F )P(F )P(S ) (- p) p 3 4 8
Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der pp(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling, generelt: P(Y ) (- p) - p,,, 3,... E(Y) p og p Var(Y) p 5 Geometrisk modell Obs.: P(Y ) (- p) - p,,, 3,... E(Y) P(Y ) (- p) - p L p 6 Geometrisk modell Eks.: Vi tipper en rekke i LOTTO hver uke framover. La Xantall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p/537966. Forventet antall uker til vi får 7 riktige første gang E(X) 7 9
Geometrisk modell Eks.: Vi tipper en rekke i LOTTO hver uke framover. La Xantall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p/537966. Forventet antall uker til vi får 7 riktige første gang E(X) /p 537966 uker (!) 8 Geometrisk modell Eks.: La Yantall terningkast til vi får sekser første gang. Da: Y~geom.(p), p/6. Hva er sannsnligheten for å få første sekser innen kast? 9 Geometrisk modell Eks.: Vi er interessert i P(Y ). Ser generelt på P(Y ) : P(Y ) P(minst en sekser innen kast) - P(ingen sekser i løpet av kast) - (- p),,,3,... P(Y ) - (- ) 6.8385 3
Geometrisk modell Eks.: Vi er interessert i P(Y ). Ser generelt på P(Y ) : P(Y ) P(minst - P(ingen en sekser innen kast) sekser i løpet av kast) - (- p),,,3,... P(Y ) - (- ) 6.8385 3 Geometrisk modell Eks.: Diagram over P(Y ) når Yant. kast til første sekser. (Vi kaller P(Y ) for den kumulative fordelingsfunksjonen til Y.) P(Y<),667,356 3,43 4,577 5,598 6,665 7,79 8,7674 9,86,8385,8654,8878,,8,6,4, Sanns. for første sekser innen..., 3 4 5 6 Antall kast til første sekser 3 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) Hpergeometrisk modell (kp. 3.7) Geometrisk modell (notater) Poisson-modell (kp. 3.8) 33
(kp. 3.8) Situasjoner der Poissonfordeling kan være en god beskrivelse: Xantall forekomster av en bestemt begivenhet i et tidsrom (f.eks. antall ulkker pr. måned) eller Xantall forekomster av et bestemt objekt i et bestemt volum eller areal (f.eks. antall bakterier i en vannprøve) 34 Eks.: La Y antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta:,,,... Med hvilke sannsnligheter??... P(Y)?? 35 Eks.: La Y antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta:,,,... I slike situasjoner er det ofte rimelig å anta. at antall forekomster i disjunkte intervall er statistisk uavhengig av hverandre,. at forventet antall forekomster pr. enhet er konstant, og 3. at sannsnligheten for to eller flere forekomster i samme intervall, går mot null når intervallengden går mot null 36
Dersom forutsetningene er tilfredsstilt, så kan vi utlede matematisk at sannsnlighetene for Y er gitt ved: For,,, 3,... P(Y ) ( λt)! λt e Her er λt forventet antall i t minutt (t i eksempelet) 37 Eks.: Dersom vi kan forvente 8 innkommende samtaler pr. minutt, har vi: For,,, 3,...,3,7,7 3,86 4,573 5,96 6, 7,396 8,396 9,4,993,7,48 3,96 4,69 5,9 6,45 7, 8,9 9,4,,, P(Y ) () 8 8 e!,5,,5 Poissonfordeling, m/forv. 8, 3 4 5 6 7 8 9 3 4 5 6 7 8 9 38 Obs.: De beskrevne antakelsene + diff.ligninger ++ gir sannsnlighetene (tids)intervall vs. areal vs. volum gir realistiske sannsnlighetsmodeller i situasjoner der antakelsene helt eller tilnærmelsesvis er tilfredsstilt 39 3
Eks.: Anta at Yantall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P( ingen samtaler i ett minutt )? P( to eller flere i ett minutt )? P( akkurat tre i løpet av to minutt )? 4 Eks.: Anta at Yantall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y ).5 e!.5 e.5. 4 Eks.: Anta at Yantall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y ).5 e!.5 e.5. P(to eller flere i ett minutt) P(Y ) - P(Y ) -.5 -{. + e! { P(Y ) + P(Y ) }.5 }.45 4 4
Eks.: Anta at Yantall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. Poissonfordeling med forventning.5: Poissonfordeling, m/forv..5,4,35,3,5,,5,,5, 3 4 5 6 7 8 9 43 Eks.: Anta at Yantall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. Dersom Xantall samtaler i to minutt, så vil vi ha at: X er Poissonfordelt med forventning.5 3 P(akkurat tre i to minutt) P(X 3) 3 3 e 3! 3.4 44 Resultat: Dersom Y er Poissonfordelt med parameter λt, har vi at: E(Y) λt og For,,, 3,... P(Y ) ( λt) λt e! Var(Y) λt Skrivemåte : Y ~ Poiss. ( λt ) 45 5
Obs.: Når E(Y) Y ~ Poiss. ( λt ), P(Y ) ( λt )! så e -λt L λt For,,, 3,... P(Y ) ( λt) λt e! 46 Beregne sannsnligheter ) med formel ) bruk av tabell (tilgjengelig på nettstedet) 47, tabell 48 6
, tabell 49 Eksempler:. Antall utrkninger per uke ved brannstasjon. Antall stormer per år 5 7