Hypergeometrisk modell

Like dokumenter
ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Hypergeometrisk modell

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Bernoulli forsøksrekke og binomisk fordeling

Betinget sannsynlighet

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Statistikk 1 kapittel 5

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

statistikk, våren 2011

Motivasjon for kurset. ÅMA110 Sannsynlighetsregning med statistikk, våren Oppsummering. ÅMA110 Sannsynlighetsregning med statistikk våren 2008

Statistikk 1 kapittel 5

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Diskrete sannsynlighetsfordelinger.

Løsningskisse for oppgaver til undervisningsfri uke 14 (6.-9. april)

Statistikk 1 kapittel 5

HØGSKOLEN I STAVANGER

Diskrete sannsynlighetsfordelinger.

tirsdag_11_09_2018_binomisk_fordeling_poisson_fordeling.notebook September 11, 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Statistikk 1 kapittel 5

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Kap. 6, Kontinuerlege Sannsynsfordelingar

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk H2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Kap. 7 - Sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren

Løsningskisse seminaroppgaver uke 15

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Kontinuerlige sannsynlighetsfordelinger.

TMA4240 Statistikk Høst 2009

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Poissonprosesser og levetidsfordelinger

Kontinuerlige sannsynlighetsfordelinger.

Kap. 6, Kontinuerlege Sannsynsfordelingar

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

TMA4240 Statistikk H2010

Kap. 5.2: Utvalgsfordelinger for antall og andeler

ST0103 Brukerkurs i statistikk Høst 2014

Oppgave 1 En ansatt skal overvåke et prosjekt der en lapp velges tilfeldig fra en boks som inneholder 10 lapper nummerert fra 1 til 10.

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Sannsynlighetsregning

Kapittel 5: Tilfeldige variable, forventning og varians.

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Notasjon. Løsninger. Problem. Kapittel 7

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4240 Statistikk 2014

HØGSKOLEN I STAVANGER

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

TMA4240 Statistikk Høst 2008

ST0202 Statistikk for samfunnsvitere

Introduction to the Practice of Statistics

Tilfeldige variable (5.2)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Regneøvelse 29/5, 2017

Regneregler for forventning og varians

Oppgave 1 a) La X være massen til et tilfeldig valgt egg, målt i gram. Sannsynligheten for at et tilfeldig valgt egg veier mer enn 60 g er

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Oppfriskning av blokk 1 i TMA4240

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Slide 1. Slide 2 Statistisk inferens. Slide 3. Introduction to the Practice of Statistics Fifth Edition

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

5.2 Diskret uniform fordeling. Midtveiseksamen (forts.) Kapittel 5. Noen diskrete sannsynlighetsfordelinger. TMA4245 V2007: Eirik Mo

Noen diskrete sannsynlighetsfordelinger. (utarbeidet av Mette Langaas), TMA4245 V2007

Midtveiseksamen i STK1100 våren 2017

Fasit for tilleggsoppgaver

6.1 Kontinuerlig uniform fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Sannsynlighet og statistikk

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

To-dimensjonale kontinuerlige fordelinger

Transkript:

Hpergeometrisk modell Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk. Da kan vi se på resultatene av uttrekningen som tilnærmet en binomisk forsøksrekke, og X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. 41 Hpergeometrisk modell Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=2) x 0 1 2 P(X=x) 0.1 0.6 0.3 P(Y=x) 0.16 0.48 0.36 Y~B( 2, 0.6 ) M p N 3 5 0.6 42

Hpergeometrisk modell Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=2) Y~B( 2, 0.6 ) x 0 1 2 P(X=x) 0.1 0.6 0.3 P(Y=x) 0.16 0.48 0.36 P(V=x) 0.155 0.49 0.355 V~hperg.(N=50,M=30,n=2) 20 30 M p N 30 50 0.6 43 Hpergeometrisk modell Altså: istedenfor å beregne sannsnligheter fra: hperg.(n=50,m=30,n=2), kan vi bruke tilnærmingene fra: Y~B( 2, 0.6 ) Tilnærmingene er gode dersom n < 0.1 N. x 0 1 2 P(Y=x) 0.16 0.48 0.36 P(V=x) 0.155 0.49 0.355 44

Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) Hpergeometrisk modell (kp. 3.7) Geometrisk modell (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) 45 Geometrisk modell Situasjon: Utgangspunktet er en binomisk forsøksrekke; n uendelig. Delforsøkene må tilfredstille: 1. uavhengige resultat i ulike delforsøk 2. resultatet er enten suksess eller fiasko 3. P( suksess ) er konstant i alle delforsøkene Hvor mange delforsøk til første suksess? 46

Geometrisk modell Eks.: Y=antall kast med terning til sekser første gang Y kan anta: 1, 2, 3,... Terningkastene er delforsøkene (sekser=suksess); tilfredsstiller krav til binomisk forsøksrekke. Da: Y = antall delforsøk til første suksess 47 Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsnlighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) (Man sier ofte at dette er en ventetidsfordeling.) 48

Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling: P(Y 1) P(S ) p 1 P(Y 2) P(F S 1 2 ) uavhengige delforsøk P(F )P(S 1 2 ) (1- p)p P(Y 3) P(F F 1 2 S 3 ) uavhengige delforsøk P(F )P(F 1 2 )P(S 3 ) (1- p) 2 p 49 Geometrisk modell Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling, generelt: P(Y ) (1- p) -1 p, 1, 2, 3,... E(Y) 1 p og Var(Y) 1 p 2 p 50

Geometrisk modell Obs.: P(Y ) (1- p) -1 p, 1, 2, 3,... E(Y) 1 P(Y ) 1 (1- p) -1 p 1 p 51 Geometrisk modell Eks.: Vi tipper en rekke i LOTTO hver uke framover. La X=antall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p=1/5379616. Forventet antall uker til vi får 7 riktige første gang = E(X) = 1/p = 5379616 uker (!) 52

Geometrisk modell Eks.: La Y=antall terningkast til vi får sekser første gang. Da: Y~geom.(p), p=1/6. Hva er sannsnligheten for å få første sekser innen 10 kast? 53 Geometrisk modell Eks.: Vi er interessert i P(Y 10). Ser generelt på P(Y ): P(Y ) P(minst en sekser innen kast) 1- P(ingen sekser i løpet av kast) 1- (1- p), 1,2,3,... 54

Geometrisk modell Eks.: Diagram over P(Y ) når Y=ant. kast til første sekser. (Vi kaller P(Y ) for den kumulative fordelingsfunksjonen til Y.) Sanns. for første sekser innen... P(Y<=) 1 0,1667 2 0,3056 3 0,4213 4 0,5177 5 0,5981 6 0,6651 7 0,7209 8 0,7674 9 0,8062 10 0,8385 11 0,8654 12 0,8878 1,0 0,8 0,6 0,4 0,2 1 P(Y ) 1- (1- ) 6 0,0 0 10 20 30 40 50 60 Antall kast til første sekser 55 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) Hpergeometrisk modell (kp. 3.7) Geometrisk modell (notater) Poisson-modell (kp. 3.8) 56

Poissonmodell (kp. 3.8) Situasjoner der Poissonfordeling kan være en god beskrivelse: X=antall forekomster av en bestemt begivenhet i et tidsrom (f.eks. antall ulkker pr. måned) eller X=antall forekomster av et bestemt objekt i et bestemt volum eller areal (f.eks. antall bakterier i en vannprøve) 57 Poissonmodell Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0, 1, 2,... Med hvilke sannsnligheter??... P(Y=) =?? 58

Poissonmodell Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0, 1, 2,... I slike situasjoner er det ofte rimelig å anta 1. at antall forekomster i disjunkte intervall er statistisk uavhengig av hverandre, 2. at forventet antall forekomster pr. enhet er konstant, og 3. at sannsnligheten for to eller flere forekomster i samme intervall, går mot null når intervallengden går mot null 59 Poissonmodell Dersom forutsetningene er tilfredsstilt, så kan vi utlede matematisk at sannsnlighetene for Y er gitt ved: For 0,1, 2, 3,... P(Y ) t! e t Her er t forventet (t 1 i eksempelet) antall i t minutt 60

Poissonmodell Eks.: Dersom vi kan forvente 8 innkommende samtaler pr. minutt, har vi: For 0,1, 2, 3,... 0 0,0003 1 0,0027 2 0,0107 3 0,0286 4 0,0573 5 0,0916 6 0,1221 7 0,1396 8 0,1396 9 0,1241 10 0,0993 11 0,0722 12 0,0481 13 0,0296 14 0,0169 15 0,0090 16 0,0045 17 0,0021 18 0,0009 19 0,0004 20 0,0002 21 0,0001 22 0,0000 P(Y ) 8 8! e 0,15 0,10 Poissonfordeling, m/forv. 8 0,05 0,00 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 61 Poissonmodell Obs.: De beskrevne antakelsene + diff.ligninger ++ gir sannsnlighetene. (tids)intervall vs. areal vs. volum gir realistiske sannsnlighetsmodeller i situasjoner der antakelsene helt eller tilnærmelsesvis er tilfredsstilt 62

Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. P( ingen samtaler i ett minutt ) =? P( to eller flere i ett minutt ) =? P( akkurat tre i løpet av to minutt ) =? 63 Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y 0) 1.5 0! 0 e 1.5 e 1.5 0.22 P(to eller flere i ett 1- P(Y 1) 1-{ 1.5 0.22 1! 1 1- minutt) P(Y 2) P(Y 0) P(Y 1) 1.5 t e } 0.45 P(Y ) e t! 64

Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. Poissonfordeling med forventning 1.5: Poissonfordeling, m/forv. 1.5 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 7 8 9 10 65 Poissonmodell Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning 1.5 samtaler pr. minutt. Dersom X=antall samtaler i to minutt, så vil vi ha at: X er Poissonfordelt med forventning 21.5 3 P(akkurat tre i 3 3 e 3! 3 to minutt) P(X 0.224 3) 1.5 og t 2 : t 1.5 2 3 P(Y ) t t! 66 e

Poissonmodell t Resultat: Dersom Y er Poissonfordelt med parameter, har vi at: E(Y) t og For P(Y ) 0,1, 2, 3,... t t! e Var(Y) t Skrivemåte : Y ~ Poiss. t 67 Poissonmodell Obs.: Når Y ~ Poiss. t, så E(Y) 0 0 P(Y t! ) e -t t For 0,1, 2, 3,... P(Y ) t t! e 68

Poissonmodell Beregne sannsnligheter 1) med formel 2) bruk av tabell (tilgjengelig på nettstedet) 69 Poissonmodell, tabell 70

Poissonmodell, tabell 71 Poissonmodell Eksempler: 1. Antall utrkninger per uke ved brannstasjon 2. Antall stormer per år 72

Antall utrkninger (ved Stavanger brannstasjon) per uke fom. 1. Januar 1996 tom. 31. Desember 1997. Totalt 181 utrkninger; i gjennomsnitt 181/104 per uke. Sammenligning med Poissonfordeling med forventning 181/104 (=1.74). Ant. per uke rel.frek. Sanns. 0 0,21 0,18 1 0,24 0,31 2 0,27 0,27 3 0,19 0,15 4 0,07 0,07 5 0,01 0,02 6 eller flere 0,01 0,01 Utrkninger, relativfrekvenshistogram. relativfrekvens 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 eller flere Antall utrkninger i en uke. rel.frek. Poisson 06.02.2011 990302-Poisson-Brannutrkninger.xls Diagram

Antall stormer (på Sola) per år i årene fom.1957 tom. 1998. Totalt 7 stormer; i gjennomsnitt 7/42 = 1/6 per år. Sammenligning med Poissonfordeling med forventning 7/42=0.167. Ant. per år rel.frek. Sanns. 0 0,857 0 0,846 1 0,119 1 0,141 2 0,024 2 0,012 3 eller flere 0,000 3 eller flere 0,001 Stormer, relativfrekvenshistogram. relativfrekvens 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 0 1 2 3 eller flere Antall stormer i et år. data Poisson 06.02.2011 990302-Poisson-Stormer.xls Ark1