ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Like dokumenter
ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Hypergeometrisk modell

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

Hypergeometrisk modell

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Betinget sannsynlighet

Bernoulli forsøksrekke og binomisk fordeling

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Statistikk 1 kapittel 5

TMA4240 Statistikk H2010

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Statistikk 1 kapittel 5

TMA4240 Statistikk H2015

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

HØGSKOLEN I STAVANGER

Løsningskisse for oppgaver til undervisningsfri uke 14 (6.-9. april)

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Løsningskisse seminaroppgaver uke 15

Diskrete sannsynlighetsfordelinger.

Diskrete sannsynlighetsfordelinger.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Motivasjon for kurset. ÅMA110 Sannsynlighetsregning med statistikk, våren Oppsummering. ÅMA110 Sannsynlighetsregning med statistikk våren 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Kap. 6, Kontinuerlege Sannsynsfordelingar

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kontinuerlige sannsynlighetsfordelinger.

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

TMA4240 Statistikk Høst 2009

tirsdag_11_09_2018_binomisk_fordeling_poisson_fordeling.notebook September 11, 2018

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

Litt mer om den hypergeometriske fordelingen og dens tilnærming av binomisk fordeling.

TMA4240 Statistikk Høst 2008

TMA4240 Statistikk Høst 2009

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

TMA4240 Statistikk Høst 2015

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

Oppgave 1 En ansatt skal overvåke et prosjekt der en lapp velges tilfeldig fra en boks som inneholder 10 lapper nummerert fra 1 til 10.

Kap. 6, Kontinuerlege Sannsynsfordelingar

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

Kap. 7 - Sannsynlighetsfordelinger

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

ST0103 Brukerkurs i statistikk Høst 2014

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

5.2 Diskret uniform fordeling. Midtveiseksamen (forts.) Kapittel 5. Noen diskrete sannsynlighetsfordelinger. TMA4245 V2007: Eirik Mo

Noen diskrete sannsynlighetsfordelinger. (utarbeidet av Mette Langaas), TMA4245 V2007

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kontinuerlige sannsynlighetsfordelinger.

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

Kapittel 5: Tilfeldige variable, forventning og varians.

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

Sannsynlighetsregning

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

TMA4240 Statistikk 2014

Poissonprosesser og levetidsfordelinger

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

HØGSKOLEN I STAVANGER

STK Oppsummering

Fasit for tilleggsoppgaver

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Notasjon. Løsninger. Problem. Kapittel 7

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Midtveiseksamen i STK1100 våren 2017

To-dimensjonale kontinuerlige fordelinger

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i TMA4240 Statistikk

Transkript:

ÅMA0 Sannsnlighetsregning med statistikk, våren 007 Kp. 3 Diskrete tilfeldige variable Noen viktige sannsnlighetsmodeller Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) Noen viktige sannsnlighetsmodeller Først litt mer i forbindelse med binomisk modell. 3

Binomisk modell, forventning og varians; utledninger Vi har slått fast at dersom X ~ B( n, p ), så: E X Var np X np( p) Dette skal vi begrunne (bevise)! 4 Binomisk modell, forventning og varians; utledninger Vi kan skrive : X I I I n, der I j 0,, dersom fiasko i delforsøk nr. dersom suksess i delforsøk nr. j j, j,,..., n Hver I j har fordelingen : i 0 P(I j =i) -p p 5 Binomisk modell, forventning og varians; utledninger Da får vi: E(I j ) 0( p) p p, i 0 P(I j =i) -p p og siden : X I I I, n får vi : E( X ) E( I I p p p np I ) E( I ) E( I ) E( I ) n n 6

Binomisk modell, forventning og varians; utledninger Videre, får vi: E(I j ) som gir : 0 ( p) p p, i 0 P(I j =i) -p p Var(I ) E(I j j ) { E(I j )} p p p( p), 7 Binomisk modell, forventning og varians; utledninger Og da: siden : X I I I n, og I j 'ene er uavhengige får vi : Var( X ) Var( I I I ) Var( I ) Var( I n ) Var( I n ) p( p) p( p) p( p) np( p) Var(I j ) p( p) 8 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) 9

/ hpergeometrisk fordeling Eks.: Vi har fem kuler, tre svarte og to røde i en boks og skal trekke to tilfeldig. La X=ant. svarte blant de to uttrukne. Kan binomisk modell brukes for X? 0 Eks.: Vi har fem kuler, tre svarte og to røde i en boks og skal trekke to tildeldig. La X=ant. svarte blant de to uttrukne. Kan binomisk modell brukes for X? Hver trekning: delforsøk, n= delforsøk, og suksess = svart kule trukket fiasko = rød kule trukket P(svart på første kule) = 3/5 P(svart på andre kule) =?? Eks.: P(svart på første kule) = 3/5 P(svart på andre kule) = 3/5, den også (!) Obs. ubetinget sannsnlighet; betinget på hva som skjer i første trekning vil vi få andre resultat. Dette viser at resultatene i slike delforsøk ikke er uavhengige! Dvs.: binomisk modell kan ikke brukes.

Vi kan enkelt finne fordelingen til X i eksempelet: P(X ) P( en svart, en rød ) 3 3 5 5 4 / 3 5 3 3 Tilsvarende for de andre mulige verdiene: P(X 0) P( ingen svart, to røde ) 3 0 5 54 / 0 P(X ) P( to svarte, ingen røde ) 3 0 3 3 5 54 / 0 x 0 P(X=x) 0. 0.6 0.3 4 Generelt: Vi trekker n stkker fra en populasjon på N objekt; hvert objekt kan kategoriseres som defekt eller ikke-defekt ; det er M defekte blant de N N-M (ikke-defekte) M (defekte) Y = antall defekte i utvalget 5

Generelt: Vi trekker n stkker fra en populasjon på N objekt; hvert objekt kan kategoriseres som defekt eller ikke-defekt ; det er M defekte blant de N N-M (ikke-defekte) M (defekte) Y = antall defekte i utvalget Vi sier da at Y er hpergeometrisk fordelt, (N,M,n) 6 Def.: Når Y er hpergeometrisk fordelt, (N,M,n), er sannsnlighetsfordelingen gitt ved: P(Y ) P( akkurat defekte i utvalget ) M N m n, N n for 0,,,..., n N-M (ikke-defekte) n- N M n M (defekte) M P(Y ) 0, dersom M. 7 Eks.: Meningsmåling. N=3.3 mill. stemmeberettigede M=antall for en bestemt sak. blant de N n=utvalgsstørrelse (omkring 00) N-M (ikke-defekte) M (defekte) Y=antall for i utvalget, er hpergeometrisk fordelt, (N,M,n). 8

Setning: Dersom Y er hpergeometrisk fordelt, (N,M,n), så: E(Y) M n N N-M (ikke-defekte) M (defekte) M M Var(Y) n N N N n N 9 Eks.: Meningsmåling; N=3.3 mill.; Anta at M=.0 mill. (60.6%) er for en bestemt sak. blant de N, og anta at n = utvalgsstørrelse = 00 Forventet antall som er for i utvalget = M.0 E(Y) n 00 666.6 N 3.3 60.6% av utvalget på 00 0 Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk.

Tilnærming til binomisk fordeling - enklere å beregne binomiske sannsnligheter Dersom n er liten i forhold til N, er det tilnærmet uavhengighet mellom resultatene i ulike trekninger/ delforsøk. Da kan vi se på resultatene av uttrekningen som tilnærmet en binomisk forsøksrekke, og X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=) Y~B(, 0.6 ) x 0 P(X=x) 0. 0.6 0.3 P(Y=x) 0.6 0.48 0.36 3 Tilnærming til binomisk fordeling X=antall defekte blant de n i utvalget er tilnærmet binomisk fordelt (n, p), med p=m/n. Eks.: X~hperg.(N=5,M=3,n=) Y~B(, 0.6 ) x 0 P(X=x) 0. 0.6 0.3 P(Y=x) 0.6 0.48 0.36 P(V=x) 0.55 0.49 0.355 V~hperg.(N=50,M=30,n=) 4

Altså: istedenfor å beregne sannsnligheter fra: hperg.(n=50,m=30,n=), kan vi bruke tilnærmingene fra: Y~B(, 0.6 ) x 0 P(Y=x) 0.6 0.48 0.36 P(V=x) 0.55 0.49 0.355 5 Altså: istedenfor å beregne sannsnligheter fra: hperg.(n=50,m=30,n=), kan vi bruke tilnærmingene fra: Y~B(, 0.6 ) Tilnærmingene er gode dersom n < 0. N. x 0 P(Y=x) 0.6 0.48 0.36 P(V=x) 0.55 0.49 0.355 6 Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) (Seinere skal vi se på viktige kontinuerlige sannsnlighetsmodeller.) 7

Situasjon: Utgangspunktet er en binomisk forsøksrekke; n uendelig. Delforsøkene må tilfredstille:. uavhengige resultat i ulike delforsøk. resultatet er enten suksess eller fiasko 3. P( suksess ) er konstant i alle delforsøkene Hvor mange delforsøk til første suksess? 8 Eks.: Y=antall kast med terning til sekser første gang Y kan anta:,, 3,... Terningkastene er delforsøkene (sekser=suksess); tilfredsstiller krav til binomisk forsøksrekke. Da: Y = antall delforsøk til første suksess 9 Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsnlighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) (Man sier ofte at dette er en ventetidsfordeling.) 30

Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling: P(Y ) P(S ) p P(Y ) P(F S ) P(Y 3) P(F F S ) uavhengige delforsøk 3 P(F )P(S ) (- p)p uavhengige delforsøk P(F )P(F )P(S ) 3 (- p) p 3 Def.: Dersom Y er antall delforsøk til første suksess i en binomisk forsøksrekke, så sier vi at Y er geometrisk fordelt med suksessannsn-lighet p, der p=p(suksess). Vi skriver: Y ~ geom.(p) Sannsnlighetsfordeling, generelt: P(Y ) (- p) - p,,, 3,... E(Y) p og p Var(Y) p 3 Obs.: P(Y ) (- p) - p,,, 3,... E(Y) P(Y ) (- p) - p p 33

Eks.: Vi tipper en rekke i LOTTO hver uke framover. La X=antall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p=/537966. Forventet antall uker til vi får 7 riktige første gang = E(X) = 34 Eks.: Vi tipper en rekke i LOTTO hver uke framover. La X=antall uker til vi får 7 riktige første gang. Da: X~geom.(p), der p=/537966. Forventet antall uker til vi får 7 riktige første gang = E(X) = /p = 537966 uker (!) 35 Eks.: La Y=antall terningkast til vi får sekser første gang. Da: Y~geom.(p), p=/6. Hva er sannsnligheten for å få første sekser innen 0 kast? 36

Eks.: Vi er interessert i P(Y 0). Ser generelt på P(Y ): P(Y ) P(minst - P(ingen - en, sekser sekser i innen løpet,,3,... kast) av kast) 37 Eks.: Vi er interessert i P(Y 0). Ser generelt på P(Y ): P(Y ) P(minst en sekser innen kast) - P(ingen sekser i løpet av kast) - (- p),,,3,... (- p) P(Y 0) - (- ) 6 0 0.8385 38 Eks.: Diagram over P(Y ) når Y=ant. kast til første sekser. (Vi kaller P(Y ) for den kumulative fordelingsfunksjonen til Y.) P(Y<=) 0,667 0,3056 3 0,43 4 0,577 5 0,598 6 0,665 7 0,709 8 0,7674 9 0,806 0 0,8385 0,8654 0,8878 Sanns. for første sekser innen...,0 0,8 0,6 0,4 0, 0,0 0 0 0 30 40 50 60 Antall kast til første sekser 39

Noen viktige sannsnlighetsmodeller Binomisk modell (kp. 3.6) (kp. 3.7) (notater) Poisson-modell (kp. 3.8) 40 (kp. 3.8) Situasjoner der Poissonfordeling kan være en god beskrivelse: X=antall forekomster av en bestemt begivenhet i et tidsrom (f.eks. antall ulkker pr. måned) eller X=antall forekomster av et bestemt objekt i et bestemt volum eller areal (f.eks. antall bakterier i en vannprøve) 4 Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0,,,... 4

Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0,,,... Med hvilke sannsnligheter??... P(Y=) =?? 43 Eks.: La Y = antall telefonsamtaler inn til sentralbordet i løpet av ett minutt. Y kan anta: 0,,,... I slike situasjoner er det ofte rimelig å anta. at antall forekomster i disjunkte intervall er statistisk uavhengig av hverandre,. at forventet antall forekomster pr. enhet er konstant, og 3. at sannsnligheten for to eller flere forekomster i samme intervall, går mot null når intervallengden går mot null 44 Dersom forutsetningene er tilfredsstilt, så kan vi utlede matematisk at sannsnlighetene for Y er gitt ved: For 0,,, 3,... P(Y ) t! e t Her er t forventet (t i eksempelet) antall i t minutt 45

Eks.: Dersom vi kan forvente 8 innkommende samtaler pr. minutt, har vi: For 0,,, 3,... 0 0,0003 0,007 0,007 3 0,086 4 0,0573 5 0,096 6 0, 7 0,396 8 0,396 9 0,4 0 0,0993 0,07 0,048 3 0,096 4 0,069 5 0,0090 6 0,0045 7 0,00 8 0,0009 9 0,0004 0 0,000 0,000 0,0000 P(Y ) 8 8! e 0,5 0,0 0,05 Poissonfordeling, m/forv. 8 0,00 0 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 0 46 Obs.: De beskrevne antakelsene + diff.ligninger ++ gir sannsnlighetene (tids)intervall vs. areal vs. volum gir realistiske sannsnlighetsmodeller i situasjoner der antakelsene helt eller tilnærmelsesvis er tilfredsstilt 47 Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P( ingen samtaler i ett minutt ) =? P( to eller flere i ett minutt ) =? P( akkurat tre i løpet av to minutt ) =? 48

Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y 0).5 0! 0 e.5 e.5 0. P(Y ) t t! 49 e Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. P(ingen i ett minutt) P(Y 0).5 0! 0 e.5 e.5 0. P(to eller flere i ett minutt) P(Y ) - P(Y ) - P(Y 0) P(Y ).5.5 t t -{ 0. e } 0.45 P(Y ) e!! 50 Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. Poissonfordeling med forventning.5: Poissonfordeling, m/forv..5 0,40 0,35 0,30 0,5 0,0 0,5 0,0 0,05 0,00 0 3 4 5 6 7 8 9 0 5

Eks.: Anta at Y=antall samtaler til en sentral, er Poissonfordelt med forventning.5 samtaler pr. minutt. Dersom X=antall samtaler i to minutt, så vil vi ha at: X er Poissonfordelt med forventning P(akkurat tre i to minutt) P(X 3) 3 3 e 3! 3 0.4.5 3.5 og t : t.5 3 P(Y ) t t! 5 e Resultat: Dersom Y er Poissonfordelt med parameter t, har vi at: E(Y) t og For P(Y ) 0,,, 3,... t t! e Var(Y) t Skrivemåte : Y ~ Poiss. t 53 Obs.:, Når Y ~ Poiss. t så E(Y) P(Y ) 0 0 t! e -t t For 0,,, 3,... P(Y ) t t! e 54

Beregne sannsnligheter ) med formel ) bruk av tabell (tilgjengelig på nettstedet) 55, tabell 56, tabell 57

Eksempler:. Antall utrkninger per uke ved brannstasjon. Antall stormer per år 58