TMA4240 Statistikk H2015

Like dokumenter
TMA4240 Statistikk H2010

5.2 Diskret uniform fordeling. Midtveiseksamen (forts.) Kapittel 5. Noen diskrete sannsynlighetsfordelinger. TMA4245 V2007: Eirik Mo

Noen diskrete sannsynlighetsfordelinger. (utarbeidet av Mette Langaas), TMA4245 V2007

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Bernoulli forsøksrekke og binomisk fordeling

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

6.5 Normalapproksimasjon til. binomisk fordeling

6.1 Kontinuerlig uniform fordeling

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

Oppfriskning av blokk 1 i TMA4240

Diskrete sannsynlighetsfordelinger.

Diskrete sannsynlighetsfordelinger.

TMA4240 Statistikk Høst 2008

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk Eksamen desember 2016

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

FORMELSAMLING TIL STK1100 OG STK1110

Statistikk 1 kapittel 5

Eksamensoppgave i TMA4240 Statistikk

Statistikk 1 kapittel 5

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Statistikk 1 kapittel 5

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

Foreleses onsdag 8. september 2010

Regneregler for forventning og varians

Kapittel 4: Matematisk forventning

HØGSKOLEN I STAVANGER

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Midtveiseksamen i STK1100 våren 2017

DEL 1 GRUNNLEGGENDE STATISTIKK

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgave i TMA4240 Statistikk

Kontinuerlige sannsynlighetsfordelinger.

Statistikk 1 kapittel 5

Prøvemidtveiseksamen TMA4240 Statistikk H2004

Kapittel 2: Hendelser

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Hypergeometrisk modell

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

TMA4240 Statistikk Høst 2009

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

FORMELSAMLING TIL STK1100 OG STK1110

TMA4240 Statistikk Høst 2015

STK Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

ST0202 Statistikk for samfunnsvitere

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

Tilfeldige variable (5.2)

TMA4240 Statistikk Høst 2007

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

TMA4240 Statistikk 2014

TMA4245 Statistikk Eksamen desember 2016

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Eksamensoppgave i TMA4295 Statistisk inferens

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Sensurveiledning for eksamen i lgu52003 våren 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Om eksamen. Never, never, never give up!

Eksamensoppgåve i TMA4240 Statistikk

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk H2015

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

HØGSKOLEN I SØR-TRØNDELAG Avdeling for lærer- og tolkeutdanning

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Kræsjkurs i statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk H2010

TMA4240 Statistikk H2015

ST0202 Statistikk for samfunnsvitere

Betinget sannsynlighet

Om eksamen. Never, never, never give up!

µ = E(X) = Ʃ P(X = x) x

Eksamensoppgave i ST0103 Brukerkurs i statistikk

HØGSKOLEN I STAVANGER

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

TMA4240 Statistikk H2010

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Transkript:

TMA4240 Statistikk H2015 Kapittel 5: Noen diskrete sannsynlighetsfordelinger 5.4 Geometrisk og negativ binomisk fordeling 5.5 Poisson-prosess og -fordeling Mette Langaas Institutt for matematiske fag, NTNU wiki.math.ntnu.no/emner/tma4240/2015h/start/

Solsikker sist Jeg planter 4 solsikkefrø. De har 70 % spiringsgrad. Hva er sannsynligheten for at minst 3 av frøene jeg har plantet vil spire?

Solsikker (igjen) En morgen planter jeg et solsikkefrø, og om kvelden sjekker jeg om frøet har spiret. Spiringsgraden til frøene jeg bruker er 70%. Dette gjentar jeg hver dag - med et nytt frø - frem til jeg totalt har fått 3 spirede frø. La X være antall dager til og med den dagen jeg har fått 3 spirede frø. Hva karakteriserer denne situasjonen og hvilken fordeling har X?

Negativ binomisk eksperiment utføres som et binomisk eksperiment med den forskjell at forsøkene gjentas til et fast antall suksesser inntreffer. Dvs. 1. Eksperimentet består av et på forhånd ukjent antall forsøk. 2. Hvert forsøk: inntreffer hendelsen A (suksess) eller ikke (fiasko). 3. Sannsynligheten for hendelsen A (suksess), P(A) = p, er den samme fra forsøk til forsøk. 4. De gjentatte forsøkene er uavhengige av hverandre. 5. Eksperimentet avsluttet når et bestemt antall, k, av hendelsen A (suksesser) har inntruffet.

Negativ binomisk fordeling Vi ser på gjentatte uavhengige forsøk som kan resultere i hendelsen A (suksess) med sannsynlighet p og komplementet til hendelsen A (A =fiasko) med sannsynlighet 1 p. La den stokastiske variabelen X angi antall forsøk som må gjøres for at hendelsen A (suksess) inntreffer k ganger. X har da en negativ binomisk fordeling med sannsynlighet ( ) x 1 b (x; k, p) = p k (1 p) (x k) k 1 for x = k, k + 1, k + 2,...

Binomisk og negativ binomisk Forsøksrekke, registrerer A (suksess) eller A (fiasko) i hvert forsøk. P(A) = p i hvert forsøk. Forsøkene er uavhengige. Binomisk Bestemmer totalt antall forsøk, n, på forhånd. X =antall suksesser på n forsøk Negativ binomisk Antall forsøk er ikke bestemt på forhånd, men eksperimentet avsluttes når k suksesser er oppnådd. X =antall forsøk til k suksesser er oppnådd.

Negativ binomisk fordeling (forts.) k = 5, p = 0.1 k = 5, p = 0.5 k = 5, p = 0.8 Negbin(k=5, p=0.1) Negbin(k=5, p=0.5) Negbin(k=5, p=0.8) 0.000 0.005 0.010 0.015 0.020 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0 50 100 150 200 5 10 15 20 25 5 6 7 8 9 10 11 Negbin(k=5, p=0.1) Negbin(k=5, p=0.5) Negbin(k=5, p=0.8) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0 50 100 150 200 0 5 10 15 20 25 30 0 5 10 15

Urne med kuler [v5] Definisjon: p = antall røde kuler antall kuler Prosedyre: Utfør inntil k røde kuler er trukket trekk en kule tilfeldig registrer fargen legg kula tilbake Da er antallet trekninger negativ binomisk fordelt.

Eksempler Solsikker. Maskin: En maskin feiler med sannsynlighet p hver time. Når den feiler bli den minimalt reparert (dvs. den blir så god som akkurat før den feilet). Når maskinen har feilet k ganger byttes den ut. X =antall timer til maskinen byttes ut. Ludo: for å starte en omgang ludo må man kaste 6 på terningen. La X være lik antall kaste til og med første 6er er kastet.

Geometrisk fordeling Negativ binomisk med k=1: g(x; p) = p(1 p) (x 1) x = 1, 2, 3,... TEO 5.3: Forventning og varians i den geometriske fordelingen g(x; p) er µ = E(X ) = 1 p og σ 2 = Var(X ) = 1 p p 2 p = 0.1 p = 0.5 p = 0.8 Negbin(k=1, p=0.1) Negbin(k=1, p=0.5) Negbin(k=1, p=0.8) 0.00 0.02 0.04 0.06 0.08 0.10 0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.2 0.4 0.6 0.8 0 20 40 60 80 100 120 Negbin(k=1, p=0.1) 0 5 10 15 20 Negbin(k=1, p=0.5) 2 4 6 8 Negbin(k=1, p=0.8) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0 20 40 60 80 100 120 0 5 10 15 0 2 4 6 8

Spørrekonkurranse på radio For å være med i en spørrekonkurranse på radio på du ringe et bestemt telefonnummer. Det er ingen telefonkø, du får enten opptatt-signal eller kommer gjennom. X = # forsøk inntil en kommer gjennom første gang. p = P(komme gjennom på tilfeldig valgt forsøk) = 1 100. 1. Hva er forventet antall ganger en må ringe for å komme gjennom? 2. Hva er sannsynligheten for å komme gjennom dersom en orker å ringe maksimalt 50 ganger? 3. Dersom en har ringt 50 ganger utan å komme gjennom, hva er sannsynligheten for å komme gjennom i neste forsøk?

NB: i andre lærebøker og i noen software (f.eks. matlab) så brukes heller Y=antall forsøk i tillegg til de k suksessene, der k=antall suksesser, slik at Y=0,...,uendelig. Dvs. at vår X=Y+k.

SMS Når jeg sender en SMS blir den mottatt ved en basestasjon i nærheten. Vi skal se på ankomsten av SMS til basestasjonen og antall SMS som mottas ved basestasjonen i løpet av et halvt minutt.

5.5 Poisson-fordeling og -prosess Vi ser på om en hendelse inntreffer eller ikke innenfor et intervall eller en region. 1. Antall hendelser som inntreffer i et intervall eller i en spesifisert region, er uavhengig av antall hendelser som inntreffer i ethvert annet disjunkt intervall eller region. 2. Sannsynligheten for at en enkelt hendelse inntreffer innenfor et lite intervall eller liten region, er proporsjonal med lengden av intervallet eller størrelsen på regionen, og er ikke avhengig av antallet hendelser som inntreffer utenfor intervallet eller regionen. 3. Sannsynligheten for at mer enn en hendelse skal inntreffe innenfor et kort intervall eller liten region er neglisjerbar.

Poisson-fordeling La den stokastiske variabelen X representere antallet hendelser i et gitt intervall eller region av størrelse t. Sannsynlighetsfordelingen til X er p(x; λt) = (λt)x e λt x = 0, 1, 2,... x! hvor λ er gjennomsnittlig antall hendelser per enhet intervall eller region (og e = 2.71828).

Antallet SMS til basestasjonen La λ = 3 sms/minutt og t = 0.5 minutt. x P(X = x) 0 0.223 1 0.335 2 0.251 3 0.126 4 0.047 5 0.014 6 0.004 7 < 0.001 0.0 0.1 0.2 0.3 0.4 0 2 4 6 8

Binomisk- og Poisson-fordeling Utledning : Poisson P(X = x) kan utledes ved å dele opp tidsaksen i n bittesmå intervaller av lengde t = t n. Da har vi en binomisk situasjon i n uavhengige intervaller. Lar vi n får vi Poisson P(X = x). TEO 5.5 La X være en binomisk stokastisk variabel med sannsynlighetsfordeling b(x; n, p). Når n, p 0, og µ = np holdes konstant, så er b(x; n, p) p(x; µ)

Poisson-fordeling (forts.) µ = λt = 0.5 µ = λt = 2 µ = λt = 10 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.00 0.05 0.10 0.15 0 1 2 3 4 5 6 0 2 4 6 8 10 12 0 5 10 15 20 25 Pois(lambda=0.5) Pois(lambda=2) Pois(lambda=10) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 6 0 2 4 6 8 10 0 5 10 15 20 25 30 TEO 5.4 Forventning og varians i Poissonfordelingen p(x; λt) er begge λt.

Poisson Standard triks= få inn sum over alle sannsynligheter

Poisson-situasjoner Alpinulykker (eksamen 5.august 2004, oppgave 3) Sikkerhet er en av de høyest prioriterte oppgavene i norske alpinanlegg. Vi antar at antall alpinulykker som krever legebehandling i alpinanlegget Alpinfjellet i en periode på t skidager, X, er Poisson-fordelt med forventningsverdi µ = λt. Her er λ skadefrekvens pr skidag og t er eksponeringstid i antall skidager. En skidag er definert som en person i alpinanlegget en hel dag. Jordskjelv α-partikler bakgrunnsstråling. Trykkfeil pr. bokside. Antall studenter som sovner pr. forelesningstime (?) Antall aviser som selges ved et utsalgssted.

Trafikk-kontroll av mobilbruk Politiet vil aksjonere mot ulovlig mobilbruk i bil, og gjennomfører en kontroll ved Lerkendal-rundkjøringen. Kontrollen varer i 3 timer. La X =antall bilførere som blir bøtelagt for ulovlig mobilbruk i løpet av de 3 timene. Anta at X Poisson, der λ = 5 og t = 3. Hva er forventet antall bilførere som blir bøtelagt i kontrollen? Hva er sannsynligheten for at ingen blir bøtelagt? Hva er sannsynligheten for at minst 20 blir bøtelagt?

Poissonfordeling P (X x) x\µ 10 11 12 13 14 15 16 17 18 0.0000.0000.0000.0000.0000.0000.0000.0000.0000 1.0005.0002.0001.0000.0000.0000.0000.0000.0000 2.0028.0012.0005.0002.0001.0000.0000.0000.0000 3.0103.0049.0023.0011.0005.0002.0001.0000.0000 4.0293.0151.0076.0037.0018.0009.0004.0002.0001 5.0671.0375.0203.0107.0055.0028.0014.0007.0003 6.1301.0786.0458.0259.0142.0076.0040.0021.0010 7.2202.1432.0895.0540.0316.0180.0100.0054.0029 8.3328.2320.1550.0998.0621.0374.0220.0126.0071 9.4579.3405.2424.1658.1094.0699.0433.0261.0154 10.5830.4599.3472.2517.1757.1185.0774.0491.0304 11.6968.5793.4616.3532.2600.1848.1270.0847.0549 12.7916.6887.5760.4631.3585.2676.1931.1350.0917 13.8645.7813.6815.5730.4644.3632.2745.2009.1426 14.9165.8540.7720.6751.5704.4657.3675.2808.2081 15.9513.9074.8444.7636.6694.5681.4667.3715.2867 16.9730.9441.8987.8355.7559.6641.5660.4677.3751 17.9857.9678.9370.8905.8272.7489.6593.5640.4686 18.9928.9823.9626.9302.8826.8195.7423.6550.5622 19.9965.9907.9787.9573.9235.8752.8122.7363.6509 20.9984.9953.9884.9750.9521.9170.8682.8055.7307 21.9993.9977.9939.9859.9712.9469.9108.8615.7991 22.9997.9990.9970.9924.9833.9673.9418.9047.8551 Tabeller og 23 formler.9999 i statistikk,.9995 Poisson-fordeling,.9985.9960.9907 side 20.9805 (av utgaven.9633 med.9367 forord fra.8989 2011). 24 1.0000.9998.9993.9980.9950.9888.9777.9594.9317 25 1.0000.9999.9997.9990.9974.9938.9869.9748.9554

1 Noen diskrete sannsynlighetsfordelinger Binomisk fordeling f(x) = b(x; n, p) = ( n x )px (1 p) n x, x = 0, 1,..., n. E(X) = np, Var(X) = np(1 p), M X (t) = (pe t + 1 p) n. Poissonfordeling f(x) = p(x; µ) = µx x! e µ, x = 0, 1, 2,.... E(X) = µ, Var(X) = µ, M X (t) = e µ(et 1). Hypergeometrisk fordeling ( k x )( N n x k f(x) = h(x; N, n, k) =, x = 0, 1,..., min(k, n). ( N n ) Tabeller og formler i statistikk, noen diskrete fordelinger. E(X) = nk N, M (t) har ikke et pent uttrykk. Var(X) = N n N 1 n k N (1 k N ).

Geometrisk (p) min X i Xi n = 1 Xi Poisson (µ) Negativbinomisk (n, p) µ = n(1 p) n µ = np n σ 2 = µ µ Binomisk (n, p) p = k/n N µ = np σ 2 = np(1 p) n Hypergeometrisk (N, n, k) e X Normal Lognormal (µ, σ 2 ) (µ, σ 2 ) log(x) X µ σ µ + σx Tabeller og formler Xi i statistikk, kart over fordelinger. Normal (0, 1) X 2 i α = β µ = αβ σ 2 = αβ 2 α Gamma (α, β) X1 X1+X2 Beta (α, β) α = β = 1 Xi X1 X2 Xi χ 2 α = ν/2 β = 2 Xi X/β Uniform (0, 1)