TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Like dokumenter
Noen diskrete sannsynlighetsfordelinger. (utarbeidet av Mette Langaas), TMA4245 V2007

5.2 Diskret uniform fordeling. Midtveiseksamen (forts.) Kapittel 5. Noen diskrete sannsynlighetsfordelinger. TMA4245 V2007: Eirik Mo

Bernoulli forsøksrekke og binomisk fordeling

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

TMA4240 Statistikk H2015

TMA4240 Statistikk H2010

TMA4240 Statistikk H2015

Statistikk 1 kapittel 5

Diskrete sannsynlighetsfordelinger.

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

TMA4240 Statistikk Høst 2008

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Kap. 6, Kontinuerlege Sannsynsfordelingar

Diskrete sannsynlighetsfordelinger.

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

TMA4245 Statistikk Eksamen desember 2016

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Oppfriskning av blokk 1 i TMA4240

Kap. 6, Kontinuerlege Sannsynsfordelingar

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

TMA4240 Statistikk Høst 2009

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Kapittel 5: Diskrete sannsynsfordelingar TMA4245 Statistikk. 5.2 Diskret uniform fordeling NTNU NTNU NTNU

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010

Kapittel 2: Hendelser

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

µ = E(X) = Ʃ P(X = x) x

Midtveiseksamen i STK1100 våren 2017

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

ST0202 Statistikk for samfunnsvitere

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

2.3: Kombinatorikk 2.4: Sannsynlighet, og Monte Carlo simulering. Foreleses onsdag 25. august 2010

TMA4240 Statistikk H2010

ÅMA110 Sannsynlighetsregning med statistikk, våren

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Foreleses onsdag 8. september 2010

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Fasit for tilleggsoppgaver

TMA4245 Statistikk Eksamen desember 2016

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

HØGSKOLEN I STAVANGER

Litt mer om den hypergeometriske fordelingen og dens tilnærming av binomisk fordeling.

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

UNIVERSITETET I OSLO

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4240 Statistikk 2014

ST0202 Statistikk for samfunnsvitere

Kapittel 4: Matematisk forventning

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Forelening 1, kapittel 4 Stokastiske variable

TMA4240 Statistikk H2015

Løsningskisse seminaroppgaver uke 11 ( mars)

Eksamensoppgåve i TMA4240 Statistikk

HØGSKOLEN I STAVANGER

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

TMA4240 Statistikk H2015

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Hogskoleni Østfold EKSAMEN. Eksamenstid: kl til k

Binomisk sannsynlighetsfunksjon

Regneregler for forventning og varians

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Høgskoleni østfold EKSAMEN

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO Matematisk Institutt

Høgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.

HØGSKOLEN I SØR-TRØNDELAG Avdeling for lærer- og tolkeutdanning

TMA4240 Statistikk H2017 [15]

Kapittel 4.3: Tilfeldige/stokastiske variable

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

MULTIPLE CHOICE ST0103 BRUKERKURS I STATISTIKK September 2016

UNIVERSITETET I OSLO

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

FORMELSAMLING TIL STK1100 OG STK1110

TMA4240 Statistikk H2010 (22)

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

TMA4240 Statistikk Høst 2015

DEL 1 GRUNNLEGGENDE STATISTIKK

Transkript:

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger 5.1-5.4: Uniform, binomisk, hypergeometrisk fordeling Mette Langaas

2 Arbeidshverdag etter endt studium Studere et fenomen (f.eks. kvalitet av produsert maskindel, elektrisitetsprisen, forsikringspremie, holdninger til miljøvennlig energi) ved å beskrive og forstå. Med mål å trekke konklusjoner og gjøre beslutninger. Trenger data: samler inn data (subjektive eller objektive) under usikkerhet, studerer fenomenet fra data, kan bruke en SV med tilhørende fordeling til å beskrive fenomenet. Hvilken fordeling? se på prosessen som har skapt dataene. se grafisk på data og studere fordelingens form.

3 Arbeidshverdag etter endt studium Derfor: kap. 5 og 6: beskrive viktige fordelinger for å lære situasjoner er fordelingen passer forstå hvordan f (x) fremkommer se hva E(X) og Var(X) er og forstå hvorfor lære å regne ut f (x), F(x) = P(X x), P(a < X b). Deretter: anslå parametere i fordelingene og trekke konklusjoner under usikkerhet (kap. 9-11).

4 5.2 Diskret uniform fordeling Diskret uniform fordeling: Hvis den stokastiske variabelen X antar verdiene x 1, x 2,..., x k med lik sannsynlighet så er X diskret uniformt fordelt med fordeling f (x; k) = 1 k, x = x 1, x 2,..., x k TEO 5.1: k i=1 µ = E(X) = x i k k og σ 2 i=1 = Var(X) = (x i µ) 2 k

5 Midtveiseksamen Eksamen 06.08.2004, oppg 1a Fra høsten 2004 vil det i TMA4240 bli innført tellende skriftlig midtveiseksamen. Denne vil bli gitt i form av en flervalgsoppgave ( multiple choice ) bestående av n = 20 spørsmål som alle har m svaralternativer. Studentene må velge et svaralternativ for hvert spørsmål (det er således ikke lov å svare blankt på et spørsmål). For å få karakter bedre enn F (36%) må minst 8 spørsmål være korrekt besvart. Ole lurer på om han skal la være å lese til midtveiseksamen og heller velge tilfeldige svaralternativer på alle spørsmålene (han vil da ikke engang lese oppgaveteksten før han svarer). Før han bestemmer seg, ber han en studiekamerat regne ut hvor stor sannsynlighet han da har for få bedre enn F.

6 Midtveiseksamen (forts.) La X være antall korrekte svar Ole får på de n = 20 spørsmålene. Forklar hvorfor vi kan anta at X er binomisk fordelt med n = 20 og p = 1 m. Finn sannsynligheten for at Ole får bedre enn F hvis han velger å svare tilfeldig på alle spørsmålene, dvs. P(X 8), når antall svaralternativer er m = 2. Finn også P(X 8) for m = 4 og m = 5. Hva blir forventet antall korrekte svar, dvs. E(X), når m = 2, 4, 5?

7 5.3 Binomisk fordeling Bernoulli prosess: Et Bernoulli eksperiment (prosess) har følgende egenskaper: 1. Eksperimentet består av n gjentatte forsøk. 2. Hvert forsøk undersøker man om en hendelse A inntreffer (suksess) eller ikke (A =fiasko). 3. Sannsynligheten for hendelsen A (suksess) kaller vi p, og denne er den samme fra forsøk til forsøk. 4. De n gjentatte forsøkene er uavhengige av hverandre. Dermed: et Bernoulli eksperiment kan resultere i hendelsen A (suksess) med sannsynlighet p og komplementet av hendelsen A (A =fiasko) med sannsynlighet 1 p.

8 5.3 Binomisk fordeling (forts.) La den stokastiske variablen X være antall ganger hendelsen A (suksess) inntreffer på de n uavhengige forsøkene. Sannsynlighetsfordelingen til X kalles binomisk fordeling og er gitt ved ( ) n f (x) = b(x; n, p) = p x (1 p) (n x), x = 0, 1,..., n x Kumulativ fordeling: F (x) = P(X x) finnes ved tabelloppslag. Eksempler: antall defekte enheter i industriell prosess antall pasienter med positiv effekt av medisin

9 Binomisk fordeling forts. n = 10, p = 0.2 n = 10, p = 0.5 n = 10, p = 0.7 TEO 5.2: Forventning og varians i binomisk fordeling b(x; n, p) er µ = E(X) = np og σ 2 = Var(X) = np(1 p)

10 Urne med kuler [v1] Definisjon: p = antall røde kuler antall kuler Prosedyre: Utfør n ganger trekk en kule tilfeldig registrer fargen legg kula tilbake Da er antallet røde kuler du trekker binomisk fordelt.

11 Urne med kuler [v2] Definisjoner: p 1 = antall hvite kuler antall kuler p 2 = antall sorte kuler antall kuler p 3 = antall blå kuler antall kuler p 4 = antall røde kuler antall kuler Prosedyre: Utfør n ganger Da er trekk en kule tilfeldig og registrer fargen legg kula tilbake antallet hvite kuler og antallet sorte kuler og antallet blå kuler og antallet røde kuler som du trekker er multinomisk fordelt.

12 Multinomisk fordeling Multinomisk fordeling: Et forsøk kan resultere i k mulige utfall A 1, A 2,..., A k, med sannsynligheter p 1, p 2,..., p k. La de stokastiske variablene X 1, X 2,..., X k representere antall ganger utfallene A 1, A 2,..., A k opptrer i n uavhengige forsøk. Sannsynlighetsfordelingen til X 1, X 2,..., X k kalles multinomisk fordeling og er gitt ved ( ) n f (x 1, x 2,..., x k ; p 1, p 2,..., p k, n) = p x 1 1 x 1, x 2,..., x px 2 2 px k k k med k i=1 x i = n, k i=1 p i = 1 og ( n x 1,x 2,...,x k ) = n! x 1!x 2! x k!.

13 Urne med kuler [v3] Definisjon: N=antall kuler k =antall røde kuler Prosedyre: Utfør n ganger trekk en kule tilfeldig registrer fargen legg kula til side Da er antallet røde kuler du trekker hypergeometrisk fordelt.

14 Antall fisker i dammen Vi vil anslå størrelsen, N, av en dyreart innenfor et område (metode fra 1896). Gjøre to undersøkelser: 1. finner og merker k individ, og slipper dem ut igjen. 2. finner så n individ, og x av disse er merket. Lukket populasjon: ingen død, fødsel, innflytting, utflytting. Andelen merkede i de to utvalgene bør da være like, bestandsanslag: k N = x n N = k n x X er hypergeometisk fordelt med parametere N, k, n.

15 5.4 Hypergeometrisk fordeling Hypergeometrisk eksperiment: har følgende egenskaper: 1. Vi har en mengde av N enheter. Av de N enhetene så klassifiseres k som hendelsen A (suksess) og N k som komplementet av hendelsen A (A =fiasko). 2. Et tilfeldig utvalg av størrelse n trekkes uten tilbakelegging fra de N enhetene. Antallet ganger, X, som hendelsen A (suksess) inntreffer er da en hypergeometrisk stokastisk variabel.

16 5.4 Hypergeometrisk fordeling (forts.) Hypergeometrisk fordeling: En hypergeometrisk stokastisk variabel, X, angir antallet ganger hendelsen A (suksess) inntreffer i et hypergeometrisk eksperiment der n enheter trekkes fra N enheter, der k av de N enheter er klassifisert som hendelsen A (suksess) og N k som komplementet av hendelsen A (A =fiasko). Sannsynlighetsfordelingen til X kalles en hypergeometrisk fordeling og er gitt ved ( k N k ) f (x) = h(x; N, n, k) = x)( n x ( N x = 0, 1, 2,..., n n)

17 Hypergeometrisk fordeling (forts.) N = 10, k = 5, n = 5 N = 12, k = 5, n = 5 N = 100, k = 50, n = 40 TEO 5.3: Forventning og varians i den hypergeometriske fordelingen h(x; N, n, k) er µ = E(X) = nk N og σ2 = Var(X) = N n N 1 n k N (1 k N )

18 Hypergeometisk og binomisk fordeling Hvis n er liten i forhold til N ( n N 0.05), så vil sammensetningen av de N enhetene endres lite under trekningen. Dermed kan k N sees på som den binomiske sannsynligheten p. Dermed kan binomisk fordeling sees på som en stor populasjon versjon av hypergeometrisk fordeling.

19 Urne med kuler [v4] Definisjoner: N=antall kuler a 1 =antall hvite kuler a 2 =antall sorte kuler a 3 =antall blå kuler a 4 =antall røde kuler Prosedyre: Utfør n ganger trekk en kule tilfeldig og registrer fargen legg kula til side. Da er antallet hvite kuler antallet sorte kuler antallet blå kuler antallet røde kuler som du trekker multivariat hypergeometrisk fordelt.

20 Multivariabel hypergeometrisk fordeling Multivariabelt hypergeometrisk eksperiment: har følgende egenskaper: 1. Et tilfeldig utvalg av størrelse n trekkes uten tilbakelegging fra N enheter. 2. Av de N enhetene så klassifiseres a 1 i cellen A 1, a 2 i cellen A 2,..., a k i cellen A k. 3. Av de n enhetene så klassifiseres x 1 i cellen A 1, x 2 i cellen A 2,..., a k i cellen A k. Sannsynlighetsfordelingen til X 1, X 2,..., X k kalles multivariabel hypergeometrisk fordeling f (x 1, x 2,..., x k ; a 1, a 2,..., a k, n) = ( a1 )( a2 ) ( x 1 x 2 an ( N n) x n ) med k i=1 x i = n og k i=1 a i = N.

21 Kakelotteri 300 lodd fordelt på 3 farger (100 av hver) 9 vinnerlodd, 3 av hver farge (33,66,99) Vi kjøper 5 lodd. To strategier: trekk 5 lodd blant de 300 loddene trekk 5 lodd av samme farge Hvilken strategi gir størst sjanse for å vinne?