Binomisk sannsynlighetsfunksjon

Like dokumenter
ST0202 Statistikk for samfunnsvitere

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

ST0202 Statistikk for samfunnsvitere

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

Bernoulli forsøksrekke og binomisk fordeling

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

ST0202 Statistikk for samfunnsvitere

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Oppfriskning av blokk 1 i TMA4240

Medisinsk statistikk Del I høsten 2009:

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Fra første forelesning:

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Ekstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2008

ST0202 Statistikk for samfunnsvitere

Forelening 1, kapittel 4 Stokastiske variable

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Seksjon 1.3 Tetthetskurver og normalfordelingen

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Høst 2012

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk H2010

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Sensurveiledning for eksamen i lgu52003 våren 2015

Midtveiseksamen i STK1100 våren 2017

Kapittel 4.4: Forventning og varians til stokastiske variable

Kapittel 3: Studieopplegg

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

TMA4240 Statistikk H2015

STK1100 våren 2019 Mere om konfidensintevaller

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen desember 2016

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

STK Oppsummering

Foreleses onsdag 8. september 2010

Forelesning 3. april, 2017

UNIVERSITETET I OSLO

Kapittel 4.3: Tilfeldige/stokastiske variable

Formelsamling i medisinsk statistikk

Seksjon 1.3 Tetthetskurver og normalfordelingen

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

UNIVERSITETET I OSLO Matematisk Institutt

TMA4240 Statistikk Høst 2009

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Utvalgsfordelinger (Kapittel 5)

ST0202 Statistikk for samfunnsvitere

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2015

Eksamensoppgave i LGU52003 MATEMATIKK 2 (5-10), EMNE 2

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

TMA4245 Statistikk Eksamen august 2014

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

DEL 1 GRUNNLEGGENDE STATISTIKK

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Utvalgsfordelinger (Kapittel 5)

TMA4240 Statistikk H2015

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

TMA4240 Statistikk H2017 [15]

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

TMA4240 Statistikk Høst 2015

Transformasjoner av stokastiske variabler

Fasit for tilleggsoppgaver

TMA4240 Statistikk 2014

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Transkript:

ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Binomisk sannsynlighetsfunksjon La det være n forsøk, sannsynlighet p for suksess og sannsynlighet q for fiasko. Den tilfeldige variable x er antall suksess i de n forsøk. Da er P(x) =c(p x )(q n x ) for x = 0, 1, 2,...,n der c er antallet grener med x suksesser. c kalles binomisk koeffisient og kan regnes ut ved ( ) n n! c = = x x!(n x)! der n! leses n-fakultet og er gitt ved n! =1 2 n. Tips: p 0 er alltid lik 1; også 0! =1. Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn P(x), x=0,1,2,3,4 fra den generelle formelen for binomisk sannsynlighetsfordeling Finn også P(x 3) Løsning: dvs. P(0) = P(1) = P(2) = P(3) = P(4) = P(x) = ( 4 x )( 1 3 ) x ( ) 2 4 x 3 ( )( ) 4 1 0 ( ) 2 4 ( ) 2 4 = = 0.198 0 3 3 3 ( )( ) 4 1 1 ( ) 2 3 ( ) 1 1 ( ) 2 3 = 4 = 0.395 1 3 3 3 3 ( )( ) 4 1 2 ( ) 2 2 ( ) 1 2 ( ) 2 2 = 6 = 0.296 2 3 3 3 3 ( )( ) 4 1 3 ( ) 2 1 ( ) 1 3 ( ) 2 1 = 4 = 0.099 3 3 3 3 3 ( )( ) 4 1 4 ( ) 2 0 ( ) 1 4 = = 0.012 4 3 3 3 dvs. P(x 3) =1 P(x = 4) =1 0.012 = 0.988

5 Forventning og standardavvik for binomisk fordeling (5.6) Forventning for binomisk fordeling med n forsøk, suksesssannsynlighet p og fiaskosannsynlighet q: μ = np Standardavvik for binomisk fordeling: σ = npq Oppgave: Finn forventning og varians for en binomisk tilfeldig variabel med n=30 og p=0.6. μ = 30 0.6 = 18.0, σ = 30 0.6 0.4 = 7.2 = 2.68 7 Eksempel 5.9: Dårlige egg 8 Løsning på dårlige egg Bestyreren på Steve s Food Market garanterer at alle hans kartonger med 12 egg inneholder høyst ett dårlig egg. Hvis en kartong inneholder mer enn ett dårlig egg, vil han erstatte hele dusinet og la kunden beholde de gode eggene! Hvis sannsynligheten for et dårlig egg er 0.05, hva er sannsynligheten for at bestyreren må erstatte en gitt kartong? La x være antall dårlige egg i en tilfeldig eske. Hvilke forutsetninger må vi gjøre for at vi skal kunne anta at x har en binomisk fordeling med n = 12 forsøk og sannsynlighet for suksess lik 0.05? Sannsynligheten for at en kartong inneholder x dårlige egg er da ( ) 12 P(x) = (0.05) x (0.95) 12 x for x = 0, 1, 2,...,12 x

Bestyreren vil erstatte en eske hvis x er enten 2,3,4,5,6,7,8,9,10,11,12. 10 Tabell 2 i Appendix B For å finne sannsynligheten for dette er det lettere å først finne sannsynligheten for å ikke erstatter kartongen, dvs. for at x = 0 eller 1. Her er ( ) 12 P(0) = (0.05) 0 (0.95) 12 =(0.95) 12 = 0.540 P(1) = 0 ( 12 1 ) (0.05) 1 (0.95) 11 = 12 (0.05) 1 (0.95) 11 = 0.341 Sannsynligheten for å få en kartong med høyst ett dårlig egg er da P(0)+ P(1) = 0.540 + 0.0341 = 0.881, så sannsynligheten for at bestyreren må erstatte en eske er 1 0.881 = 0.119. Leser av at med n = 12, p = 0.05 er P(0) =0.540, P(1) =0.341 11 Intelligenstester (6.1) 12 Sannsynlighetstetthet og histogram

13 Sannsynlighetstetthet og histogram 14 Sannsynlighetstetthet Sannsynlighetsfordelingen til en kontinuerlig tilfeldig variabel x er gitt ved en såkalt sannsynlighetstetthet f (x) ( probability distribution function ). Sannsynligheten for å få et resultat i intervallet fra a til b finnes fra P(a < x < b) = b a f (x)dx som er lik arealet av det skraverte området på figuren under. 15 Normalfordelingen (6.2) Sannsynlighetstettheten til en normalfordelt tilfeldig variabel x har formel: f (x) = 1 e 1 2 ( x μ σ )2 2πσ 16 Standardnormalfordelingen (6.3) Dette er normalfordelingen med μ = 0,σ = 1. En standardnormalfordelt tilfeldig variabel betegnes ofte med z. Sannsynlighetstettheten er gitt ved formelen f (z) = 1 e 1 2 z2 2π Som for diskrete tilfeldige variable kan vi definere forventning og standardavvik også for kontinuerlige variable. For x med sannsynlighetstetthet f (x) ovenfor er: forventningen gitt ved μ (lik 100 i IQ-eksemplet) standardavviket gitt ved σ (lik 16 i IQ-eksemplet)

17 Egenskaper for standardnormalfordelingen 1. Det totale areal under kurven er 1. 2. Sannsynlighetstettheten har en topp, er symmetrisk om 0, og strekker seg uendelig langt ut i hver retning uten å berøre den horisontale aksen. 3. Forventningen i fordelingen er 0 og standardavviket er 1. 4. Arealet på hver side av 0 er lik 0.5. 5. Nesten hele arealet ligger mellom z = 3 ogz = 3. 18 z-score (standard score) Standardnormalfordelingen er fordelingen til såkalte z-score, som kan dannes fra en normalfordelt tilfeldig variabel x med forventning μ og standardavvik σ ved å beregne: z = x μ σ z-score kan også beregnes for et sett av data med gjennomsnitt x og utvalgsstandardavvik s ved å standardisere alle observasjonene med z = x x s 19 Beregning av sannsynligheter for standardnormalfordelingen Sannsynligheten for at z har en verdi i et intervall fra a til b er gitt som arealet under standardnormalfordelingskurven fra a til b. Formelt kan vi skrive dette arealet som P(a < z < b). Tabell 3 i Appendix B viser arealet under kurven mellom a = 0og ulike verdier av b, dvs. P(0 < z < b) Tabellen kan brukes til å finne arealer for alle valg av a, b.

Eksempel: Finn arealet under standard normalfordelingen fra z=0 til z=1.52. z 0.00 0.01 0.02. 1.5 0.4357. P(0 < z < 1.52) =0.4357 Eksempel: Finn P(z>1.52) P(z > 1.52) = 1 P(z < 1.52) = 1 (P(z < 0)+P(0 < z < 1.52)) = 1 0.5 0.4357 = 0.0643

Eksempel: Finn P(z<-1.52) Oppgave: Finn P(z>2.03) P(z < 1.52) = P(z > 1.52) = 1 P(z < 1.52) = 1 (P(z < 0)+P(0 < z < 1.52)) = 1 0.5 0.4357 = 0.0643 Oppgave: Finn P(z<-1.65) Eksempel: Finn P(-1.5<z<2.1) P( 1.5 < z < 2.1) = P( 1.5 < z < 0)+P(0 < z < 2.1) = P(0 < z < 1.5)+P(0 < z < 2.1) = 0.4332 + 0.4821 = 0.9153 Eksempel: Finn P(0.7<z<2.1) P(0.7 < z < 2.1) = P(0 < z < 2.1) P(0 < z < 0.7) = 0.4821 0.2580 = 0.2241 Oppgave: Finn P(0.75<z<2.25)