ST0202 Statistikk for samfunnsvitere [4]

Like dokumenter
Trekking uten tilbakelegging. Disjunkte hendelser (4.5) Forts. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Sannsynligheten for en hendelse (4.2) Empirisk sannsynlighet. ST0202 Statistikk for samfunnsvitere

Sannsynligheten for en hendelse (4.2) Empirisk sannsynlighet. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010

Kapittel 2: Sannsynlighet

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Utfallsrom og hendelser. Disjunkte hendelser. Kapittel 2: Sannsynlighet. Eirik Mo Institutt for matematiske fag, NTNU

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Oppgave 1 dvs 2 kort med samme verdi og 3 kort med ulike andre verdier. 4 verdier paret kan ta, og de to kortene i paret kan velges på måter.

SANNSYNLIGHETSREGNING

Forelesning 4, kapittel 3. : 3.4: Betinget sannsynlighet.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Kapittel 2: Sannsynlighet [ ]

Blokk1: Sannsynsteori

MULTIPLE CHOICE ST0103 BRUKERKURS I STATISTIKK September 2016

Statistikk og økonomi, våren 2017

Sannsynlighetsregning og Statistikk

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kapittel 4.5

Tema 1: Hendelser, sannsynlighet, kombinatorikk Kapittel ST1101 (Gunnar Taraldsen) :19

TMA4240 Statistikk Høst 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Følgelig vil sannsynligheten for at begge hendelsene inntreffer være null,

Kapittel 4: Betinget sannsynlighet

TMA4240 Statistikk H2010

Sannsynlighetsregning og kombinatorikk

Kapittel 4: Betinget sannsynlighet

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kap. 4.5 STK1000 H11

Fagdag ) Du skal fylle ut en tippekupong. På hvor mange måter kan dette gjøres?

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

6 Sannsynlighetsregning

Betinget sannsynlighet, total sannsynlighet og Bayes setning

Slide 1. Slide 2 Statistisk inferens. Slide 3. Introduction to the Practice of Statistics Fifth Edition

- Et stokastisk forsøk er et forsøk underlagt tilfeldige variasjoner, for eks. kast med en terning, trekking av et lottotall o.l.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Forelesning 3, kapittel 3. : 3.2: Sannsynlighetsregning. Kolmogoroffs aksiomer og bruk av disse.

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

B A. Figur 1: Venn-diagram for(a B) = A B

Oppgaver. Innhold. Sannsynlighet 1P, 1T og 2P-Y

TMA4240 Statistikk Høst 2015

Introduction to the Practice of Statistics

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Oppgaver. Innhold. Sannsynlighet Vg1P

Løsninger. Innhold. Sannsynlighet Vg1P

Sannsynlighet (Kap 3)

10.4 Sannsynligheter ved flere i utvalget (kombinatorikk)

4.4 Sum av sannsynligheter

Betinget sannsynlighet, Total sannsynlighet og Bayes setning

ECON Statistikk 1 Forelesning 3: Sannsynlighet. Jo Thori Lind

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Kapittel 4: Sannsynlighet - Studiet av tilfeldighet

Sannsynlighetsregning

Kapittel 2, Sannsyn. Definisjonar og teorem på lysark, eksempel og tolking på tavla. TMA september 2016 Ingelin Steinsland

Løsninger. Innhold. Sannsynlighet 1P, 1T og 2P-Y

TMA4240 Statistikk 2014

ST0202 Statistikk for samfunnsvitere

ØVINGER 2017 Løsninger til oppgaver. 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir

Fra første forelesning:

9.5 Uavhengige hendinger

Kapittel 4.3: Tilfeldige/stokastiske variable

Total sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk = Vi kan skrive en hendelse B som en disjunkt

Betingede sannsynligheter Fra spøkefull Monty Hall til alvorsfull kreftdiagnostikk

Quiz, 4 Kombinatorikk og sannsynlighet

Sannsynlighetsregning

Fasit. Grunnbok. Kapittel 5. Bokmål

ST0202 Statistikk for samfunnsvitere

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Statistikk 1 kapittel 3

Betinget sannsynlighet

TMA4240 Statistikk Høst 2013

Formelsamling i medisinsk statistikk

Litt mer om den hypergeometriske fordelingen og dens tilnærming av binomisk fordeling.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Løsningskisse seminaroppgaver uke 15

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

STK1100 våren Kombinatorikk = = Uniform sannsynlighetsmodell. Et stokastisk forsøk har N utfall. Det er de mulige utfallene for forsøket.

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

TMA4240 Statistikk Høst 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren Grunnbegrep. Grunnbegrep, sannsynligheten for et utfall

Sannsynlighet 1T, Prøve 2 løsning

STK1100 våren 2017 Kombinatorikk

ST0202 Statistikk for samfunnsvitere

Statistikk 1 kapittel 3

sannsynlighet for hendelse = antall ganger hendelsen inntreffer antall forsøk

1 Sannsynlighetsrgning

Testobservator for kjikvadrattester

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Datainnsamling, video av forelesning og referansegruppe

Sannsynlighet: Studiet av tilfeldighet

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Statistikk 1 kapittel 5

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

Transkript:

ST0202 Statistikk for samfunnsvitere [4] Kapittel 4: Sannsynlighet 4.4: Disjunkte hendelser, 4.5: Uavhengige hendelser 4.6: Er disjunkthet og uavhengighet relatert til hverandre? Bruk av sannsynlighetsregning Mette Langaas Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2011h/start

2 Repetisjon: ikke-og-eller? Ā (ikke) A og B A eller B

3 Repetisjon: ikke-og-eller og setninger Komplementsetningen: (ikke) P(Ā)=1-P(A) Den generelle addisjonssetningen: (eller) P(A eller B)=P(A)+P(B)-P(A og B) Den generelle multiplikasjonssetningen: (og) P(A og B)=P(A) P(B A)=P(B) P(A B)

4 Kap. 4.1-4.3 i bruk En boks inneholder en rød (R), en blå (B) og en hvit (H) kule. Trekk to kuler uten tilbakelegging. (Trekk først en kule og legg den til side, trekk så en til. Se på hva du fikk.) Utfallene og deres sannsynligheter kan finnes ved hjelp av et sannsynlighetstre. Sannsynligheten for et utfall finnes ved å multiplisere (betingede) sannsynligheter langs grenene. (Den generelle multiplikasjonsregelen.) Sannsynligheten for en hendelse finnes ved å summere sannsynlighetene for de enkeltutfallene (grenene) som hører til hendelsen.

Det er 6 mulig utfall, og de lister vi som {(R, B), (R, H), (B, R), (B, H), (H, R), (H, B)}

Sannsynligheten for gren 1 (første kule rød og andre blå): P(R, B) = P(R)P(B R) = 1/3 1/2 = 1/6 Sannsynligheten for hendelsen en rød og en blå kule : Gren 1 og gren 3 gir en rød og en blå kule, så vi må summere disse to sannsynlighetene P(en rød og en blå kule) = 1/6 + 1/6 = 1/3

7 Betinget rødt: leksa fra igår Tre kort: Rødt på begge sider Rødt på en side, blått på en side Blått på begge sider Lukk øynene, trekk et kort og legg på bordet. Gitt at kortsiden du ser er rød, hva der da sannsynligheten for at også siden du ikke ser er rød?

8 Disjunkte hendelser (4.4) To disjunkte (gjensidig utelukkende) hendelser: Hendelser definert slik at dersom en av hendelsene inntreffer, kan den andre ikke inntreffe. dvs. P(A og B) = 0 eller med Venn-diagram:

Hvis vi har flere enn 2 hendelser, kalles disse parvis disjunkte ( mutually exclusive ) hvis hvert par av dem er disjunkte etter definisjonen på forrige slide. Eksempel: Betrakt et eksperiment der to terninger blir kastet. Tre hendelser er definert: A: Summen av tallene på terningene er 7 B: Summen av tallene på terningene er 10 C: Begge terningene viser samme tall. Er disse tre hendelsene parvis disjunkte?

A: Summen av tallene på terningene er 7 B: Summen av tallene på terningene er 10 C: Begge terningene viser samme tall. A og B er disjunkte. A og C er disjunkte. B og C er ikke disjunkte, fordi B og C = (5, 5) De tre hendelsene er dermed ikke parvis disjunkte (selv om alle tre ikke kan inntreffe samtidig).

11 Den spesielle addisjonsregelen For disjunkte hendelser A og B gjelder P(A eller B) = P(A) + P(B) Denne regelen kan generaliseres: For parvis disjunkte hendelser A, B, C... E gjelder P(A eller B eller C eller... eller E) = P(A)+P(B)+P(C)+...+P(E)

Illustrasjon av den spesielle addisjonsregelen: Her er A og B disjunkte, og vi har: P(A eller B) = P(A) + P(B)

13 Eksempel: Kast to terninger. Hva er sannsynligheten for at summen er 7 (hendelse A) eller at terningene er like (hendelse B)? Hendelse A (grønn) og B (blå) er disjunkte (inntreffer A kan ikke B inntreffe og motsatt, se figur under).

Regelen over gir da P(A eller B) = P(A) + P(B) = 6 36 + 6 36 = 1 3

15 Disjunkt? Vi trekker tilfeldig en person fra en populasjon, og definerer tre hendelser: A: Personen er yngre enn 60 år. B: Personen er minst 70 år gammel. C: Personen er minst 80 år gammel. Tegn Venn-diagram og forklar hvilke hendelser som er disjunkte.

16 Uavhengige hendelser (4.5) To hendelser A og B er uavhengige hendelser hvis det at A har hendt (eller ikke har hendt) ikke påvirker sannsynligheten for at B skal hende, dvs. P(B) = P(B A) = P(B Ā) eller P(A) = P(A B) = P(A B) Dersom den ene av linjene er oppfylt vil alltid den andre være det også. Hendelser som ikke er uavhengige, kalles avhengige.

17 Eksempler på uavhengighet Kast en mynt to ganger. A er at mynten lander på H i første kast, B er at mynten lander på H i andre kast. Hvorfor er P(B A) = P(B)? Kast en terning og en mynt. A er at terningen gir en 6er, B er at mynten lander på Kron (H). Hvorfor er P(B A) = P(B)? Trekk to kort fra en kortstokk ved at det først trekkes ett kort, som legges tilbake, og at det så stokkes på ny og trekkes et nytt kort. A er at det er en spar i første trekning, B er at det er en hjerter i andre trekning. Forklar hvorfor A og B er uavhengige. Ville disse hendelsene være uavhengige dersom du ikke la tilbake det første kortet før du trakk det andre?

Husk den generelle multiplikasjonsregel: P(A og B) = P(A)P(B A) Dersom A og B er uavhengige, har vi P(B A) = P(B), og P(A B) = P(A) så vi får: Den spesielle multiplikasjonsregel: P(A og B) = P(A)P(B) Dette kan generaliseres til tilfellet med flere enn to uavhengige hendelser: For uavhengige hendelser A, B, C,..., E gjelder P(A og B og C og... og E) = P(A) P(B) P(C)... P(E)

19 Oppgave Kast en mynt to ganger. A er at mynten lander på H i første kast, B er at mynten lander på H i andre kast. Hva blir P(A og B)? Kast en mynt ti ganger (jmf. Siffer, episode 1). La A 1 være at mynten lander på H i første kast, A 2 at mynten lander på H i andre kast,..., A 10 at mynten lander på H i tidende kast. Hva blir P(A 1 og A 2 og og A 10 )?

20 Trekning med tilbakelegging En bolle inneholder 7 kuler, 5 gule (Y) og to røde (R). To kuler trekkes med tilbakelegging, dvs. at det først trekkes en kule, så legges denne tilbake, og det trekkes en kule til. La Da er A = den første kulen er gul (Y) B = den andre kulen er gul (Y) P(begge kulene er gule) = P(A og B) = P(A) P(B A) = 5 7 5 7 = 25 49 siden vi nå har at: er altså A og B uavhengige. P(B A) = 5 7 = P(B)

21 Vi husker: Trekning uten tilbakelegging En bolle (urne) inneholder 7 kuler, 5 gule (Y) og to røde (R). To kuler trekkes uten tilbakelegging, dvs. at det først trekkes en og at det så trekkes en til uten å legge den første tilbake. P(begge kulene er gule) = P(A og B) = P(A) P(B A) = 5 7 4 6 = 20 42

Merk: nå er P(B A) = 4 6 og P(B Ā) = 5 6. Vi kan da umiddelbart konkludere at A og B er avhengige hendelser. Hva er P(B)? P(B) = P(A og B) + P(Ā og B) = P(A) P(B A) + P(Ā) P(B Ā) = 5 7 4 6 + 2 7 5 6 = 20 42 + 10 42 = 30 42 = 15 21 = 5 7 Som igjen medfører at A og B er avhengige.

23 Formel for betinget sannsynlighet Ved å stokke om på den generelle multiplikasjonsregelen, P(A og B) = P(A) P(B A) får vi et uttrykk for sannsynligheten for hendelsen A gitt at hendelsen B har inntruffet: P(A og B) P(B A) = P(A)

24 Eksempel En student blir trukket tilfeldig fra en populasjon bestående av 200 studenter hvorav 140 studerer fulltid (80 kvinner og 60 menn) og 60 studerer deltid (40 kvinner og 20 menn). La hendelsen A være at studenten studerer fulltid og hendelse C at studenten er kvinne. a) Finn P(A), P(C), P(A og C) b) Finn P(A C) og P(C A) c) Er A og C uavhengige?

25 Uavhengighet og disjunkthet (4.6) Uavhengighet og disjunkthet er begreper som ofte blandes. La A og B være to hendelser med positive sannsynligheter P(A) og P(B). At A og B er disjunkte, betyr at de ikke kan inntreffe samtidig, dvs. at P(A og B) = 0 At A og B er uavhengige betyr at sannsynligheten for B ikke endrer seg dersom vi vet om A har inntruffet, dvs. at vi har P(A og B) = P(A)P(B A) = P(A)P(B) Men dette kan ikke være 0 da både P(A) og P(B) er positive. To hendelser kan derfor ikke både være disjunkte og uavhengige.

26 Bruk av sannsynlighetsregning

27 Eksempel: Kvalitetskontroll En produsent produserer en artikkel. I gjennomsnitt er 80% av artiklene feilfrie. Hver artikkel blir kontrollert før den sendes ut. Kontrolløren feilklassifiserer artikkelen 10% av gangene (dvs. sier at artikkelen er feilfri når den har feil, eller at den har feil når den er feilfri). Hvilken andel av artiklene blir klassifisert som feilfrie? Definer følgende hendelser: F: Artikkelen er feilfri. K: Artikkelen er klassifisert som feilfri av kontrollør Tegn et trediagram.

Her er F* brukt for F og K* for K i trediagrammet. Artikkelen blir klassisfisert feilfri for gren 1 og gren 3. Dermed summeres sannsynligheten for gren 1 og gren 3: P(K ) = 0.72 + 0.02 = 0.74

29 Eksempel (forts.) Anta at bare artikler som blir klassifisert som feilfrie blir utsendt. Hva er andelen av feilfrie artikler blant de utsendte artiklene? P(F K ) = P(F og K ) P(K ) = 0.72 0.74 = 0.973 Så kvalitetskontrollen øker andelen av feilfrie artikler fra 80% til 97.3%.

30 Oppgave: Dopingtesting En viss type doping forekommer i 1% av populasjonen. Testen kan påvise dette i 95% av tilfellene hvor personen er dopet, men påviser det også feilaktig i 2% av tilfelllene hvor personen ikke er dopet. Hva er sannsynlighenten for at personen er dopet dersom dopingtesten er positiv? La D=personen er dopet A=testen er positiv

31 Oppgave: Det er oppgitt at P(A) = 0.60 P(B Ā) = 0.15 P(B A) = 0.05 a) Er A og B uavhengige? b) Hva er P(B)? c) Hva er P(A B)? (Vink: Tegn et sannsynlighetstre)

32 Oppgave: En 60 år gammel storrøyker oppsøker lege med kronisk hoste og kortpustethet. Legen er bekymret og definerer følgende hendelser: A: Pasientens symptom er kronisk hoste og kortpustethet. B: Pasienten har lungekreft Erfaringer viser at vi kan anta følgende sannsynligheter for 60 årige storrøykere: P(A B)=0.9, P(A B)=0.01, P(B)=0.05 Hva er sannsynligheten for at pasienten har lungekreft gitt symptomene, dvs P(B A)? A) 0.91 B) 0.77 C) 0.50 D) 0.83 E) 0.99 (Vink: Sannsynlighetstre!)

33 Diagnostiske tester S= syk person, S=frisk person. T = positiv test, T = negativ test. For legemidler vet man: P(T S): sannsynligheten for at testen slår ut positivt, gitt at personen er syk (sensitiviteten til testen). Ønskes høyest mulig. P( T S): sannsynligheten for at testen slår ut negativt, gitt at personen er frisk. (spesifisitet). Ønskes høyest mulig Interessant for pasienten: P(S T ): sannsynligheten for at du er syk, gitt at du har fått en positiv test. Positiv prediktiv verdi. P( S T ): sannsynligheten for at du er frisk, gitt at du har fått en negativ test. Negativ prediktiv verdi.

34 Hvorfor utføres ikke HIV-test som masseundersøkelse? P(S T ) = P(S og T ) P(T ) Hva er sannsynligheten for at en person med positiv HIV-test virkelig er HIV-smittet, P(S T )? Anta Sensitivitet av testen: P(T S)= 0.98 Spesifisitet av testen: P( T S)= 0.995, dvs. P(T S) = 0.005. Svaret er avhengig av forekomsten av HIV i populasjonen, P(S) (prevalensen). Anta at forekomsten av HIV i en populasjon er P(S) = 0.0005.

P(S og T ) P(S T ) = = P(T ) 0.000490 0.000490 + 0.005 = 0.09

x-akse: andel smittede i befolkningen. y-akse: andel som er smittet blant de med positiv test.

37 HIV-test Norge som helhet: P(S) = 0.001 (anslag fra lærebok i medisinsk statistikk) gir P(S T ) = 0.16. Sprøytemisbrukere: P(S) = 0.1 gir P(S T ) = 0.956. Storby i sentral-afrika: P(S) = 0.25 gir P(S T ) = 0.985. Dette gir et problem ved masseundersøkelser. De fleste av personene med positiv prøve kan faktisk være friske.

38 Oppgave: disjunkt To terninger blir kastet. Hendelsene er A=summen er 7, C=terningene viser det samme tallet, E=summen er 8. a) Hvilke par av hendelser er disjunkte? b) Finn sannsynlighetene P(A eller C), P(A eller E), og P(C eller E) Fasit: a) A og C, A og E, b) 1/3, 11/36, 1/6

39 Oppgave (Eksamen høst 2005) Hva er sannsynligheten for at summen av to terninger er større enn eller lik 10 gitt at minst en av terningene er 6? A) 1/4 B) 1/3 C) 5/11 D) 6/11 E) 1/2 Fasit: 5/11

40 Oppgave: uavhengighet Dersom P(A)=0.3 og P(B)=0.4 og A og B er uavhengige hendelser. Hva er sannsynlighetene a) P(A og B) b) P(B A) c) P(A B) Fasit: a) 0.12, b) 0.4, 0.3

41 Fasit: betinget rødt P(andre rødt først rødt)=(sum av sanns for gren 1+2)/(sum av sanns for grenene 1+2+3)=2/3

42 Fasit: deltidsstuderende a) A=fulltid C=kvinne P(A og C) = P(A) = n(a) n(s) = 140 200 = 0.7 P(C) = n(c) n(s) = 120 200 = 0.6 n(a og C) n(s) = 80 200 = 0.4

43 Fasit: deltidsstuderende b)+c) b) P(A C) = P(C A) = P(A og C) P(C) P(A og C) P(A) = 0.4 0.6 = 0.67 = 0.4 0.7 = 0.57 c) A og C er avhengige siden P(A C) P(A), P(C A) P(C)

44 Fasit: dopingtest P(D A) = P(D og A) P(A) = 0.0095 0.0095 + 0.0198 = 0.32