ST0202 Statistikk for samfunnsvitere [4] Kapittel 4: Sannsynlighet 4.4: Disjunkte hendelser, 4.5: Uavhengige hendelser 4.6: Er disjunkthet og uavhengighet relatert til hverandre? Bruk av sannsynlighetsregning Mette Langaas Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2011h/start
2 Repetisjon: ikke-og-eller? Ā (ikke) A og B A eller B
3 Repetisjon: ikke-og-eller og setninger Komplementsetningen: (ikke) P(Ā)=1-P(A) Den generelle addisjonssetningen: (eller) P(A eller B)=P(A)+P(B)-P(A og B) Den generelle multiplikasjonssetningen: (og) P(A og B)=P(A) P(B A)=P(B) P(A B)
4 Kap. 4.1-4.3 i bruk En boks inneholder en rød (R), en blå (B) og en hvit (H) kule. Trekk to kuler uten tilbakelegging. (Trekk først en kule og legg den til side, trekk så en til. Se på hva du fikk.) Utfallene og deres sannsynligheter kan finnes ved hjelp av et sannsynlighetstre. Sannsynligheten for et utfall finnes ved å multiplisere (betingede) sannsynligheter langs grenene. (Den generelle multiplikasjonsregelen.) Sannsynligheten for en hendelse finnes ved å summere sannsynlighetene for de enkeltutfallene (grenene) som hører til hendelsen.
Det er 6 mulig utfall, og de lister vi som {(R, B), (R, H), (B, R), (B, H), (H, R), (H, B)}
Sannsynligheten for gren 1 (første kule rød og andre blå): P(R, B) = P(R)P(B R) = 1/3 1/2 = 1/6 Sannsynligheten for hendelsen en rød og en blå kule : Gren 1 og gren 3 gir en rød og en blå kule, så vi må summere disse to sannsynlighetene P(en rød og en blå kule) = 1/6 + 1/6 = 1/3
7 Betinget rødt: leksa fra igår Tre kort: Rødt på begge sider Rødt på en side, blått på en side Blått på begge sider Lukk øynene, trekk et kort og legg på bordet. Gitt at kortsiden du ser er rød, hva der da sannsynligheten for at også siden du ikke ser er rød?
8 Disjunkte hendelser (4.4) To disjunkte (gjensidig utelukkende) hendelser: Hendelser definert slik at dersom en av hendelsene inntreffer, kan den andre ikke inntreffe. dvs. P(A og B) = 0 eller med Venn-diagram:
Hvis vi har flere enn 2 hendelser, kalles disse parvis disjunkte ( mutually exclusive ) hvis hvert par av dem er disjunkte etter definisjonen på forrige slide. Eksempel: Betrakt et eksperiment der to terninger blir kastet. Tre hendelser er definert: A: Summen av tallene på terningene er 7 B: Summen av tallene på terningene er 10 C: Begge terningene viser samme tall. Er disse tre hendelsene parvis disjunkte?
A: Summen av tallene på terningene er 7 B: Summen av tallene på terningene er 10 C: Begge terningene viser samme tall. A og B er disjunkte. A og C er disjunkte. B og C er ikke disjunkte, fordi B og C = (5, 5) De tre hendelsene er dermed ikke parvis disjunkte (selv om alle tre ikke kan inntreffe samtidig).
11 Den spesielle addisjonsregelen For disjunkte hendelser A og B gjelder P(A eller B) = P(A) + P(B) Denne regelen kan generaliseres: For parvis disjunkte hendelser A, B, C... E gjelder P(A eller B eller C eller... eller E) = P(A)+P(B)+P(C)+...+P(E)
Illustrasjon av den spesielle addisjonsregelen: Her er A og B disjunkte, og vi har: P(A eller B) = P(A) + P(B)
13 Eksempel: Kast to terninger. Hva er sannsynligheten for at summen er 7 (hendelse A) eller at terningene er like (hendelse B)? Hendelse A (grønn) og B (blå) er disjunkte (inntreffer A kan ikke B inntreffe og motsatt, se figur under).
Regelen over gir da P(A eller B) = P(A) + P(B) = 6 36 + 6 36 = 1 3
15 Disjunkt? Vi trekker tilfeldig en person fra en populasjon, og definerer tre hendelser: A: Personen er yngre enn 60 år. B: Personen er minst 70 år gammel. C: Personen er minst 80 år gammel. Tegn Venn-diagram og forklar hvilke hendelser som er disjunkte.
16 Uavhengige hendelser (4.5) To hendelser A og B er uavhengige hendelser hvis det at A har hendt (eller ikke har hendt) ikke påvirker sannsynligheten for at B skal hende, dvs. P(B) = P(B A) = P(B Ā) eller P(A) = P(A B) = P(A B) Dersom den ene av linjene er oppfylt vil alltid den andre være det også. Hendelser som ikke er uavhengige, kalles avhengige.
17 Eksempler på uavhengighet Kast en mynt to ganger. A er at mynten lander på H i første kast, B er at mynten lander på H i andre kast. Hvorfor er P(B A) = P(B)? Kast en terning og en mynt. A er at terningen gir en 6er, B er at mynten lander på Kron (H). Hvorfor er P(B A) = P(B)? Trekk to kort fra en kortstokk ved at det først trekkes ett kort, som legges tilbake, og at det så stokkes på ny og trekkes et nytt kort. A er at det er en spar i første trekning, B er at det er en hjerter i andre trekning. Forklar hvorfor A og B er uavhengige. Ville disse hendelsene være uavhengige dersom du ikke la tilbake det første kortet før du trakk det andre?
Husk den generelle multiplikasjonsregel: P(A og B) = P(A)P(B A) Dersom A og B er uavhengige, har vi P(B A) = P(B), og P(A B) = P(A) så vi får: Den spesielle multiplikasjonsregel: P(A og B) = P(A)P(B) Dette kan generaliseres til tilfellet med flere enn to uavhengige hendelser: For uavhengige hendelser A, B, C,..., E gjelder P(A og B og C og... og E) = P(A) P(B) P(C)... P(E)
19 Oppgave Kast en mynt to ganger. A er at mynten lander på H i første kast, B er at mynten lander på H i andre kast. Hva blir P(A og B)? Kast en mynt ti ganger (jmf. Siffer, episode 1). La A 1 være at mynten lander på H i første kast, A 2 at mynten lander på H i andre kast,..., A 10 at mynten lander på H i tidende kast. Hva blir P(A 1 og A 2 og og A 10 )?
20 Trekning med tilbakelegging En bolle inneholder 7 kuler, 5 gule (Y) og to røde (R). To kuler trekkes med tilbakelegging, dvs. at det først trekkes en kule, så legges denne tilbake, og det trekkes en kule til. La Da er A = den første kulen er gul (Y) B = den andre kulen er gul (Y) P(begge kulene er gule) = P(A og B) = P(A) P(B A) = 5 7 5 7 = 25 49 siden vi nå har at: er altså A og B uavhengige. P(B A) = 5 7 = P(B)
21 Vi husker: Trekning uten tilbakelegging En bolle (urne) inneholder 7 kuler, 5 gule (Y) og to røde (R). To kuler trekkes uten tilbakelegging, dvs. at det først trekkes en og at det så trekkes en til uten å legge den første tilbake. P(begge kulene er gule) = P(A og B) = P(A) P(B A) = 5 7 4 6 = 20 42
Merk: nå er P(B A) = 4 6 og P(B Ā) = 5 6. Vi kan da umiddelbart konkludere at A og B er avhengige hendelser. Hva er P(B)? P(B) = P(A og B) + P(Ā og B) = P(A) P(B A) + P(Ā) P(B Ā) = 5 7 4 6 + 2 7 5 6 = 20 42 + 10 42 = 30 42 = 15 21 = 5 7 Som igjen medfører at A og B er avhengige.
23 Formel for betinget sannsynlighet Ved å stokke om på den generelle multiplikasjonsregelen, P(A og B) = P(A) P(B A) får vi et uttrykk for sannsynligheten for hendelsen A gitt at hendelsen B har inntruffet: P(A og B) P(B A) = P(A)
24 Eksempel En student blir trukket tilfeldig fra en populasjon bestående av 200 studenter hvorav 140 studerer fulltid (80 kvinner og 60 menn) og 60 studerer deltid (40 kvinner og 20 menn). La hendelsen A være at studenten studerer fulltid og hendelse C at studenten er kvinne. a) Finn P(A), P(C), P(A og C) b) Finn P(A C) og P(C A) c) Er A og C uavhengige?
25 Uavhengighet og disjunkthet (4.6) Uavhengighet og disjunkthet er begreper som ofte blandes. La A og B være to hendelser med positive sannsynligheter P(A) og P(B). At A og B er disjunkte, betyr at de ikke kan inntreffe samtidig, dvs. at P(A og B) = 0 At A og B er uavhengige betyr at sannsynligheten for B ikke endrer seg dersom vi vet om A har inntruffet, dvs. at vi har P(A og B) = P(A)P(B A) = P(A)P(B) Men dette kan ikke være 0 da både P(A) og P(B) er positive. To hendelser kan derfor ikke både være disjunkte og uavhengige.
26 Bruk av sannsynlighetsregning
27 Eksempel: Kvalitetskontroll En produsent produserer en artikkel. I gjennomsnitt er 80% av artiklene feilfrie. Hver artikkel blir kontrollert før den sendes ut. Kontrolløren feilklassifiserer artikkelen 10% av gangene (dvs. sier at artikkelen er feilfri når den har feil, eller at den har feil når den er feilfri). Hvilken andel av artiklene blir klassifisert som feilfrie? Definer følgende hendelser: F: Artikkelen er feilfri. K: Artikkelen er klassifisert som feilfri av kontrollør Tegn et trediagram.
Her er F* brukt for F og K* for K i trediagrammet. Artikkelen blir klassisfisert feilfri for gren 1 og gren 3. Dermed summeres sannsynligheten for gren 1 og gren 3: P(K ) = 0.72 + 0.02 = 0.74
29 Eksempel (forts.) Anta at bare artikler som blir klassifisert som feilfrie blir utsendt. Hva er andelen av feilfrie artikler blant de utsendte artiklene? P(F K ) = P(F og K ) P(K ) = 0.72 0.74 = 0.973 Så kvalitetskontrollen øker andelen av feilfrie artikler fra 80% til 97.3%.
30 Oppgave: Dopingtesting En viss type doping forekommer i 1% av populasjonen. Testen kan påvise dette i 95% av tilfellene hvor personen er dopet, men påviser det også feilaktig i 2% av tilfelllene hvor personen ikke er dopet. Hva er sannsynlighenten for at personen er dopet dersom dopingtesten er positiv? La D=personen er dopet A=testen er positiv
31 Oppgave: Det er oppgitt at P(A) = 0.60 P(B Ā) = 0.15 P(B A) = 0.05 a) Er A og B uavhengige? b) Hva er P(B)? c) Hva er P(A B)? (Vink: Tegn et sannsynlighetstre)
32 Oppgave: En 60 år gammel storrøyker oppsøker lege med kronisk hoste og kortpustethet. Legen er bekymret og definerer følgende hendelser: A: Pasientens symptom er kronisk hoste og kortpustethet. B: Pasienten har lungekreft Erfaringer viser at vi kan anta følgende sannsynligheter for 60 årige storrøykere: P(A B)=0.9, P(A B)=0.01, P(B)=0.05 Hva er sannsynligheten for at pasienten har lungekreft gitt symptomene, dvs P(B A)? A) 0.91 B) 0.77 C) 0.50 D) 0.83 E) 0.99 (Vink: Sannsynlighetstre!)
33 Diagnostiske tester S= syk person, S=frisk person. T = positiv test, T = negativ test. For legemidler vet man: P(T S): sannsynligheten for at testen slår ut positivt, gitt at personen er syk (sensitiviteten til testen). Ønskes høyest mulig. P( T S): sannsynligheten for at testen slår ut negativt, gitt at personen er frisk. (spesifisitet). Ønskes høyest mulig Interessant for pasienten: P(S T ): sannsynligheten for at du er syk, gitt at du har fått en positiv test. Positiv prediktiv verdi. P( S T ): sannsynligheten for at du er frisk, gitt at du har fått en negativ test. Negativ prediktiv verdi.
34 Hvorfor utføres ikke HIV-test som masseundersøkelse? P(S T ) = P(S og T ) P(T ) Hva er sannsynligheten for at en person med positiv HIV-test virkelig er HIV-smittet, P(S T )? Anta Sensitivitet av testen: P(T S)= 0.98 Spesifisitet av testen: P( T S)= 0.995, dvs. P(T S) = 0.005. Svaret er avhengig av forekomsten av HIV i populasjonen, P(S) (prevalensen). Anta at forekomsten av HIV i en populasjon er P(S) = 0.0005.
P(S og T ) P(S T ) = = P(T ) 0.000490 0.000490 + 0.005 = 0.09
x-akse: andel smittede i befolkningen. y-akse: andel som er smittet blant de med positiv test.
37 HIV-test Norge som helhet: P(S) = 0.001 (anslag fra lærebok i medisinsk statistikk) gir P(S T ) = 0.16. Sprøytemisbrukere: P(S) = 0.1 gir P(S T ) = 0.956. Storby i sentral-afrika: P(S) = 0.25 gir P(S T ) = 0.985. Dette gir et problem ved masseundersøkelser. De fleste av personene med positiv prøve kan faktisk være friske.
38 Oppgave: disjunkt To terninger blir kastet. Hendelsene er A=summen er 7, C=terningene viser det samme tallet, E=summen er 8. a) Hvilke par av hendelser er disjunkte? b) Finn sannsynlighetene P(A eller C), P(A eller E), og P(C eller E) Fasit: a) A og C, A og E, b) 1/3, 11/36, 1/6
39 Oppgave (Eksamen høst 2005) Hva er sannsynligheten for at summen av to terninger er større enn eller lik 10 gitt at minst en av terningene er 6? A) 1/4 B) 1/3 C) 5/11 D) 6/11 E) 1/2 Fasit: 5/11
40 Oppgave: uavhengighet Dersom P(A)=0.3 og P(B)=0.4 og A og B er uavhengige hendelser. Hva er sannsynlighetene a) P(A og B) b) P(B A) c) P(A B) Fasit: a) 0.12, b) 0.4, 0.3
41 Fasit: betinget rødt P(andre rødt først rødt)=(sum av sanns for gren 1+2)/(sum av sanns for grenene 1+2+3)=2/3
42 Fasit: deltidsstuderende a) A=fulltid C=kvinne P(A og C) = P(A) = n(a) n(s) = 140 200 = 0.7 P(C) = n(c) n(s) = 120 200 = 0.6 n(a og C) n(s) = 80 200 = 0.4
43 Fasit: deltidsstuderende b)+c) b) P(A C) = P(C A) = P(A og C) P(C) P(A og C) P(A) = 0.4 0.6 = 0.67 = 0.4 0.7 = 0.57 c) A og C er avhengige siden P(A C) P(A), P(C A) P(C)
44 Fasit: dopingtest P(D A) = P(D og A) P(A) = 0.0095 0.0095 + 0.0198 = 0.32