Kapittel 4: Betinget sannsynlighet Ofte vil kunnskap om at en hendelse har inntruffet påvirke sannsynligheten for en annen hendelse. Terningkast. ={1,2,3,4,5,6}. A= odde ={1,3,5}. B= mindre enn 4 = {1,2,3}. g m 3 6 og P(B) 1 2 1 2 Hva er sannsynligheten for A dersom vi vet at B har inntruffet? Redusert utfallsrom: B ={1,2,3}, A= odde ={1,3} Får da: P(A B) 2 3 Definisjon: Den betingede sannsynligheten for A gitt B er: P(A B) P(A B) P(B) A B Terningkasteksemplet: A= odde ={1,3,5}. B= mindre enn 4 = {1,2,3}. A B={1,3} P(A B) 2/6 1/3 P(A B) P(B) 1/2 1/2 2 3
Merk: P(A B) og P(B A) er to forskjellige ting! A= fly ankommer i rute og D= flyet drar i rute Vet at =0.85, P(D)=0.82 og P(A D)=0.78 Dersom flyet ankommer i rute hva er sannsynligheten for at det drar i rute? P(A D) 0.78 0.85 P(D A) 0.92 Dersom flyet drar i rute hva er sannsynligheten for at det ankom i rute? Merk: Komplementregelen gjelder også for betingede sannsynligheter: P(A C B)=1- P(A B) Flyeksemplet: Dersom flyet ankommer i rute hva er sannsynligheten for at det ikke drar i rute? P(D C A) 1 P(D A) 1 0.92 0.08 Dersom flyet drar i rute hva er sannsynligheten for at det ikke ankom i rute?
Multiplikasjonsregelen: P(A B) Fra P(A B) og P(B A) P(B) ser vi at: P(A B) P(A B)=P(A B) P(B) og P(A B)=P(B A) 5% av alle menn og 0.25% av alle kvinner er fargeblinde. Du sitter på en kafe, hva er sannsynligheten for at neste person som kommer inn døra er en fargeblind mann? M= mann og F= fargeblind P(M F)=P(F M) P(M)=0.05 0.5=0.025 5% av alle menn og 0.25% av alle kvinner er fargeblinde. Hvor stor andel av befolkningen er fargeblinde? La M= mann, K= kvinne og F= fargeblind Antar også at P(M)=P(K)=0.5
Generell regel (loven om total sannsynlighet/oppsplittingsregelen): La B 1,B 2,,B n være en oppsplitting/oppdeling av utfallsrommet, dvs = B 1 B 2 B n og ingen felles elementer i B i -ene: B 1 B 3 B 4 A B 2 B 5 Da har vi: = P(A B 1 )+ P(A B 2 )+ + P(A B n ) = P(A B 1 ) P(B 1 )+ P(A B 2 ) P(B 2 )+ +P(A B n ) P(B n ) Viktig spesialtilfelle: = P(A B)+ P(A B C ) = P(A B) P(B)+ P(A B C ) P(B C ) En fabrikk har 3 maskiner M 1, M 2 og M 3 M 1 lager 30% av produktene og 2% av disse har feil. M 2 lager 45% av produktene og 3% av disse har feil. M 3 lager 25% av produktene og 2% av disse har feil. D= tilfeldig produkt fra fabrikken har feil Hva er P(D)?
Spørreundersøkelse, sensitive spørsmål. Gi personen to spørsmål, for eksempel: 1. Er siste siffer i personnummeret ditt odde? 2. Har du snytt på skatten i år? Be personen kaste kron og mynt (uten at den som spør ser på) og svare på 1 dersom kron og på 2 dersom mynt. A = personen svarer ja E 1 = personen svarer på spørsmål 1 E 2 = personen svarer på spørsmål 2 Ved å spørre mange finner man at =0.32. Ønsker P(A E 2 ) = P(A E 1 )+ P(A E 2 ) = P(A E 1 ) P(E 1 )+P(A E 2 ) P(E 2 ) 0.32 = 0.5 0.5+ P(A E 2 ) 0.5 P(A E 2 )=0.14, dvs 14% snyter på skatten. Bayes lov Dersom vi kombinerer definisjonen av betinget sannsynlighet P(A B) P(B A) med multiplikasjonsregelen P(A B)=P(A B) P(B) får vi Bayes lov: P(B A) P(A B) P(B) I en markedsundersøkelse har man funnet ut at 35% av forbrukerne bruker varemerket Favoritt og 52% bruker Super. Man fant også ut at blant de som bruker Super er der 16% som også bruker Favoritt. Hvor stor andel av de som bruker Favoritt bruker også Super? P(F S) P(S) P(F) 0.16 0.52 0.35 P(S F) 0.24
Medisinsk test La A= person tester positivt og B= person har sykdommen Vet at P(B)=0.001, P(A B)=0.99 og P(A B C )=0.02 Finn og P(B A) = P(A B)+ P(A B C ) = P(A B) P(B)+P(A B C ) P(B C ) = 0.99 0.001 + 0.02 (1-0.001) = 0.02097 P(A B) P(B) 0.99 0.001 0.02097 P(B A) 0.0472 Dvs ved positiv test er det bare 4.72% sannsynlighet for å være syk! Skyldes at sannsynligheten for feilaktig positiv test er ganske høy. Spørsmål på TV-program La J= seer mener ja og R= seer ringer inn. Anta at 50% av seerne mener ja, at sannsynligheten for at en ja-seer ringer inn er 15% og at sannsynligheten for at en nei-seer ringer inn er 1%. Hva er sannynligheten for at en innringer mener ja?
Sannsynlighetstrær Situasjoner med mange betingede sannsynligheter kan av og til gjøres mer oversiktelige med å tegne såkalte sannsynlighetstrær. En fabrikk har 3 maskiner M 1, M 2 og M 3 M 1 lager 30% av produktene og 2% av disse har feil. M 2 lager 45% av produktene og 3% av disse har feil. M 3 lager 25% av produktene og 2% av disse har feil. D= tilfeldig produkt fra fabrikken har feil 0.02 D 0.30 Fabrikk 0.45 0.25 M 1 M 2 M 3 0.98 D C 0.03 D 0.97 0.02 0.98 D C D D C Ved å gange sammen de betingede sannsynlighetene angitt i treet kan vi få regnet ut sannsynlighetene for slutthendelsene/løvene : 0.30 Fabrikk 0.45 0.25 M 1 M 2 M 3 0.02 0.98 0.03 0.97 0.02 0.98 D 0.006 D C 0.294 D 0.0135 D C 0.4365 D 0.005 D C 0.245 Merk at alle sannsynlighetene til høyre summerer seg til 1, og sannsynligheten for at en tilfeldig vare er defekt finner vi ved å summere sannsynlighetene for alle defektutfallene: P(D)=0.006+0.0135+0.005=0.0245
Uavhengighet Dersom informasjon om at en hendelse B har inntruffet ikke påvirker sannsynligheten for en annen hendelse A, sier vi at A og B er uavhengige. Dvs A og B er uavhengige dersom P(A B)=. Dersom f.eks. A= temperaturen i morgen er over 5 grader og B= et terningkast gir utfallet 5 eller 6 er opplagt P(A B)= dette er uavhengige hendelser. Dersom f.eks. A= StatoilHydro-aksjen stiger i morgen og B= oljeprisen stiger i morgen er P(A B) dette er ikke uavhengige hendelser. Fra regelen P(A B)=P(A B) P(B) ser vi også at når A og B er uavhengige så vil P(A B)= P(B). Og når A er uavhengig av B er også B uavhengig av A slik at ved uavhengighet vil følgende tre forhold alltid være oppfylte: P(A B)= P(B A)=P(B) P(A B)= P(B) For å sjekke uavhengighet er det nok å se om en av disse tre er oppfylte Flyeksemplet A= fly ankommer i rute og D= flyet drar i rute Er A og D uavh.? Vi har vist at P(D A)=0.92 P(D)=0.82, dvs ikke uavhengige! La A= brann og B= brannvarsler ute av drift. Anta at A og B er uavhengige og at =0.001 og P(B)=0.06. Da blir P(A B)= P(B) =0.001 0.06=0.00006 La A= 6-er i første terningkast og B= 6-er i andre terningkast. Er A og B uavhengige?
Utslipp fra bil A= for høyt utslipp av hydrokarbon B= for høyt utslipp av karbondioksyd Dersom =0.32, P(B)=0.26 og P(A B)=0.18, er A og B uavhengige? Til slutt litt om sjeldne hendelser Dersom mange nok forsøk utføres vil hendelser som har liten sannsynlighet for å inntreffe i ett forsøk likevel skje regelmessig. Lotto Sannsynligheten for å få 7 rette i lotto dersom man tipper ei rekke er: 1/5379616 = 1.86 10-7 Likevel er det, på grunn av det store antallet som tipper, nesten hver uke noen som får 7 rette.
Feiltolkning av sjeldne hendelser Mer alvorlig eksempel: Jus At en hendelse tilsynelatende har veldig liten sannsynlighet for å inntreffe ved en tilfeldighet er ikke uten videre et tilstrekkelig bevis. I England har flere mødre blitt dømt for drap basert på at to av barna deres har dødd i krybbedød. Det ble vurdert som veldig lite sannsynlig at en mor skulle oppleve to spedbarn dø bare ved tilfeldigheter. Men, det er veldig mange mødre med to eller flere barn i England så over tid er sannsynligheten for at noen av dem vil oppleve en dobbel krybbedød ikke så liten Analog sak i Norge: Landås-saken. Les mer på: http://www.forskning.no/artikler/2005/juli/1121169750.27 Nettavisen gir deg bedre råd
Ved bruk av ting vi lærer senere i pensum kan vi regne ut følgende: Dersom en person tipper 210 rekker i Vikinglotto hver uke i ti år er sannsynligheten for at han vinner en førstepremie i løpet av perioden ca 0.9 %, og sannsynligheten for at han vinner to førstepremier ca 0.0038% Dersom 1000 personer tipper 210 rekker i Viking-lotto hver uke i ti år er sannsynlig-heten for at minst en av dem vinner to ganger ca 4%. Dersom 10 000 personer tipper 210 rekker i Viking-lotto hver uke i ti år er sannsynlig-heten for at minst en av dem vinner to ganger ca 32%. Dersom 100 000 personer tipper 210 rekker i Viking-lotto hver uke i ti år er sannsynlig-heten for at minst en av dem vinner to ganger ca 98%. Dvs sannsynligheten for at en eller annen person i befolkningen opplever å vinne to ganger i Viking-lotto i løpet av en del år er ikke nødvendigvis så liten Oppsummering Betinget sannsynlighet: P(A B) P(A B) P(B) Multiplikasjonsregelen: P(A B)=P(A B) P(B) Loven om total sannsynliget: =P(A B 1 ) P(B 1 )+ P(A B 2 ) P(B 2 )+ + P(A B n ) P(B n ) der B 1,B 2,,B n er en oppdeling av utfallsrommet. Viktig spesialtilfelle: = P(A B)+ P(A B C ) = P(A B) P(B)+ P(A B C ) P(B C ) Bayes lov: P(B A) P(A B) P(B) Ved uavhengighet er: P(A B)=, P(B A)=P(B) og P(A B)= P(B)