Betinget sannsynlighet, Total sannsynlighet og Bayes setning Innhold: Produktsetning, avhengighet, betinget sannsynlighet (.2,.) Setningen om total sannsynlighet (.4) Bayes setning (.4) Disse tingene henger sammen og bør sees i sammenheng! Viktig å se sammenhengen mellom formlene og diagrammene. (Venndiagram, trediagram og tabell.) Produktsetningen: P A B P A P B hvis A og B er uavhengige P A P B A eller P B P A B hvis A og B er avhengige Legg merke til at produktsetningen kan skrives på to måter når A og B er avhengige, pga. symmetri; P A B P B A! Dette kan vi bruke til å utlede "den forenklede Bayes setning": P A P B A P B P A B som gir: P B A P B P A B eller P A B P A P B A P A P B Denne setningen er fin når vi må resonnere "baklengs", altså gå fra P A B til P B A. Eksempel: Eske med 2 blå og røde kuler, trekker to kuler og observerer farve. Trekning uten tilbakelegging. (En fremgangsmåte som skaper avhengighet mellom første og andre trekning!) av 5 baye.tex
Her har vi, rett fra trediagrammet: Produktsetning: P R R 2 P R P R 2 R 5 P R B 2 P R P B 2 R 5 P B R 2 P B P R 2 B 2 5 P B B 2 P B P R 2 B 2 5 2 0 2 0 6 4 20 0 2 4 20 0 Hva er sannsynligheten for at den første kulen var Rød, gitt at den andre var Blå, altså P R B 2??? Vi kan resonnere oss frem ved å tenke forholdstall: Når vi vet at den andre er blå, så står vi igjen med de hendelsene som har blå i andre: R B 2 og B B 2 Hvis vi tenker relativ frekvens og starter med 00 forsøk, ville disse to hendelsene utgjøre ca. og 0 av de 00 tilfellene, altså 0 40 Av disse 40 tilfellene er det (R B 2 ) som har rød i første, og da blir sannsynligheten: P R B 2 0 4 Går vi tilbake fra relativ frekvens til sannsynlighet, ved å dividere med 00, får vi: P R B 2 0 00 00 0 00 0 0 0 P R B 2 P R B 2 P B B 2 P R P B 2 R P B 2 Det siste uttrykket er som vi ser "forenklet Baye", og det nest siste uttrykket er den ordentlige Bayes setning! Men det ser vi bedre, når vi har sett på setningen om total sannsynlighet. Setningen om Total Sannsynlighet 2 av 5 baye.tex
I dette Venn-diagrammet her har vi en såkalt "fullstendig oppdeling" av utfallsrommet, dvs. at utfallsrommet er delt i tre deler O, O 2 og O,der Delene tilsammen dekker hele utfallsrommet. (O O 2 O U) Delene er disjunkte, dvs. at de ikke overlapper hverandre. Vi ser at hendelsen/mengden A må være lik summen av rød, blå og grønn del, henholdsvis snittene A O,A O 2 og A O,ellermedandreord: P A P A O P A O 2 P A O Som med betinget sannsynlighet gir Setningen om Total Sannsynlighet: P A P O P A O P O 2 P A O 2 P O P A O Med tabell kunne det se slik ut: O O 2 O A P O P A O P O 2 P A O 2 P O P A O P A A P O P O 2 P O I bokens eksempel er utfallsrommet bare delt i to, da har vi O og O! Bayes Setning Setter vi uttrykket for total sannsynlighet inn i nevneren i "den forenklede Baye", får vi Bayes Setning: P O A P O P A O P O P A O P O 2 P A O 2 P O P A O Eksempel: av 5 baye.tex
I bedriften DuppeDitter AS produseres, ikke uventet duppeditter. Produksjonen skjer i maskinene M, M 2 og M. Disse tre maskinen har henholdsvis 25%, 5% og 40% av produksjonen. Sannsynlighetene for at en produsert duppeditt er produsert med en bestemt maskin er da: P M 0.25, P M 2 0.5 og P M 0.4 Sannsynligheten for å produsere defekte duppeditter er henholdsvis: P D M 0.04, P D M 2 0.02 og P D M 0.0 Setningen med Total Sannsynlighet Med setningen om total sannsynlighet kan vi regne ut sannsynligheten for at en tilfeldig valgt produsert duppeditt er defekt: P D P D M P D M 2 P D M fordi maskinene utgjør en fullstendig oppdeling av utfallsrommet, duppedittene må være produsert med en av dem! Med betinget sannsynlighet får vi formulert total sannsynlighet: P D P M P D M P M 2 P D M 2 P M P D M 0.25 0.04 0.5 0.02 0.4 0.0 0.02 Bayes Setning Med Bayes setning kan vi regne ut sannsynligheten for at en defekt duppeditt er produsert av maskin : P M D P M P D M P D der nevneren er setningen om total sannsynlighet, som vi har regnet ut allerede, så vi får: P M D 0.25 0.04 0.02 0.476 Eksempler på at Bayes setning er viktig: Vha. Bayes setning kan man vise at det kan være farlig å utføre medisinske tester for sjeldne sykdommer (Se oppgave.20 side om HIV-tester) løgndetektorundersøkelser av mistenkte i rettsaker. Løgndetektorproblematikken er av samme art, skyldige i en drapssak er eksempelvis en "sjelden forekommende sykdom", det er faktisk bare en som har denne "sykdommen" i hver sak! Selvom en test er 99% sikker, altså at P Test positiv Syk 0.99, 4 av 5 baye.tex
kan man for sjeldne forekomster av Syk oppleve at den omvendte sannsynligheten blir fartruende lav P Syk Test positiv 0.5! Hvis man eksmpelvis teste hele den norske befolkning for HIV, ville titusenvis av friske mennesker få positiv test! Dette kaller man "falske positiver" og hele problematikken kalles "False Positive Paradox" 5 av 5 baye.tex