Kapittel 2: Sannsynlighet 2.1, 2.2: Utfallsrom og hendelser 2.3, 2.4: Kombinatorikk og sannsynlighet 2.5, 2.6, 2.7: Regneregler, betinget sanns. 2.8: Bayes regel Eirik Mo Institutt for matematiske fag, NTNU FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Eksperiment Utfall. Utfall Hendelse
3 Utfallsrom og hendelser DEF 2.1 Ufallsrom: mengden av alle mulige resultater (utfall) av et stokastisk forsøk. DEF 2.2 Hendelse: delmengde av utfallsrommet. DEF 2.3 A =Komplementet til en hendelse A: (også brukt A, A c, A) alle utfall i S som ikke er i A. A ={e S e / A}. DEF 2.4: (A B)=Snittet av to hendelser A og B: alle utfall som både er i A og i B. DEF 2.6: (A B)=Unionen av to hendelser A og B: alle utfall som er i A eller i B eller i begge. 4 Disjunkte hendelser (mutually exclusive) DEF 2.5: To hendelser A og B er disjunkte hvis snittet er tomt: A B=. Viktig egenskap når vi skal regne med sannsynligheter for hendelser (og ofte på eksamen skal man vise om to hendelser er disjunkte!)
5 Regneregler Kommutativ lov: A B = B A Assosiativ lov: (A B) C Distributiv lov: A (B C) = A (B C) = (A B) (A C) 6 De Morgans lov (A B) = A B (A B) = A B
7 Multihendelser La S være utfallsrom og A 1, A 2,..., A n S, n hendelser. Minst en hendelse: A 1 A 2 A n = n i=1 A i Alle hendelser: A 1 A 2 A n = n i=1 A i 8 Hva er de fargelagte områdene? 1... 2... 3... 4... 5... 6... C B A D 7... 8... 9...
9 Produktregel for valgprosess [2.3] TEO 2.1 Produktregel: Hvis en operasjon kan utføres på n 1 måter, og for hver av disse en annen operasjon kan utføres på n 2 måter, så kan de to operasjonene utføres på n 1 n 2 måter. TEO 2.2 Den generaliserte produktregel: En valgprosess har k trinn. I det første trinnet er det n 1 valgmuligheter, i det andre trinnet er det n 2 muligheter,..., i det siste trinnet er et n k muligheter. Da er det tilsammen n 1 n 2...n k valgmuligheter. 10 Ordnede utvalg MED tilbakelegging: Fra en mengde med n elementer kan vi lage n n n = n r ordnede utvalg på r elementer når utvelgingen skjer med tilbakelegging. UTEN tilbakelegging, TEO 2.4: Fra en mengde med n elementer kan vi lage n (n 1) (n 2) (n r + 1) n P r ordnede utvalg på r elementer når utvelgingen skjer uten tilbakelegging.
11 Permutasjoner DEF 2.7 Permutasjon: En permutasjon er en ordning av alle, eller en delmengde av alle elementer. TEO 2.3: n elementer kan ordnes i rekkefølge på n! = n (n 1) 2 1 måter. TEO 2.5: n elementer kan ordnes i rekkefølge i en sirkel på (n 1)! = (n 1) 2 1 måter. 12 Ikke-ordnede utvalg TEO 2.8 Uordnet utvalg uten tilbakelegging: Fra en mengde med n elementer kan vi lage ( n r) = n (n 1) (n 2) (n r+1) r! = n! r!(n r)! = nc r uordnede utvalg på r elementer når utvelgingen skjer uten tilbakelegging.
13 Ikke-ordnede utvalg: Alternativ utledning Fra de n ulike elementene a 1, a 2,..., a n skal vi lage to grupper med hhv. r og n r medlemmer. Hvor mange måter, K, kan det gjøres hvis vi ikke tar hensyn til ordningen innen de to gruppene? anta at vi har EN slik gruppering som gir r a-er (n r) a-er Det er r! mulige måter å ordne de r a-ene på venstre side på og (n r)! mulige måter å ordne de (n r) a-ene på høyre side på. Dvs. totalt r!(n r)! måter. Vi gjør dette med alle K grupperinger, og det er det samme som å permutere de n opprinnelige elementene, dvs K r!(n r)! = n! Dermed K = n! r!(n r)! 14 Binomisk koeffisient og Pascals trekant Binomisk koeffisient: ( ) n r = n! r!(n r)!. ( n r) finnes i rad n på plass r.
15 Ikke-ordnede utvalg i r celler Generalisering av ikke-ordnede utvalg i 2 celler (de r vi har valgt og de (n r) vi ikke har valgt). TEO 2.7: Vi kan dele en mengde med n elementer inn i r celler med n 1 elementer i første celle, n 2 elemeter i andre ( celle,..., og n r elementer i rte celle, på n ) n 1,n 2,...,n r = n! n 1!n 2! n r! måter, der n = n 1 + n 2 + + n r. TEO 2.6: Antall ordninger av n objekter, der n 1 er av type 1, n 2 n! er av type 2,... og n k er av type k, er n 1!n 2! n k!. (Sier det samme som TEO 2.7). Multinomisk koeffisient: ( n n 1,n 2,...,n r ) 16 Oppsummering kombinatorikk På hvor mange måter kan man trekke r elementer fra n når trekningen skjer med/uten tilbakelegging når ordningen betyr/ikke betyr noe? ordnet ikke-ordnet med tilbakelegg. n r ikke pensum n! uten tilbakelegg. (n r)! = ( n ) np r r = n! r!(n r)! = nc r
17 2.4 Sannsynlighet for hendelse Kast to terninger Første terning 1 2 3 4 5 6 1 1,1 1,2 1,3 1,4 1,5 1,6 2 2,1 2,2 2,3 2,4 2,5 2,6 Andre 3 3,1 3,2 3,3 3,4 3,5 3,6 terning 4 4,1 4,2 4,3 4,4 4,5 4,6 5 5,1 5,2 5,3 5,4 5,5 5,6 6 6,1 6,2 6,3 6,4 6,5 6,6 Merk av i tabellen over og finn sannsynligheten for følgende hendelser: 1. A: samme antall øyne for begge terninger 2. B: sum antall øyne 10 3. C: minst en sekser 18 Sannsynlighet for hendelse [2.4] DEF 2.8 (modifisert) Et sannsynlighetsmål, P, på et utfallsrom, S, er en reell funksjon definert på hendelser i S, slik at 0 P(A) 1, A S P(S) = 1 P( ) = 0 DEF 2.9 Hvis resultatet av et eksperiment er ett av N like sannsynlige utfall (uniform sannsynlighetsmodell), og hvis nøyaktig n av disse gir hendelsen A, så er sannsynligheten til A P(A) = n N = antall gunstige utfall for A antall mulige utfall
Figur fra Xeni Dimakos, Norsk Regnesentral 20 Alternativt om sannsynlighet Sannsynlighet kan være en subjektiv betraktning. Sannsynligheten for at Vålerenga vinner serien i 2007. Sannsynligheten for at du får A på eksamen i TMA4240. Relativ frekvens konvergerer mot sannsynlighet Chevalier de Mere s problem: er det mer sannsynlig å få 1. minst en sekser i fire kast med en terning, eller 2. minst en dobbel-sekser i 24 kast med to terninger? de Mere mente (fra empiriske data) at 1) var større enn 2).
21 demere: relativ frekvens minst en sekser i fire kast med en terning minst en dobbel-sekser i 24 kast med to terninger Relativ frekvens 0.40 0.45 0.50 0.55 0.60 0 20 40 60 80 100 Antall gjentak 22 demere: relativ frekvens minst en sekser i fire kast med en terning minst en dobbel-sekser i 24 kast med to terninger Relativ frekvens 0.40 0.45 0.50 0.55 0.60 0 200 400 600 800 1000 Antall gjentak
23 demere: relativ frekvens minst en sekser i fire kast med en terning minst en dobbel-sekser i 24 kast med to terninger Relativ frekvens 0.40 0.45 0.50 0.55 0.60 0 5000 10000 15000 20000 25000 30000 Antall gjentak 24 demere: ulike startpunkt
25 Addisjonssetninger [2.5] Fortsettelse: kast to terninger Første terning 1 2 3 4 5 6 1 1,1 1,2 1,3 1,4 1,5 1,6 2 2,1 2,2 2,3 2,4 2,5 2,6 Andre 3 3,1 3,2 3,3 3,4 3,5 3,6 terning 4 4,1 4,2 4,3 4,4 4,5 4,6 5 5,1 5,2 5,3 5,4 5,5 5,6 6 6,1 6,2 6,3 6,4 6,5 6,6 Følgende hendelser er definert: A: samme antall øyne for begge terninger, P(A) = 1 6 B: sum antall øyne 10, P(B) = 1 6 C: minst en sekser, P(C) = 11 36 Finn sannsynligheten for A B : samme antall øyne og/eller sum 10 A B C : samme antall øyne og/eller sum 10 og/eller minst en sekser. 26 Addisjonssetningen TEO 2.11: Hvis A, B og C er tre hendelser, så er P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C)
27 Disjunkte hendelser TEO 2.10: Hvis A og B er to hendelser, så er P(A B) = P(A) + P(B) P(A B) Korrolar 1: Hvis A og B er disjunkte er P(A B) = P(A) + P(B) Korrolar 2: Hvis A 1, A 2, A 3,..., A n er disjunkte hendelser, så er P(A 1 A 2 A n ) = P(A 1 ) + P(A 2 ) + + P(A n ) A4 A3 A1 A5 A2 A7 A6 A8 A9 An S 28 Partisjon av utfallsrommet Korrolar 3: Hvis A 1, A 2, A 3,..., A n er en partisjon av utfallsrommet S, da er P(A 1 A 2 A n ) = P(A 1 )+P(A 2 )+ +P(A n ) = P(S) = TEO 2.12: Hvis A og A er komplementære hendelser, så er P(A) + P(A ) = 1 A4 A3 A5 A6 A10 A2 A9 A1 A7 A8 S
29 Eksamen 5.august 2004, 2a Vi ser på dødsfall om natten ved sykehjemmet Aftensol. Ved sykehjemmet er det tre sykepleiere i rene nattevaktstillinger, Anne, Bernt og Cecilie. Hver natt er en av dem på vakt gjennom hele natten, og det er da ingen andre ansatte tilstede ved hjemmet. Anne jobber i 100% nattevaktstilling, mens Bernt og Cecilie jobber i 50% nattevaktstillinger. Vi ser på en tilfeldig valgt natt og definerer følgende hendelser: A = Anne er på vakt, B = Bernt er på vakt, C = Cecilie er på vakt, D = det skjer et dødsfall. Anta at alle dødsfall skjer naturlig. Det er da rimelig å gå ut fra at sannsynligheten for dødsfall er den samme uansett hvilken sykepleier som er på vakt, dvs. at P(D A) = P(D B) = P(D C). Anta at den felles verdi for disse er 0.06. 30 Eksamen 5.august 2004, 2a 1. Tegn de 4 hendelsene definert på forrige side i et venndiagram. 2. Hva er sannsynlighetene P(A), P(B) og P(C)? 3. Finn P(D). 4. Er hendelsene D og C uavhengige? Begrunn svaret.
31 Oppsummering fra 2.1-2.5 FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Eksperiment Utfall. Utfall ordnet ikke-ordnet med tilbakelegg. n r ikke pensum uten tilbakelegg. n! n = n! (n r)! r r!(n r)! Hendelse Sannsynlighet: egenskaper, gunstige vs. frekvens mulige, relativ Sannsynlighet for mer enn en hendelse 32 Betinget sannsynlighet [2.6] DEF 2.9: Den betingede sannsynligheten for B, gitt A, skrives P(B A), og er definert som P(B A) = P(A B) P(A) hvis P(A) > 0 TEO 2.13: Hvis både hendelsene A og B kan inntreffe i et eksperiment, så er P(A B) = P(A) P(B A)
33 Biltilsynet: utslipp fra bil Biltilsynet har satt tall på følgende hendelser: E: overstige hydrokarbongrensen, P(E)=0.32 F: overstige karbonoksydgrensen, P(F)=0.4 E F: overstige både hydrokarbon- og karbonoksydgrensen, P(E F)=0.18 E 0.18 F 34 0.32 Velg ut en tilfeldig bil i Norge, og register utslipp Hva er sannsynligheten for at bilen du undersøker overskrider karbonoksydgrensen, gitt at du allerede vet at den overskrider hydrokarbongrensen? Hva er sannsynligheten for at bilen du undersøker overskrider hydrokarbongrensen, gitt at du allerede vet at den overskrider karbonoksydgrensen? Uavhengige hendelser 0.4 S DEF 2.10: To hendelser A og B er uavhengige hvis og bare hvis P(B A) = P(B) eller P(A B) = P(A) Ellers, så er A og B avhengige hendelser. TEO 2.14: To hendelser A og B er uavhengige hvis og bare hvis P(A B) = P(A) P(B)
36 Venndiagram for uavhengige hendelser Hendelsen A: høyde a og lengde l, P(A) = a l h l. Hendelsen B: høyde h og lengde b, P(B) = h b. h l Hendelsen A B: høyde a og lengde b, P(A B) = a b. h l Ved uavhengighet er P(A B) = P(A) P(B), og vi har P(A) P(B) = a l h l h b h l = a b. h l
37 Multihendelser TEO 2.15: Hvis hendelsene A 1, A 2,..., A k kan inntreffe i et eksperiment, så er P(A 1 A 2 A k ) = P(A 1 ) P(A 2 A 1 ) P(A 3 A 1 A 2 ) P(A k A 1 A 2 A k 1 ) Hvis hendelsene A 1, A 2,..., A k er uavhengige, så er P(A 1 A 2 A k ) = P(A 1 ) P(A 2 ) P(A 3 ) P(A k ) 38 Chevalier demere de Mere mente (fra empiriske data) at 1) var større enn 2): 1. minst en sekser på fire kast med en terning, eller 2. minst en dobbel-sekser på 24 kast med to terninger? Løsning: 1. P(minst en sekser på fire kast med en terning)=1 ( 5 6 )4 = 0.5177 2. P(minst en dobbelt-sekser på 24 kast)=1-( 35 36 )24 =0.4914. Figur fra og les mer i Cartoon Guide to Statistics
39 Idrettsutøvere Idrettsutøvere kan deles inn i tre kategorier: De som doper seg nå (2%) De som har dopet seg tidligere (14 %) De som aldri har dopet seg (84 %) La sannsynligheten for positiv dopingtest for de tre gruppene være hhv. 80 %, 6 % og 3 %. a) Hva er sannsynligheten for at en tilfeldig valgt idrettsutøver gir positiv test? b) Hva er sannsynligheten for at en idrettsutøver som avlegger positiv dopingtest, virkelig er dopet? 40 Total sannsynlighet [2.8] TEO 2.16: Total sannsynlighet Hvis hendelsene B 1, B 2,..., B k gir en partisjon (oppdeling) av utfallsrommet S, slik at P(B i ) 0 for i = 1,..., k, da har vi for hver hendelse A i S k k P(A) = P(B i A) = P(B i )P(A B i ) i=1 i=1 B4 B3 B5 B6 A B10 B2 B9 B1 B7 B8 S
41 Bayes regel TEO 2.17: Bayes regel Hvis hendelsene B 1, B 2,..., B k gir en partisjon (oppdeling) av utfallsrommet S, slik at P(B i ) 0 for i = 1,..., k, da har vi for hver hendelse A i S hvor P(A) 0 at P(B r A) = = P(B r A) P(A) = P(B r A) P k i=1 P(B i A) P(A B r )P(B r ) P k i=1 P(A B i)p(b i ) for r = 1, 2,..., k. 42 Tykkelse av veidekke Før en seksjon av en ny vei er godkjent for bruk inspiseres tykkelsen av veidekket ved hjelp av ultralyd. For et 20 cm dekke, gjøres dette hver 160 meter. Hver 160 meter seksjon vil aksepteres hvis den målte tykkelsen er minst 19cm. Anta at 90% av seksjonenene følger forskriftene (de er faktisk tykkere enn 19cm) Men, en ultralydmåling er dessverre bare 80% sikker, dvs. 80% sjanse for at målingen viser >=19cm gitt at tykkelsen i virkeligheten er >=19cm, og at det er 80% sjanse for at målingen viser <19cm, gitt at tykkelsen i virkeligheten er <19cm. Vi ser på en tilfeldig valgt seksjon av veien som er blitt godkjent for bruk. Hva er sannsynligheten for at seksjonen virkelig er laget etter forskriftene, gitt at den er blitt godkjent for bruk?
43 Sykdom og test S= syk person T= positiv test For legemidler vet man: P(T S): sannsynligheten for at testen slår ut positivt, gitt at personen er syk (sensitiviteten til testen). Ønskes høyest mulig. P(T S ): sannsynligheten for at testen slår ut negativt, gitt at personen er frisk. (spesifisitet). Ønskes høyest mulig Interessant for pasienten: P(S T): sannsynligheten for at du er syk, gitt at du har fått en positiv test. P(S T ): sannsynligheten for at du er frisk, gitt at du har fått en negativ test. 44 HIV-test Hva er sannsynligheten for at en person med positiv HIV-test virkelig er HIV-smittet? Anta Sensitivitet av testen: P(T S)= 0.98 Spesifisitet av testen: P(T S )= 0.995, dvs. P(T S ) = 1 0.995 = 0.005. Svaret er avhengig av forekomsten av HIV i populasjonen: P(S) 1 10000 2 10000 = 5000 1 5 10000 = 2000 1 10 10000 = 1000 1 20 10000 = 500 1 50 10000 = 500 1 100 10000 = 100 1 P(S T) 0.02 0.04 0.09 0.16 0.28 0.50 0.66 P(S) = 0.0005 = 5 10000 (Dagbladet febr 2003, 1900 smittet av HIV i Norge (av 4 000 000), dvs 0.5 promille.) Dette gir et problem ved masseundersøkelser. De fleste av personene med positiv prøve kan faktisk være friske.
45 TV-debatt (Eksamensoppgave fra HiSør-Trøndelag 1998) Et politisk spørsmål blir tatt opp i en TV-debatt. Et stykke ut i debatten stiller programlederen det samme spørsmålet til seerne. Vi ser heretter bare på de seerne som har en oppfatning om spørsmålet. De som mener ja oppfordres til å ringe et bestemt telefonnummer og de som mener nei et annet nummer. Vi antar i denne oppgaven at 70% av seerne mener ja og 30% mener nei. Vi antar videre at sannsynligheten for at en tilfeldig ja-seer ringer inn, er 0.05, og sannsynligheten for at en tilfeldig nei-seer ringer inn, er 0.10. La J være hendelsen at en seer mener ja, og R være hendelsen at han ringer. 46 TV-debatt (forts.) a) Formuler de fire opplysningene som sannsynligheter (betingede og ubetingede) for J og R. Bestem P(R). b) Hvor stor andel av innringerne mener ja? Gir resultatet et riktig bilde av seernes oppfatning?