Terningkast Halvor Aarnes, UiO, 2014 Innhold Ett terningkast og utfallsrom... 1 Union og snitt... 4 Betinget sannsynlighet... 5 Forventningsverdi E(X) og varianse Var(X)... 5 Konfidensintervall for proporsjoner... 7 Sum av to terninger... 8 Sum av tre terninger... 12 Triangulære tall... 15 Ett terningkast og utfallsrom Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6 Sannsynligheten P for et av disse tallene i et terningkast er 1/6. 1
P 1 6 1, 2, 3, 4, 5, 6 X er en diskret (diskontinuerlig) stokastisk (tilfeldig) variabel som representerer alle mulige utkomme av et terningkast. Et terningkast stokastisk eksperiment. Variabelen X har ingen enkeltverdi, men har en statistisk diskret sannsynlighetsfordeling av verdier. P(X = x i ) betyr sannsynligheten for at den tilfeldige variabelen X skal ha verdien x i, hvor x i er et tall i utfallsrommet {1, 2, 3, 4, 5, 6}. En hendelse kan ikke samtidig både skje og ikke skje, de utelukker hverandre gjensidig. Når terningen kastes er alle utfall 1 til 6 uavhengige av hverandre. Sannsynlighet P som befinner seg i intervallet [0, 1] er en tellbar egenskap som tilhører en samling undermengder (delmengder) av en universell mengde, det totale utfallsrommet S. Den totale sannsynlighet er lik 1, P(S) = 1, og sannsynligheten kan aldri være større enn 1. Den diskrete variabelen X for et terningkast er uniformt fordelt og summen av sannsynlighetene blir lik 1: P 1 Vi ønsker å uttrykke sannsynligheten for en hendelse (event) i S. Sannsynlighet har en analogi med en masse = 1 som kan bli fordelt i varierende tykkelse over et område på den reelle tall-linjen. Noen steder på aksen tall-linje plasserer man mye av massen, på andre deler lite eller ingenting. Der hvor man har plassert mest masse blir det størst sannsynlighet. Dette gjenspeiles i begrepet sannsynlighettetthetsfunksjon. Hvis det ikke er noen skjevhet i uttaket av prøver fra S så vil punktsannsynligheten P(x i ) være lik for alle elementene (objektene) x i i S. Sannsynligheten P uttrykkes som en fraksjon (brøk), prosent eller desimaltall e.g. ½ = 50% = 0.05. Sannsynligheten for at hendelse A skal skje, P(A), er lik brøken antall måter man kan få hendelse A (=suksess) 2
dividert på det totale utfallsrommet S som inneholder antall mulige utkomme. Den komplementære hendelsen,, at A ikke skjer, blir 1-P(A). 1 Sannsynligheten for å kaste en treer er P(X = 3) = 1/6. Figur 1. Simulering av utfall av ett terningkast gjentatt en million ganger, og som gir en uniform fordeling av sannsynligheter, 1/6 = 0.1666 Alle utfallene 1til 6 er like sannsynlige. 3
Figur 2. Simulering av utfall av ett terningkast gjentatt en million ganger, Alle utfallene 1til 6 er like sannsynlige, som også vist i Figur 1. Sannsynligheten for å få en sekser i ett terningkast er P(X = 6) = 1/6, sannsynligheten for å få to seksere i to terningkast er 1/6 2 = 1/36. Dette er to uavhengige hendelser hvor sannsynligheten følger multiplikasjonsregelen. Sannsynligheten for å få tre seksere i tre terningkast er 1/6 3 =1/216. Sannsynligheten for å få n seksere i n terningkast er 1/6 n. Sannsynligheten for ikke å få en sekser i et terningkast er 1-P(X = 6) = 5/6. Union og snitt Union (U) tilsvarer logisk og. Snitt ) tilsvarer logisk eller. Sannsynligheten for at terningen viser 4, 5 eller 6 blir: 4 6 4 1 1 6 6 1 6 1 2 1. Hva er sannsynligheten for å få et liketall eller et multiplum av 3 (delelig på 3) ved å kaste en terning? Vi har undermengden liketall: A = {2, 4, 6} fra utfallsmengden S
og undermengden multiplum av 3: B = {3, 6} Vi er interessert i unionen AUB = {2, 3, 4, 6} P(AUB) = 4/6 = 2/3, fordi unionen har 4 elementer. Vi kunne ha regnet ut på en annen måte: 3 2 6 6 1 6 4 6 2 3 Sannsynligheter kan visualiseres med Venn-diagram. Betinget sannsynlighet 1.Vi kaster en vanlig spillterning med utfallsrommet S = {1, 2, 3, 4, 5, 6}. Det er kjent at resultatet er et liketall, det vil si undermengden A = {2, 4, 6}, og vi har en en betinget sannsynlighet. P(B A). Gitt hendelse A, hva er sannsynligheten for hendelse B. Hva er sannsynligheten for at et av disse liketallene er delelig med 3? Dette gir undermengden B = {3, 6}). Hvis begge disse hendelsene skal være oppfylt er det snittet av A og B, A B = {6} Sannsynligheten for B gitt A blir: 1 6 3 6 1 3 Forventningsverdi E(X) og varianse Var(X) Sannsynlighetsteori er studiet av tilfeldige utkomme i et eksperiment. Tilfeldig betyr at utkomme ikke er fastlagt på forhånd, det er innebygget en usikkerhet i eksperimentutfallet. Sannsynlighet og mengdelære har samme logiske struktur. Forventningsverdi E(X) for en diskret variabel er: 5
For ett terningkast: Forventningen E(X) for et kast av en perfekt eller rettferdig terning, hvor X er alle mulige utfall, er 3.5. Du får ikke 3.5 ved å kaste en terning, men det er et veiet gjennomsnitt (middelverdi). 1 1 2 1 3 1 4 1 5 1 6 1 21 6 6 6 6 6 6 6 3.5 Jo større variansen er desto mindre sannsynlig er det å treffe på forventningsverdien. Variansen Var(X) for en diskret variabel er: Kan også skrives som: µ hvor µ er gjennomsnittsverdien Forventning og varianse eksisterer bare hvis rekkene konvergerer. V ariansen ved å gjenta ett terningkast blir ca. 2.9: 13.5 1 6 23.5 1 6 3 3.5 1 6 4 3.5 1 6 5 3.5 1 1 63.5 2.9166 6 6 Fordelingsfunksjonen (sannsynlighetsmassefunksjonen) 6
Sannsynlighetstettsfunksjonen f(x) for en stokastisk diskret variabel X er: Hvis X er en tilfeldig endimensjonal variabel som inneholder objektene x så vil fordelingsfunksjonen F(x) (sannsynlighetsmassefunksjonen) være definert som: Den kumulative sannsynligheten,kumulativ fordelingsfunksjon F(x), får vi ved å summere punktsannsynlighetene. Fordelingsfunksjonen F(x) befinner seg i [0,1], slik at for alle reelle x: 0 1 lim 0 lim 1 Hvis massen er plassert slik at det er brudd i plasseringen er fordelingsfunksjonen diskret (diskontinuerlig), og er massen plassert kontinuerlig er fordelingsfunksjonen kontinuerlig. Konfidensintervall for proporsjoner Hvis man har X suksess i n forsøk så blir andelen suksess vi bruker p hatt ( )om et forhold i en prøve, og p for populasjonen. Gjennomsnittet til samplingsfordelingen til blir lik p. Det finnes forskjellige metoder for beregning av konfidensintervall for proporsjoner. Tradisjonelt har man bare brukt: 1 1.96 7
men den er ofte lite dekkende og bedre er er Agresti-Coull metoden for beregning av konfidensintervallsom hvor man tilføyer to suksess og to ikke-suksess: 2 4 Konfidensintervallet for forholdet blir: 1 1 4 4 hvor Z = 1.96 for 95% konfidensintervall og Z = 2.58 got 99% konfidensintervall. Sum av to terninger Utfallsrommet for summen av antall øyne på for de sidene som vender opp ved kast av to rettferdige terninger er: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 Vi skal summere øyne på to terninger. Følgende 6 x 6 matrise viser mulige utfall for summen av to terninger. Antall mulige utfall ved kast av to terninger er lik 36 (6 2 ). 8
Figur 3. Simulering av summen av to terninger gjentatt 100000 ganger. Histogrammet er symmetrisk med summen 7 som det mest sannsynlige utfall, og de mest sjelde utfall er summen 2 = 1 + 1 og 12 = 6 + 6. 1, 1 2, 1 3, 1 4, 1 5, 1 6, 1 1, 2 2, 2 3, 2 4, 2 5, 2 6, 2 1, 3 2, 3 3, 3 4, 3 5, 3 6, 3 1, 4 2, 4 3, 4 4, 4 5, 4 6, 4 1, 5 2, 5 3, 5 4, 5 5, 5 6, 5 1, 6 2, 6 3, 6 4, 6 5, 6 6, 6 Punktsannsynlighetene for summering av øyne på to terninger blir: 2 3 4 5 6 7 8 9 10 11 12 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36 9
Disse sannsynlighetene kommer som skrålinjer i matrisen ovenfor, nederst fra venstre og opp mot høyre. 1+1=2 2+1=3 3+1=4 4+1=5 5+1=6 6+1=7 1+2=3 2+2=4 3+2=5 4+2=6 5+2=7 6+2=8 1+3=4 2+3=5 3+3=6 4+3=7 5+3=8 6+3=9 1+4=5 2+4=6 3+4=7 4+4=8 5+4=9 6+4=10 1+5=6 2+5=7 3+5=8 4+5=9 5+5=10 6+5=11 1+6=7 2+6=8 3+6=9 4+6=10 5+6=11 6+6=12 Figur 4. Stolpediagram som viser simulering av summen to terninger gjentatt 100000 ganger. 1. Hva er sannsynligheten for å kaste summen 7 med to terninger? 6/36 = 1/6 2. Hva er sannsynligheten for å kaste summen 6 ved kast av to terninger? 5/36 = 13.9%. Summen av sannsynlighetene for hele utfallsrommet er lik 1. Vi kan regn ut forventet verdi E(X) og varians Var(X) for summen av to terninger. Forventet verdi blir ca. 7 og variansen er ca. 5.8 10
Figur 4. Stolpediagram som viser den kumulative sannsynlighetsfordelingen med diskrete verdier hvor summen av alle sannsynlighetene blir lik 1. Oppgave Kast to terninger og beregn summen av punkter ( øyne ) for de to sidene som vender opp. Gjenta forsøket minst 30 ganger. Sett en strek for hver gang summen blir lik tallet i tabellen nedenfor. Lag en grafisk framstilling Sum Strek for hvert utkomme Totalantall 2 3 4 5 6 7 8 9 10 11 12 11
Vi kan regn ut forventet verdi E(X) og varians Var(X) for summen av to tern inger. Fremstill resultatet grafisk og sammenlign med de teoretiske utfa llene. Sum av tre terninger Det er 6 3 =216 mulige utfall ved kast av tre terninger. Det er det samme om en terning kastes tre ganger eller tre terninger en gang hvis det ikke er noen interaksjon mellom terningene. Sannsynligheten for hvert av disse utfallene er1/216 Utfallsrommet for summen av antall øyne på for de sidene som vender opp ved kast av tre terninger 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 Alle mulige kombinasjoner for summen ved kast av tre terninger er 6 3 =216. 12
Antall mulige utkomme for sum av kast av tre terninger: Sum Antall utkomme 3 1 4 3 5 6 6 10 7 15 8 21 9 25 10 27 11 27 12 25 13 21 14 15 15 10 16 6 17 3 18 1 Det er bare 1 måte å få sum 3 = 1+1+1 og 18 = 6+6+6 Figur 5. Histogram for sannsynlighetene for simulering av sum av tre terninger gjentatt 100000 ganger. Histogrammet er symmetrisk. 13
Figur 6. Stolpediagram som viser frekvensen av sum av tre terninger gjentatt 100000 ganger. Figur 7. Stolpediagram som viser den kumulative sannsynlighetsfordelingen med diskrete verdier for summen av tre terninger, hvor summen av alle sannsynlighetene blir lik 1. 14
Forventningsverdien E(X) for sum av tre terninger er ca. 10.5. Oppgave Kast tre terninger og beregn summen av punkter ( øyne ) for sidene som vender opp. Gjenta forsøket minst 30 ganger. Sett en strek for hver gang summen blir lik tallet i tabellen nedenfor. Framstill grafisk Sum Strek for hvert utfall Totalantall 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1. Hvis du kaster ti terninger samtidig eller hver for seg. Hva er sannsynligheten for å få akkurat tre seksere? Ca. 15.5%. Dette er ti Bernoulli-forsøk med mulig utkomme 1/6 (sukse ss) og 5/6 (ikke-suksess). Triangulære tall Triangulære tall angir hvor mange måter heltallet N kan skrives som summen av tre positive tall. Eksempler på triangulære tall er 0, 1, 3, 6, 10, 15, 21, 28, 36, 45, Et triangulære tall T n 1 2 15
Summen av to påhverandre følgende triangulære tall er et kvadrattall. For tabellen over er for n > 8 er det ikke lenger triangulære tall. Tallet 9 kan skrive s som 1+1+7, 1+7+1, 7+1+1, men siden terningen stopper ved tallet 6 følger ikke sum av terninger rekken lenger de triangulære tallene, men symmetrien kommer tilbake igjen for n > 12. Referanser Wikipedia R Development Core Team (2011). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.r-project.org/ (PS. På min gamle hjemme-pc har jeg ikke fått somlet meg til en oppdatering). 16