1 Section 4-1: Introduksjon til sannsynlighet 2 Section 4-2: Enkel sannsynlighetsregning 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger 4 Section 5-2: Tilfeldige variable 5 Section 5-3: Binomisk sannsynlighetsfordeling
Regelen for uvanlige hendelser Rare event rule Anta at: Analogi Vi har en bestemt antagelse om noe Vi observerer noe i dataene som er svært uvanlig hvis antagelsen er sann Konklusjon: Da er det noe galt med antagelsen! Vi antar at tiltalte er uskyldig Det er svært usannsynlig å ha disse bevisene dersom tiltalte er uskyldig: Da er antagelsen om uskyld gal!!
Regelen for uvanlige hendelser Example IT-avdelingen anslår at rundt 15% av BI studentene har en IPhone Men i en stikkprøve av 1939 BI studenter har 22% Iphone Hvis bare 15% av populasjonen har Iphone, så skal det mye til for at andelen i en stikkprøve med 1939 studenter er 22%... Konklusjon: antagelsen om 15% er gal!
Regelen for uvanlige hendelser og statistisk inferens Rare event rule Vi har en bestemt antagelse om populasjonen. Den kalles en hypotese. Dataene i stikkprøven er svært uvanlige i forhold til hypotesen: Konklusjon: Da er det noe galt med hypotesen! Statistisk inferens Med sannsynlighetsregning begynner vi med andre del av kurset: Statistisk inferens. Det er kunsten å bruke stikkprøven til å si noe generelt om hele populasjonen.
Sannsynligheten til en hendelse Sannsynlighet Det er fundamentalt viktig å kunne regne ut sannsynligheten til en hendelse. Å tolke sannsynligheten Men det er like viktig å kunne tolke sannsynlighetsverdier.
Definisjoner Hendelse (eng: event) En samling av utfall fra en tilfeldig prosedyre. Eksempel: Du triller to terninger. Begge terninger viser det samme er en hendelse. Enkelhendelse (eng: simple event) En hendelse som består av ett spesielt utfall. Eksempel: Du triller to terninger. Begge terninger viser 1 er en enkelhendelse Utfallsrom (eng: sample space) Alle enkelhendelser som prosedyren kan resulterere i.
Notasjon for sannsynlighetsregning Notasjon P angir sannsynlighet (eng: probability) A, B, og C angir spesifikke hendelser P(A) er sannsynligheten for at hendelse A inntreffer
Beregne sannsynlighet Alle utfall er like sannsynlige Da beregner man sannsynligheten som P(A) = Antall måter A kan inntreffe på Totalt antall enkelthendelser Example Du triller to terninger. La A være hendelsen: Summen av terningene er 3". P(A) = 2 36 = 1 18 0.056
Beregne sannsynlighet Sannsynligheten er et tall mellom 0 og 1 Example Sannsynligheten til en umulig hendelse er 0 Sannsynligheten til en hendelse som helt sikkert inntreffer, er 1 Enhver hendelse har en sannsynlighet mellom 0 og 1. Du triller to terninger. La A være hendelsen: Summen av terningene er 30. P(A) = 0 La A være hendelsen: Summen av terningene er mer enn 1. P(A) = 1 La A være hendelsen: Summen av terningene er mer enn 2. P(A) = 35 36 Det er meget sannsynlig at hendelsen Summen av terningene er mer enn 2 inntreffer. Det skjer 35 av 36 ganger...
Tolke sannsynligheter
Komplementet til en hendelse Komplement Noen ganger er det lettere å beregne sannsynligheten til komplementet Example For en hendelse A er komplementet alle utfall som ikke er i A. Det betegnes A Da har vi P(A) = 1 P(A) Hva er sannsynligheten for at B: summen av terninger ikke er 3? Komplementet er B: summen av terningene er 3 På side 9 så vi at : P(B) = 1 18 P(A) = 1 P(B) = 1 1 18 = 17 18 = 0.944 Det er 94.4% sjanse for at summen av to terninger ikke blir 3
Kapittel 5: Sannsynlighetsfordelinger Om kapittel 5 Vi kombinerer deskriptiv statistikk fra kapittel 3 med sannsynlighet fra kapittel 4 Da får vi diskrete sannsynlighetsfordelinger som er tema i kapittel 5 Sannsynlighetsfordelinger beskriver hva som sannsynligvis vil skje, ikke hva som faktisk skjedde.
Section 5-2: Tilfeldige variable Tilfeldig variabel (eng: random variable) En tilfeldig variabel er et tall som er et utfall av en tilfeldig prosess. Examples Antall øyne ved et terningkast Lojalitet hos en tilfeldig valgt bankkunde, målt på en skala fra 1 til 10 Fordelingen til en tilfeldig variabel Sannsynlighetsfordelingen til en diskret tilfeldig variabel angir sannsynligheten for hver tenkelige verdi av den tilfeldige variabelen. Dette gjøres vha en tabell eller en formel.
To typer tilfeldige variable Diskret tilfeldig variabel Dersom variabelen har et endelig eller tellbart antall utfall. Example Antall øyne ved et terningkast Kontinuerlig tilfeldig variabel Dersom variabelen har uendelig mange utfall målt på en kontinuerlig skala uten gap. Example Vekten på en tilfeldig valgt pasient
Sannsynlighetshistogram Figur: Antall meksikansk-amerikanske medlemmer i jury
Krav til en sannsynlighetsfordeling To krav må oppfylles 1. P(x) = 1 2. 0 P(x) 1
Forventning og standardavvik til en tilfeldig variabel Forventning / Gjennomsnitt Populasjonsgjennomsnittet µ til en tilfeldig variabel: µ = x P(x) Standardavvik til en tilfeldig variabel Standardavviket σ i populasjonen: σ = (x µ)2 P(x)
Forventning og standardavvik for et terningkast Example Tabell: sannsynlighetsfordeling for et terningkast, se side 14 x 1 2 3 4 5 6 1 1 1 1 1 1 P(x) 6 6 6 6 6 6 µ = 1 1 6 + 2 1 6 + 3 1 6 + 4 1 6 + 5 1 6 + 6 1 6 = 21 6 = 3.5 σ = (1 3.5) 2 1 6 + (2 3.5)2 1 6 + + (6 3.5)2 1 6 17.5 = 1.71 6
Permutasjoner Antall permutasjoner av N objekter En permutasjon er en ordning av objektene i en viss rekkefølge. Hvis vi har N objekter, er antallet ordninger: Example N! = N (N 1)... 2 1 Hvor mange måter kan 7 personer stille seg i kø på? Svar: 7! = 7 6 5 4 3 2 1 = 5040 måter
Antall uordnete utvalg Antall uordnete utvalg uten tilbakelegging Vi velger n av totalt N objekter. Antall måter det kan gjøres på: ( ) N N (N 1) (N 2)... (N n + 1) = n n! ( a ) b betyr velg b fra en samling a, og kalles en binomisk koeffisient Examples Du skal velge 4 studenter fra en klasse på 18. Hvor mange måter kan du gjøre det på? Svar: ( ) 18 4 = 18 17 16 15 4 3 2 1 = 3060 Lotto: 34 kuler. Hvor mange utvalg av 7 kuler finnes det? ( ) 34 = 5379616 7
Binomisk forsøksrekke En serie identiske og uavhengige forsøk Vi gjør et forsøk n ganger Hvert forsøk er uavhengig av det forrige Utfallet i et forsøk er enten vellykket eller mislykket Utfallet er vellykket med sannsynlighet p, og mislykket med sannsynlighet 1 p. Example Du kaster kron/mynt 5 ganger kron vellykket/suksess mynt mislykket/failure binomisk forsøksrekke med n = 5 og p = 0.5
Antall 6 ere på ti terningkast suksess 6 på terningen binomisk forsøksrekke med n = 10 og p = 1/6 Hvor sannsynlig er det å få akkurat tre 6 ere? Sannsynligheten for at de tre første blir 6, og deretter ingen: ( 1 6 )3 ( 5 6 )7 = 0.0013 Antall plasseringer av tre 6 ere i rekka: ( ) 10 = 120 3 Så sannsynligheten for nøyaktig tre 6 ere er ( ) 10 P(3) = ( 1 3 6 )3 ( 5 6 )7 = 0.155
Binomialfordelingen Binomialfordelingen La x være antall suksesser i en binomisk forsøksrekke Da er x en diskret tilfeldig variabel Sannsynligheten for at vi totalt får a vellykkete forsøk er gitt ved binomialfordelingen ( ) n P(x = a) = p a (1 p) n a a
Tre måter å regne ut binomialfordelingen 1. Formelen P(x = a) = ( ) n p a (1 p) n a a Example Sannsynligheten for å få 6 to ganger i ti terningkast er P(x = 2) = 10 9 2 1 (1/6)2 (5/6) 8 = 0.29
Tre måter å regne ut binomialfordelingen 2. Tabell Bruk tabell A-1 i boka. F.eks. med n = 12 og p = 0.8 så er sannsynligheten for 5 suksesser lik 0.003. Example Ti terningkast eksempelet fra forrige side. n = 10, p = 1/6 og x = 2 Sjekk i tabell A-1 Er sannsynligheten er 0.29?
Tre måter å regne ut binomialfordelingen 3. Kalkulator/Excel/JMP JMP. Lag en søyle med formula editor Binomial distribution. Excel har funksjonene COMBIN(N; n) for ( ) N n BINOMDIST(5; 20; 0,22; 0) for binomiske punktsannsynligheter BINOMDIST(5; 20; 0,22; 1) for binomiske kumulative (maks 5) sannsynligheter Online kalkulatorer. Søk på binomial distribution pdf på http://www.wolframalpha.com Texas BII plus kalkulator har også ( ) N n
Binomialfordelingen Example To røde og syv grønne baller Vi trekker en ball n = 20 ganger, med tilbakelegging. Hva er sannsynligheten for å få rød ball nøyaktig fem ganger? Svar: Dette er identiske og uavhengige forsøk med p = 2 9 : P(5) = ( ) 20 ( 2 5 9 )5 ( 7 9 )15 = 0.19
Punktsannsynligheter og kumulative sannsynligheter Kumulativ sannsynlighet Punktsannsynlighet Sannsynligheten for nøyaktig a vellykkete forsøk. Kumulativ sannsynlighet er derimot sannsynligheten for at høyst a forsøk er vellykkete: P(høyst a) = P(0) + P(1) + P(2) + + P(a) Example To røde og syv grønne baller. Sannsynligheten for rød ball høyst to ganger: ( 20 0 ) ( 2 9 )0 ( 7 9 )20 + ( 20 1 P(høyst 2) = P(0) + P(1) + P(2) = ) ( 2 9 )1 ( 7 ( ) 20 9 )19 + ( 2 2 9 )2 ( 7 9 )18 = 0.146
Example Ringe 12 tilfeldig valgte kunder for en markedsundersøkelse. vellykket kunden svarer på spørsmålene Oppringningene uavhengige av hverandre Suksess-sannsynlighet p = 0.2 Binomisk forsøksrekke med n = 12 og p = 0.2 Sannsynligheten for at minst to kunder svarer? Regn ut komplementet: at 0 eller 1 kunde svarer P(0) + P(1) = 0.069 + 0.206 = 0.275 Sannsynligheten for at minst to kunder svarer er 1 0.275 = 0.725