Slide 1. Slide 2 Statistisk inferens. Slide 3. Introduction to the Practice of Statistics Fifth Edition

Like dokumenter
Introduction to the Practice of Statistics

Kapittel 4.3: Tilfeldige/stokastiske variable

Denne uken: Kapittel 4.3 og 4.4

Innledning kapittel 4

Sannsynligheten for en hendelse (4.2) Empirisk sannsynlighet. ST0202 Statistikk for samfunnsvitere

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Introduction to the Practice of Statistics

Utvalgsfordelinger (Kapittel 5)

Sannsynlighet: Studiet av tilfeldighet

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Kapittel 4: Sannsynlighet - Studiet av tilfeldighet

Statistikk og dataanalyse

ST0202 Statistikk for samfunnsvitere [4]

TMA4245 Statistikk Eksamen desember 2016

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Betinget sannsynlighet

Eksamensoppgave i TMA4240 Statistikk

STK Oppsummering

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Kapittel 4: Betinget sannsynlighet

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Blokk1: Sannsynsteori

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

MULTIPLE CHOICE ST0103 BRUKERKURS I STATISTIKK September 2016

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Trekking uten tilbakelegging. Disjunkte hendelser (4.5) Forts. ST0202 Statistikk for samfunnsvitere

Kapittel 4: Betinget sannsynlighet

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4240 Statistikk Høst 2008

Kap. 6.1: Fordelingen til en observator og stok. simulering

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Seksjon 1.3 Tetthetskurver og normalfordelingen

Forelening 1, kapittel 4 Stokastiske variable

TMA4240 Statistikk H2010

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Løsninger. Innhold. Sannsynlighet Vg1P

Statistikk 1 kapittel 5

ST0202 Statistikk for samfunnsvitere Introduksjon til ST0202 høsten 2012 Kapittel 1: Statistikk

Statistikk 1 kapittel 5

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kapittel 4.5

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

Sannsynlighet og statistikk

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

Eksempel: kast med to terninger

Oppfriskning av blokk 1 i TMA4240

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kap. 4.5 STK1000 H11

Kapittel 5: Tilfeldige variable, forventning og varians.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Statistikk 1 kapittel 5

UNIVERSITETET I OSLO Matematisk Institutt

Regneregler for forventning og varians

Sannsynlighetsbegrepet

Sannsynlighetsregning og Statistikk

Fra første forelesning:

TMA4240 Statistikk H2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Utvalgsfordelinger (Kapittel 5)

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Kapittel 4.4: Forventning og varians til stokastiske variable

Sannsynlighetsregning og kombinatorikk

Oppgaver. Innhold. Sannsynlighet Vg1P

ST0103 Brukerkurs i statistikk Høst 2014

TMA4240 Statistikk H2010

Tema 1: Hendelser, sannsynlighet, kombinatorikk Kapittel ST1101 (Gunnar Taraldsen) :19

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Statistikk 1 kapittel 5

µ = E(X) = Ʃ P(X = x) x

ST0202 Statistikk for samfunnsvitere

SANNSYNLIGHETSREGNING

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4240 Statistikk Høst 2015

Oppgaver. Innhold. Sannsynlighet 1P, 1T og 2P-Y

Sannsynligheten for en hendelse (4.2) Empirisk sannsynlighet. ST0202 Statistikk for samfunnsvitere

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Eksamen desember 2015

Kort overblikk over kurset sålangt

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Innledning kapittel 4

ÅMA110 Sannsynlighetsregning med statistikk, våren Grunnbegrep. Grunnbegrep, sannsynligheten for et utfall

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Transkript:

Slide 1 David S. Moore George P. McCabe Introduction to the Practice of Statistics Fifth Edition Chapter 4: Probability: The Study of Randomness 9/22/2010 Copyright 2005 by W. H. Freeman and Company Slide 2 Statistisk inferens Hvor ofte vil denne metoden gi korrekt svar hvis jeg bruker den mange ganger Tilfeldighet Kan ikke predikeres på forhånd Regulært mønster Basis for sannsynlighet Eksempel: Kaste mynt, to utfall Sannsynlighet 0.5 for å få krone Slide 3

Slide 4 Tilfeldighet og Sannsynlighet Beskriver hva som skjer hvis eksperiment gjentas mange ganger Mindre regularitet enn mange tror Tilfeldighet Utfall er usikkerhet, men regulært mønster for et stort antall repetisjoner Sannsynlighet Andel ganger et utfall skjer i en lang serie av repetisjoner Slide 5 Myntkast Buffon: Kastet mynt 4040 ganger 2048 ganger krone Andel p =0.5069 Pearson: 24.000 kast, p =0.5005 Kerrich: 10.000 kast, p =0.5067 Slide 6 Tilfeldigheter Noen ting er tilfeldige i vår verden Utfall av myntkast Utstråling av partikler fra radioaktiv stråle Resultat av tilfeldig utfall eller randomisert eksperiment Sannsynlighet: Beskriver tilfeldig oppførsel Empirisk definisjon Kan aldri observere en sannsynlighet Repetisjoner av uavhengige forsøk

Slide 7 Sannsynlighetsteori Startet for å studere utfall av spill Utviklet videre i forbindelse med analyse av astronomiske data (målefeil) Brukes idag i mange sammenhenger Levetidstabeller Trafikkflyt Genetiske data Spredning av sykdommer Analyse av finansielle data Slide 8 Sannsynlighetsmodeller (4.2) Matematisk språk for å beskrive tilfeldig utfall Beskrive hva vi vet Mulige utfall (Mynt/Kron) Sannsynlighet for utfall (0.5 for kron) Utfallsrom: Sett av alle mulige utfall, S Hendelse: Et mulig utfall eller et sett av utfall Vil gi hver mulig hendelse en sannsynlighet Slide 9 Utfallsrom Myntkast: S={Mynt,Kron} Hendelse: Mynt eller kron Terningkast: S={1,2,3,4,5,6} Hendelse: {1,2,3}, {3,4} Spørreundersøkelse, ja/nei, utvalgsstørrelse n S={0,1,2,...,n} Hendelse: {0,1,...,10} Levetid etter behandling S={alle positive tall} Hendelse: {x>60}

Slide 10 Egenskaper sannsynligheter Tall mellom 0 og 1 P(Terning=1)=1/6 0 P(A) 1 Alle mulige utfall må tilsammen ha sannsynlighet 1 P(Terning er 1,2,3,4,5 eller 6) = 1 P(S) = 1 Slide 11 Egenskaper sannsynligheter To hendelser som ikke har noen felles utfall har sannsynlighet lik summen av de individuelle utfall P(Terning =1)=1/6, P(Terning=2)=1/6 P(Terning =1 eller 2)= 1/6 + 1/6 = 1/3 A og B disjunkte: P(A eller B) = P(A) + P(B) Sannsynligheten for at en hendelse ikke inntreffer er 1 minus sannsynligheten for at den inntreffer P(Terning 1) = 1-1/6 = 5/6=P(Terning = 2,3,4,5 eller 6) A c = kompliment av A, P(A c ) = 1-P(A) Slide 12

Slide 13 Slide 14 Endelige antall utfall Gi en sannsynlighet til hvert utfall Sannsynlighet for hendelse: Summere sannsynligheter for alle utfall involvert Slide 15 Benfor's lov Første tall i tall som sendes inn (skatt, lønn, utgifter etc) Fusk: Sammenlikne med tabell

Slide 16 Benfor's lov A={første tall er 1}, B={første tall er 6} P(A)=P(1)=0.301 P(B)=P(6)+P(7)+P(8)+P(9)=0.222 P(A c )=1-0.301=0.699 P(A eller B)=P(A)+P(B)=0.523 C={første tall er odde}=0.609 P(B eller C)=0.727 P(B)+P(C) Slide 17 Like sannsynlige utfall I mange tilfelle rimlig å anta alle utfall like sannsynlige Myntkast: 0.5 for mynt kron Terningkast: 1/6 for 1,2,3,4,5,6 Generelt, k utfall, alle like sannsynligheter 1/k P(A) = (antall utfall i A) / k = (antall utfall i A)/ (Antall utfall i S) Slide 18 Uavhengighet og multiplikasjonsregelen Myntkast A = {Først kast er kron} B = {Andre kast er kron} A og B er ikke disjunkte Rimelig at A og B er uavhengige Kunnskap om A endrer ikke sannsynligheten for B Hva er P(A og B)? Multiplikasjonsregel: Uavhengighet: P(A og B)=P(A) * P(B)

Slide 19 Slide 20 Myntkast Myntkast A = {Først kast er kron} B = {Andre kast er kron} Antar A og B er uavhengige P(A og B) = P(A) * P(B) = 0.5*0.5=0.25 Slide 21 Utdeling kort 52 kort, 26 røde P(første kort rødt) = 26/52 = 0.5 P(andre kort rødt hvis første rødt)=25/51 < 0.5 P(andre kort rødt hvis første sort) = 26/51 > 0.5 Ikke uavhengighet

Slide 22 Mendel's lov Arv opererer tilfeldig Frø har farge grønn eller gul Hver plante bærer to gener for frøfarge Arver et gen fra hver foreldreplante, sannsynl.0.5 Gen: G eller Y, GG=Grønn, GY,YG,YY=Gul Anta far = GY og mor = GY M={G fra far}, F={G fra mor} P(M og F)=P(M)P(F)=0.5*0.5=0.25 Kan vise P(Grønn)=0.25 etter mange generasjoner Slide 23 Multiplikasjon: Kun ved uavhengighet Plutselig barnedødlighet: 1 av 8500 dør uforklarlig, sanns 0,000118 To barn død i samme familie Foreldre siktet for drap Uavhengighet: P(To barn dør)=0.000118*0.000118=1/72 250 000 Flere kvinner siktet i England Royal Statistical Society: Uavhengighet ikke rimelig Britisk regjering tok opp 258 saker på nytt Slide 24 Flere regler A og B uavhengige medfører A c og B c uavhengige A, B og C uavhengige medfører P(A, B og C)=P(A)P(B)P(C) P(Krone 3 ganger på rad)=0.5*0.5*0.5=0.125 Formell definisjon uavhengighet vanskelig Vil vanligvis anta uavhengighet

Slide 25 Hiv tester Ved testing av HIV, mange kommer ikke tilbake for å sjekke resultat Rask, men mindre pålitelig HIV test: få minutter P(Falsk positiv) = 0.004 P(Riktig negativ) = 0.996 P(Minst en av 200 gir falsk positiv) = 1 P(Ingen av 200 gir falsk positiv) = 1 P(200 negative) = 1-0.996 200 =1-0.4486=0.5514 Slide 26 Stokastiske variable Utfallsrom kan ta ulike former 4 myntkast: S={MMMM,MMMK,MMKM, MMKK,MKMM,MKMK,...} Statistikk: Mest interessert i numeriske utfall X = antall kron i 4 myntkast, S={0,1,2,3,4} X er en stokastisk (tilfeldig) variabel Stokastisk variabel: Numerisk utfall av et tilfeldig fenomen Slide 27

Slide 28 Slide 29 Myntkast X=antall kron (H) i 4 myntkast Antar P(H)=P(T)=0.5, ballansert mynt Uavhengige kast P(X=0)=P(TTTT)=0.5*0.5*0.5*0.5=0.0625 P(X=0)=(Antall «gunstige» kombinasjoner)/ (Antall mulige kombinasjoner)=1/16=0.0625 P(X=2)=6/16=0.375 Slide 30

Slide 31 Slide 32 Myntkast P(X 2)=P(X=2)+P(X=3)=P(X=4) =0.375+0.25+0.0625=0.6875 P(X 1)=1-P(X=0) =1-0.0625=0.9375 Slide 33 Kontinuerlige stokastiske variable Datamaskiner genererer tilfeldige tall mellom 0 og 1 S={x;0 x 1} Sprer data uniformt over S P(0.3 x 0.7)=? Kan ikke lengre allokere sannsynligheter til hver verdi Tetthetskurver og areal

Slide 34 Kontinuerlige tilfeldige variable En variabel X som tar verdier i et intervall av tall. Sannsynlighetsfordelingen til X beskrives av en tetthetskurve Sannsynligheten for en hendelse er arealet under tetthetskurven og over de verdier av X som beskriver hendelsen Slide 35 Slide 36

Slide 37 Slide 38 Sannsynlighet 0 for ethvert utfall Angir sannsynligheter til intervaller istedet for individuelle utfall P(X=0.8)=0 X=0.8 er et sett av lengde 0, areal=0 Et utfall vil i praksis aldri være helt lik 0.8 Tre desimaler: 0.799 eller 0.801 9 desimaler: 0.799999999 eller 0.800000001 Gir P(X<0.8)=P(X 0.8) Slide 39 Normalfordeling X er N(μ,σ) Z=(X-μ)/σ er N(0,1) Eksempel: p=andel studenter som jukser på eksamen p =andel observert jukset i et tilfeldig utvalg p tilfeldig variabel Kan vise: tilnærmet N(0.12,0.016) hvis p=0.12 P(p <0.10 eller p >0.14)= 1-P(0.10<p <0.14)=1-P(-1.25<Z<1.25)=0.7888

Slide 40