ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Like dokumenter
Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2008

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

TMA4245 Statistikk Høst 2016

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Eksempel: kast med to terninger

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

UNIVERSITETET I OSLO

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Transformasjoner av stokastiske variabler

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Oppfriskning av blokk 1 i TMA4240

Bernoulli forsøksrekke og binomisk fordeling

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Statistikk 1 kapittel 5

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

TMA4240 Statistikk H2015

Statistikk 1 kapittel 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

To-dimensjonale kontinuerlige fordelinger

ST0103 Brukerkurs i statistikk Høst 2014

Test, 3 Sannsynlighet og statistikk

Regneregler for forventning og varians

Sannsynlighetsregning og kombinatorikk

TMA4245 Statistikk Eksamen desember 2016

Forelening 1, kapittel 4 Stokastiske variable

TMA4240 Statistikk H2010

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

ÅMA110 Sannsynlighetsregning med statistikk, våren

Sannsynlighetsbegrepet

Foreleses onsdag 8. september 2010

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Innledning kapittel 4

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

ST0202 Statistikk for samfunnsvitere

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Binomisk sannsynlighetsfunksjon

Statistikk 1 kapittel 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

Notasjon. Løsninger. Problem. Kapittel 7

Innledning kapittel 4

UNIVERSITETET I OSLO Matematisk Institutt

FORMELSAMLING TIL STK1100 OG STK1110

Sannsynlighet og statistikk S2 Oppgaver

TMA4240 Statistikk Høst 2009

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Kapittel 4.3: Tilfeldige/stokastiske variable

Statistikk 1 kapittel 5

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Deterministiske fenomener. Stokastiske forsøk. Litt historikk

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2015

UNIVERSITETET I OSLO

Midtveiseksamen i STK1100 våren 2017

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Eksamen desember 2015

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Kapittel 4.4: Forventning og varians til stokastiske variable

ØVINGER 2017 Løsninger til oppgaver. 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir

Kapittel 2: Hendelser

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

Sannsynlighet og statistikk S2 Løsninger

DEL 1 GRUNNLEGGENDE STATISTIKK

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Svarer til avsnittene 2.1 og 2.2 i læreboka

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Deterministiske fenomener. Stokastiske forsøk. Litt historikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Betinget sannsynlighet

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Sannsynlighetsregning og Statistikk

Sannsynlighet og statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Notater til forelesning i Sannsynlighetsregning SK 101 Matematikk i grunnskolen I

UNIVERSITETET I OSLO

ECON Statistikk 1 Forelesning 3: Sannsynlighet. Jo Thori Lind

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

TMA4240 Statistikk Høst 2015

Eksamensoppgave i TMA4240 Statistikk

Fasit for tilleggsoppgaver

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST/ST Sannsynlighetsregning og statistikk Vår 9 Oppgaver fra boka 3..9 Ved et terningkast anses utfallet antall øyne lik for å være suksess mens alt annet er fiasko. Sannsynligheten for å slå en sekser er uniform, lik p =, samt konstant ved hvert terningkast. Hvert kast anses som uavhengig av hverandre. Det vil si at den stokastiske variabelen X = antall seksere er binomisk fordelt. P (minst sekser på kast) = P (X ) P (X = ) ( ) ( ) ( ( ) 5 =.5 P (minst sekser på kast) = P (X ) [P (X = ) + P (X + )] [ ( ) ] ( ) k ( ) k k [ k= ( 5 ) + ( ) ] 5 =.87 [ ] P (minst 3 sekser på 8 kast) = P (X 3) P (X = k) [ k= ( k ) ( k= ] ) k ( ) k [.375 +.35 +.987] =.5973 Altså mest sannsynlig å få minst en sekser på terningkast. ) 3.. La X = antall missiler som treffer flyet og Y = antall raketter som treffer båten. For hver avfyrt missil/rakett er det snakk om uavhengige forsøk med konstant sannsynlighet for suksess (treffe målet) henholdsvis p X =. og p Y =.5. Så både X og Y kan anses som binomisk fordelt. Det er opplyst at flyet styrter hvis det treffes av eller flere missiler, mens båten. januar 9 Side av 9

synker hvis den treffes av én rakett. Dvs. P (flyet styrter) = P (X ) k= ( k ) ( 5 P (X = k) k= ) k ( ) k [. +.378] =.3 P (båten synker) = P (Y ) P (Y = ) ( ) ( ) (.5987 =. Så det er størst sannsynlighet for å overleve i flyet. ) 3.. Hvert barn er et uavhengig forsøk med konstant sannsynlighet p =.5 for at barnet er ei jente (suksess). Så med barn er det snakk om forsøk og ( ) ( ) ( P ( av hvert kjønn) = =.375 ) P (3 av hvert kjønn) =P (3 jenter og gutt) + P ( jente og 3 gutter) ( ) ( ) 3 ( = 3 ( ) ( ) ( + 3 ) ( ) ( ) = =.5 3 Så det er størst sannsynlighet for å få 3 barn av samme kjønn. ) 3.. En populasjon på 9 bjørner består av mørke og 3 lyse. Av disse er observert forskjellige. La X være antall observerte mørke bjørner. Siden det er observert forskjellige bjørner er det snakk om et udvalg uten tilbakeleging og X vil være hypergeometrisk fordelt. Hvis det skal være observert minst dobbelt så mange mørke som lyse bjørner, ut av i alt observert, må det være observert minimum mørke bjørner. Så spørsmålet kan besvares ved P (X ) = x= P (X = x) hvor den øvre grense skyldes antallet observerte bjørner. P (X ) = P (X = x) x= ( = )( 3 ) ( 9 ) + ( )( 3 ( )( 3 5( ) 9 + ( ) 9 ) ) =.5357 +.3 +.9 =.79 3.. Det velges 5 av mulige spørsmål til eksamen. Hvis Anne kan svare på 8 av de mulige spørsmål, har hun da minst 85% sannsynlighet for å kunne svare på minst av 5 spørsmål?. januar 9 Side av 9

La X betegne antall korrekte svar på eksamen. Oppgaven er da å finne sannsynligheten for å trekke 5 spørsmål ut fra en pulje på spørsmål (uten tilbakeleging), hvor hun kan svare på minst. Dvs. ( 8 )( ( 8 )( P (X ) = P (X = ) + P (X = 5) = ( ) 5 ) + ( ) ) =.778 5 5 Så Anne har ikke 85% sannsynlighet for å kunne svare riktig på av 5 spørsmål ved kun å kunne 8 av mulige spørsmål. 3.3. a) Urnen inneholder 5 baller nummerert til 5 og det trekkes baller samtidig. La X være det største nummeret assosiert med de to trukne baller. Den største verdien vil alltid være > da baller trekkes uten tilbakelegning og 5, så utfallsrommet er begrenset til S X = {, 3,, 5}. Med et så overkommelig utfallsrom kan sannsynlighetsfordelingen konstrueres som P (X = k) = antall muligheter for X = k antall mulige kombinasjoner Antall mulige kombinasjoner de to ballene kan trekkes, som er gitt ved antall permutasjoner n P k = 5 P =. Sannsynligheten for hvert utfall kan da lett finnes ved telling av mulige kombinasjoner. F.eks. for k = er det kun utfallene {(, ), (, )}, for k = 3 er det {(, 3), (, 3), (3, ), (3, )} osv. Samlet gir det sannsynlighetsfordelingen k 3 5 p X (k) / / 3/ / som oppfyller kravene til en diskret sannsynlighetsfordeling. b) La nå V være summen av de to ballenes verdi. Utfallsrommet består av helltal i intervallet 3 til 9, og på samme vis som i forrige spørsmål kan en sannsynlighetsfordeling for V konstrueres ved simpel kombinatorik og telling. k 3 5 7 8 9 p V (k) / / / / / / / 3.3. a) Nå blir ballene i forrige oppgave trukket med tilbakeleging, verdien av. ball er nå uavhengig av. balls verdi. Utfallsrommet utvides til S X = {,, 3,, 5} og en fordeling p X (k) kan konstrueres på samme måte som før, hvor antall mulige kombinasjoner nå er 5 = 5. Så f.eks. for k = er det kun et mulig utfall (, ), for k = er det utfallene {(, ), (, ), (, )} som teller, mens det for k = 3 er {(, 3), (, 3), (3, 3), (3, ), (3, )} osv. Dette gir sannsynlighetsfordeling p X (k):. januar 9 Side 3 av 9

k 3 5 p X (k) /5 3/5 5/5 7/5 9/5 b) Utfallsrommet for V er nå utvidet til heltall i intervallet [, ], men framgangsmåten er den samme som i spørsmål 3.3. b) Den diskrete sannsynlighetsfordeling p V (k) blir da: k 3 5 7 8 9 p V (k) /5 /5 3/5 /5 5/5 /5 3/5 /5 /5 3.3.3 Vi kaster en rettferdig terning (altså en "vanligterning der alle utfall er like sannsynlige) tre ganger. X er det største antallet øyne på de tre kastene. Utfallsrommet er S X = {,, 3,, 5, }. La (a, b, c) være verdiene vi kaster, og vi har 3 = muligheter for kastene ( utfall per kast). Det betyr at sannsynligheten for at X = er /, fordi da må (a, b, c) = (,, ). X = når minst én av a, b, c er og resten er. Da har vi tre muligheter for ett -tall, tre muligheter for to -tall, og én mulighet for tre -tall, som gir oss P (X = ) = 7/. En mer generell tankegang er at vi har to muligheter for hvert terningkast ( eller ), og derfor har 3 = 8 muligheter, minus de der vi ikke har noen -tall, som her er (a, b, c) = (,, ). Det blir altså 3 / / = 7/. For X = 3 må minst én av terningene ha 3 øyne, mens de andre har, eller 3. Da har alle 3 muligheter, 3 3 = 7, minus de situasjonene der ingen er 3-tall (og bare og ) som har 3 = 8 muligheter. Altså, P (X = 3) = 3 3 / 3 / = 9/. Nå ser vi et system her, for X = k har vi k 3 minus (k ) muligheter. Da kan vi skrive ned den generelle formelen: p X (k) = k3 (k )3 som vi kan se at vil summere til, så dette er en gyldig sannsynlighetstetthet. 3.3. Terningen blir kastet 3 ganger og X er det største antall øyne på de tre kastene. Ved Definisjon 3.3. er da F X (k) = P (X k) = P (max(a, b, c) k) hvor (a, b, c) er antall øyne i hvert av de tre kastene (se også Eksempel 3.). For at det største antall øyne X k må det nødvendigvis gjelde at a k og b k og c k. Da hendelsene a, b og c er uavhengige fås F X (k) = P (max(a, b, c) k) = P ((a k) (b k) (c k)) = P (a k)p (b k)p (c k) = k k k ( ) k 3 = k =,...,. januar 9 Side av 9

da P (a k) = k x=. 3.3. Den kumulative fordelingsfunksjon for den diskrete variabelen X har formen F X (x) = x(x + )/ i punktene x =,,...,. For å finne sannsynlighetsfordelingen p X (x) bruker vi at F X (x) = x k= p X(k) og dermed p X (x) = F X (x) F X (x ) = hvor p X () = F X () = også er dekket. x(x + ) x(x ) = x x =,,..., 3..3 f Y (y) = 3 y, y. Da er P ( Y < ) =P ( < Y < ) =P ( < Y < 3 ) = P (Y < 3 ) P (Y < ) Vi må finne den kumulative sannsynlighetsfordelingen: Da har vi at F Y (y) = y f Y (y)dy = y = (y3 ( ) 3 ) = (y3 + ) 3 y dy = 3 y y dy = 3 [ ] y 3 y3 P ( Y = P (Y < 3 ) P (Y < ) ( (3 = ) ( 3 ( + ) ) 3 + ) = (7/ / + ) = (/) = 3/ = ((7/ + ) (/ + )) 3.. Når man har en spesiell type malaria kan man beskrive tiden man er i remisjon (remissionpå engelsk) ved den kontinuerlige pdf-en f Y (y) = 9 y, y 3, der Y måles i år. Sannsynligheten for at en malariapasients remisjonstid varer mer enn år er da P (Y > ) P (Y ) f Y (y)dy 9 y dy 9 [(/3)y ] 7 = 7. januar 9 Side 5 av 9

3.. Vi vet at f Y (y) = (n + )(n + )y n ( y), y, n N. For at f Y (y) skal være en sannsynlighetstetthet, må den oppfylle. f Y (y), y.. f Y (y) dy =. For å vise. holder det å vise at alle faktorene som inngår i f Y (y) er større eller lik null når y. Siden n N, vet vi at (n + ) > (n + ) >. Videre, ser vi at y n og at ( y) innenfor det angitte intervallet. Følgelig er f Y (y). Vi viser. ved å utføre integrasjonen: f Y (y) dy = (n + )(n + )y n ( y) dy () = [ (n + )y n+ (n + )y n+] = (n + ) (n + ) =. Altså er f Y (y) en sannsynlighetstetthet. 3..8 Y er en eksponensialfordelt stokastisk variabel. Sannsynlighetstettheten er f Y (y) = λe λy, y. Vi finner den kumulative sannsynlighetsfordelingen F Y (y): F Y (y) = f Y (y) dy = λe λy dy = C e λy () Vi finner konstanten C ved å kreve at sannsynlighetstettheten integrerer til : lim y F Y (y) = C =. Altså er F Y (y) e λy.. januar 9 Side av 9

3.. Y er en kontinuerlig stokastisk variabel med kumulativ sannsynlighetsfordeling, y < F Y (y) = y, y, y Den tilhørende sannsynlighetstettheten er f Y (y) = y, y. Vi skal finne P ( < Y 3 ) ved å. Bruke den kumulative sannsynlighetsfordelingen, F Y (y).. Bruke sannsynlighetstettheten, f Y (y). Metode : Metode : P ( < Y 3 ) = P (Y 3 ) P (Y ) = F Y ( 3 ) F Y ( ) () P ( < Y 3 ) = 3 f Y (y) dy = 3 = 9 = 5. y dy = [ y ] 3 (3) = 5. (5) Alternativt, for metode, ser vi at sannsynlighetstettheten er lineær i dette problemet - altså kan vi beregne integralet ved å finne arealet av trapesen sannsynlighetstettheten danner med x-aksen. P ( < Y 3 ) = f Y ( )(3 ) + (f Y ( 3 ) f Y ( ))(3 ) () = + = 5. 3..8 Farerate ("hazard rate") er gitt ved: h(y) = f Y (y) F Y (y) Fra 3..8 har vi for eksponensiell familie at f Y (y) = λe λy, y og F Y (y) = e λy. Da er fareraten h(y) = λe λy ( e λy ) = λe λy e λy = λ. januar 9 Side 7 av 9

R-oppgave library(ggplot) library(scales) a Stokastisk variabel fra Øving : X N (, ), altså en normalfordelt varabel med gjennomsnitt og varians. Utfallsrommet er hele den reelle tallinja. b Hendelsesfamilien til X: den minste familien av mengder som inneholder alle intervall på den reelle tallinja. Sannsynlighetsfordelingen til X er en normalfordeling med gjennomsnitt og varians. c # temperatur i Celcius fra 9-8 temp_3 <- c(.3, 5.,, 5., 5.8, 8., 8.3, 8.8, 7.5,.) temp_ <- c(.9, 9.5, 7.8, 5.5,.8,.,.3, 8.7,., 5.) temp <- c(temp_3, temp_) mean(temp) ## [] 3.85 var(temp) ## [] 8.3 T er en stokastisk variabel som måler temperatur, og utfallsrommet er hele den reelle tallinja. Merk at de mulige verdiene T kan ta kun er større enn -73.5 (men utfallsrommet inneholder tall lavere enn det, sannsynligheten for at T kan ta disse verdiene er ). Hendelsesfamilien til T : den minste familien av mengder som inneholder alle intervall på den reelle tallinja (den samme som X i forrige oppgave). Sannsynlighetsfordelingen til T er ikke kjent. Det er riktignok vanlig å anta at temperatur er normalfordelt. Gjennomsnittet er 3.85 og variansen er 8.3 i dataene fra Røros. d ggplot(data.frame(temperatur = temp), aes(x = Temperatur, y =..density..)) + geom_histogram(bins = 3)

.3. density.. 5 Temperatur