TMA4245 Statistikk Høst 2016

Like dokumenter
TMA4240 Statistikk Høst 2015

Følgelig vil sannsynligheten for at begge hendelsene inntreffer være null,

Oppgave 1 a) Antall måter å velge ut k elementer fra en populasjon på n er gitt av binomialkoeffisienten

TMA4245 Statistikk Høst 2016

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

TMA4240 Statistikk Høst 2015

Oppgave 1 a) La X være massen til et tilfeldig valgt egg, målt i gram. Sannsynligheten for at et tilfeldig valgt egg veier mer enn 60 g er

TMA4240 Statistikk 2014

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

TMA4240 Statistikk Høst 2013

TMA4240 Statistikk 2014

Oppgave 1 dvs 2 kort med samme verdi og 3 kort med ulike andre verdier. 4 verdier paret kan ta, og de to kortene i paret kan velges på måter.

TMA4240 Statistikk Høst 2015

B A. Figur 1: Venn-diagram for(a B) = A B

TMA4245 Statistikk Vår 2015

TMA4245 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016

Betinget sannsynlighet, Total sannsynlighet og Bayes setning

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kap. 4.5 STK1000 H11

TMA4240 Statistikk 2014

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kapittel 4.5

ST0103 Brukerkurs i statistikk Høst 2014

TMA4240 Statistikk Høst 2015

Kapittel 2: Sannsynlighet [ ]

Tema 1: Hendelser, sannsynlighet, kombinatorikk Kapittel ST1101 (Gunnar Taraldsen) :19

Sannsynlighetsregning og kombinatorikk

TMA4245 Statistikk Eksamen august 2014

Betinget sannsynlighet, total sannsynlighet og Bayes setning

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2015

ØVINGER 2017 Løsninger til oppgaver. 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir

SANNSYNLIGHETSREGNING

TMA4240 Statistikk Høst 2012

TMA4240 Statistikk Høst 2008

Oppgave 1 En ansatt skal overvåke et prosjekt der en lapp velges tilfeldig fra en boks som inneholder 10 lapper nummerert fra 1 til 10.

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4245 Statistikk

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

MULTIPLE CHOICE ST0103 BRUKERKURS I STATISTIKK September 2016

TMA4240 Statistikk H2010

Statistikk og økonomi, våren 2017

TMA4245 Statistikk Eksamen august 2014

Fagdag ) Du skal fylle ut en tippekupong. På hvor mange måter kan dette gjøres?

TMA4240 Statistikk Høst 2007

TMA4140 Diskret Matematikk Høst 2016

Oppgaver. Innhold. Sannsynlighet 1P, 1T og 2P-Y

EKSAMEN I ST2101 STOKASTISK MODELLERING OG SIMULERING Onsdag 1. juni 2005 Tid: 09:00 14:00

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Sannsynlighetsregning

TMA4265 Stokastiske prosesser

Oppgaver. Innhold. Sannsynlighet Vg1P

Sted Gj.snitt Median St.avvik Varians Trondheim Værnes Oppdal

TMA4240 Statistikk Høst 2015

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Kapittel 2: Sannsynlighet

TMA4265 Stokastiske prosesser

TMA4240 Statistikk Høst 2012

Tabell 1: Beskrivende statistikker for dataene

Kapittel 2: Sannsynlighet [ ]

Løsningsskisse for oppgavene til uke 7

TMA4240 Statistikk Høst 2013

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

Løsningsforslag, eksamen statistikk, juni 2015

Oppfriskning av blokk 1 i TMA4240

Kapittel 5: Mengdelære

LØSNINGSFORSLAG EKSAMEN VÅR07, MA0301

10.4 Sannsynligheter ved flere i utvalget (kombinatorikk)

TMA4240 Statistikk Høst 2015

Betinget sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi trenger en definisjon av betinget sannsynlighet!

TMA4240 Statistikk H2010

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

TMA4100 Matematikk 1 Høst 2014

Eksamensoppgåve i TMA4245 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Sannsynlighet i uniforme modeller. Addisjon av sannsynligheter

Blokk1: Sannsynsteori

Løsninger. Innhold. Sannsynlighet 1P, 1T og 2P-Y

Oppgaveløsninger til undervisningsfri uke 8

Sannsynlighet og kombinatorikk tips til bruk av Smart tavle

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians.

6 Sannsynlighetsregning

Quiz, 4 Kombinatorikk og sannsynlighet

MA0002 Brukerkurs i matematikk B Vår 2014

x n+1 = x n f(x n) f (x n ) = x n x2 n 3

STK1100 våren Betinget sannsynlighet og uavhengighet. Vi trenger en definisjon av betinget sannsynlighet! Eksempel 1

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

= 5, forventet inntekt er 26

MA2401 Geometri Vår 2018

TMA4240 Statistikk Høst 2015

EKSAMEN I EMNE SIF5072 STOKASTISKE PROSESSER Onsdag 31. juli 2002 Tid: 09:00 14:00

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Transkript:

Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 2 Løsningsskisse Oppgave 1 En kartong inneholder 10 pakker hvorav 2 er undervektige. Vi skal trekke pakker tilfeldig inntil de to med feil vekt er funnet. Definer: I i : pakke trukket som nr i har riktig vekt I i : pakke trukket som nr i er undervektig. a) Ved første trekning er det 10 like sannsynlige utfall, hvorav 2 av utfallene er å trekke en undervektig pakke. Dette gir P (I 1) #gunstige #mulige 2 10 0.20. b) Dersom den første pakken som trekkes har riktig vekt, gjenstår det to undervektige pakker som kan trekkes. Antallet like sannsynlige utfall er nå 9, da en pakke er trukket. P (I 2 I 1 ) #gunstige #mulige 2 9 0.22. c) Da de to utfallene I 1 og I 1 utgjør en oppdeling av utfallsrommet, kan vi benytte setningen om total sannsynlighet, slik at P (I 2) P (I 2 I 1 ) P (I 1 ) + P (I 2 I 1) P (I 1) 2 9 8 10 + 1 9 2 10 0.2. Alternativt: Fordi en ikke vet noe mer om den første pakken, vet en like mye om den andre som den første. P (I 2) P (I 1) #gunstige #mulige 2 10 0.20. d) Det er finnes to helser som gjør at de to undervektige pakkene ikke er funnet når en har trukket fire pakker. En har da enten trukket en undervektig og tre pakker med riktig vekt, eller ingen undervektige og fire pakker med riktig vekt. anb2-lsf-b 29. august 2016 Side 1

p #gunstige #mulige ( 2 1 ) ( 8 3 ( 10 4 ) ( ) 8 + 4 ) 91 105 0.867 e) La X : antall pakker en må kontrollveie for å finne de to med feil. Vi har at P (X x) er sannsynligheten for at en må trekke x pakker for å finne de to undervektige. Vi finner, for hver x, P (X x) ved å se på antall gunstige over antall mulige plasseringer av de to undervektige pakkene i trekkrekkefølgen. ( ) 10 Antall mulige plasseringer av de undervektige pakkene er 45. Antall gunstige 2 plasseringer av de to undervektige pakkene vil variere med x. Vi tar for oss øke verdier av x for å finne et mønster. Vi har at P (X 1) 0 45, da det ikke er mulig å kjenne plasseringen til de to undervektige etter bare ett trekk. Videre har vi at for X 2 trekk vil det finnes 1 gunstig plassering av de to pakkene som vil føre til at en har oppdaget disse etter bare to trekk (nemlig at de er plassert helt først i trekkrekkefølgen). For X 3 vil det finnes 2 gunstige plasseringer; posisjon 1 og 3, eller posisjon 2 og 3 i rekkeølgen (merk at plassering av undervektige pakker på posisjon 1 og 2, og en normalvektig pakke på posisjon 3 ville ført til X 2 og teller dermed ikke som et gunstig utfall for dette tilfellet). Vi ser nå et mønster; vi må for en gitt x finne den andre undervektige pakken på posisjon x, mens den første kan ta enhver tidligere plassering. Det gir (x 1) gunstige plasseringer av de to undervektige pakkene. Dersom ingen undervektig pakke er funnet etter 8 trekninger vet vi at de to siste pakkene er undervektige. For tilfellet X 8 har vi dermed (x 1) + 1 8 gunstige utfall, nemlig at de to undervektige er nummer 8 og et hvilket nummer mindre enn 8 i trekkrekkefølgen, i tillegg til det gunstige utfallet at de to undervektige er de to siste pakkene i trekkrekkefølgen. For tilfellet X 9 har vi x 1 8 gunstige utfall på samme måte som tidligere. I tillegg vet vi at dersom kun en undervektig pakke er funnet i løpet av de 9 første veiingene vil den siste pakken være undervektig, og vi trenger dermed kun å veie 9 pakker. Det gir a x 1 8 gunstige utfall, og totalt sett har vi for X 9, (x 1) + (x 1) 16 gunstige utfall. Sannsynligheten for at X 10 er 0, da det aldri vil være nødving å veie 10 pakker for å finne de to undervektige. Dette gir anb2-lsf-b 29. august 2016 Side 2

P (X x) x 1 45 x 1,..., 7 8 45 x 8 16 45 x 9 0 x 10. Sannsynlighetsfordelingen til antallet pakker som må kontrollveies kan eventuelt beregnes vha multiplikasjonsmetoden: P (X 1) 0 P (X 2) P (I 1, I 2) P (I 1) P (I 2 I 1) 2 1 10 9 1 45 P (X 3) P (I 1, I 2, I 3) + P (I 1, I 2, I 3) P (P (I 1) P (I 2 I 1) P (I 3 I 1, I 2 ) + P (P (I 1 ) P (I 2 I 1 ) P (I 3 I 1, I 2) 2 8 1 10 9 8 + 8 2 1 10 9 8 2 45. Figur 1 viser punktsannsynlighetene. Figur 1: Punktsannsynligheter Oppgave 2 For en tilfeldig valgt person som turisten støter på, definerer vi de tre helsene I: personen er innfødt, anb2-lsf-b 29. august 2016 Side 3

Figur 2: Venndiagram for helsene I, T og E. T: personen er turist, E: personen snakker engelsk. Opplysningene i oppgaveteksten kan da formuleres som følger. Hver tie innfødte snakker engelsk: P (E I) 1/10, hver femte person han møter er turist: P (T) 1/5, annenhver turist snakker engelsk: P (E T) 1/2. a) Vi antar at alle personene turisten møter enten er innfødte, eller er turister selv. Da er I og T komplementære helser, slik at P (I) + P (T) 1 og P (I) 1 P (T) 1 1 5 4 5. I venndiagrammet i figur 2 er dette illustrert ved å dele opp rektangelet som representerer hele utfallsrommet i to deler. Siden vi har engelsktale både blant de innfødte og blant turistene, plasserer vi regionen som representerer E slik at den overlapper både I og T. b) Sannsynligheten for at en tilfeldig person turisten møter er engelsktale, er gitt ved loven om total sannsynlighet, P (E) P (E I) + P (E T) P (E I)P (I) + P (E T)P (T) 1 10 4 5 + 1 2 1 5 9 50. c) For å finne den betingede sannsynligheten for at en person er innfødt, gitt at vedkomme snakker engelsk, bruker vi definisjonen av betinget sannsynlighet, samt sannsynligheten P (E) fra b), P (I E) P (I E) P (E) P (E I)P (I) P (E) 1 10 4 5 9 50 4 9. anb2-lsf-b 29. august 2016 Side 4

Oppgave 3 Undervannssøk (Bayesiansk oppdatering) a) For å beregne verdien av apriorifordelingen i hver gridcelle, kan vi bruke en dobbel for-løkke som itererer over rader og kolonner. clear; close all; clc nx 12; ny 12; pr NaN(nx,ny); z NaN(nx,ny); for i 1:nx for j 1:ny pr(i,j) exp(-0.5*((i-(nx+1)/2)^2 + (j-(ny+1)/2)^2)/8); pr pr./sum(sum(pr)); pr0 pr; En måte å visualisere fordelingen på er ved å bruke imagesc. Dette gir et bilde hvor funksjonsverdi representeres av farge. Legger vi til en colorbar ved siden av selve bildet, blir figuren lett å tolke. figure(1) imagesc(pr0) title(sprintf( Apriorifordeling (0/%i celler unders{\\o}kt),nx*ny),... FontSize,18, Interpreter, Latex ) cbh1 colorbar; xlabel( i ) ylabel( j ) ylabel(cbh1, $P(X_{ij} 1)$, Interpreter, Latex, FontSize,16) b) Vi vil finne sannsynligheten for at X 1,1 1 gitt at Y 1,1 0. Ved Bayes setning er denne lik P (X 1,1 1 Y 1,1 P (X 1,1 1)P (Y 1,1 0 X 1,1 1) P (Y 1,1 P (X 1,1 1)P (Y 1,1 0 X 1,1 1) P (Y 1,1 0 X 1,1 P (X 1,1 + P (Y 1,1 0 X 1,1 1)P (X 1,1 1) (1 l)p 0 (1, 1) 1 (1 p(1, 1)) + (1 l)p 0 (1, 1) p 0 (1, 1)(1 l) 1 p 0 (1, 1) + p 0 (1, 1) lp 0 (1, 1) p 0(1, 1)(1 l) 1 p 0 (1, 1)l. Videre vil vi finne sannsynligheten for at X ij 1 gitt at Y 1,1 0, der (i, j) ikke er lik anb2-lsf-b 29. august 2016 Side 5

Figur 3: Apriorifordelingen p 0 (i, j). (1, 1). Igjen bruker vi Bayes setning og får P (X ij 1 Y 1,1 P (X ij 1)P (Y 1,1 0 X ij 1) P (Y 1,1 P (X ij 1) 1 P (Y 1,1 0 X 1,1 P (X 1,1 + P (Y 1,1 0 X 1,1 1)P (X 1,1 1) p 0(i, j) 1 p 0 (1, 1)l. Her bruker vi antakelsen om at det kun finnes ett vrak, og at det kun befinner seg i en enkelt gridcelle, til å si at P (Y 1,1 0 X ij 1) 0. Merk at uttrykket for den marginale sannsynligheten P (Y 1,1 i nevneren er det samme i begge tilfellene. c) Her kan vi gå fram på samme måte som i b), men med (i k, j k ) i stedet for (1, 1), og anb2-lsf-b 29. august 2016 Side 6

med p k (i, j) i stedet for p 0 (i, j). Se først på tilfellet (i, j) (i k, j k ). Der har vi p k (i k, j k ) P (X ik,j k 1 Y 1,1... Y ik 1,j k 1 P (X i k,j k 1, Y 1,1... Y ik 1,j k 1 P (Y 1,1... Y ik 1,j k 1 P (X i k,j k 1, Y 1,1... Y ik 1,j k 1 P (Y 1,1... Y ik 1,j k 1 P (Y ik,j k 0 X ik,j k 1) P (Y ik,j k 0 Y 1,1... Y ik 1,j k 1 p k 1 (i k, j k ) P (Y ik,j k 0 X ik,j k 1)/ (P (Y ik,j k 0 X ik,j k P (X ik,j k 0 Y 1,1... Y ik 1,j k 1 + P (Y ik,j k 0 X ik,j k 1)P (X ik,j k 1 Y 1,1... Y ik 1,j k 1 ) 1 l p k 1 (i k, j k ) 1 (1 p k 1 (i k, j k )) + (1 l)p k 1 (i k, j k ) 1 l p k 1 (i k, j k ) 1 p k 1 (i k, j k ) + p k 1 (i k, j k ) lp k 1 (i k, j k ) p k 1(i k, j k ) (1 l). 1 p k 1 (i k, j k )l For resten av cellene, altså de med (i, j) (i k, j k ), får vi på likne vis p k (i, j) P (X ij 1 Y 1,1... Y ik 1,j k 1 P (X ij 1, Y 1,1... Y ik 1,j k 1 P (Y 1,1... Y ik 1,j k 1 P (X ij 1, Y 1,1... Y ik 1,j k 1 P (Y 1,1... Y ik 1,j k 1 P (Y i k,j k 0 X ij 1, Y 1,1... Y ik 1,j k 1 P ((Y ik,j k 0 Y 1,1... Y ik 1,j k 1 p k 1 (i, j) P (Y ik,j k 0 X i,j 1)/ (P (Y ik,j k 0 X ik,j k P (X ik,j k 0 Y 1,1... Y ik 1,j k 1 + P (Y ik,j k 0 X ik,j k 1)P (X ik,j k 1 Y 1,1... Y ik 1,j k 1 ) 1 p k 1 (i, j) 1 (1 p k 1 (i k, j k )) + (1 l) p k 1 (i k, j k ) p k 1 (i, j) 1 p k 1 (i k, j k )l. d) Posteriorifordelingen kan f.eks. beregnes som følger. lik 0.9; po NaN(nx,ny); K 144; if K 0 po pr; anb2-lsf-b 29. august 2016 Side 7

for k 1:K [ik,jk] ind2sub([nx,ny],k); mlik 1 - lik*pr(ik,jk); for i 1:nx for j 1:ny if nx*(i-1)+j~k po(i,j) pr(i,j)./mlik; else po(i,j) pr(i,j).*(1-lik)./mlik; pr po; TMA4245 Statistikk Visualisering med imagesc kan gjøres som vist under. For å lage alle figurene oppgaven ber om må en bruke ulike verdier av K. figure(2); imagesc(po); title(sprintf( Posteriorifordeling (%i/%i celler unders{\\o}kt),k,nx*ny),... FontSize,18, Interpreter, Latex ) cbh2 colorbar; xlabel( i ) ylabel( j ) ylabel(cbh2, $P(X_{ij} 1 Y_{1,1} \ldots Y_{ij} $,... Interpreter, Latex, FontSize,16) Figur 4 viser sannsynlighetsfordelingen underveis i søket, etter at de første 89 cellene er undersøkt uten funn. I denne situasjonen er det størst sannsynlighet for at vraket befinner seg i den nederste delen av leteområdet, som ikke er undersøkt a. Når vi sammenlikner figur 3 og 5, ser vi at posteriorifordelingen etter at alle cellene er undersøkt uten funn er identisk med apriorifordelingen. Dersom vi leter gjennom hele området uten å finne noe, er vi altså like usikre på vrakets posisjon som vi var før vi begynte å lete. Det kan virke som om vi har mer informasjon etter å ha undersøkt 89 celler enn vi har etter å ha undersøkt alle 144, slik at vi tilsynelate har tapt informasjon ved å undersøke resten av leteområdet. Men vi kan også tolke dette som at vi har fått mer informasjon om hvor stor spredningen i sannsynlighetsfordelingen egentlig er. Etter å ha undersøkt alle cellene vet vi med andre ord mer om hvor mye (eller lite) vi egentlig vet. anb2-lsf-b 29. august 2016 Side 8

Figur 4: Posteriorifordelingen p 89 (i, j). Figur 5: Posteriorifordelingen p 144 (i, j). anb2-lsf-b 29. august 2016 Side 9