TMA4240 Statistikk Høst 2015

Like dokumenter
TMA4245 Statistikk Vår 2015

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

TMA4245 Statistikk Høst 2016

Q-Q plott. Insitutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk. Kvantiler fra sannsynlighetsfordeling

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2008

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

HØGSKOLEN I STAVANGER

TMA4240 Statistikk 2014

TMA4245 Statistikk Eksamen desember 2016

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Oppgave 1 a) La X være massen til et tilfeldig valgt egg, målt i gram. Sannsynligheten for at et tilfeldig valgt egg veier mer enn 60 g er

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Eksamen desember 2015

Binomisk fordeling. Hypergeometrisk fordeling. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi har følgende situasjon: = = 2

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Løsningsforslag, eksamen statistikk, juni 2015

TMA4240 Statistikk Høst 2015

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

TMA4240 Statistikk Høst 2015

Algoritme-Analyse. Asymptotisk ytelse. Sammenligning av kjøretid. Konstanter mot n. Algoritme-kompeksitet. Hva er størrelsen (n) av et problem?

TMA4240 Statistikk Høst 2015

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

i x i

Statistikk 1 kapittel 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

Bernoulli forsøksrekke og binomisk fordeling

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Statistikk 1 kapittel 5

Regneregler for forventning og varians

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

TMA4240 Statistikk 2014

Forelesning 13. mars, 2017

TMA4240 Statistikk Høst 2016

Fasit for tilleggsoppgaver

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

TMA4240 Statistikk H2015

Kapittel 4: Matematisk forventning

TMA4240 Statistikk Høst 2012

TMA4245 Statistikk Eksamen desember 2016

EKSAMEN I TMA4240 Statistikk

TMA4245 Statistikk Eksamen august 2014

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Følgelig vil sannsynligheten for at begge hendelsene inntreffer være null,

Løsningskisse seminaroppgaver uke 11 ( mars)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

TMA4245 Statistikk Høst 2016

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Oppfriskning av blokk 1 i TMA4240

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Vår 2007

To-dimensjonale kontinuerlige fordelinger

Betinget sannsynlighet

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Løsningskisse for oppgaver til undervisningsfri uke 14 (6.-9. april)

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Test, 3 Sannsynlighet og statistikk

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Løsning eksamen desember 2017

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2013

Kapittel 5: Tilfeldige variable, forventning og varians.

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Løsningskisse seminaroppgaver uke 15

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2018

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

MA1301/MA6301 Tallteori Høst 2016

Forelening 1, kapittel 4 Stokastiske variable

ØVINGER 2017 Løsninger til oppgaver. Lineærkombinasjonen Z = 5X + 8Y har forventningsverdi

LØSNING: Eksamen 22. mai 2018

TMA4240 Statistikk Høst 2012

Eksamensoppgave i TMA4245 Statistikk

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Transkript:

Norges teknisk-naturvitenskapelige universitet Institutt for ateatiske fag Øving nuer, blokk I Løsningsskisse Oppgave a X kan eksepelvis være resultatet av en flervalgsoppgave ed 0 sp og svaralternativ til hvert spørsål, der du for hvert sp gjetter på et av de fe alternativene Vi kan finne punktsannsynligheten for X ved P X P X 4, so vi kan slå opp i forelsalingen b N er totalt antallet objekter, hvorav k objekter kan beskrives so suksesser, ens de resterende N k objektene kan beskrives so ikke-suksesser Variabelen X beskriver antall suksesser blant n tilfeldige objekter trukket fra det totale antallet N Utfallsroet til X er slik at ax0, n N k x inn, k slik at vi i dette tilfellet har X {0,,, 7} c P X 6 6 4 03 4 03 6 4 004 For k har vi at X er geoetrisk fordelt ed paraeter p 03, og forventningsverdien er i dette tilfellet gitt ved EX /p Oppgave 2 X er hypergeoetrisk fordelt ed N 000 turer, k turer kjører transportfiraet gjenno sentru og N k 99 uteno sentru, og vi tar en stikkprøve av størrelse n Betingelser: Et tilfeldig utvalg av størrelse n tas uten tilbakelegging fra N enheter Her: et tilfeldig utvalg av n turer sjekket blant N turer so totalt kjøres De N enhetene deles inn i to grupper, k suksesser og N k fiaskoer Her: k turer kjøres gjenno sentru og N k 99 turer kjøres uteno sentru X er antallet suksesser blant de n Her: X er antall turer gjenno sentru av de n turene so ble sjekket Punktsannsynligheten i hypergeoetrisk fordeling, N 000, k, n er gitt so: 99 P X x x x og ulige verdier for x er 0,, 2, 3, 4, ovlsffinal 7 septeber 20 Side 000

99 P X 0 0 0 0972 000 Siden P X 0 097 å x 0 være den verdien av x so gir høyest punktsannsynlighet siden suen av alle punktsannsynligheter er kan ingen annen punktsannsynlighet være større enn -097 99 P X 0 2 0 3 000 Til saenligning er sannsynligheten for å vinne 7 rette i lotto 8 0 7 Koentar : Når N er stor i forhold til n boka nevner so toelfingerregel at n/n 00, og her er jo /000 000 så kan binoisk fordeling brukes so en tilnæring til hypergeoetrisk fordeling når vi regner ut sannsynligheter Da gjør vi n forsøk og i hvert forsøk sjekker vi o transporten skjer gjenno bykjernen, p k N 000 er sannsynlighet for transport gjenno bykjernen, og X er antall transporter gjenno bykjernen for de n undersøkt Da kan punktsansynligheten til X tilnæres ed n P X x k x N x k N n x x 000 x 000 x Videre er tilnæret: P X 0 P X 0 000 0 000 0 000 097 000 000 000 32 0 2 Koentar 2: Denne oppgaven er basert på en henvendelse fra en tidligere bygg-student, og er basert på faktiske forhold Dog, transportfiraet sa først at alle 000 turene var kjørt uteno bykjernen og kun etter at de be øtt ed fakta på at stikkprøve av turer viste transport gjenno bykjernen så inforerte de o at det kun var akkurat disse turene av de 000 so hadde blitt kjørt gjenno bykjernen La oss tenke oss at vi ser på dette so en hypotesetest, der vi ønsker å finne ut o det er grunn til å tro at transportfiraet har kjørt er enn k av turene gjenno bykjernen: H 0 : k vs H : k > P -verdien til testen ville vært å regne ut P X so vi har gjort i oppgaven, og denne er 2 0 3, so ville ført til at vi forkastet nullhypotesen og ville tro at flere enn transporter var kjørt gjenno bykjernen Men, dette var ikke ed i oppgaven Oppgave 3 Vi ser på en tilfeldig valgt natt og definerer følgende hendelser: A Anne er på vakt, B Bernt er på vakt, ovlsffinal 7 septeber 20 Side 2

C Cecilie er på vakt, D det skjer et dødsfall Og antar at alle dødsfall skjer naturlig a Venndiagra for de fire hendelsene: C B A D Siden det bare er Anne, Bernt og Cecilie so jobber på sykehjeet o natten vil hendelsene A, B og C utgjøre en partisjon av utfallsroet, og vi å ha at P A + P B + P C Dette ser vi også av venndiagraet Siden Bernt og Cecilie jobber like ofte å P B P C Siden Anne jobber dobbelt så ofte so hver av Bernt og Cecilie å P A 2 P B 2 P C Vi utrykker alt ved P B P A + P B + P C 2 P B + P B + P B P B 02 Dered har vi at P A 0 P B 02 P C 02 For å regne ut P D kan vi bruke setningen o total sannsynlighet Vi vet at A, B, C er en partisjon av utfallsroet P D P D A + P D B + P D C P D A P A + P D B P B + P D C P C 006 0 + 02 + 02 006 Definisjonen av uavhengighet sier at C og D er to uavhengige hendelser hvis og bare hvis P D C P D, dvs at tilleggsinforasjon ikke endrer bildet Vi ser fra utregningene over at P D C P D 006, og C og D er dered uavhengige hendelser Intuitivt vil uavhengighet av C og D følge av antagelsen o naturlig død b X er en stokastisk variabel so beskriver antall av n 0 naturlige dødsfall so skjer på Cecilies vakter Betingelser for at X er binoisk fordelt: ovlsffinal 7 septeber 20 Side 3

Vi ser på n 0 dødsfall For hver dødsfall sjekker vi o Cecilie var på vakt eller ikke TMA4240 Statistikk Sannsynligheten for at Cecilie er på vakt gitt at det har skjedd et dødsfall er P C D P C 02, og denne sannsynligheten er det sae for alle de n dødsfallene De n dødsfallene er uavhengige siden de er naturlige og vi antar dered at det ikke er snakk o sittsoe sykdoer eller epideier Under disse 4 betingelsene er X antall naturlig dødsfall på Cecilies vakter binoisk fordelt ed paraetere n 0 og p 02 Dered er sannsynlighetsfordelingen til X gitt ved punktsannsynligheten fx, n fx p x p n x, x 0,,, n x Sannsynligheten for at 7 eller flere av 0 dødsfall o natten skjer på Cecilies vakter finner vi enklest ved tabelloppslag s 3 i forelsalingen, P X 7 P X 6 0996 0004 La Y være en stokastisk variabel so angir antall sykepleiere blant 300 sykepleiere so opplever flere enn 7 dødsfall på sine vakter av totalt 0 dødsfall Y vil dered være binoisk fordelt ed n 300 og p 0004 Sannsynligheten for at inst en av de 300 sykepleierne opplever at 7 eller flere av 0 naturlige dødsfall skjer på sine vakter er gitt so P Y 300 P Y P Y 0 0004 0 0004 300 0 0 0996 300 03 07 Selv o det er lite sannsynlig bare 4 proille at det skjer 7 av 0 naturlige dødsfall på Cecilies vakter, er det svært sannsynlig 70 prosent at inst 7 av 0 dødsfall kan skje på vakten til en av sykepleierne i Norge so jobber i sae stillingstype so Cecilie Disse observasjonene styrker ikke istanken ot Cecilie Analogi: Hver uke er det so regel noen so får 7 rette i Lotto, selv o dette har en forsvinnende lav sannsynlighet for hver Lotto-spiller Oppgave 4 a Antall ulige tallkobinasjoner blir 0 4 0000 Sannsynligheten for å gjette riktig blir da p 0000 X er geotrisk fordelt ed paraeter p 0000 fordi det er bare to ulige utfall, gjette riktig eller feil, ed konstant sannsynlighet, hvert gjett er uavhengig av de forrige ovlsffinal 7 septeber 20 Side 4

gjettene, og X er antall gjett til og ed først suksess riktig gjett P X x p p x P X 300 299 0000 0000 b Antall åter å plassere to 7-tall blandt 4 posisjoner er 4 4 3 2 2 6 Antall ulige siffer på to gjenværende posisjoner er 9 2 8 geotrisk fordeling 9, 7 0 0303, 3 TMA4240 Statistikk Dette gir 6 8 486 Dered blir X geoetrisk fordelt ed p /486, Forventet tid til første vinner blir dered E[X] p 486 486 /2 in 243 in 4 tier 3 inutter c For å finne P Y ser vi på sannsynligheten for å gjette riktig på første forsøk, nelig / P Y For å finne P Y 2 ser vi på sannsynligheten for andre innringer gjetter riktig, satidig so første innringer gjetter galt Vi ser nå at vi tenker på situasjonene innringer nuer en gjetter riktig kode og innringer nuer to gjetter riktig kode så det vil være nyttig å definere hendelsene der i, 2,, Vi kan nå skrive P Y 2 P F 2 F c P F 2 F c P F c, F i : Innringer nuer i gjetter riktig kode der P F 2 F c er sannsynligheten for å gjette en riktig av ulige kobinasjoner Dered har vi P Y 2 P F 2 F c P F 2 F c P F c, For å finne P Y 3 fortsetter vi ed sae tankegang so over, P Y 3 P F 3 F2 c F c P F 2 F2 c F cp F 2 c F c P F 2 F2 c F cp F 2 c F cp F c 2 2 2 ovlsffinal 7 septeber 20 Side

Vi kan fortsette på sae åte so over for å finne fordelingen til Y Vi setter opp sannsynligheten P Y y P F c F c 2 F c y F y P F y F c F c 2 F c y P F c F c 2 F c y P F y F c F c 2 F c y P F c y F c F c 2 F c y 2 P F c 2 F c P F c y y y 2 2 Da blir fy P Y y for y, 2,, Forventet tid til noen vinner preien: Forventet tid blir da EY y y fy + 2 EY /2 in + 4 y y + 2 y y in 2 in 4 sec Oppgave a Rosinene er unifort fordelt i pakken En porsjon utgjør en te-del av pakken Hvis vi ser for oss fordelingen av rosiner i pakken, har vi at en rosin er i porsjon feks det øverste laget av frokostblanding i pakken eller ikke i porsjon Vi har dered utfallene rosinen er i porsjon kall dette en suksess og rosinen er ikke i porsjon kall dette en ikke-suksess Sannsynligheten for at en rosin er i porsjon er / da vi har antatt unifor fordeling i pakken Vi ser nå at plassering av n rosiner i pakken kan representeres so en Bernoulli-prosess, og totalt antall suksesser av n forsøk fordelingen til X vil følge en binoisk fordeling X Bin n, Hvis den første prosjonen inneholder x rosiner, er det n x rosiner igjen so fordeler seg på de øvrige porsjonene Den betingede fordelingen til X 2 gitt at X x er dered binoisk ed paraetre n x og /, [X 2 X ] Bin n x, ovlsffinal 7 septeber 20 Side 6

Første prosjon inneholder inst en rosin ed sannsynlighet P X P X 0 n TMA4240 Statistikk Krever vi at denne sannsynligheten skal være større enn eller lik β, får vi følgende ulikhet, so kan løses ed hensyn til n, P X β n β n β n log log β log β n log Ulikheten snur fra nest siste til siste linje fordi log / < 0 b X og X 2 er ikke uavhengige Jo flere rosiner so er inneholdt i den første porsjonen, jo færre rosiner vil en forvente å finne i den andre porsjonen Korrelasjonskoeffisienten ello X og X 2 er negativ, siden en økning i den ene variabelen er forbundet ed en forventet reduksjon av den andre Den negative saenhengen blir særs tydelig når 2, slik at X + X 2 n Den siultane punktsannsynligheten til X og X 2 er P X x, X 2 x 2 P X x P X 2 x 2 X x n x n x n x 2 n x x 2 x x 2 n n x x x n 2 x x 2 n x n x x 2 2 n x x 2 x, x 2, n x x 2 n x 2 n x x 2 x, x 2, n x x 2 Variablene X, X 2 og i3 X i n X X 2 følger den ultinoiske sannsynlighetsfordelingen ed paraetre n og p /, /, 2/ T c Forventingsverdien til indikatorvariabelen Y er EY 0 P Y 0 + P Y P Y P X 0 n Siden arginalfordelingene til Y, Y 2,, Y er like, har vi EY i EY for i 2, 3,,, so gir EW E Y i EY i EY n i i ovlsffinal 7 septeber 20 Side 7 n x x 2

Variansen til Y er VarY 0 EY 2 P Y 0 + EY 2 P Y n 2 n + n 2 n n [ n + n ] }{{} n 2n n Kovariansen ello Y og Y 2 er CovY, Y 2 EY Y 2 EY EY 2 y y 2 P Y y, Y 2 y 2 EY 2 y 0 y 2 0 Variansen til W er VarW Var Y i P Y, Y 2 EY 2 P Y P Y 2 Y P X 0 2 P X 0P X 2 0 X 0 P X 0 2 n 2 n [ n ] 2 2 n 2n i VarY i + i i CovY i, Y j j i j VarY + CovY, Y 2 [ n ] 2n [ 2 n ] 2n + ovlsffinal 7 septeber 20 Side 8