TMA4245 Statistikk Høst 2016

Like dokumenter
Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Eksempel: kast med to terninger

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2009

Foreleses onsdag 8. september 2010

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

TMA4240 Statistikk H2015

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Kapittel 2: Hendelser

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

TMA4240 Statistikk Høst 2015

To-dimensjonale kontinuerlige fordelinger

TMA4240 Statistikk Høst 2007

Oppgave 1 a) La X være massen til et tilfeldig valgt egg, målt i gram. Sannsynligheten for at et tilfeldig valgt egg veier mer enn 60 g er

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Oppfriskning av blokk 1 i TMA4240

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

TMA4240 Statistikk Høst 2015

Bootstrapping og simulering Tilleggslitteratur for STK1100

TMA4240 Statistikk Eksamen desember 2015

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

Regneøvelse 22/5, 2017

TMA4245 Statistikk Høst 2016

TMA4240 Statistikk Høst 2008

TMA4120 Matematikk 4K Høst 2015

TMA4240 Statistikk Høst 2009

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2016

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Oblig 1 i MAT2400. Oppgave 1. Tor Hedin Brønner. a) Vi tar integralet av f X (x) fra til x: = 1. Medianen, µ, finner vi ved å sette.

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

UNIVERSITETET I OSLO

Medisinsk statistikk Del I høsten 2009:

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100

Bootstrapping og simulering

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015

Øving 1 TMA Grunnleggende dataanalyse i Matlab

i x i

UNIVERSITETET I OSLO

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

TMA4240 Statistikk 2014

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Vi regner først ut de nødvendige partiellderiverte for å se om vektorfeltet er konservativt. z = 2z, F 2 F 2 z = 2y, F 3. x = 2x, F 3.

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

= x lim n n 2 + 2n + 4

MA1102 Grunnkurs i analyse II Vår 2019

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

TMA4240 Statistikk Eksamen desember 2015

EKSAMEN I TMA4245 Statistikk

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

TMA4100 Matematikk 1 Høst 2014

Stokastisk variabel. Eksempel augefarge

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Forelesning 3. april, 2017

TMA4240 Statistikk 2014

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 11. juni HiS Jørstadmoen. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

Tabell 1: Beskrivende statistikker for dataene

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Oppgavene er hentet fra fagets lærebok, Hass, Weir og Thomas, samt gamle eksamener.

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Kapittel 4.4: Forventning og varians til stokastiske variable

Tema 2: Stokastiske variabler og sannsynlighetsfordelinger Kapittel 3 ST :44 (Gunnar Taraldsen)

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2012

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

ST0202 Statistikk for samfunnsvitere

MA1102 Grunnkurs i Analyse II Vår 2015

Bernoulli forsøksrekke og binomisk fordeling

TMA4240 Statistikk Høst 2012

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Prøveeksamen i MAT 1100, H-03 Løsningsforslag

Forelesning 27. mars, 2017

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Som vanlig er enkelte oppgaver kopiert fra tidligere års løsningsforslag. Derfor kan notasjon, språk og stil variere noe fra oppgave til oppgave.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Eksamen i TMA4122 Matematikk 4M

NTNU Institutt for matematiske fag. TMA4100 Matematikk 1 høsten Løsningsforslag - Øving 8. Oppgave 1. Oppgave 2

Forslag til endringar

Løsningsforslag øving 8, ST1301

TMA4245 Statistikk Eksamen august 2014

Løsningsforslag Eksamen S2, høsten 2017 Laget av Tommy O. Sist oppdatert: 26. november 2017

Binomisk sannsynlighetsfunksjon

Kontinuerlige sannsynlighetsfordelinger.

TMA4240 Statistikk 2014

Løsningsforslag, eksamen MA1101/MA6101 Grunnkurs i analyse I, vår 2009

UNIVERSITETET I OSLO

STK Oppsummering

Transkript:

TMA5 Statistikk Høst 6 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving Løsningsskisse Oppgave a) Den tilfeldige variabelen X er kontinuerlig fordelt med sannsynlighetstetthet nx n dersom < x f X (x). ellers Den kumulative fordelingsfunksjonen F er lik det bestemte integralet av sannsynlighetstettheten f fra til x. Siden f(x) for x setter vi som nedre grense for integralet, F (x) x f(t)dt x nt n dt [t n ] x xn. Fordelingsfunksjonen F (x) gir sannsynligheten for at X x, og kan brukes til å finne sannsynligheten for at / < X 3/, P ( < X 3 ) ( P X 3 ) ( P X ) F Setter vi inn n får vi og med n får vi P P ( ) 3 F ( < X 3 ) ; n 3, ( < X 3 ) ; n ( ) 3 ( ) ( ) 9 6 6. For å bestemme medianen til X setter vi P (X a) F (a) /, slik at F (a) a n. ( ) 3 n ( ) n. Medianen er altså a / dersom n / dersom n. anb3-lsf-b 5. september 6 Side

Forventningsverdien til X er lik integralet av xf(x) fra til, E(X) xf(x)dx nx n dx xnx n dx n n + / dersom n /3 dersom n. TMA5 Statistikk Høst 6 For n er medianen og forventningsverdien identiske, mens for n er medianen størst ( /.7 > /3). b) Histogrammet f X (x) kan plottes på følgende måte: data3load ( data3. txt ) ; histogram ( data3, Normalization, pdf ) Vi bruker her innstillingene Normalization og pdf for å få et normalisert histogram slik at vi kan sammenligne historgrammet med sannsynlighetstettheten f X (x). Sannsynlighetstettheten f X (x) kan for eksempel plottes slik: n; xl i n s p a c e (,, 3 ) ; fn x. ˆ ( n ); p l o t ( x, f ) Resultatet er vist i Figur. Vi ser at sannsynlighetstettheten stemmer godt overens med histogrammet, selv om vi har få observasjoner som har verdi lavere enn.5. Den empiriske kumulative fordelingsfunksjonen og fordelingsfunksjonen kan plottes på følgende måte: e c d f ( data3 ) Fx. ˆ n p l o t ( x, F) Resultatet er vist i Figur. Den empiriske fordelingen ˆF (x) har samme fasong som den teoretiske fordelingen F (x), men den empiriske fordelingen tar noe lavere verdier. Andel av observasjonene som er mellom og 3 er: mean( data3 >(/) & data3 <(3/)) ans.67 Kommandoen data3>(/) returner en vektor av lengde 3 med verdi for alle observasjoner i data3 som er større enn og ellers. Tilsvarende gir data3<(3/) for alle observasjoner mindre enn 3. Merk at & er og operatoren i Matlab, dvs. den sammenligner de to vektorene og returner en ny vektor av lengde 3 der hvert element har verdi anb3-lsf-b 5. september 6 Side

TMA5 Statistikk Høst 6 dersom både data3>(/) og data3<(3/) har verdi. Den søkte sannsynligheten finnes ved å ta gjennomsnittet. Medianen til observasjonene er: median ( data3 ) ans.775 Forventningsverdien til observasjonene er: mean( data3 ) ans.7 Sammenligner vi dette med de teoretiske resultatene i a) ser vi at estimatene våre er i nærheten av de teoretiske verdiene. Figur : Histogram over de 3 observasjonene og sannsynlighetstettheten f X (x). Figur : Empirisk kumulativ fordelingsfunksjon ˆF (x) og fordelingsfunksjonen F (x) basert på 3 observasjoner c) Vi studerer nå det store datasettet og gjentar deloppgave b). Vi plotter historgrammet, sannsynlighetstettheten, den empiriske og den teoretiske kumulative fordelingsfunksjonen som tidligere: anb3-lsf-b 5. september 6 Side 3

TMA5 Statistikk Høst 6 data3load ( data3. txt ) ; %Histogram og s a n n s y n l i g h e t s t e t t h e t : histogram ( data3, Normalization, pdf ) n; xl i n s p a c e (,, 3 ) ; fn x. ˆ ( n ) p l o t ( x, f ) %Kumulativ f o r d e l i n g : e c d f ( data3 ) Fx. ˆ n p l o t ( x, F) De resulterende plottene er gitt i Figur 3 og. Vi ser at de teoretiske fordelingene stemmer godt overens med observasjonene. Merk at siden vi har flere observasjoner vil Matlab øke antallet søyler/bins. Andel av observasjonene som er mellom og 3 mean( data3 >(/) & data3 <(3/)) ans.97 Medianen til observasjonene er: median ( data3 ) ans.75 Forventningsverdien til observasjonene er: mean( data3 ) ans.67 er nå: Vi ser at vi i dette tilfellet oppnår estimater nærmere den teoretiske verdien enn i oppgave b). Estimatene er altså nærmere de teoretiske, utregnede verdiene fra oppgave a). Dersom man har et sett med observasjoner som er trukket fra en bestemt fordelingsfunksjon f X (x), kan man forvente at medianen og gjennomsnittet til observasjonene vil komme nærmere og nærmere de teoretiske verdiene når størrelsen på datasettet øker. I grensen, dvs. med uendelig mange observasjoner kan en forvente å få eksakt den teoretisk verdien. Oppgave Togforsinkelsen Eksamen desember 3, oppgave av 3 Oppgitt: x r e ax dx r! a r+ for a >, r heltall. anb3-lsf-b 5. september 6 Side

TMA5 Statistikk Høst 6 Figur 3: Histogram over de 3 observasjonene og sannsynlighetstettheten f X (x). Figur : Empirisk kumulativ fordelingsfunksjon ˆF (x) og fordelingsfunksjonen F (x) basert på 3 observasjoner. a) For at g(x) skal være en sannsynlighetstetthet, må vi ha sannsynlighet er. (Bruker formelen med r og a.) k/ gir k. g(x)dx kxe x dx k k. For forventet forsinkelse brukes formelen igjen, med r og a : g(x)dx, dvs at total E(X) xg(x)dx x xe x dx x e x dx 3. For å vise at det er.9 i sannsynlighet for mer enn to minutters forsinkelse, bruker vi delvis integrasjon. anb3-lsf-b 5. september 6 Side 5

TMA5 Statistikk Høst 6 Prob(X > ) xe x dx [ ] xe x + x e + e x dx e + e 5e.9. e x dx b) V er binomisk fordelt med n og p.9 under forutsetning av at Hendelsene mer enn minutter forsinket for to forskjellige dager er uavhengige. Sannsynligheten for mer enn minutter forsinket er lik.9 hver dag. Antall forsøk (dager) er bestemt på forhånd, det er to utfall og vi teller antall suksesser. (Togselskapet ville neppe kalle en dag med mer enn to minutters forsinkelse for en suksess.) Prob(V ) Prob(V ) Prob(V ) Prob(V ).9.9.9.6. Ser vi på et år med n virkedager, er V binomisk(,.9). Da kan vi bruke tilnærmingen til normalfordelingen, dvs 3 + /.9 Prob(V > 3) Prob(V 3) Φ(.9 (.9) Φ(.5).59. c) Setter x i den betingede fordelingen. Da har oppholdstiden Y fordeling f(y ) e y for y >. Med andre ord er Y X eksponensialfordelt med parameter (og forventningsverdi). Simultantetthet finner vi ved å multiplisere; f(x, y) f(y x)g(x) x xy e xe x x e x(+ y ) for x >, y >. Marginaltettheten for Y finnes ved å integrere ut x: h(y) f(x, y)dx x e x(+ y ) dx ( + y 3, for y >. )3 ( + y) 3 Her brukte vi enda en gang formelen som var oppgitt, denne gangen med a + y/ og r. anb3-lsf-b 5. september 6 Side 6

Oppgave 3 TMA5 Statistikk Høst 6 Vi ønsker å finne sannsynligheten for at summen av X og Y er mindre enn 6 minutter, altså P (X + Y 6). Vi vet at X og Y er uavhengige, slik at f(x, y) g(x)h(y). Dermed er simultanfordelingen gitt ved f(x, y) 3 3 for < x < 3, < y < 5, ellers Vi observerer at hendelsen X + Y 6 vil oppstå hvis X tar verdier < x < 6 y, for enhver Y, slik at < y < 5. Dermed kan vi integrere simultantettheten over dette området for å regne ut sannsynligheten, P (X + Y 6) 5 6 y 5 6 y 5 5 [ 3.833 [ 3 3 3 f(x, y)dxdy 3 3 dxdy 3 x ] 6 y dy (6 y)dy 3 (6y y )] 5 anb3-lsf-b 5. september 6 Side 7