Oppgave 1: Feil på mobiltelefoner



Like dokumenter
> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk Høst 2009

Kontinuerlige sannsynlighetsfordelinger.

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

EKSAMEN I TMA4245 Statistikk

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

EKSAMEN I EMNE TMA4245 STATISTIKK

TMA4240 Statistikk Høst 2016

STK Oppsummering

Litt mer om eksponensialfordelingen

TMA4240 Statistikk Høst 2015

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Eksamen desember 2015

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Regler i statistikk STAT 100

TMA4240 Statistikk Høst 2015

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Regneøvelse 22/5, 2017

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240 Statistikk 2014

HØGSKOLEN I STAVANGER

Fasit for tilleggsoppgaver

Løsningsforslag eksamen 27. februar 2004

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Løsningsforslag til obligatorisk innlevering 3.

UNIVERSITETET I OSLO

Løsningsforslag Til Statlab 5

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Ridge regresjon og lasso notat til STK2120

TMA4240 Statistikk Høst 2009

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

ECON2130 Kommentarer til oblig

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

Løsningsforslag: STK2120-v15.

TMA4240 Statistikk Høst 2009

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Eksamen desember 2015

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

Om eksamen. Never, never, never give up!

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk 2014

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Om eksamen. Never, never, never give up!

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Eksamensoppgave i TMA4245 Statistikk

Statistikk og dataanalyse

La U og V være uavhengige standard normalfordelte variable og definer

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Kapittel 2: Hendelser

Kort overblikk over kurset sålangt

UNIVERSITETET I OSLO

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

EKSAMEN I TMA4240 Statistikk

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4240 Statistikk Høst 2012

Løsning eksamen desember 2017

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

Eksamen i. MAT110 Statistikk 1

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

HØGSKOLEN I STAVANGER

Forslag til endringar

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Emnenavn: Grunnleggende matematikk og statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Løsningsforslag Eksamen S2, høsten 2017 Laget av Tommy O. Sist oppdatert: 26. november 2017

Kap. 8: Utvalsfordelingar og databeskrivelse

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Høgskolen i Gjøviks notatserie, 2001 nr 5

ØVINGER 2017 Løsninger til oppgaver. Øving 1

Eksamensoppgave i TMA4295 Statistisk inferens

Transkript:

Oppgave 1: Feil på mobiltelefoner a) Sannsynlighetene i oppgaven blir P (F 1 F 2 ) P (F 1 ) + P (F 2 ) P (F 1 F 2 ) P (F 1 ) + 1 P (F2 C ) P (F 1 F 2 ) 0.080 + 0.075 0.006 0.149 P (F 1 F 2 ) P (F 1 F 2 ) P (F 2 ) P (F 1 F 2 ) 1 P (F C 2 ) 0.006 1 0.925 0.080 P (F C 1 F C 2 ) P ((F 1 F 2 ) C ) 1 P (F 1 F 2 ) 1 0.149 0.851 Siden P (F 1 F 2 ) P (F 1 ) er F 1 og F 2 uavhengige. Vi har også at P (F 1 ) P (F 2 ) P (F 1 ) (1 P (F C 2 )) 0.080 (1 0.925) 0.006 P (F 1 F 2 ), som betyr at F 1 og F 2 er uavhengige. To hendelser er disjunkte dersom snittet er den tomme mengde, som oppfyller P ( ) 0. Siden P (F 1 F 2 ) > 0, må F 1 F 2, og F 1 og F 2 er ikke disjunkte. b) Sannsynligheten for at en mottatt klage gjelder feil av type 2: Ved å bruke Bayes regel får vi at P (F 2 R) P (F 2 R) P (R F 2)P (F 2 ) P (R F 2)(1 P (F2 C) 0.70 (1 0.925) 0.35 Sannsynligheten for at en mottatt klage gjelder feil av type 1 eller 2: 1

P (F 1 F 2 R) P ((F 1 F 2 ) R) P ((F 1 R) (F 2 R)) P (F 1 R) + P (F 2 R) P (F 1 F 2 R) P (R F 1)P (F 1 ) + P (R F 2 )P (F 2 ) P (R F 1 F 2 )P (F 1 F 2 ) 0.90 0.080 + 0.70 (1 0.925) 0.95 0.006 0.1188 0.792 Alternativ metode: Bruker addisjonssetninga, og deretter Bayes regel på hvert ledd i summen. P (F 1 F 2 R) P (F 1 R) + P (F 2 R) P (F 1 F 2 R) P (R F 1)P (F 1 ) + P (R F 2)P (F 2 ) P (R F 1 F 2 )P (F 1 F 2 ) P (R F 1)P (F 1 ) + P (R F 2 )P (F 2 ) P (R F 1 F 2 )P (F 1 F 2 ) 0.90 0.080 + 0.70 (1 0.925) 0.95 0.006 0.1188 0.792 Oppgave 2 - Trafikkmåling a) Vi finner sannsynlighetene ved å slå opp i tabell: P (X > 20) P (X 20) 1 0.9170 0.0830 P (10 X < 20) P (X 19) P (X 9) 0.8750 0.0699 0.8051. Utleder E(X) ved å benytte definisjonen av forventningsverdi E(X) x x f(x) λe λ x1 x0 λ x 1 (x 1)! λe λ x λx x! e λ e λ y0 x0 x λx x! e λ 0 + e λ λ y y! λ e λ e λ λ. x1 x λx x! Som stemmer med resultatet i formelsamlingen. I nest siste overgangen gjenkjenner vi taylorrekka til e λ. 2

b) Ved bruk av sentralgrenseteoremet har vi at ˆλ E(ˆλ) n(0, 1), V ar(ˆλ) siden ˆλ er gjennomsnittet av uavhengige og identisk fordelte stokasiske variable. Finner E(ˆλ) og V ar(ˆλ), ( ) 1 n E(ˆλ) E X i 1 n E(X i ) λ n n } {{ } λ ( ) 1 n V ar(ˆλ) V ar X i 1 n n n 2 V ar(x i ) λ/n. } {{ } λ Dette betyr at P ( z α/2 < ˆλ λ λ/n < z α/2 ) 1 α, hvor z α/2 er α/2 kvantilen i standard normalfordelingen. Det er vanskelig å løse denne ulikheten mht på λ så vi velger derfor å bytte ut λ med ˆλ i nevner P z α/2 < ˆλ λ < z α/2 1 α. ˆλ/n Løser så mhp λ Vi vet da fra (1) at invervallet P ) (ˆλ z α/2 ˆλ/n < λ < ˆλ + z α/2 ˆλ/n 1 α. (1) [ˆλ z α/2 ˆλ/n, ˆλ + zα/2 ˆλ/n ] tilnærmet sannsynlighet 1 α (når n er tilstrekkelig stor). dekker den ukjente λ med Numerisk: ˆλ 1 n n x i 359/30 11.9667. Setter inn i konfidensintervallet og får [11.9667 2.576 11.9667/30, 11.9667 + 2.576 11.9667/30] [10.02, 13.91] c) Likelihoodfunksjonen er lik simultanfordelingen til dataene, L(λ; x 1,..., x n, y 1,..., y m ) n λ x i x i! e λ m (λ/2) y j j1 y j! P n e λ/2 λ( x i) n x i! P m (λ/2)( j1 y j) e nλ m j1 y e mλ. j! 3

Tar som vanlig logaritmen av likelihoodfunksjonen og får l(λ; x 1,...,x n, y 1,..., y m ) n n m m ln(λ) x i ln( x i!) nλ + ln(λ/2) y j ln( y j!) mλ/2. j1 j1 (2) Ønsker nå å finne den verdien av λ som maksimerer likelihoodfunksjonen. Finner dette ved å deriverere (2), sette 0 og løse mht på λ dl dλ n x m i j1 n + y j m/2 0 λ λ n m λ(n + m/2) x i + y j. j1 λ Dermed får vi sannsynlighetsmaksimeringsestimatoren n ˆλ x i + m j1 y j. n + m/2 Oppgave 3 - Tomat-produksjon Vi gjennkjenner dette som en regresjonsmodel: hvor E n(e; 0, 15). Y 100 + β(x x r ) + E, a) La x x r som gir at Y r 100 + E n(y r ; 100, 15) P (Y r > 110) 1 P (Y r 110) 1 P ( Y r 100 110 100 < ) 15 15 1 Φ(0.667) 0.2514 90 100 P (90 < Y r < 110) 1 P ( < Y r 100 15 15 Φ(0.667) Φ( 0.667) 0.7486 0.2514 0.4972 < 110 100 ) 15 P (En mer enn dobbelt så tung som den andre) 2P (Y 1 r > 2Y 2 r ) 2P (Y 1 r 2Y 2 r > 0), 4

hvor Yr 1 2Yr 2 n( 100, (15 2 + 4 15 2 )). Dette gir videre 2 P (Yr 1 > 2Yr 2 ) 2P ( Y r 1 2Yr 2 ( 100) > 100 ) 5 15 5 15 2(1 Φ(2.98)) 2(1 0.9986) 0.0028 b) Drivhus lysintensitet: x 1,..., x 5 Observasjoner: Y ij, i 1,..., 5, j 1,..., 3 Velger å finne en estimator ved å bruke maksimum likelihood metoden. (Det finnes klart andre måter å finne estimatorer på som feks minste kvadraters metode eller mer på ren intuisjon.) L(β) 3 Tar som vanlig logaritmen l(β) 5 j1 3 j1 { const exp 1 } 2 15 2 [y ij 100 β(x i x r )] 2 5 { const 1 } 2 15 2 [y ij 100 β(x i x r )] 2 Derviverer så l(β) mht β og setter 0. Løser så mht β. Dette vil da være maksimum likelihoodestimatoren som gir estimatoren dl(β) dβ 3 j1 5 [y ij 100 β(x i x r )] ( (x i x r )) 0 j1 ˆβ (Y ij 100)(x i x r ) (x. i x r ) 2 Vi sjekker nå forventnigen til estimatoren vi har funnet. Hvis estimatoren er forventningsrett, er alt vel og bra, hvis ikke må vi gjøre en justering for å få den forventningsrett, dette er da typisk å multiplisere med en passende konstant. [ E( ˆβ) j1 E (Y ] ij 100)(x i x r ) j1 E[(Y ij 100)](x i x r ) 5 β(x i x r )(x i x r ) β 3 j1 5

Altså er estimatoren vi har funnet forventningsrett! Videre skal vi nå finne variansen til estimatoren [ V ar( ˆβ) j1 V ar (Y ] ij 100)(x i x r ) j1 (x i x r ) 2 V ar((y ij 100)) [ ] 2 152 [ (x i x r ) 2 ] 2 15 2 c) Prediktoren er Ŷ0 100 + ˆβ(x 0 x r ). Fra oppgaveteksten har vi at ˆβ 2.0 og at x 0 x r 5 som gir at ŷ 0 110. Vi undersøker prediksjonsfeil ved å ta utgangspunkt i fordelingen til Y 0 Ŷ0. (3) Først observerer vi at (3) er normalfordelt fordi det kun er en lineærkombinasjon av normalfordelte stokastiske variable. Det neste er da å finne forventning og varians i denne normalfordelingen, E(Y 0 Ŷ0) E(Y 0 ) E(Ŷ0) 100 + β(x 0 x r ) (100 + E( ˆβ)(x 0 x r )) 0 V ar(y 0 Ŷ0) V ar(y 0 ) + V ar(ŷ0) 15 2 + (x 0 x r ) 2 V ar( ˆβ) 15 2 + 5 2 1.2 255. I den første overgangen i utregning av varians kan vi gjøre fordi Y 0 og Ŷ0 er uavhengige. Dette er de fordi Ŷ 0 kun er en funksjon av observesjonene Y ij, i 1,..., 5, j 1,..., 3 og altså ikke Y 0 (alle Y ene er uavhengige pr definisjon i regresjonsmodellen). Dermed har vi at Y 0 Ŷ0 0 255 n(0, 1), som gir at P ( z 0.025 < Y 0 Ŷ0 0 255 < z 0.025 ) 0.95. Løser så med hensyn på det ukjente (Y 0 ) og får at Y 0 ligger i intervallet [ ŷ 0 z 0.025 255, ŷ 0 + z 0.025 255 ] [78.7, 141.3] med 95% sannsynlighet. 6