TMA4240 Statistikk Høst 2018

Like dokumenter
for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen august 2014

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Eksamensoppgave i TMA4240 Statistikk

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk Høst 2016

i x i

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2015

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Løsningsforslag eksamen 27. februar 2004

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

TMA4240 Statistikk Høst 2015

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2016

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Høst 2009

LØSNINGSFORSLAG ) = Dvs

EKSAMEN I FAG TMA4240 STATISTIKK

Løsningsforslag eksamen 25. november 2003

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4245 Statistikk

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Eksamensoppgave i TMA4245 Statistikk

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO Matematisk Institutt

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1: Feil på mobiltelefoner

EKSAMEN I TMA4240 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

HØGSKOLEN I STAVANGER

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

TMA4240 Statistikk Høst 2015

Eksamensoppgåve i TMA4240 Statistikk

TMA4240 Statistikk Høst 2007

Utvalgsfordelinger (Kapittel 5)

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk H2010

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Kapittel 4.4: Forventning og varians til stokastiske variable

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Eksamensoppgave i TMA4240 Statistikk

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

STK1100 våren 2019 Mere om konfidensintevaller

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

Tilleggsoppgaver for STK1110 Høst 2015

TMA4240 Statistikk H2010

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Eksamensoppgåve i TMA4245 Statistikk

TMA4240 Statistikk H2010 (20)

HØGSKOLEN I STAVANGER

Om eksamen. Never, never, never give up!

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

TMA4240 Statistikk Høst 2012

Om eksamen. Never, never, never give up!

UNIVERSITETET I OSLO

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Kort overblikk over kurset sålangt

UNIVERSITETET I OSLO

Fasit for tilleggsoppgaver

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Transkript:

TMA4240 Statistikk Høst 2018 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 5 Dette er andre av tre innleveringer i blokk 2. Denne øvingen skal oppsummere pensum forelest frem til og med uke 44. Spesielt er det i denne innleveringen fokus på konfidens- og prediksjonsintervall. For å få godkjent innleveringen kreves det at minimum 40% av svarene er riktige, og at man har gjort et ordentlig forsøk på å løse alle oppgavene. Alle deloppgaver teller like mye. Oppgave 1 En metallurg har vært med på å utvikle en ny legering, og skal presentere ulike egenskaper ved legeringen til sine kolleger. Vi skal her se på bestemmelse av smeltepunktet til legeringen. På grunn av mindre variasjoner i sammensetningen av legeringen, målefeil og lignende, kan gjentatte målinger av smeltepunktet til legeringen antas å være realisasjoner av uavhengige og normalfordelte variabler med forventningsverdi µ og kjent standardavvik σ = 2 C. a) Anta først (kun i dette punktet) at forventningsverdien er µ = 1468 C. Metallurgen tar en måling av smeltepunktet. Hva er sannsynligheten for at observert smeltepunkt er lavere enn 1467 C? Anta så at metallurgen tar åtte uavhengige målinger av smeltepunktet, X 1, X 2,..., X 8. Hva er sannsynligheten for at gjennomsnittet av de åtte målingene av smeltepunktet, X = 1 8 8 i=1 X i, ligger mellom 1467 C og 1469 C? Anta i resten av oppgaven at forventningsverdien til legeringens smeltepunkt, µ, er ukjent, men at standardavviket er kjent og lik σ = 2 C. b) Utled et 90% konfidensintervall for µ basert på n uavhengige målinger av smeltepunktet, X 1, X 2,..., X n. Metallurgen vil ikke at lengden på intervallet skal overstige 3 C, og har funnet ut at n 5 målinger garanterer dette. Bruk de 5 første observasjonene gitt i tabell 1 til å bestemme intervallet numerisk. x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 1467.4 1468.0 1471.6 1468.6 1468.8 1471.9 1469.4 1466.0 Tabell 1: Data over smeltepunkt i C. Det oppgis at gjennomsnittet av de 8 observasjonene er 1469.0 C. inn5-oppg-b 17. oktober 2018 Side 1

Oppgave 2 Vi skal i denne oppgaven se på høydefordelingene til menn og kvinner. Anta at høyden til menn er normalfordelt med forventningsverdi µ M = 179 og varians σ 2 M = 62, og at høyden til kvinner er normalfordelt med forventningsverdi µ K og varians σ 2 K a) Finn sannsynligheten for at en tilfeldig valgt mann er over 185 cm. Finn sannsynligheten for at en mann er over 185 cm gitt at han er over 179 cm. b) La µ K = β µ M, der β er en ukjent parameter vi ønsker å estimere. Anta at vi har høydedata fra et tilfeldig utvalg på n = 5 kvinner; X i N(µ K, σk 2 ), i = 1, 2,..., n. n Som estimator for β velges ˆβ i=1 = X i nµ M Er ˆβ forventningsrett? Utled et uttrykk for et 95% konfidensintervall for β, og finn tallsvar når vi fra data får x = n i=1 x i/n = 167.5 og s 2 = 1 n i=1 n 1 (x i x) 2 = 5.1 2. Oppgave 3 En sjokoladefabrikk ønsker å måle porøsiteten i sjokoladeplatene på samlebåndet. Eieren har anskaffet seg nytt måleutstyr. Utstyrsleverandøren oppgir at måleutstyret har normalfordelt feil med forventning µ = 0 og varians σ 2 m = 0.0009. a) Anta at oppgitt målefeil er korrekt. Regn ut sannsynligheten for at utstyret måler en porøsitet som er høyere enn det porøsiteten egentlig er. Regn ut sannsynligheten for at målefeilen er større enn 0.05. Hvis en tar to uavhengige målinger med utstyret og bruker gjennomsnittet av disse som måling, hva er da sannsynligheten for at avviket mellom målt og sann porøsitet er større enn 0.05? Sjokoladefabrikkeieren godtar at µ = 0, men tviler på at målevariansen som er oppgitt er korrekt. Han utfører derfor fem uavhengige måleforsøk på en referanse-sjokoladeplate med kjent porøsitet på eksakt 0.15: 0.153 0.132 0.128 0.174 0.163 Du kan se bort fra avrundingsfeilen i fjerde desimal i målingene. b) Skriv opp den beste forventningsrette estimatoren for målevariansen basert på måleserien og antakelsene over. Begrunn valget ditt. Skriv opp fordelingen til estimatoren, vis at den er forventningsrett og finn variansen til estimatoren. Utled et 95% konfidensintervall for den korrekte målevariansen. Kommentér resultatet.

Oppgave 4 En målestasjon for luftforurensning registrerer innholdet av såkalt inhalerbart støv (dvs. partikler med midlere diameter opptil 1/100 mm) i lufta. La X (med enhet milliondels gram pr m 3 ) være en måling av innholdet av inhalerbart støv på en tilfeldig valgt dag. Målinger av X på ulike dager antas stokastisk uavhengige. a) Under vanlige forhold antas at X er normalfordelt med forventning µ = 35 og varians σ 2 = 25. (Dette skal antas bare i dette punktet). Finn sannsynligheten for at en måling X er over 40, P (X > 40). Finn også sannsynligheten for at X er mellom 30 og 40, P (30 < X < 40). Finn sannsynligheten for at summen av målinger på to ulike dager er over 80. Anta at de to målingene er uavhengige. I en kommune finnes n slike målestasjoner. Fra disse får vi i løpet av en dag målinger X 1, X 2,..., X n som antas uavhengige og identisk normalfordelte med forventning µ og varians σ 2, der både µ og σ er ukjente parametre. Her vil µ angi graden av forurensning. Anta at n = 5 og at det en dag gjøres følgende målinger av X 1,..., X 5 : 252, 311, 268, 287, 302 For senere bruk oppgis at 5 i=1 X i = 1420 og 5 i=1 (X i X) 2 = 2342. b) Hvilke egenskaper bør en god estimator ha? Sett opp en forventningsrett estimator ˆµ for µ basert på X 1,..., X n. Finn variansen til ˆµ. (Vis hvordan du regner den ut). Sett også opp en estimator for σ 2 og bruk denne til å finne en estimator for variansen til ˆµ. c) Utled et 95% konfidensintervall for µ. Regn ut tallsvar for intervallgrensene når dataene er som gitt ovenfor. Anta at det egentlig er 6 målestasjoner i kommunen, men at det på den dagen de 5 observasjonene ovenfor ble gjort, skjedde en feil ved avlesningen fra den siste stasjonen. d) Utled et intervall som med en sannsynlighet på 95% inneholder den ukjente målingen ved denne stasjonen. Hva kaller vi et slikt intervall? Hvorfor er dette intervallet bredere enn konfidensintervallet fra punkt c)? Oppgave 5 En gartner har spesialisert seg på tomatproduksjon i drivhus. Det er kjent at vekten på tomatene er avhengig av lysintensiteten i drivhuset. La Y være vekten (i gram) på en vilkårlig tomat og x være lysintensiteten. Da har en Y = 100 + β(x x r ) + E, hvor x r er en kjent referanse-lysintensitet som gartneren tradisjonelt bruker, β er en ukjent parameter og E er en normalfordelt (Gaussisk) tilfeldig variabel med forventning 0 g og varians

σ 2 = 15 2 g 2. Vi har altså at Y er normalfordelt med forventning µ = µ(x; β) = 100+β(x x r ) og standardavvik σ = 15. En sesong har gartneren brukt referanse-lysintensiteten x = x r slik at Y er normalfordelt med forventningsverdi 100 g og varians 15 2 g 2. Etter sesongen kontrollerer han tomatene. a) Regn ut sannsynligheten for at en vilkårlig tomat veier mer enn 110 g. Regn ut sannsynligheten for at en vilkårlig tomat veier mellom 90 g og 110 g. Gartneren henter ut to vilkårlige tomater. Regn ut sannynligheten for at den ene er mer enn dobbelt så tung som den andre. Gartneren har fem drivhus, og en sesong ønsker han å undersøke hvordan tomatenes vekt avhenger av lysintensiteten. Han setter lysintensiteten konstant men ulik i de fem drivhusene. Etter sesongen velger han ut tre tomater vilkårlig fra hvert drivhus og veier dem. b) Vis at sannsynlighetsmaksimeringsestimatoren for β, basert på observasjonene beskrevet over, er Vis at estimatoren er forventningsrett. 3 5 j=1 i=1 ˆβ = (Y ij 100)(x i x r ) 3 5 i=1 (x i x r ) 2 Utled et uttrykk for variansen til estimatoren. Sesongen etter bestemmer han seg for å bruke samme konstante lysintensitet x 0, som er ulik x r, i alle drivhusene. c) Vi er interessert i å predikere vekten av en vilkårlig tomat etter denne sesongen. Vi vil altså predikere Y når x = x 0, og vi betegner dette med Y 0. Forventningsverdien til Y 0 kan estimeres ved å estimere β; ˆµ Y0 = ˆµ(x 0 ; β) = µ(x 0 ; ˆβ) = 100 + ˆβ(x 0 x r ). Hva er estimatet når ˆβ er 2.0 og x 0 x r = 5? Vis at forventningsverdien til Y 0 ˆµ Y0 er 0, og at variansen er 15 2 + (x 0 x r ) 2 Var( ˆβ). (Hint: ˆβ er forventningsrett og er kun en funksjon av observasjonene fra forrige sesong.) Ta utgangspunkt i Z = Y 0 ˆµ Y0 15 2 + (x 0 x r ) 2 Var( ˆβ). Fasit Bruk at estimatoren for β er normalfordelt (hvilken fordeling har da Z?) til å utlede et uttrykk for et 95%-prediksjonsintervall for vekten av en vilkårlig tomat etter sesongen. Bruk at estimatoren for β har varians 1.20, samt at ˆβ er 2.0 og at x 0 x r = 5 til å regne ut tallsvar. 1. a) 0.301, 0.84 b) [1467.41, 1470.35]

2. a) 0.1587, 0.3173 b) [0.90, 0.97] 3. a) 0.5, 0.0475 b) [0.000122, 0.00188] 4. a) 0.16, 0.68, 0.08 c) [254.0, 314.0] 5. a) 0.2514,0.4972,0.0028 c) [78.7,141.3]