Eksamensoppgave i TMA4245 Statistikk

Like dokumenter
Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4240 STATISTIKK

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4275 Levetidsanalyse

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i TMA4295 Statistisk inferens

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4275 Levetidsanalyse

TMA4240 Statistikk Eksamen desember 2015

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk 2014

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

HØGSKOLEN I STAVANGER

EKSAMEN I TMA4300 BEREGNINGSKREVENDE STATISTIKK Torsdag 16 Mai, 2013

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2016

i x i

UNIVERSITETET I OSLO

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4250 Romlig Statistikk

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgåve i TMA4255 Anvendt statistikk

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Eksamensoppgave i TMA4275 Levetidsanalyse

Løsningsforslag eksamen 27. februar 2004

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4320 Introduksjon til vitenskapelige beregninger

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Eksamensoppgave i SØK1004 Statistikk for økonomer

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i SØK Statistikk for økonomer

TMA4240 Statistikk Eksamen desember 2015

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

HØGSKOLEN I STAVANGER

LØSNINGSFORSLAG ) = Dvs

TMA4240 Statistikk Høst 2012

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

EKSAMEN I TMA4285 TIDSREKKEMODELLER Fredag 7. desember 2012 Tid: 09:00 13:00

EKSAMEN I TMA4245 Statistikk

EKSAMENSOPPGAVE STA-1001.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

TMA4240 Statistikk Høst 2015

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgave i TMA4267 Lineære statistiske modeller

vekt. vol bruk

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

Om eksamen. Never, never, never give up!

ST0202 Statistikk for samfunnsvitere

Eksamensoppgåve i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Om eksamen. Never, never, never give up!

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

EKSAMEN I TMA4240 Statistikk

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk Høst 2018

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

Eksamensoppgave i TMA4320 Introduksjon til vitenskapelige beregninger

UNIVERSITETET I OSLO

Faktor - en eksamensavis utgitt av ECONnect

Transkript:

Institutt for matematiske fag Eksamensoppgave i TMA4245 Statistikk Faglig kontakt under eksamen: Ingelin Steinsland a, Øyvind Bakke b Tlf: a 73 59 02 39, 926 63 096, b 73 59 81 26, 990 41 673 Eksamensdato: 19. mai 2014 Eksamenstid (fra til): 9.00 13.00 Hjelpemiddelkode/Tillatte hjelpemidler: Stemplet gult A5-ark med egne håndskrevne notater, bestemt enkel kalkulator, Tabeller og formler i statistikk, Matematisk formelsamling (K. Rottmann) Målform/språk: bokmål Antall sider: 4 Antall sider vedlegg: 0 Kontrollert av: Dato Sign Merk! Studenter finner sensur i Studentweb. Har du spørsmål om din sensur må du kontakte instituttet ditt. Eksamenskontoret vil ikke kunne svare på slike spørsmål.

TMA4245, 19. mai 2014 bokmål Side 1 av 4 Oppgave 1 Samleserien Agnes samler på kort i samleserien Verdens dyr. Serien består av θ forskjellige kort. På hvert kort er det bilde av en dyreart og opplysninger om arten. I tillegg er et av tallene 1, 2,..., θ trykt på kortet dette tallet er kortets nummer i samleserien. La X være nummeret på et kort som kjøpes i butikken. Vi antar at P (X = x) = 1/θ for x = 1, 2,..., θ og P (X = x) = 0 for alle andre x. Det vil si at det er samme sannsynlighet for å få hver type kort. Vi antar også at når vi kjøper flere kort, er kortnumrene uavhengige. a) Anta (i dette punktet) at det er 50 forskjellige kort, altså at θ = 50. Agnes kjøper 2 kort. Hva er sannsynligheten for at de er forskjellige? Hva er sannsynligheten for at alle kortene er forskjellige hvis Agnes kjøper 8 kort? Produsenten av kortene reklamerer med at det er 200 kort i serien. Agnes har kjøpt 20 kort, men har aldri fått noe høyere kortnummer enn 170. Anta at X 1, X 2,..., X n er uavhengige kortnumre, og la max X i være det største av disse kortnumrene. b) Finn kumulativ fordelingsfunksjon P (X i x) for x = 1, 2,..., θ. Vis at P (max X i x) = (x/θ) n for x = 1, 2,..., θ. Hva er P (max X i 170) hvis n = 20 og det er θ = 200 forskjellige kort i samleserien? Anta at θ er ukjent. Numrene på kortene som Agnes har kjøpt, er 7, 8, 25, 32, 55, 72, 74, 74, 89, 100, 102, 114, 121, 124, 126, 129, 131, 151, 165 og 170. Agnes vil teste nullhypotesen θ = 200 mot alternativet θ < 200, og bruker max X i, det vil si høyeste kortnummer, som testobservator. Hun finner et forkastningsområde som er gitt ved max x i 172. c) Hva blir konklusjonen av hypotesetesten med Agnes data? Finn signifikansnivået for testen. Finn teststyrken i θ = 180 og i θ = 160. d) Vis at sannsynlighetsmaksimeringsestimatet for θ er 170 med Agnes data. Er sannsynlighetsmaksimeringsestimatoren forventningsrett? Begrunn svaret (du trenger ikke å regne ut estimatorens forventningsverdi).

Side 2 av 4 TMA4245, 19. mai 2014 bokmål Figur 1: Boksplott fra to anlegg Figur 2: 100 observasjoner av fosforinnhold og gjennomstrømning Oppgave 2 Fosfor fra renseanlegg Vi er interessert i fosforinnhold (i gram pr. kubikkmeter) i ferdig renset vann fra renseanlegg. a) Figur 1 viser boksplott av målinger av fosforinnhold fra to anlegg, Vik og Nes. Vurder ut fra boksplottene om fosforinnholdet kan komme fra normalfordelinger, og om fosforinnhold fra de to anleggene har like medianer, like forventningsverdier og like varianser. Begrunn kort svarene dine. b) Vi antar i dette punktet at fosforinnholdet Y av en prøve er normalfordelt med forventningsverdi µ = 0,3 og varians σ 2 = 0,1 2. Finn sannsynligheten for at Y er mindre enn 0,5. Finn sannsynligheten for at Y er større enn 0,3. Finn den betingede sannsynligheten for at Y er mindre enn 0,5 gitt at Y er større enn 0,3. En grunn til at fosforinnholdet varierer, kan være at det avhenger av gjennomstrømningen i anlegget. La q i være gjennomstrømningen (i kubikkmeter pr. sekund) der prøve nr. i ble tatt og Y i fosforinnholdet i prøve nr. i. Vi antar en enkel lineær regresjonsmodell Y i = α + βq i + ɛ i, der α og β er regresjonsparametre. Videre antar vi at støyleddene ɛ i er uavhengige og normalfordelte med forventningsverdi 0 og varians σ 2 ɛ.

TMA4245, 19. mai 2014 bokmål Side 3 av 4 c) Vi antar (bare i dette punktet) at regresjonsparametrene er kjente: α = 0,05, β = 0,3 og σ 2 ɛ = 0,05 2. Vis at fosforinnholdet i en prøve ved gjennomstrømning 0,5 er normalfordelt med forventningsverdi 0,2 og varians 0,05 2, og at fosforinnholdet i en prøve ved gjennomstrømning 1,0 er normalfordelt med forventningsverdi 0,35 og varians 0,05 2. Hva er sannsynligheten for at den største av tre uavhengige fosformålinger ved gjennomstrømning 1,0 er større enn 0,4? Hva er sannsynligheten for at en måling ved gjennomstrømning 0,5 er større enn en (uavhengig) måling ved gjennomstrømning 1,0? Figur 2 viser n = 100 observasjoner av fosforinnhold og gjennomstrømning. Vi ønsker nå å estimere α og β ved minste kvadraters metode basert på disse dataene. d) Forklar kort hva minste kvadraters metode er, og illustrer med en figur. Sett opp uttrykkene du trenger, og forklar framgangsmåten. Du trenger ikke utlede uttrykkene for estimatorene. Vi antar nå at variansen σ 2 ɛ er kjent. La Ŷ0 være prediksjonen av fosforinnhold gitt av den tilpassede (estimerte) regresjonsmodellen ved gjennomstrømning q 0. Det oppgis at Ŷ0 er normalfordelt med forventningsverdi α + βq 0 og varians σ 2 ɛ ( 1 n + (q 0 q) 2 ) ni=1. (q i q) 2 e) Utled et 95 %-prediksjonsintervall for en ny (uavhengig) observasjon av fosforinnholdet når gjennomstrømningen er q 0. Forklar kort forskjellen på et konfidensintervall og et prediksjonsintervall. I figur 3 er data plottet sammen med tilpasset (estimert) regresjonslinje og grensene for et intervall. Er dette et 95 %-prediksjonsintervall eller et 95 %- konfidensintervall? Begrunn svaret. f) Spesifiser antakelsene som er gjort i regresjonsmodellen. Diskuter ut fra figur 2, 3 og 4 om disse antakelsene er oppfylt.

Side 4 av 4 TMA4245, 19. mai 2014 bokmål Figur 3: Estimert regresjonslinje med grenser for intervall Figur 4: Venstre: Residualplott (differanse mellom data og estimert regresjonslinje langs y-akse, gjennomstrømning langs x-akse). Høyre: Normalsannsynlighetsplott (normalkvantil-kvantilplott, QQ-plott) for residualer (differanser mellom data og estimert regresjonsllinje)