UNIVERSITETET I OSLO

Like dokumenter
UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

vekt. vol bruk

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Tilleggsoppgaver for STK1110 Høst 2015

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

EKSAMENSOPPGAVE STA-1001.

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4245 Statistikk

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 Statistikk

EKSAMENSOPPGAVER STAT100 Vår 2011

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

ECON240 VÅR / 2016 BOKMÅL

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

EKSAMENSOPPGAVE STA-2004.

HØGSKOLEN I STAVANGER

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

TMA4240 Statistikk 2014

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Løsningsforslag eksamen 27. februar 2004

EKSAMEN I TMA4255 ANVENDT STATISTIKK

TMA4240 Statistikk Høst 2016

Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).

STK juni 2016

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag

UNIVERSITETET I OSLO

LØSNINGSFORSLAG ) = Dvs

Eksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer)

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen desember 2016

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Forelesning 8 STK3100/4100

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

i x i

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgaver brukt i STA100 Sannsynlighetsregning og statistikk

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin.

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

UNIVERSITETET I OSLO

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

TMA4240 Statistikk Høst 2016

Fasit for tilleggsoppgaver

UNIVERSITETET I OSLO Matematisk Institutt

Transkript:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte hjelpemidler: Tabell over normal-, t-, og χ 2 -fordeling. Godkjent kalkulator og formelsamling for STK1100/STK1110. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Oppgave 1. Vi skal undersøke hyppigheten av ulykker i forbindelse med dykkerarbeid i Nordsjøen. La λ være en parameter som som angir forventet antall ulykker per timeverk. Vi har samlet inn data fra n forskjellige offshore-anlegg et bestemt år. La X i betegne antall ulykker i løpet av et år ved i-te anlegg, i = 1, 2,, n. Hver ulykke antas å opptre uavhengig av alle andre ulykker. Det er da rimelig å anta at X i er Poisson-fordelt med parameter λt i, der t i er totalt antall timeverk per år i i-te anlegg. Dvs. P (X i = x i ) = (λt i) x i exp ( λt i ), x i = 0, 1, 2, x i! Videre er X 1, X 2,..., X n uavhengige tilfeldige variable. a) En mulig estimator for λ er i=1 ˆλ = X i i=1 t. i Vis at ˆλ er en forventningsrett estimator for λ. Finn variansen til ˆλ. Hva blir estimatet av λ med data for n = 5 anlegg gitt til slutt i oppgaven (neste side)? b) Vis at ˆλ er sannsynlighetsmaksimerings-estimatoren (maximum likelihood estimator) for λ. c) En annen mulig estimator for λ er i=1 ˆλ = X it i n. i=1 t2 i Hvilken av de to estimatorene vil du foretrekke? Begrunn svaret ditt. (Fortsettes på side 2.)

Eksamen i STK1110, Mandag 1. desember 2014. Side 2 Anlegg 1 2 3 4 5 t i 3.00 10 4 2.00 10 4 0.87 10 4 2.50 10 4 0.63 10 4 x i 9 4 4 7 3 Oppgave 2. De siste ukene, spesielt etter fremlegging av statsbudsjettet, har opposisjonspartiet Ap opplevd rekordhøy oppslutning i flere meningsmålinger. Siste partibarometer fra 12. november 2014 viste at 42.2 % av de spurte ville ha stemt Ap hvis det hadde vært valg denne dagen. Vi kan lese på nettsidene til Opinion Perduco, som har gjennomført målingen, at de har spurt 960 personer. a) Kan vi med dette si at det er nesten sikkert at Ap ville ha fått minst 40 % av stemmene i et eventuelt stortingsvalg den dagen? Besvar spørsmålet ved å formulere og gjennomføre en hypotesetest. Oppgave 3. Forurensninger i vannet på to strender A og B i Oslofjorden skal undersøkes. Det mistenkes at strand A er mer forurenset enn strand B. Det blir tatt 9 prøver, 4 fra strand A og 5 fra strand B. La X 1, X 2,..., X 4 betegne målingene fra strand A, som kan antas uavhengige identisk fordelte variable fra normalfordelingen N(µ A, σ 2 ). La Y 1, Y 2,..., Y 5 være målingene fra strand B, som kan antas uavhengige identisk fordelte fra normalfordelingen N(µ B, σ 2 ). Målingene fra strand A og strand B er også uavhengige av hverandre. Vi skal først anta at variansen σ 2 er kjent lik 4. Observasjonene var Forurensning strand A (x i ) (i ppm): 16, 12, 14, 10 Forurensning strand B (y i ) (i ppm): 11, 8, 14, 7, 10 a) Gir målingene grunnlag for å konkludere med at strand A er mer forurenset enn strand B? Besvar spørsmålet ved å gjennomføre en hypotesetest. Husk å spesifisere hypotesene, beregn forkastningsområde og skriv en skikkelig konklusjon. Bruk signifikansnivå α = 0.01. b) Hva er en P-verdi? Finn P-verdien for testen ovenfor. c) Hvor mange prøver må man ta hvis man skal ha like mange prøver fra A som fra B, og man i testen i a) foruten signifikansnivået på 1% forlangte at sannsynligheten for å forkaste H 0 når µ A µ B = 4 skal være minst 95%? d) Variansen σ 2 er i virkeligheten ukjent og må estimeres. Finn et estimat for variansen basert på de tilsammen 9 målingene fra de to strendene. Du kan bruke at de empiriske variansene for A og B er hhv. s 2 A = 6.67 og s2 B = 7.50. Gjennomfør testen i a) når variansen er ukjent. (Fortsettes på side 3.)

Eksamen i STK1110, Mandag 1. desember 2014. Side 3 e) Utled et 99% konfidensintervall for forskjellen µ A µ B, fremdeles med ukjent varians som må estimeres. Forklar hvordan et slikt intervall skal tolkes. Oppgave 4. Når et fast stoff skal løses i vann og løsningsprosessen er forbundet med forbruk av varme, stiger løseligheten (målt i gram oppløst stoff per 100 gram vann) med stigende temperatur. Løselighetskurven for et salt S skal bestemmes ved følgende forsøk: 100 g vann varmes opp til x grader Celsius, og man bestemmer antall gram (Y ) av saltet som løses i vannet ved denne temperaturen. Forsøket utføres 18 ganger. Vi antar at Y 1, Y 2,, Y 18 er uavhengige og normalfordelte med samme ukjente varians σ 2 og forventning gitt ved E(Y i ) = β 0 + β 1 x i, der x i er temperaturen i forsøk i. I utskriften fra R nedenfor finner du observasjonene og flere analyser av datasettet. a) Hvilke tall i R-utskriften er minste kvadraters estimater for β 0, β 1 og σ? Diskuter hvor godt modellen passer til data på bakgrunn av utskrift og figurer. b) Beregn et 95% konfidensintervall for β 1. Du kan hente ut størrelser du trenger fra R-utskriften. c) Forklar hvordan konfidensintervallet ovenfor henger sammen med å teste hypotesen på signifikansnivå α = 0.05. H 0 : β 1 = 0 mot H a : β 1 0 d) Du vil anslå løseligheten ved 35 grader Celsius. Forklar hva som er forskjellen på et konfidensintervall for forventet løselighet og et prediksjonsintervall for en ny observasjon ved denne temperaturen. Finn begge ved hjelp av utskriften. e) Fra teorien burde løselighetskurven for salt S være et polynom heller enn en linje. Skriv opp en regresjonsmodell der du legger til et annengradsledd. En slik analyse er også gjennomført i R, se vedlagte utskrift. Vurder om annengradsmodellen er mer passende enn den lineære. x=c(10, 10, 10, 20, 20, 20, 30, 30, 30, 40, 40, 40, 50, 50, 50, 60, 60, 60) y=c(56.3, 59.9, 58.6, 63.7, 63.6, 65.4, 68.3, 70.6, 69.6, 74.1, 76.3, 74.6, 80.5, 79.7, 79.1, 84.7, 85.9, 84.9) plot(x,y) (Fortsettes på side 4.)

Eksamen i STK1110, Mandag 1. desember 2014. Side 4 fit=lm(y~x) summary(fit) Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max -2.3603-0.5203-0.1732 0.5654 1.6454 Coefficients: Estimate Std. Error t value Pr( t ) (Intercept) 53.32889 0.55615 95.89 <2e-16 *** x 0.53314 0.01428 37.33 <2e-16 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 1.035 on 16 degrees of freedom Multiple R-squared: 0.9887, Adjusted R-squared: 0.9879 F-statistic: 1394 on 1 and 16 DF, p-value: < 2.2e-16 abline(fit) plot(fit$res) qqnorm(fit$res) new=data.frame(x=35) predict(fit,new,interval="confidence") fit lwr upr 1 71.98889 71.47187 72.50591 predict(fit,new,interval="prediction") fit lwr upr 1 71.98889 69.73523 74.24254 fit2=lm(y~x+i(x^2)) summary(fit2) Call: lm(formula = y ~ x + I(x^2)) Residuals: Min 1Q Median 3Q Max -2.0726-0.4243-0.2073 0.7668 1.5274 Coefficients: Estimate Std. Error t value Pr( t ) (Intercept) 52.5233333 1.0765078 48.790 < 2e-16 *** x 0.5935595 0.0704281 8.428 4.51e-07 *** I(x^2) -0.0008631 0.0009849-0.876 0.395 (Fortsettes på side 5.)

Eksamen i STK1110, Mandag 1. desember 2014. Side 5 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 1.042 on 15 degrees of freedom Multiple R-squared: 0.9892, Adjusted R-squared: 0.9878 F-statistic: 687.2 on 2 and 15 DF, p-value: 1.777e-15 y 60 65 70 75 80 85 fit$res 2 1 0 1 10 20 30 40 50 60 x 5 10 15 Index Normal Q Q Plot Sample Quantiles 2 1 0 1 2 1 0 1 2 Theoretical Quantiles SLUTT