UNIVERSITETET I OSLO

Like dokumenter
UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

vekt. vol bruk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

HØGSKOLEN I STAVANGER

Tilleggsoppgaver for STK1110 Høst 2015

UNIVERSITETET I OSLO

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA-1001.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

ECON240 VÅR / 2016 BOKMÅL

EKSAMEN I TMA4255 ANVENDT STATISTIKK

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

TMA4240 Statistikk Høst 2018

Eksamensoppgave i TMA4245 Statistikk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

TMA4240 Statistikk Eksamen desember 2015

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

TMA4240 Statistikk Høst 2009

EKSAMENSOPPGAVE STA-2004.

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgave i TMA4255 Anvendt statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Løsningsforslag: STK2120-v15.

EKSAMENSOPPGAVER STAT100 Vår 2011

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

UNIVERSITETET I OSLO

STK juni 2016

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

HØGSKOLEN I STAVANGER

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

EKSAMEN I TMA4255 ANVENDT STATISTIKK

STK Oppsummering

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

i x i

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag eksamen 27. februar 2004

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2016

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

TMA4240 Statistikk Høst 2007

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

Eksamensoppgave i TMA4240 Statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

HØGSKOLEN I STAVANGER

Transkript:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på 8 sider. Vedlegg: Tabeller over normal-, F- og χ 2 - fordelingene. Tillatte hjelpemidler: Godkjent kalkulator og formelsamling for ST100 og ST110. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Oppgave 1. Anta at Y 1, Y 2,..., Y n er uavhengige og normalfordelte med forventning µ og varians σ 2. (a) Anta at σ 2 er kjent. Vis at n ˆµ = Y = 1 n i=1 Y i er sannsynlighetsmaksimeringsestimatoren (SME) for µ. Hvorfor kan vi også betegne ˆµ som en momentestimator? (b) Anta at både µ og σ 2 er ukjente. Finn simultan SME for (µ, σ 2 ). Er denne estimatoren også en momentestimator? Er SME forventningsrett i dette tilfellet? (c) Foreslå en testobservator for hypotesetestingsproblemet H 0 : µ = µ 0 mot H 1 : µ µ 0 med signifikansnivå α når σ 2 er ukjent. (Fortsettes side 2.)

Eksamen i ST110, Mandag 30. mai 2005. Side 2 Argumenter for testobservatorens fordeling når µ = µ 0. Testen kan gjennomføres både ved hjelp av forkastningsgrenser og p- verdi (signifikanssannsynlighet). Angi for begge måter hvordan og diskutér kort sammenhengen. (d) Angi et 95% konfidensintervall for µ. Forklar hva det betyr at dette er et konfidensintervall. Utled at intervallet du oppga faktisk er et 95% konfidensintervall. Diskutér kort sammenhengen mellom konfidensintervall og hypotesetesting. Oppgave 2. Vi skal i denne oppgaven se på Q-Q plot for den dobbelteksponensielle fordelingen. Den har tetthet gitt ved f(x) = 1 2 e x, < x <. Som tettheten til en standard normalfordelt tilfeldig variabel er tettheten symmetrisk rundt null. Tettheten avtar imidlertid saktere mot null for x ±. (a) Finn den kumulative fordelingsfunksjonen F, og vis at den inverse funksjonen F 1 er gitt ved { F 1 log(2z) 0 < z < 1 2 (z) = 1 log(2(1 z)) z < 1 2 (b) La U være en uniformt fordelt variabel på intervallet [0, 1], d.v.s. fordelingen til U har tetthet { 1 0 u 1 g(u) = 0 ellers. Vis at den tilfeldige variabelen F 1 (U) er dobbelteksponensient fordelt. (c) Anta at U 1,..., U n er uavhengige uniformt fordelte på [0, 1] og la U (1) U (n) være ordningsobservatoren. La V k = U (k) være k te element i ordningsobservatoren. Da har V k tetthet, k = 1,..., n { n! (k 1)!(n k)! h(v) = vk 1 (1 v) n k 0 v 1 0 ellers. [Dette trenger du ikke å vise.] Finn E(V k ) og Var(V k ). [Hint: Vis først at 1 0 vk 1 (1 v) n k dv = (k 1)!(n k)! n!.] (Fortsettes side 3.)

Eksamen i ST110, Mandag 30. mai 2005. Side 3 (d) La X 1,..., X n være uavhengige dobbelteksponensielt fordelte observasjoner og la X (1) X (n) være ordningsobservatoren. Begrunn at et spredningsplott (F 1 ( k ), X n+1 (k)), k = 1,..., n tilnærmet vil være en rett linje gjennom origo. Hva er stigningsforholdet? (e) La Φ være den kumulative fordelingsfunksjon til en normalfordelt variabel med forventning 0 og varians 1. Forklar hvordan et plott av (Φ 1 ( k ), X n+1 (k)), k = 1,..., n ser ut. (f) Anta nå at X 1,..., X n er uavhengige identisk fordelt med tetthet k(x) = 1 exp( x µ /σ) 2σ der µ og σ er ukjente parametre. La X (1) X (n) være ordningsobservatoren. Hvordan vil nå et plot ( ) k (F 1, X (k) ), k = 1,..., n n + 1 se ut? Oppgave 3. Frank and Althoen (Statistics concepts and applications, 1994) skriver om et forsøk på å undersøke effekten av ulike signaler på reaksjonstider hos menn og kvinner. Det er totalt 15 menn og 15 kvinner med i undersøkelsen og disse blir tilfeldig fordelt i 3 grupper med 5 menn og 5 kvinner i hver. Signalet for den første gruppen er en hørlig tone (Tone), signalet for den andre gruppen er et kort lyssignal (Light) og signalet for den tredje gruppen er et mild elektrisk puls fra et metall-bånd rundt håndlettet (Pulse). Alle personene er instruert til å presse [ENTER] knappen på en PC så snart signalet er oppfanget, og tiden mellom signalet og responsen blir automatisk lagret. Hver person får 12 forsøk og summen av responstidene (i sekunder) er gitt i tabellen nedenfor. (Fortsettes side 4.) Tone Light Pulse 10.0 6.0 9.1 7.2 3.7 5.8 Men 6.8 5.1 6.0 6.0 4.0 4.0 5.0 3.2 5.1 10.5 6.6 7.3 8.8 4.9 6.1 Women 9.2 2.5 5.2 8.1 4.2 2.5 13.4 1.8 3.9

Eksamen i ST110, Mandag 30. mai 2005. Side 4 (a) Tabellen nedenfor viser et (delvis) resultat for variansanalyse på disse data. Source df SS MS F Kjonn 1 2.133 * 0.6410 Signaltype * 97.267 * 14.6119 Interaksjon * * * 3.4952 Error * 79.880 * Total 29 202.547 Sett opp den modell som ligger bak denne analysen. Hvilke antagelser bygger denne modellen på? Fyll ut de manglende tallene (markert med *). (b) Forklar hvordan du kan teste om Interaksjon er en signifikant faktor. Når du utfører denne testen med signifikansnivå α = 0.05, hva blir konklusjonen? Test også på de andre faktorene i modellen og kommentér resulatene. Oppgave 4. Torsdag 28. april 2005 har Asker og Bærum Budstikka en artikkel (med overskrift Åtte av ti over takst) om priser av salg av boliger i forhold til boligtakst. I artikkelen er det også en tabell over 35 boliger med takst (Takst), antall kvadratmeter (kvm) og hvilke priser boligene er solgt for (Pris). (Denne tabellen er gjengitt bakerst i oppgavesettet for kompletthetsskyld men vil ikke være nødvendig å bruke for å løse denne oppgaven.) Vi vil i denne oppgaven se på disse dataene og prøve å se på sammenhengen mellom pris, takst og antall kvadratmeter. Dataene er vist i kryssplott nedenfor. (Fortsettes side 5.)

Eksamen i ST110, Mandag 30. mai 2005. Side 5 Nedenfor er resultatet av en lineær regresjonsanalyse med Pris (i 100.000 kr) som responsvariabel og antall kvm. og Takst (også i 100.000 kr) som forklaringsvariable: Estimate Std. Error t value Pr(> t ) (Intercept) 0.72634 0.65168 1.115 0.273 kvm -0.01828 0.01278-1.430 0.162 Takst 1.09548 0.05506 19.895 0.000 Residual standard error: 1.562 on 32 degrees of freedom Multiple R-Squared: 0.9877 (a) Sett opp regresjonsmodellen som denne analysen bygger på og de vanlige antagelser som ligger til grunn for analyse basert på denne modellen. Forklar hva de ulike delene av utskriften står for. (b) Per og er interessert i en annonsert bolig på 105 kvm med Takst på 2.300.000 kr. Basert på modellen ovenfor, beregn en prediksjon for Pris. Utled et generelt uttrykk for variansen til prediksjonsfeilen som funksjon av varianser og kovarianser for estimatene til regresjonskoeffisientene. For de ovenfor angitte verdier av kvm og Takst blir variansen til prediksjonsfeilen lik 0.0821 (dette behøver du ikke å regne ut). Bruk dette til å lage et prediksjonsintervall for Pris. (c) Resultatene ovenfor viser at kvm ikke er en signifikant variabel i modellen (og selve estimatet på koeffisienten blir faktisk negativ!). Samtidig ville en forvente en klar positiv sammenheng mellom pris og størrelse på boliger. Hvordan kan man forklare dette resultatet? (Fortsettes side 6.)

Eksamen i ST110, Mandag 30. mai 2005. Side 6 Oppgave 5. Dataene nedenfor angir antall forekomster av lever-svulst i rotter etter eksponering av ulike mengder DDT (Tomatis, et al.,1972): Dose Antall dyr Svulst (100ppm) testet forekomster 0 111 4 0.02 105 4 0.10 124 11 0.50 104 13 2.50 90 60 Vi vil anta forekomster av svulst er uavhengige mellom dyrene. Anta sannsynligheten for svulst følger en såkalt Armitage-Doll model, som sier at Pr(forekomst av svulst x) = 1 e (β 0+β 1 x+β 2 x 2 ) (a) Sett opp likelihood funksjonen for β og vis at β j l(β) = C c=1 x j c[y c e (β 0+β 1 x c+β 2 x 2 c ) 1 e (β 0+β 1 x c+β 2 x 2 c) (n c y c )], j = 0, 1, 2 Regn ut forventningen til β j l(β) og kommentér hvordan det stemmer med den generelle teorien. (b) Numerisk optimering av likelihooden ga ˆβ =(0.0459, 0.1627, 0.1019) J 1 (ˆβ) = 1 1000 0.2207 0.9849 0.3705 0.9849 13.2389 5.4734 0.3705 5.4734 2.8201 der x er dose av DDT (i 100ppm). Vi er interessert i å estimere parametervektoren β = (β 0, β 1, β 2 ). Vi vil i det videre la n c være antall testede dyr på dose nivå x c og y c tilhørende antall dyr med forekomster av svulst. Videre vil vi la C være antall dosenivåer. Bruk dette til å konstruere et 95% konfidensintervall for β 1. Spesifisér hvilke antagelser/resultater du baserer deg på ved konstruksjon av konfidensintervallet. (Fortsettes side 7.)

Eksamen i ST110, Mandag 30. mai 2005. Side 7 (c) En parametrisk bootstrapping ble utført på problemet, som ga følgende resultater: Gj.snitt Std.avvik 0.025 kv. 0.975 kv. β0 0.0456 0.0154 0.0157 0.0772 β1 0.1619 0.1169-0.0594 0.3952 β2 0.1040 0.0538-0.0077 0.2107 Her er Gj.snitt gjennomsnitt, Std.avvik er empirisk standard avvik, 0.025 kv. er 2.5% kvantilen og 0.975 er 97.5% kvantilene til bootstrap samplene av de tilhørende β-estimatene. Figuren nedenfor viser også histogrammer av de simulerte β j -ene. Bruk dette til å konstruere et standard bootstrap intervall (basic bootstrap interval) på 95% nivå for β 1. Kommentér eventuelle forskjeller med det intervallet du fikk i (b). Oppgave 6. 14. mai 2001 stemte høyesterett i USA ned statlige lover som lovliggjorde marijuana for medisinsk bruk. Den amerikanske Gallup organisasjonen utførte senere en undersøkelse av tilfeldig valgte amerikanere (18 år eller eldre) der de ble spurt om de støttet den begrensede bruk av marijuana når foreskrevet av leger for å lindre smerter og lidelser. (Kilde: Sullivan, Statistics - Informed Decisions using data, 2004.) Resulatet av undersøkelsen, oppdelt etter aldersgrupper, er følgende: (Fortsettes side 8.) Alder 18-29 30-49 50 år Mening år år eller eldre For 172 313 258 Imot 52 103 119

Eksamen i ST110, Mandag 30. mai 2005. Side 8 En ønsker å teste om det er sammenheng mellom alder og mening. Sett opp en passende null-hypotese for å teste dette. Du får oppgitt at den tilhørende testobservator er χ 2 = 6.6814 i dette tilfellet (dette behøver du ikke å regne ut). Bruk dette til å utføre testen. Angi også øvre og nedre grenser for p-verdien til testen. Tabell over boligdata for oppgave 2 kvm Pris Takst kvm Pris Takst 1 194 55.00 50.00 19 105 23.50 23.00 2 109 35.00 30.50 20 209 52.50 52.00 3 120 27.75 24.00 21 88 21.00 20.50 4 120 33.20 29.50 22 106 19.00 18.50 5 218 42.50 39.75 23 187 38.00 37.50 6 111 24.10 21.50 24 85 18.40 17.90 7 153 30.00 27.90 25 88 20.00 19.70 8 192 52.00 50.00 26 87 21.50 21.30 9 137 28.75 26.90 27 95 16.00 15.80 10 130 25.50 23.90 28 93 16.50 16.30 11 62 17.10 15.90 29 151 30.00 30.00 12 69 17.30 16.10 30 79 17.80 18.20 13 271 68.00 67.00 31 50 16.25 16.75 14 82 20.50 19.50 32 55 11.00 11.50 15 181 26.60 25.80 33 135 27.00 28.00 16 92 17.50 16.80 34 115 17.80 19.20 17 81 15.50 14.90 35 276 52.50 55.00 18 125 26.00 25.50 SLUTT