UNIVERSITETET I OSLO

Like dokumenter
UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

vekt. vol bruk

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Fasit og løsningsforslag STK 1110

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Høst 2007

UNIVERSITETET I OSLO

STK juni 2016

Løsningsforslag eksamen 27. februar 2004

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

ECON240 VÅR / 2016 BOKMÅL

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2009

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMENSOPPGAVER STAT100 Vår 2011

Løsningsforslag: STK2120-v15.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

TMA4245 Statistikk Eksamen desember 2016

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

UNIVERSITETET I OSLO

Fasit for tilleggsoppgaver

Om eksamen. Never, never, never give up!

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Tilleggsoppgaver for STK1110 Høst 2015

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Om eksamen. Never, never, never give up!

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Skoleeksamen i SOS Kvantitativ metode

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

TMA4240 Statistikk H2010 (20)

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

HØGSKOLEN I STAVANGER

Eksamensoppgåve i TMA4240 Statistikk

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Løsningsforslag eksamen 25. november 2003

Verdens statistikk-dag.

TMA4240 Statistikk H2010 (22)

Eksamensoppgave i TMA4245 Statistikk

EKSAMENSOPPGAVE STA-1001.

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

TMA4240 Statistikk Høst 2009

Oppgave 1. Kilde SS df M S F Legering Feil Total

10.1 Enkel lineær regresjon Multippel regresjon

Inferens i regresjon

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

MOT310 Statistiske metoder 1, høsten 2011

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

UNIVERSITETET I OSLO

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

UNIVERSITETET I OSLO

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Oppgave 14.1 (14.4:1)

TMA4240 Statistikk Eksamen desember 2015

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg.

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Transkript:

Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte hjelpemidler: Tabell over Poisson-, normal-, t-, og F-fordeling. Godkjent kalkulator og formelsamling for STK1100/STK1110. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Oppgave 1. a) Dette er en standard oppgave om sammenligning av to andeler, kapittel 10.4. Se deler av side 507-509 for utledning (large sample test procedure). b) Dette er også standard, se side 512 i boken. Uttrykket for variansen blir forskjellig fordi vi i a) har antatt at H 0 er sann, dvs. p 1 p 2. c) La ˆp 1 102/200 0.51, ˆp 2 248/400 0.62 og ˆp (102 + 248)/(200 + 400) 0.583. Testobservator i a) får verdi z 2.576. Med tosidig alternativ og α 0.05 må vi sjekke om z > z 0.025 1.96 eller z < z 0.025 1.96. Siden observert z er mindre enn -1.96 forkaster vi H 0 og konkluderer på nivå 0.05 at det er signifikant forskjell i andel fulltidsstudenter. Innsatt i formelen for konfidensintervallet får vi (-0.194, -0.026). At 0 ikke ligger i dette intervallet stemmer med at vi fikk forkastning av hypotesen om at p 1 p 2. Oppgave 2. a) Vi setter score kvinner: X i N(µ 1, σ 2 ), i 1,..., n og score menn: Y i N(µ 2, σ 2 ), i 1,..., m. Hypotesene blir H 0 : µ 1 µ 2 0 H a : µ 1 µ 2 < 0 Baserer oss på X N(µ 1, σ 2 /n) og Ȳ N(µ 2, σ 2 /m). Fordi vi antar lik varians bruker vi S p S pooled (n 1)S2 1 +(m 1)S2 2 n+m. (Fortsettes på side 2.)

Eksamen i STK1110, Tirsdag 11. desember 2012. Side 2 Testobservator t X Ȳ S p 1/n + 1/m t n+m 2, dvs. student-t-fordelt med n + m 2 frihetsgrader. Med n 10 og n 9 blir dette 17 frihetsgrader. Fra R-utskriften finner vi observert verdi for t som t-statistic- 0.959 og tilhørende p-verdi 0.1755. Med nivå α 0.05 har vi ingen grunn til å forkaste H 0. b) Hypotesene blir her H 0 : σ 2 1 σ 2 2 mot H a : σ 2 1 σ 2 2. Vi vet at (n 1)S 2 1 σ 2 1 χ 2 n 1 Testobservator (m 1)S 2 2 σ 2 2 χ 2 m 1 f (n 1)S2 1/σ 2 1(n 1) (m 1)S 2 2/σ 2 2(m 1) S2 1/σ 2 1 S 2 2/σ 2 2 F n 1,m 1 dvs. F-fordelt med n 1 og m 1 frihetsgrader. Innsatt n og m blir dette 9 og 8 frihetsgrader. Under H 0 er f S2 1 1.6688 og vi finner p-verdi 0.4822 fra utskriften. S2 2 Med nivå α 0.1 har vi ingen grunn til å forkaste H 0. c) Vi har modellen y i β 0 + β 1 x 1i + β 2 x 2i + β 3 x 1i x 2i + ɛ i Med indikatorvariabelen x 2 1 for kvinner og x 2 0 for menn, får vi modellene Kvinner: y i β 0 + β 1 x 1i + β 2 + β 3 x 1i + ɛ i (β 0 + β 2 ) + (β 1 + β 3 )x 1i + ɛ i Menn: y i β 0 + β 1 x 1i + ɛ i β 2 blir dermed forskjellen mellom kvinner og menn i grunnleggende lønnstillegg, og β 3 blir forskjellen mellom kvinner og menn i uttelling for score (dvs. forskjellen i stigningstall). d) β 2 31.123, noe som betyr at kvinner typisk får ca. 31$ mindre i lønnstillegg i utgangspunktet. Men her er p-verdi 0.5293, så denne forskjellen er ikke signifikant. For uttelling for score, derimot, har vi klare resultater: β 3 3.96, som betyr at stigningstallet, som sier hvor mye lønnsøkning man kan forvente for hvert ekstra poeng for arbeidsinnsats, er betraktelig lavere for kvinner enn for menn. Her er p-verdi 0.00029 og forskjellen signifikant på alle rimelige nivåer. e) Vi har at β 3 N(β 3, σ 2 β3 ) og videre (Fortsettes på side 3.) β 3 β 3 t n (3 1) t 15.

Eksamen i STK1110, Tirsdag 11. desember 2012. Side 3 Et (1 α)100% konfidensintervall finnes fra P ( t α/2,15 < β 3 β 3 < t α/2,15 ) 1 α. Med α 0.01 trenger vi t 0.005,15 2.947, slik at et 99% konfidensintervall for β 3 blir β 3 ± 2.947 3.96 ± 2.947 0.8437 3.96 ± 2.4864 ( 6.45, 1.47). Hvis vi velger ut 19 personer tilfeldig og beregner et slik 99% konfidensintervall for β 3 mange ganger, vil vi i det lange løp få intervaller som dekker den sanne verdien av β 3 i 99% av tilfellene. f) Multiple R-squared finnes ved R 2 1 SSE/SST, eller som kvadratet av korrelasjonen mellom observerte responser y i og predikerte responser ŷ i, i 1,...n. Tall mellom 0 og 1, som gir andelen av variasjonen i y som kan forklares av modellen. I plottet ser vi klart at det er forskjell i stigningstall for kvinner og menn. Bør nevne residualplott og normalfordelingsplott for residualene. Oppgave 3. a) Med modellen y i βx i + ɛ i, i 1,..., n, setter vi opp utttrykket for kvadratavvikene (y i βx i ) 2. Deriverer med hensyn på β og setter lik 0: β (y i βx i ) 2 0 2 (y i βx i )( x i ) 0 y i x i β x 2 i 0 β MK x iy i x2 i E( β MK ) x ie(y i ) x2 i x iβx i x2 i β V ( β MK ) x2 i V (y i ) n ( n x2 i σ 2 x2 i )2 ( σ2 n x2 i )2 x2 i (Fortsettes på side 4.)

Eksamen i STK1110, Tirsdag 11. desember 2012. Side 4 b) E( β A ) E(y i) x i β x i x i β Skal sammenligne V ( β A ) V (y i) ( x i) nσ2 2 ( x i) σ2 2 n x 2 σ 2 n x 2 og σ 2 n. x2 i Vet at (x i x) 2 0 alltid er sant. Ved enkel regning finner vi fra dette at x2 i n x 2 alltid. Derfor er σ 2 x2 i dvs. V ( β MK ) V ( β A ) og vi velger derfor β MK. σ2 n x 2, Oppgave 4. a) Skal teste H 0 : λ 1 mot H a : λ > 1 med α 0.05. Naturlig å forkaste H 0 når X k, der k finnes fra P (X k λ 1) 0.05 1 P (X < k λ 1) 0.05 P (X < k λ 1) 0.95 Fra Tabell: P (X 3 λ 1) P (X < 4 λ 1) 0.981. Så k 4, dvs. man må minst observere 4 tilfeller for å kunne forkaste på nivå 0.05. b) P (X 4 λ 2) 1 P (X 3 λ 2) 1 0.857 0.143 P (Type II feil) 0.857 c) Siden X i Poisson(n i p), har vi Likelihood for m år blir da P (X i x i ) (n ip) x i e n ip. x i! m (n i p) x i e n ip L(p) x i! (Fortsettes på side 5.)

Eksamen i STK1110, Tirsdag 11. desember 2012. Side 5 Log-likelihood blir loglik(p) [x i log(n i p) n i p log(x i!)] m p loglik(p) [ ] xi n i n i p n i [ ] xi p n i x i p n i Setter lik 0 og finner MLE p X i n i E( p) E(X i) n i n ip n i p V ( p) V (X i) ( m n n ip i) 2 ( n i) p 2 m n i