Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.



Like dokumenter
Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

10.1 Enkel lineær regresjon Multippel regresjon

UNIVERSITETET I OSLO

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

UNIVERSITETET I OSLO

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

UNIVERSITETET I OSLO

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk Høst 2015

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMENSOPPGAVER STAT100 Vår 2011

Eksamensoppgave i TMA4255 Anvendt statistikk

Faktor - en eksamensavis utgitt av ECONnect

Løsningsforslag, eksamen statistikk, juni 2015

UNIVERSITETET I OSLO

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

UNIVERSITETET I OSLO

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Eksamensoppgave i TMA4240 Statistikk

Eksamen i. MAT110 Statistikk 1

Kort overblikk over kurset sålangt

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2016

EKSAMENSOPPGAVE. Eksamen i: STA Brukerkurs i statistikk 1 Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

Eksamensoppgave i TMA4255 Anvendt statistikk

Fasit og løsningsforslag STK 1110

Eksamen i. MAT110 Statistikk 1

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4245 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Eksamensoppgave i TMA4255 Anvendt statistikk

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Statistikk og dataanalyse

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

TMA4245 Statistikk Eksamen desember 2016

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2007

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

1 10-2: Korrelasjon : Regresjon

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

UNIVERSITETET I OSLO

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

UNIVERSITETET I OSLO

ECON240 VÅR / 2016 BOKMÅL

Eksamen i emnet Stat111 - Statistiske metoder 28. mai 2014, kl

Eksamenssettet består av to deler. Ved bedømmelsen teller del A 30 % og del B 70 %. Innenfor hver del teller alle deloppgaver likt.

UNIVERSITETET I OSLO

STK1000 Obligatorisk oppgave 2 av 2

Transkript:

Eksamen i: MET040 Statistikk for økonomer Eksamensdag: 4 november 2008 Tid for eksamen: 09.00-13.00 Oppgavesettet er på 4 sider. Tillatte hjelpemidler: Alle trykte eller egenskrevne hjelpemidler og kalkulator. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt. Oppgave 1 I første halvår vurderte revisorfirma A 2 000 bilag og oppdaget 12 feil. I andre halvår vurderte revisorfirma A 8 000 bilag og fant 24 feil. I første halvår vurderte revisorfirma B 4 000 bilag og oppdaget 20 feil. I andre halvår vurderte revisorfirma B 1 000 bilag og fant 2 feil. Vi antar at tallene er representative i den forstand at de viser sannsynligheten for at selskapene finner feil i de to periodene. a) Hvilket firma hadde størst sannsynlighet for å finne feil i første halvår? Hvilket firma hadde størst sannsynlighet for å finne feil i andre halvår? Hvilket firma hadde størst sannsynlighet for å finne feil året sett under ett? b) Prøv å gi en forklaring på sammenhengen mellom de tre svarene i a). 1

Oppgave 2 Bokmål Vi skal investere ialt 10 millioner kroner i tre ulike selskaper; A, B og C. Alle aksjene koster 100 kr idag. Aksjekursen om et år er X i selskap A, Y i selskap B og Z i selskap C, og alle aksjene har en forventet aksjekurs på 120 kr om et år. Anta at vi investerer x% i aksje 1, y% i aksje B og resten, z%, i aksje C. Shortsalg er ikke tillatt i disse aksjene, så x 0, y 0, z 0. a) Forklar at den samlede verdien V av aksjene om et år er gitt ved uttrykket og finn forventet verdi av aksjene om et år. V = 1 000x X + 1 000y Y + 1 000z Z b) Anta at Var[X] = 100, Var[Y ] = 200 og Var[Z] = 600. I hvilken av aksjene bør du investere mest dersom du ønsker minst mulig usikkerhet (varians) i V? Begrunn svaret kort. c) Anta at variansene er som i b), og at aksjekursene er uavhengige variabler. Beregn hvor mange prosent du bør investere i hver av aksjene for å få minimal usikkerhet (varians) i V. Sammenlikn resultatet med svaret i b). d) Anta at aksjekursene er avhengige og at X = 120 + 10ɛ Y = 120 + 10 2 ɛ Z = 120 + 10 6 ɛ der ɛ er standard normalfordelt. Finn E[X], E[Y ], E[Z], Var[X], Var[Y ], Var[Z]. e) Anta at aksjekursene er som i punkt d). Vis at V = 12 000 000 + 10 000(x + 2 y + 6 z)ɛ Beregn hvor mange prosent du bør investere i hver av aksjene for å få minimal usikkerhet (varians) i V. Sammenlikn resultatet med svarene i b) og c). Oppgave 3 Vi har undersøkt gjennomsnittlig lønnsinntekt i to ulike regioner, og har samlet inn data fra 5 000 tilfeldig valgte personer i region 1 og 7 000 tilfeldig valgte personer i region 2. I region 1 fant vi X = 312 000 (kr), mens Y = 310 000 (kr) i region 2. Estimert standardavvik S var 43 000 (kr), der ( n1 ) S 2 1 n 2 = (X i X) 2 + (Y i Y ) 2 n 1 + n 2 2 i=1 a) Bruk en to-sidig t-test med 5% signifikansnivå for sammenlikning av to utvalg til å undersøke om det det er signifikant forskjell i forventet inntekt i de to regionene. 2 i=1

b) En såkalt ekvivalenstest er foreslått brukt i tilfeller der en sammenlikner to ulike variabler X og Y, og ønsker å undersøke om forskjellen i forventet verdi sannsynligvis er så liten at den ikke har praktisk betydning. I testen har vi µ X = E[X], µ Y = E[Y ] og definerer δ = µ X µ Y I en slik test må en presisere hvor liten δ må være for at differensen ikke har praktisk betydning. Denne størrelsen kalles, og vi vil påstå at differensen ikke har praktisk betydning når < δ < Testen kan formuleres slik: H 0 : δ eller δ H A : < δ < En regner ut T 1 = ˆδ + S[ˆδ] T 2 = ˆδ S[ˆδ] der ˆδ og S[ˆδ] regnes ut som i en t-test for sammenlikning av forventning i to utvalg, og forkaster H 0 på signifikansnivå α dersom T 1 t (n 1+n 2 2) α og T 2 t (n 1+n 2 2) α Velg = 5 000 (kr) og gjennomfør en ekvivalenstest for de to regionene. Bruk 5% signifikansnivå. Sammenlikn resultatene i a) og b), og gi en kommentar. Oppgave 4 Vi har undersøkt boligprisene i et område, og har samlet inn data for salgspris (i 1 000 kr) og boligareal ( i m 2 ) for 50 ulike eneboliger. Boligene har omtrent samme beliggenhet, og omtrent samme størrelse på tomten. Vi har gjennomført en lineær regresjon, og resultatet er vist i vedlagte utskrift fra MINITAB. a) Kommenter i hvilken grad du mener forutsetningene for regresjonsmodellen er oppfylt i dette tilfellet. b) Hvilken tolkning vil du gi til regresjonskoeffesientene i dette tilfellet? c) Diskuter/kritiser antagelsen om at boligprisen stiger lineært med størrelsen på boligen. d) Hvor stor er forklaringskraften til modellen? Er dette noe vi kunne regnet med? Begrunn svaret. e) Gjennomsnittstørrelsen på boligene som ble undersøkt var 100 m 2. Regn ut et 95% prediksjonsintervall for en tilsvarende enebolig med gjennomsnittstørrelse 100 m 2. 3

Regression Analysis: Pris versus Boligareal The regression equation is Pris = 536 + 21,5 Boligareal Predictor Coef SE Coef T P Constant 535,6 180,6 2,97 0,005 Boligareal 21,525 1,785 12,06 0,000 S = 209,730 R-Sq = 75,2% R-Sq(adj) = 74,7% 4

Fasit/Løsningsforslag MET040 Vår 2008 Oppgave 1 a) I første halvår fant revisorfirma A 0.6% feil, mens revisorfirma B fant 0.5% feil. Revisorfirma A hadde dermed størst sannsynlighet for å finne feil i første halvår. I andre halvår fant revisorfirma A 0.3% feil, mens revisorfirma B fant 0.2% feil. Revisorfirma A hadde dermed størst sannsynlighet for å finne feil i andre halvår. Året sett under ett fant revisorfirma A 0.36% feil, mens revisorfirma B fant 0.44% feil. Året sett under ett hadde revisorfirma B størst sannsynlighet for å finne feil. Selv om firma A er best i hvert halvår, taper de året sett under ett. b) Forklaringen er at det er langt flere feil i første halvår, og revisorfirma B vinner fordi de har konsentrert virksomheten til den perioden der det kanskje var mest viktig å gjøre undersøkelser. Kommentar: Fenomenet over er velkjent i statistikk og omtales gjerne som Yule-Simpsons paradoks. Oppgave 2 a) Siden hver aksje koster 100 kr, skal vi kjøpe ialt 100 000 aksjer. Hver prosent vi investerer gir da 1 000 aksjer, og vi kjøper derfor 1 000x aksjer i selskap A, 1 000y i selskap B og 1 000z aksjer i selskap C. Den samlede verdien V blir V = antall aksjer i A kurs på aksje A + antall aksjer i B kurs på aksje B + antall aksjer i C kurs på aksje C = 1 000x X + 1 000y Y + 1 000z Z siden x + y + z = 100. E[V ] = E[1 000x X + 1 000y Y + 1 000z Z] = 1 000xE[X] + 1 000yE[Y ] + 1 000zE[Z] = 1 000 120 (x + y + z) = 12 000 000 b) Siden aksjene i selskap A er minst usikre, bør vi investere mest her. c) Vi regner først ut variansen til V : Var[V ] = Var[1 000x X + 1 000y Y + 1 000z Z] = 1 000 000x 2 Var[X] + 1 000 000y 2 Var[Y ] + 1 000 000z 2 Var[Z] = 100 000 000(x 2 + 2y 2 + 6z 2 ) Vi må finne x, y, z slik at x 2 + 2y 2 + 6z 2 blir minst mulig. Siden z = 100 x y, kan vi finne minimum for funksjonen f(x, y) = x 2 + 2y 2 + 6(100 x y) 2 = 60000 1200x + 7x 2 1200y + 12xy + 8y 2 5

Deriverer vi denne funksjonen og setter de partielle derverte lik 0, finner vi likningssystemet 14x + 12y = 1 200 12x + 16y = 1 200 Dette likningssystemet har løsningen x = 60, y = 30, som gir minimum for funksjonen. Dersom vi ønsker minst mulig varians, må vi investere 60% i selskap A, 30% i selskap B og 10% i selskap C. Vi ser at vi investerer mest i selskap A (som i punkt b)), men at vi også bør spre investeringen på de tre selskapene. d) Siden E[ɛ] = 0, blir E[X] = E[Y ] = E[Z] = 120 som før. Bruker vi regelen Var[a + bɛ] = b 2 Var[ɛ] som gjelder når a og b er konstanter, finner vi Var[X] = 100, Var[Y ] = 200, Var[Z] = 600 som i punkt b) og c). e) Vi setter inn uttrykkene for X, Y og Z i formelen fra A og trekker leddene sammen: V = 1 000x X + 1 000y Y + 1 000z Z = 1 000x(120 + 10ɛ) + 1 000y(120 + 10 2ɛ) + 1 000z(120 + 10 6ɛ)) = 120 000(x + y + z) + 10 000(x + 2 y + 6 z)ɛ = 12 000 000 + 10 000(x + 2 y + 6 z)ɛ I dette tilfellet blir Var[V ] = 100 000 000(x + 2 y + 6 z) 2 Denne funksjonen har minimum for x = 100, y = 0, z = 0. I dette tilfellet får vi minst varians hvis vi investerer alt i selskap A. Dette er i samsvar med konklusjonen i b). Her er aksjene 100% korrelerte, og da er det ikke noe å hente på å spre investeringen på de tre selskapene slik som vi gjorde i punkt c). Kommentar: ɛ kan oppfattes som en markedsindikator. Ting går bra når denne indikatoren er positiv, men tilsvarende dårlig når ɛ er negativ. Selskap A er det selskapet som i minst grad er knyttet opp til denne usikre verdien. Vi får minst usikkerhet ved å plassere alle midlene der. Hvis shortsalg hadde vært tillatt, kunne vi eliminert tilnærmet all risiko ved at vi for eksempel kjøpte ca 169 000 aksjer i selskap A, mot at vi shortet ca 69 000 aksjer i selskap C. Oppgave 3 a) Vi regner ut S[ˆδ] = S 1 n 1 + 1 n 2 = 43 000 6 1 5 000 + 1 7 000 = 796.21

T = 312 000 310 000 796.21 = 2.51 Siden vi har en to-sidig test med 5% signifikansnivå, skal vi finne t 0.025 = 1.96 (med så mange observasjoner blir det ingen forskjell mellom t-fordelingen og normalfordelingen). Siden T = 2.51 > 1.96 = t 0.025 forkaster vi nullhypotesen om likhet, og konkluderer at forventet inntekt høyst sannsynlig er ulik i de to regionene. b) Vi regner ut T 1 = 2 000 + 5 000 796.21 = 8.79 T 2 = 5 000 2 000 796.21 = 3.77 I dette tilfellet skal vi finne t 0.05 = 1.645. Siden T 1 = 8.79 > 1.645 = t 0.05 T 2 = 3.77 > 1.645 = t 0.05 forkaster vi nullhypotesen om vesentlig forskjell, og konkluderer at forskjellen i forventet inntekt høyst sannsynlig er marginal. Kommentar: Oppgaven illustrerer en generell svakhet ved klassisk hypotesetesting. Har vi mange observasjoner, vil selv helt marginelle forskjeller gi forkastning av en nullhypotese om likhet. I slike tilfeller kan en ekvivalenstest være bedre egnet til å kaste lys over situasjonen. En bør imidlertid være klar over at en ekvivalenstest i noen grad er i strid med grunnprinsippene i klassisk hypotesetesting der en nesten alltid tar utgangspunkt i nullhypoteser med likhet som utgangspunkt. Oppgave 4 a) Vi ser at observasjonene har en tydelig lineært voksende trend. Riktignok er det endel spredning omkring linja, men ikke mer enn en kunne regne med. Normalscore plottet er en rimelig rett linje. Det er noen mindre avvik i begynnelsen og slutten, men ikke mer enn at det kan aksepteres. Histogrammet er litt skjevt, men kan klart aksepteres. Residualene er rimelig jevnt spredt omkring null, er rimelig homogene og uten klare trender. Residualene kan helt klart aksepteres. Alt i alt er dette en modell vi kan ha god tiltro til. b) Når boligarealet øker med 1 kvadratmeter, øker prisen på boligen med 21 525 kr. Det er rimelig å tolke stigningstallet som pris pr kvadratmeter. Konstantleddet er noe mer uklart, men for nybygg er det naturlig å tolke dette leddet som faste kostnader knyttet til bygget, det inkluderer tomtepris og ulike former for tilknytningsavgifter. For eldre boliger er dette bildet noe mer uklart, men prisene reflekteres i stor grad av prisene på nybygg, så vi antyder samme tolkning på konstantleddet også i det tilfellet. c) I noen grad er det rimelig å tro at prisene øker lineært med størrelsen. I store trekk krever et dobbelt så stort hus dobbelt så mye materialer og dobbelt så mye tid for byggearbeidet. 7

Det er imidlertid sannsynlig at store hus kan bygges noe mer effektivt (mindre tid pr kvadratmeter) enn små. Boligene i denne undersøkelsen er rimelig jevnstore, så det er trolig at effekten av mer effektiv bygging er relativt liten. Argumentene over gjelder først og fremst for nybygg, men som antydet i b) vil prisene på eldre boliger i stor grad reflekteres av prisene på nybygg. d) Forklaringskraften til modellen er ca 75%. Boligpriser blir i stor grad satt på grunnlag av kvadratmeterpris på nybygg, så det er rimelig at forklaringskraften er ganske høy. Med 75% forklaringskraft gjenstår ca 25% uforklart variasjon, og forklaringskraften ville økt betydelig dersom vi også hadde tatt hensyn til andre forhold som for eksempel boligens alder, generelle standard og byggestil. e) Predikert verdi 535.6 + 21.525 100 = 2 688.1 For å finne et 95% prediksjonsintervall, må vi regne ut S[Y Ŷ ] = S 1 + 1 (100 100)2 + = 211.8 50 M Vi trenger ikke finne verdien til M fordi dette leddet nulles ut i uttrykket over. Siden vi har 50 observasjoner, må vi bruke t-fordelingen med parameter 48. Tabellen lister bare verdiene for parameterne 45 og 50. Forskjellen mellom disse er helt marginell, og vi bruker verdien for parameter 50 siden den er nærmest, og t (48) 0.025 = 2.009 (interpolering ville gitt verdien 2.011, men forskjellen er uten praktisk betydning). Grensene til et 95% prediksjonsintervall blir dermed 2 688.1 ± 2.009 211.8 Et 95% prediksjonsintervall vil derfor ligge mellom 2.26 og 3.11 millioner kr. 8