UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Like dokumenter
A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Eksamensoppgave i SØK Statistikk for økonomer

EKSAMEN. EMNEANSVARLIG: Terje Bokalrud og Hans Petter Hornæs. TILLATTE HJELPEMIDLER: Kalkulator og alle trykte og skrevne hjelpemidler.

Eksamensoppgave i ST0103 Brukerkurs i statistikk

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

Binomisk fordeling. Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

HØGSKOLEN I STAVANGER

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4245 Statistikk

Fasit for tilleggsoppgaver

Løsningsforslag til seminar 4 Undervisningsfri uke

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

Litt mer om den hypergeometriske fordelingen og dens tilnærming av binomisk fordeling.

EKSAMEN I TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk 2014

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Eksamensoppgave i TMA4240 Statistikk

Løsningskisse seminaroppgaver uke 11 ( mars)

TMA4240 Statistikk Høst 2012

TMA4240 Statistikk Høst 2016

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

i x i

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

UNIVERSITETET I OSLO

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

STK1100 våren 2019 Mere om konfidensintevaller

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag Til Statlab 5

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2009

EKSAMENSOPPGAVE. Eksamen i: STA Brukerkurs i statistikk 1 Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9

TMA4240 Statistikk Høst 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Econ 2130 uke 16 (HG)

Eksamen i. MAT110 Statistikk 1

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

a) Ved avlesning på graf får man. Dermed er hastighet ved tid sekund lik.

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2015

DEL 1 Uten hjelpemidler

Eksamensoppgave i TMA4240 Statistikk

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

TMA4240 Statistikk Høst 2015

Eksamensoppgave i ST0103 Brukerkurs i statistikk

UNIVERSITETET I OSLO Matematisk Institutt

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

DEL 1 Uten hjelpemidler

Eksamensoppgave i TMA4245 Statistikk

Matematikk 2, 4MX25-10

ÅMA110 Sannsynlighetsregning med statistikk, våren

HØGSKOLEN I STAVANGER

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 22. mai 2008

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Løsningskisse seminaroppgaver uke 15

EKSAMEN I HSTAT1101, 22. NOVEMBER 2018: LØSNINGSFORSLAG. Knut R. Wangen, Innledning

HØGSKOLEN I STAVANGER

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Emnenavn: Eksamenstid: Faglærer: Hans Kristian Bekkevard

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

UNIVERSITETET I OSLO

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Faktor - en eksamensavis utgitt av ECONnect

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2009

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Statistikk 1 kapittel 5

Formelsamling i medisinsk statistikk

Transkript:

Eksamen i: ECON2130 Statistikk 1 UNIVERSITETET I OSLO ØONOIS INSTITUTT Eksamensdag: 01.06.2015 Sensur kunngjøres: 22.06.2015 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 4 sider Tillatte hjelpemidler: Alle trykte og skrevne hjelpemidler er tillatt. I tillegg kan du ta med lommekalkulator som ikke kan brukes til å kommunisere med andre. Eksamen blir vurdert etter ECTS-skalaen. A-F, der A er beste karakter og E er dårligste ståkarakter. F er ikke bestått.

1 ECON2130: ESAEN 2015v Oppgave 1 En klasse på 25 elever på videregående består av 15 jenter og 10 gutter. 4 av jentene og 2 av guttene røyker. En elev trekkes ut rent tilfeldig (slik at alle 25 har samme sannsynlighet). A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn Røyker Ikke - røyker Sum Jente Gutt Sum 25 ii) Definer begivenhetene G og R ved, G = «den uttrukne er gutt» og R = «den uttrukne røyker». Finn følgende 4 sannsynligheter P( G), P( G R), P( G R) og P( G R) B. Det trekkes 3 elever fra klassen til en komité rent tilfeldig (dvs. slik at alle ikkeordnete utvalg på 3 er like sannsynlige). La X være antallet i komiteen som røyker. i) Forklar hvorfor X er hypergeometrisk fordelt. ii) Beregn PX ( 2) (med 3 desimalers nøyaktighet). 25 [Hint: For å lette regningen oppgis 2300 3.] iii) Bruk kjente egenskaper ved den hypergeometriske fordelingen til å vise at E( X ) 0.72 og Var( X ) 0.5016 C. I tillegg til X innfører vi Y = antall jenter i komiteen. Den simultane fordelingen for ( XY, ), bestemt ved f ( x, y) P( X x Y y), er gitt i tabell 1 (som du ikke trenger å vise):

2 Tabell 1 Tabell over f ( x, y ) x y 0 1 2 3 sum 0 0.024 0.134 0.191 0.072 0.421 1 0.024 0.125 0.201 0.096 0.446 2 0.003 0.033 0.059 0.029 0.124 3 0.000 0.002 0.005 0.002 0.009 sum 0.051 0.294 0.456 0.199 1.000 i) Forklar hvorfor f (3,0) 0. ii) Beregn P( X Y ). iii) Anta vi vet at det er 2 jenter og 1 gutt i den uttrukne komiteen, men ikke om de røyker eller ikke. Hva er da sannsynligheten for at høyst en av dem røyker? [Hint: Finn P( X 1 Y 2) ] D. Beregn korrelasjonskoeffisienten mellom X og Y. [Hint: For å lette regningen oppgis 3 3 ] E( Y ) 1.8, Var( Y ) 0.7 og xyf ( x, y) 1.34 x 0 y 0 E. Utvalget i punkt B blir trukket uten tilbakelegging på følgende måte. Alle elevene skriver navnet sitt på en lapp som legges i en kurv (til sammen 25 navnelapper). Utvalget trekkes så ved å trekke en og en navnelapp av gangen uten å legge den uttrukne lappen tilbake i kurven før neste trekning. Anta vi i stedet trekker 3 elever med tilbakelegging (dvs. vi trekker lappene en og en, men legger hver lapp som blir trukket tilbake i kurven før neste trekning). ed denne metoden er det naturligvis en viss risiko for at en og samme elev (dvs. navnelapp) blir trukket ut flere ganger. Finn sannsynligheten for at de 3 navnelappene (trukket ut med tilbakelegging) er forskjellige. [Hint: Det er flere måter å finne denne sannsynligheten på. Du kan selve velge den du synes er best. En av dem er å beregne antall gunstige utfall og antall mulige utfall. En annen metode er følgende: La A være begivenheten at de to første navnelappene som blir trukket er forskjellige, og B begivenheten at alle tre er forskjellige (der altså B er den begivenheten vi ønsker sannsynligheten for). Forklar hvorfor B A B og PA ( ) 24 25. Bruk så multiplikasjonssetningen på P( A B). ]

3 Oppgave 2 I 2014 ble det i Sverige trukket et representativt utvalg på n 1313 ungdommer i aldersklassen 16-29 år. Av disse var det 107 som røykte jevnlig. I 2012 røykte 10% av ungdommer i denne aldersklassen i Sverige. Vi ønsker å teste om tallene tyder på at røyking blant ungdommer i Sverige har gått ned fra 2012 til 2014. La X være antall som røyker jevnlig i et representativt utvalg på n ungdommer. Anta at X er binomisk fordelt med parametre n og p (kort: X ~ bin( n, p ) ), der p er andelen av ungdommer i Sverige som røyker jevnlig i 2014, og som tolkes som sannsynligheten for at en tilfeldig valgt ungdom i Sverige røyker. A. i) Sett opp en test med signifikansnivå 5% for H0: p 0.1 mot H1: p 0.1. Skriv testen på formen, «Forkast H 0 hvis X k» og bestem den kritiske verdien k. ii) Beregn p-verdien (tilnærmet) for testen i i) basert på tallene i innledningen og formuler en konklusjon. Bruk heltallskorreksjon ved beregning av p-verdien. B. i) Utled en tilnærmet formel for styrkefunksjonen for testen din i punkt Ai, der du tilnærmer den binomiske fordelingen med en normalfordeling. ii) iii) Forklar kort hva som menes med begrepet «feil av type 2» ved bruk av en test. Beregn (tilnærmet) sannsynligheten for feil av type 2 for testen din i punkt Ai dersom den ukjente p er lik 0.095, og dersom p 0.105. Oppgave 3 Resultatene fra den svenske undersøkelsen i oppgave 2 er splittet opp på kvinner og menn som vist i tabell 2.

4 Tabell 2 Antall kvinner og menn, 16-29 år, som røyker - basert på et representativt utvalg fra Sverige 2014. vinner enn sum Røyker 67 40 107 Røyker ikke 674 532 1206 sum 741 572 1313 Vi kan se på dette som to utvalg, et for kvinner ( n 741 personer), og et for menn ( n 572 personer). La X, X betegne henholdsvis antall kvinner som røyker og antall menn som røyker i to slike utvalg. De observerte verdiene av X, Xi utvalget er 67 og 40 henholdsvis. Anta X, X er uavhengige stokastiske variable som begge er binomisk fordelte, X ~ bin( n, p ) og X ~ bin( n, p ), der p, p er andelen henholdsvis av kvinner og menn i alderen 16-29 år i Sverige som røyker i 2014. Andelene p, p betraktes som ukjente, og tallene n, n som gitte tall (ikke-stokastiske). Vi ønsker å bruke data til å estimere forskjellen i andel, p p, samt beregne et konfidensintervall for. A. i) Vis at ˆ X X n n er en forventningsrett estimator for. Beregn estimatet ˆobs (der indeksen obs indikerer den observerte verdien). ii) iii) Vis at standardavviket (SD) for ˆ er gitt ved ˆ p (1 p ) p (1 p ) SD( ) n n Forklar hvorfor ˆ er tilnærmet normalfordelt. B. i) ˆ Det kan vises (som du ikke trenger å gjøre) at W er tilnærmet standard SE( ˆ ) normalfordelt (N(0,1)) uansett, der standardfeilen, SE( ˆ ), er estimert standardavvik som i punkt Aii, der de ukjente p, p er erstattet med estimater. Bruk dette til å utlede en formel for et konfidensintervall for med konfidensgrad tilnærmet 0.95. ii) Beregn det observerte konfidensintervallet utledet i punkt Bi ut fra data.