UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Like dokumenter
Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Slope-Intercept Formula

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER STATISTICS FOR ECONOMISTS

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Siste seminar: Foreslåtte oppgaver basert på ønsker.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

FINAL EXAM IN STA-2001

0:7 0:2 0:1 0:3 0:5 0:2 0:1 0:4 0:5 P = 0:56 0:28 0:16 0:38 0:39 0:23

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Dynamic Programming Longest Common Subsequence. Class 27

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Neural Network. Sensors Sorter

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

Minimumskrav bør være å etablere at samtykke ikke bare må være gitt frivillig, men også informert.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Besvar tre 3 av følgende fire 4 oppgaver.

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Databases 1. Extended Relational Algebra

Exam in Quantum Mechanics (phys201), 2010, Allowed: Calculator, standard formula book and up to 5 pages of own handwritten notes.

Eksamensoppgave i GEOG Geografi i praksis - Tall, kart og bilder

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

Universitetet i Bergen Det matematisk-naturvitenskapelige fakultet Eksamen i emnet Mat131 - Differensiallikningar I Onsdag 25. mai 2016, kl.

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Trigonometric Substitution

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i GEOG1004 Geografi i praksis Tall, kart og bilder

Speed Racer Theme. Theme Music: Cartoon: Charles Schultz / Jef Mallett Peanuts / Frazz. September 9, 2011 Physics 131 Prof. E. F.

EN Skriving for kommunikasjon og tenkning

Eksamen PSY1010 / PSYC1100 Forskningsmetode I

TMA4240 Statistikk 2014

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

EKSAMEN I EMNE ST1201/ST6201 STATISTISKE METODER Onsdag 5. desember 2007 Tid: 09:00 13:00

Eksamen i TFY4230 STATISTISK FYSIKK Onsdag 21. desember, :00 19:00

Kartleggingsskjema / Survey

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Examination paper for (BI 2015) (Molekylærbiologi, laboratoriekurs)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

PATIENCE TÅLMODIGHET. Is the ability to wait for something. Det trenger vi når vi må vente på noe

0:6 0:3 0:1 0:4 0:2 0:4

Exercise 1: Phase Splitter DC Operation

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013

Oppgave 1a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

NORGES TEKNISK-NATURVITENSKAPELIGE UNIVERSITET Side 1 av 5 INSTITUTT FOR ENERGI- OG PROSESSTEKNIKK

Perpetuum (im)mobile

Appendix B, not for publication, with screenshots for Fairness and family background

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamen ENG1002/1003 Engelsk fellesfag Elevar og privatistar/elever og privatister. Nynorsk/Bokmål

Oppgave. føden)? i tråd med

Eksamensoppgaver til SOSANT1101. Regional etnografi: jordens folk og kulturelt mangfold. Utsatt skoleeksamen 12. desember 2013 kl.

Graphs similar to strongly regular graphs

EXAMINATION PAPER. Exam in: STA-3300 Applied statistics 2 Date: Wednesday, November 25th 2015 Time: Kl 09:00 13:00 Place: Teorifagb.

Den som gjør godt, er av Gud (Multilingual Edition)

Inference for Distributions

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

The exam consists of 2 problems. Both must be answered. English

Mathematics 114Q Integration Practice Problems SOLUTIONS. = 1 8 (x2 +5x) 8 + C. [u = x 2 +5x] = 1 11 (3 x)11 + C. [u =3 x] = 2 (7x + 9)3/2

Transkript:

Eksamen i: ECON2130 Statistikk 1 Exam: ECON2130 Statistics 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: Mandag 23. mai 2005 Sensur kunngjøres: Tirsdag 14. juni Date of exam: Monday, May 23, 2005 Grades will be given: Tuesday, June 14 Tid for eksamen: kl. 09:00 12:00 Time for exam: 9:00 a.m. 12:00 noon Oppgavesettet er på 7 sider The problem set covers 7 pages English version on page 5 Tillatte hjelpemidler: Alle trykte og skrevne hjelpemidler, samt lommekalkulator Resources allowed: All written and printed resources, as well as calculator Eksamen blir vurdert etter ECTS-skalaen. A-F, der A er beste karakter og E er dårligste ståkarakter. F er ikke bestått. The grades given: A-F, with A as the best and E as the weakest passing grade. F is fail. Oppgave 1 I denne oppgaven kan du anta at sannsynligheten for at det blir pike (og sannsynligheten for at det blir gutt) i en vilkårlig fødsel er 1/2, og at kjønnet i forskjellige fødsler er uavhengige av hverandre. Vi er interessert i kjønnsfordelingen av barna for en vilkårlig tre-barns familie. Definer utfallet xyz som kjønnet til de tre barna der x er kjønnet til det eldste, y til det nest eldste og z til det yngste barnet. For eksempel, utfallet PGP betyr at det eldste og det yngste barnet er piker mens nest eldste er gutt. a. Skriv opp utfallrommet som i dette tilfellet (for en tre-barns familie) består av 8 mulige utfall. Forklar hvorfor det er rimelig å anta at den tilhørende sannsynlighetsmodellen er uniform. b. Definer begivenhetene (hendelsene): A = Familien har 2 piker og en gutt B = Familien har minst 2 piker C = Det eldste barnet er pike i) Finn P(A), P(B) og P(C). ii) Finn PB ( C), PB ( C) og PB ( C. ) 1

c. i) Om en tre-barns familie vet vi at de har minst to piker. Hva er i så fall sannsynligheten for at det tredje barnet er gutt? Merk at vi her ikke vet noe om det tredje barnet er født som nr. 1, 2 eller 3. ii) Om en annen tre-barns familie vet vi at de to eldste barna er piker. Hva er da sannsynligheten for at det tredje barnet er gutt? d. Et ungt par ønsker seg minst ett barn av hvert kjønn og bestemmer seg til å fortsette å få barn til målet er nådd. For enkelthets skyld antar vi at det første barnet de fikk var pike. La X betegne antall nye forsøk (barnefødsler) som må til inntil første gutt blir født. Etter at målet (minst ett av hvert kjønn) er nådd vil de ikke ha flere barn. Forklar hvorfor det er rimelig å anta at X er geometrisk fordelt når vi ser bort fra komplikasjoner som for eksempel ufruktbarhet, tvillingfødsler, og det faktum at det er begrenset hvor mange barn et par i praksis kan få. La Y være antall barn paret ender opp med i alt. Med andre ord, Y = X + 1. Beregn forventning og varians for Y samt sannsynligheten for at Y blir minst lik 7. e. Etter å ha tenkt seg om finner paret ut at de uansett ikke vil ha mer enn maksimum 6 barn. Med andre ord, selv om de ender opp med 6 piker, så vil de slutte med å få flere barn. Sett opp sannsynlighetsfordelingen til Y (antall barn i alt, inklusive den førstefødte piken) i dette tilfellet. Det vil si, bestem de aktuelle sannsynlighetene i følgende tabell: y 2 3 4 5 6 PY ( = y)????? Hva blir forventet Y i dette tilfellet? Oppgave 2 Normaltemperaturen hos mennesker varierer litt fra person til person. Inntil relativt nylig har man regnet gjennomsnittlig normaltemperatur i populasjonen av mennesker som 37,0 grader Celcius. Tabell 1 viser resultatet av måling av normaltemperaturen for et utvalg av n = 130 personer, ordnet i stigende rekkefølge. (For hvert individ er normaltemperaturen bestemt som et gjennomsnitt av flere målinger over tid.) Merk at tabellen består av 10 rader og 13 kolonner. 2

Tabell 1 (Normaltemperatur for 130 personer) 35.7 35.8 35.9 35,9 36,0 36,1 36,1 36,2 36,2 36,2 36,2 36,2 36,2 36,3 36,3 36,3 36,3 36,3 36,3 36,4 36,4 36,4 36,4 36,4 36,4 36,5 36,5 36,5 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,2 37,2 37,2 37,2 37,2 37,2 37,2 37,3 37,3 37,3 37,3 37,3 37,3 37,4 37,4 37,4 37,4 37,5 37,7 37,8 38,2 Gjennomsnitt: 36,81 Standardavvik: 0,4074 a. Bestem medianen for observasjonene. Spiller det noen rolle om gjennomsnitt og standardavvik er beregnet på grunnlag av de sorterte observasjonene eller på grunnlag av de opprinnelige (usorterte) dataene? Gi en grunn for ditt svar. b. Observasjonene er gruppert i intervaller i tabell 2. Merk at øvre grense i hvert intervall er inklusiv, mens nedre grense er eksklusiv. Dette betyr, for eksempel, at observasjonen 36,1 hører med i intervall nr. 2 og ikke i intervall nr. 3. Tabell 2 Intervall Frekvens 35,5-35,8 2 35,8-36,1 5 36,1-36,4 18 36,4-36,7 29 36,7-37,0 37 37,0-37,3 31 37,3-37,6? 37,6-37,9? 37,9-38,2? Sum 130 Fyll inn de korrekte frekvensene der det står spørsmålstegn i tabellen og skisser et histogram basert på grupperingen. Kommenter formen på fordelingen. c. De opprinnelige (usorterte) dataene betraktes som observasjoner av de stokastiske variablene, X1, X2,, X130, som antas uavhengige og identisk fordelte med forventning 2 og varians, E( X i ) = µ, var( X i ) = σ, som begge antas ukjente. Tyder dataene på at µ er forskjellig fra 37,0? Sett opp null-hypotese og alternativ og en test for dette. Gjennomfør testen og undersøk om p-verdien er større eller mindre enn 0,002 (0,2%). Formuler en konklusjon. d. Vi definerer en normaltemperatur som uvanlig dersom den er høyst lik 35,9 eller minst lik 37,5. La p betegne sannsynligheten for at en tilfeldig valgt person har uvanlig 3

normaltemperatur. Gjør kort rede for hvorfor antall uvanlige normaltemperaturer i utvalget er binomisk fordelt. Bruk dette til å finne en forventningsrett estimator for q = 100 p, dvs. prosenten av uvanlige normaltemperaturer i populasjonen. Beregn et estimat for q ut fra dataene i utvalget. Estimer også standardavviket for estimatoren din. e. La intervallet ( LU, ) være et konfidensintervall for p med konfidensgrad 1 α. Forklar hvorfor konfidensintervallet (100 L, 100 U ) for q da også har samme konfidensgrad 1 α. Bruk dette til å beregne et konfidensintervall for q med konfidensgrad 0,90. Anslå også hvor mange observasjoner som må til for å få et 90% konfidensintervall for q med lengde høyst 2 prosentpoeng, dvs. slik at intervallet ser omtrent ut som q ˆ ± 1. 4

ENGLISH VERSION Problem 1 In this problem you can assume that the probability of a girl (and the probability of a boy) is 1/2 in an arbitrary birth, and that the sex occurring in different births are independent. We are interested in the sex of the children in an arbitrary three-children family. Define the outcome xyz as the sex of the three children, where x denotes the sex of the oldest, y of the second oldest, and z the sex of the youngest child. For example, the outcome GBG means that the oldest and the youngest of the children are girls while the second oldest is a boy. a. Write down the sample space which, in this case (for a three-children family), consists of 8 possible outcomes. Explain why it is reasonable to assume that the corresponding probability model is uniform. b. Define the following events: A = The Family has 2 girls and one boy B = The family has at least 2 girls C = The oldest child is a girl i) Find P(A), P(B) og P(C). ii) Find PB ( C), PB ( C) og PB ( C. ) c. i) About a certain three-children family we know that they have at least two girls. What is then the probability that the third child is a boy? Note that we do not know here if the third child is born as no. 1, 2 or 3. ii) About another three-children family we know that the two oldest children are girls. What is then the probability that the third child is a boy? d. A young couple want at least one child of each sex, and decide to continue to give birth to children until that target is acheived. For simplicity we assume that the first child they got was a girl. Let X denote the number of new attempts (child births) necessary until the first boy is born. After the aim (at least one of each sex) is achieved, they do not want any more children. Explain why it is reasonable to assume that X is geometrically distributed when we ignore complications as, e.g., possible infertility, twin births, and the fact that it is limited how many children a single couple can get in practice. Let Y be the total number of children the couple ends up with in the end. I.e., Y = X + 1. Calculate the expectation and variance of Y, and the probability that Y becomes at least 7. e. After having considered the matter, the couple decide that they, whatever happens, do not want more than 6 children. In other words, even if they end up with 6 girls, they will quit getting more children. Determine the distribution of Y (total number of children including the first born girl) in this case. I.e., fill in the relevant probabilities in the following table: 5

y 2 3 4 5 6 PY ( = y)????? What is expected Y in this case? Problem 2 The normal temperature in human beings varies somewhat from person to person. Until fairly recently it has been common to assume that the average normal temperature in the population of humans is 37,0 degrees Celcius. Table 1 gives the results of measuring the normal temperature for a sample of n = 130 people where the data have been sorted in an increasing order. (The normal temperature for an individual is determined as the average of several measurements over time.) Note that the table consists of 10 rows and 13 columns. Table 1 (Normal temperature for 130 people) 35.7 35.8 35.9 35,9 36,0 36,1 36,1 36,2 36,2 36,2 36,2 36,2 36,2 36,3 36,3 36,3 36,3 36,3 36,3 36,4 36,4 36,4 36,4 36,4 36,4 36,5 36,5 36,5 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,2 37,2 37,2 37,2 37,2 37,2 37,2 37,3 37,3 37,3 37,3 37,3 37,3 37,4 37,4 37,4 37,4 37,5 37,7 37,8 38,2 Mean: 36,81 Standard deviation: 0,4074 a. Determine the median of the observations. Does it make any difference if the mean and standard deviation are calculated based on the sorted data in the table or based on the original (unsorted) data? Give a reason for your answer. b. The observations are grouped in intervals shown in table 2. Note that the upper limit in each interval is inclusive while the lower limit is exclusive. This means, for example, that the observation, 36,1 belongs to the second interval and not the third. 6

Table 2 Interval Frequency 35,5-35,8 2 35,8-36,1 5 36,1-36,4 18 36,4-36,7 29 36,7-37,0 37 37,0-37,3 31 37,3-37,6? 37,6-37,9? 37,9-38,2? Sum 130 Fill in the correct frequencies where it is a question mark in the table, and sketch an histogram based on the grouped data. Comment on the shape of the distribution. c. The original (unsorted) data are considered to be observations of random variables, X1, X2,, X130, which are assumed to be independent and identically distributed with 2 expectation and variance, E( X i ) = µ, var( X i ) = σ, both unknown. Is there evidence in the data that µ is different from 37,0? Write down the null hypothesis and alternative and establish a test for this. Perform the test and investigate whether the p-value is larger or smaller than 0,002 (0,2%). Formulate a conclusion. d. We define the normal temperature as unusual if it is at most equal to 35,9 or at least equal to 37,5. Let p denote the probability that a randomly chosen person has unusual normal temperature. Explain briefly why the number of unusual normal temperatures in the sample is binomially distributed. Use this to find an unbiased estimator for q = 100 p, i.e., the percentage of unusual normal temperatures in the population. Also estimate the standard deviation of your estimator. e. Let the interval ( LU, ) be a confidence interval for p with the degree of confidence 1 α. Explain why the corresponding confidence interval (100 L, 100 U ) for q also has the same degree of confidence 1 α. Use this to calculate a 90% confidence interval for q. Estimate how many observations are needed to obtain a 90% confidence interval for q with length at most 2 percentage points, i.e., so that the resulting interval will look close to q ˆ ± 1. 7