Eksamen : ECON3 Statstkk Exam: ECON3 Statstcs UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: Torsdag. jun 6 Sensur kunngjøres: Fredag 6. jun Date of exam: Thursday, June, 6 Grades wll be gven: Frday, June 6 Td for eksamen: kl. :3 7:3 Tme for exam: :3 p.m. 5:3 p.m. Oppgavesettet er på 5 sder The problem set covers 5 pages Englsh verson on page 3 Tllatte hjelpemdler: Alle trykte og skrevne hjelpemdler, samt lommekalkulator er tllatt Resources allowed: All prnted and wrtten resources, as well as calculator s allowed Eksamen blr vurdert etter ECTS-skalaen. A-F, der A er beste karakter og E er dårlgste ståkarakter. F er kke bestått. The grades gven: A-F, wth A as the best and E as the weakest passng grade. F s fal. Oppgave I en by med stemmeberettgete nnbyggere pågår en heftg debatt om det skal etableres en bomrng (dvs bommer på alle nnfartsveene der hver passerng mot byen med bl koster en avgft) for å fnansere dverse trafkkprosjekter. På slutten av et debattprogram på lokal-tv ble seerne anmodet om å rnge nn ( løpet av programmet) og stemme for eller mot bomrng. Av 5 nnrngere var 5 (altså 9%) mot bomrng. For enkelhets skyld antar v at tallet bare omfatter byens stemmeberettgete og at bare stemmeberettgete rngte nn tl programmet. V antar også at alle de stemmeberettgete har en menng for eller mot. La M betegne motstander og T tlhenger av bomrng. La S betegne det å delta telefonavstemnngen TV og S det å kke delta. Anta at de stemmeberettgete er fordelt de fre kombnasjonene av menng og stemmedeltagelse som angtt tabell. Tabell T (for) M (mot) S (avgr stemme) 5 5 S (avgr kke stemme) 3
a. For en tlfeldg valgt stemmeberettget, la begvenhetene T, M og S stå for at vedkommende er tlhenger, motstander eller deltok TV-avstemnngen henholdsvs. () Fnn sannsynlghetene PM ( ), PM ( S), PM ( S ) og PM ( S) () Er M og S uavhengge? Begrunn svaret dtt. b. Anta v trekker to personer rent tlfeldg fra populasjonen av stemmeberettgete. La X være antall blant de to som er M (dvs. motstander av bomrng). Anta X er bnomsk fordelt. () Begrunn antakelsen at X er bnomsk fordelt hvert fall tlnærmet. Hva blr forventnngen tl X? () Beregn sannsynlgheten for at de er enge (dvs. begge for eller begge mot bomrng). c. (Mer krevende). Tallene første rad tabell (5 og 5) er kjente fra TVavstemnngen, som mplserer at PM ( S ) =,9. Tallene annen rad ( og 3) er mdlertd bare gjetnnger for regneeksemplets skyld. De er vrkelgheten ukjente. Sett p= PM ( ) som er ukjent og av spesell nteresse. Hvlke tall måtte det ha stått annen rad tabell (stedenfor og 3) hvs TV-avstemnngen hadde vært representatv betydnngen p= PM ( S) =,9? Oppgave For å måle graden av over- eller undervekt hos mennesker brukes ofte kroppsmassendeksen (KMI), som defners som ( vekt) /( høyde ) der vekt er målt klo (kg) og høyde meter (m). Normalområdet for KMI regnes fra tl 5 kg / m. En KMI under regnes som undervekt og en KMI over 5 som overvekt. I denne oppgaven betyr ung kvnne en kvnne aldersgruppen 9 år. a. La X være KMI for en tlfeldg valgt kvnne fra populasjonen av unge kvnner Norge. V antar at X er normalfordelt med forventnng µ =, og standardavvk σ = 3, ( dvs. X~ N (,, 3, ) ), der parameterverdene er hentet fra en norsk kostholdsundersøkelse fra 997. () Vs at sannsynlgheten for at en tlfeldg valgt ung kvnne er undervektg (KMI < ), er,39. () Fnn nedre desl ( d ) defnert ved PX ( d) =,. b. Betrakt et tlfeldg utvalg av unge norske kvnner, og la X være KMI for kvnne nr. utvalget. Anta at X, X, X3, X er uavhengge og dentsk fordelte med samme fordelng som X punkt a.. () Fnn PX< ( ) der X = X. n = () Hva er sannsynlgheten for at mnst tre av de fre kvnnene utvalget har KMI <?
c. En gruppe på 5 kvnnelge studenter ved en drettshøyskole dskuterer om det er et urmelg slankepress på kvnnelge drettsutøvere. Tl å begynne med regstrerte de sn egen KMI og fant gjennomsnttet for gruppen, x =,5, og emprsk standardavvk, s = 3,9. Gruppen tar utgangspunkt følgende modell: X, X,, Xn er uavhengge og dentsk fordelte med X ~ N ( µσ, ), der n = 5, og der µσ, begge antas ukjente. Her representerer X KMI for person nr. gruppen. Beregn et 95% konfdensntervall for µ under dsse betngelsene. Drøft kort rmelgheten av modellen og eventuelt tlleggsforutsetnnger som trengs for å kunne tolke µ som gjennomsnttlg KMI populasjonen av yngre kvnnelge drettsutøvere Norge. d. Gruppen ønsker å teste H : µ µ mot H : µ < µ, der µ =, som er brukt punkt a. I håp om å øke utsagnskraften fnner gruppen å kunne forutsette at σ er kjent lk 3,. Forøvrg er forutsetnngene som punkt c. Sett opp en test med sgnfkansnvå 5% som utnytter at σ er kjent. Gjennomfør testen med dataene gtt punkt c., og formuler en konklusjon. Beregn også testens p-verd. e. Gtt testen punkt d., der antall observasjoner er 5. Hva blr sannsynlgheten for å begå fel av type I og sannsynlgheten for å begå fel av type II hvs µ = µ =,? Hva blr de to felsannsynlghetene hvs µ =,5? f. La nå antall observasjoner, n, være vlkårlg. For øvrg la modell (med kjent σ ) og hypoteser være som punkt d. Sett opp testobservator og forkastnngområde når n er vlkårlg, der sgnfkansnvået fortsatt er 5%. Sett også opp et uttrykk for styrkefunksjonen, γ ( µ ). Hvor stor må n være for at styrkefunksjonen for testen skal ha en verd på mnst,95 hvs den sanne verden av µ er,5? ENGLISH VERSION Problem In a town contanng nhabtants wth a rght to vote there s an ntensve debate gong on concernng the possblty of establshng a toll rng (.e., toll statons on all roads leadng to town where each passng by car towards town requres a fee to be pad), n order to fnance varous traffc projects. In a debate program on local TV the vewers were asked to phone n (durng the program) ther opnon for or aganst the establshment of the toll rng. Ths resulted n 5 calls of whch 5 (.e., 9%) were aganst toll rng. For smplcty we assume that the number of nhabtants n the town only nclude those that have a rght to vote, and that all calls to the TV staton were from people wth a rght to vote. In addton we assume that all nhabtants wth a rght to vote have an opnon for or aganst toll rng. Let M denote opposton aganst and T support for the toll rng. Let S denote partcpaton n the phone votng n the TV program and S non-partcpaton. Assume that the 3
nhabtants wth a rght to vote fall nto the four combnatons of opnon and TV-vote behavor as gven n table : Table T (for) M (aganst) S (voter) 5 5 S (non-voter) 3 a. For a randomly chosen person wth a rght to vote from the town, let the events T, M and S denote that he or she s a supporter, an opponent or a partcpant of the TV vote respectvely. () Fnd the probabltes PM ( ), PM ( S), PM ( S ) and PM ( S) (v) Are M and S ndependent? Gve a reason for your answer. b. Suppose that two people are drawn at random from the populaton of nhabtants wth a rght to vote. Let X be the number among the two who are M (.e., aganst toll rng). Suppose that X s bnomally dstrbuted. () Dscuss the assumpton that X s bnomally dstrbuted at least approxmately. What s the expectaton of X? () Calculate the probablty that they agree (.e., that both of them are for or both are aganst the toll rng). c. (More demandng). The numbers n the frst row of table (5 and 5) are known from the TV votng, whch mples that PM ( S ) =,9. The numbers n the second row ( and 3), however, are only guesses for the sake of llustraton. They are n fact unknown. Put p= PM ( ) whch s unknown and of specal nterest. Whch numbers would have to be n the second row n table (nstead of and 3) f the TV-vote were representatve n the sense that p= PM ( S) =,9? Problem The body mass ndex (BMI) s often used to measure the degree of over- or underweght of human bengs. It s defned as ( weght) /( heght ) where weght s measured n klo (kg) and heght n meter (m). The normal nterval for BMI s usually taken to extend from to 5 kg / m. A BMI below s counted as underweght and a BMI over 5 as overweght. In ths problem the term young woman means a woman belongng to the age group 9 years. a. Let X be the BMI for a randomly chosen woman from the populaton of young women n Norway. We assume that X s normally dstrbuted wth expectaton µ =, and standard devaton σ = 3, (.e.. X~ N (,, 3,) ). The parameter values are taken from a Norwegan study from 997.
() Show that the probablty that a randomly chosen young woman s underweght (BMI < ), s,39. () Fnd the lower decle ( d ) defned by PX ( d) =,. b. Let X be the BMI of woman no. n a random sample of young Norwegan women. Suppose that X, X, X3, X are ndependent and dentcally dstrbuted wth the same dstrbuton as X n secton a. () Fnd PX< ( ) where X = X. n = () What s the probablty that at least three of the four women n the sample have BMI <? c. A group consstng of 5 female students from a hgh school of athletcs are dscussng whether there s an unreasonable pressure on female athletes for slmmng. Intally they all measured ther own BMI and found that the mean for the group was x =,5, and sample standard devaton, s = 3,9. The group decdes to base ther statstcal analyss on the followng model: X, X,, Xn are ndependent and dentcally dstrbuted wth X ~ N ( µσ, ), where n = 5, and where µσ, both are assumed to be unknown. Here X represents the BMI for person no. n the group. Calculate a 95% confdence nterval for µ under these condtons. Dscuss brefly the reasonableness of the model and possble extra assumptons that are needed n order to be able to nterpret µ as the mean BMI n the populaton of young female athletes n Norway. d. The group wshes to test H : µ µ aganst H : µ < µ where µ =, (referred to n secton a). Hopng to ncrease the strength of the nformaton n the data, the group fnds reason to assume thatσ s known and equal to 3,. Otherwse the assumptons are as n secton c. Set up a test for the gven hypotheses that utlzes σ beng known, and usng the level of sgnfcance 5%. Carry out the test usng the data gven n secton c. State a concluson. Fnally, calculate the p-value of the test. e. Consder the test n secton d., where the number of observatons s 5. What s the probablty of makng an error of type I and what s the probablty of makng an error of type II f µ = µ =,? What are the two error probabltes f µ =,5? f. Now, let the number of observatons, n, be arbtrary. Otherwse let the model (wth known σ ) and hypotheses be as n secton d. Set up the test statstc and the rejecton regon when n s arbtrary, where the level of sgnfcance s 5%. Also set up an expresson for the power functon, γ ( µ ). How large must n be n order that the power functon of the test attans a value of at least,95 f the true value of µ s,5? 5