UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamen : ECON0 Statstkk, våren 004 Exam: ECON0 Statstcs, sprng 004 Eksamensdag: Fredag 8. ma 004 Date of exam: Frday, May 8, 004 Td for eksamen: kl. 09:00 :00 Tme for exam: 9:00 a.m. :00 noon Oppgavesettet er på 6 sder The problem set covers 6 pages Englsh verson on page 4 Tllatte hjelpemdler: Alle trykte og skrevne hjelpemdler, samt kalkulator er tllatt. Resources allowed: All wrtten and prnted resources, as well as calculator are allowed. Eksamen blr vurdert etter ECTS-skalaen. A-F, der A er beste karakter og E er dårlgste ståkarakter. F er kke bestått. Grades gven: A-F, where A s the best and E s the weakest passng grade. F s fal. Oppgave En gtt prøve er laget som en flervalgsprøve ( multple choce test ). Prøven består av tre spørsmål. For hvert spørsmål er det oppgtt fre svaralternatver hvorav kun ett er rktg, og studenten blr bedt om å ang det svaralternatvet vedkommende mener er det rktge. Spørsmålene er uavhengge den forstand at man kke trenger å vte svaret på et av spørsmålene for å kunne svare rktg på et annet. a. En student som kke vet svaret på noen av delspørsmålene bestemmer seg for å gjette helt vlkårlg. () Hva er sannsynlgheten for at studenten gjetter rktg på et enkelt spørsmål? () Hva er sannsynlgheten for at studenten får rktg svar på alle de tre spørsmålene? () Hva er sannsynlgheten for at studenten gjetter galt på alle tre spørsmålene? Begrunn svarene dne. b. () Hva er sannsynlgheten for at en student gjetter rktg på kun ett eneste av de tre spørsmålene, og galt på de to andre spørsmålene? For å bestå prøven må en student ha svart rktg på mnst to av de tre spørsmålene. () Hva er sannsynlgheten for å bestå prøven for en student som gjetter helt vlkårlg på svaralternatvet for alle spørsmålene? [Hnt: Du kan bygge på besvarelsen dn punkt a og b() for å svare på punkt b()] c. Om en student vet v at han gjettet helt vlkårlg på svaralternatvet for alle spørsmålene. V vet også at han hadde mnst ett rktg svar, men v vet kke om han hadde så mye som to eller tre rktge. Hva er sannsynlgheten for at han besto prøven?
d. (Mer krevende). En annen student klarer å elmnere to svaralternatver fra spørsmål som hun vet er gale. Hun gjetter så vlkårlg på et av de to gjenværende svaralternatvene. For spørsmål klarer hun å elmnere ett svaralternatv og gjetter vlkårlg på et av de tre gjenværende. På spørsmål gjetter hun helt vlkårlg på et av de fre alternatve svarene. Hva er sannsynlgheten for at hun består prøven, dvs. svarer rett på to eller tre spørsmål? Oppgave En skole benytter en prøve av samme type som beskrevet oppgave for et av sne større kurs. Et semester var det n = 00 studenter som tok prøven. Resultatene er gtt tabellen: Antall rktge svar Antall studenter 0 Sum 7 9 4 50 00 a. Som beskrevet oppgave kreves det mnst rktge svar for å bestå prøven. La p være sannsynlgheten for at en tlfeldg valgt student kke består prøven. La Q være den samme sannsynlgheten målt prosent. Med andre ord: Q= 00 p. La X være antall studenter som kke består prøven blant n = 00 studenter. Anta at X er bnomsk fordelt. () Drøft kort hva du mener taler for og/eller mot en slk antakelse. () Sett opp en forventnngsrett estmator for Q, og forklar hvorfor den er forventnngsrett. () Beregn estmatet for Q ut fra tallene nnlednngen, og anslå også standardavvket for estmatet. b. Skolen ønsker at kurset med prøve skal være slk at sannsynlgheten for kke å bestå prøven kke bør overstge 0%. () Tyder tallene nnlednngen på at sannsynlgheten for kke å bestå for en tlfeldg valgt student er over 0% for det aktuelle semesteret? Velg som hypotesepar H 0 : p 0,0 og H : p > 0,0 og sett opp en passende testobservator. Beregn både krtsk verd og P-verden (sgnfkans-sannsynlgheten) for testen dn. Gjennomfør testen med sgnfkansnvå 5%. () Formuler en konklusjon med begrunnelse testresultatet. Oppgave a. Anta at Z er standard normalfordelt: Z ~ N (0, ). () Forklar hvorfor PZ< ( 0) =. () Fnn kvartlene N(0, ). b. Anta at X ~ N ( µσ, ). () Skrv medanen tl X som M. Bruk medanens defnsjon P(X < M) = ½ for å vse at medanen tl X er lk forventnngen, µ, tl X. [Hnt: Ta X µ utgangspunkt at ~ N(0, ) ] σ La Q, Q betegne nedre og øvre kvartl fordelngen N ( µσ, ). () Hva er sannsynlghetene P(Q <X< Q ) og P(X> Q )? () Vs at Q = µ 0,67σ (der tallet
0,67 er bestemt med to desmalers nøyaktghet). (v) Fnn også Q og vs at kvartlbredden er Q Q =, 4σ. c. V er nteressert gjennomsnttshøyden for norske kvnner ( µ ), som v antar er ukjent. På en forelesnng statstkk ved Økonomsk nsttutt 999 var det kvnnlge studenter tl stede som alle oppga sn høyde. La x betegne høyden cm for kvnne nr. der =,,,. Resultatet er gtt tabellen: 4 5 6 7 8 9 0 x 58 68 64 76 75 68 7 7 75 7 6 68 75 Tl hjelp under regnngen nedenfor oppgs x = 0, x = 7 675 = = Som vanlg for høydemålnger antar v at tallene er observasjoner av stokastske varable X, X,, X som antas å være uavhengge og normalfordelte, N ( µσ, ), der µ og σ er ukjente. () Beregn et 90% konfdensntervall for µ. () Har du noen krtske kommentarer tl å anslå gjennomsnttshøyden for norske kvnner på denne måten? Det llle utvalget vårt kan ses på som en plotstude dvs. som en nnlednng tl en større undersøkelse. () I sstnevnte store undersøkelse ønsker v et 90% konfdensntervall for µ med en lengde som kke overstger cm. Hvor mange observasjoner (omtrent) trenges for å oppnå dette? Du kan anta her at σ er kjent, og at dens verd er lk estmatet du fant plotstuden. d. La N betegne antall observasjoner som trengs for oppnå et 90% konfdensntervall for µ med lengde høyst cm. N avhenger av den ukjente parameteren σ, og må derfor anses som ukjent. Hvor uskkert er anslaget for N du beregnet punkt c? Besvar dette spørsmålet ved å beregne et 95% konfdensntervall for N basert på dataene punkt c. [ Hnt: Beregn først et 95% konfdensntervall for σ.]
4 Englsh verson: Problem A gven school test s constructed as a multple choce test. The test conssts of three questons. For each queston four dfferent possble answers are presented of whch only one s correct. The student s asked to choose the answer that he or she thnks s the correct one. The questons are ndependent n the sense that t s not necessary to know the answer to one queston n order to answer correctly another one. a. A student who does not know the answer to any of the queston decdes to guess completely at random. () What s the probablty that the student wll guess correctly for a sngle queston? () What s the probablty that the student guesses correctly for all three questons? () What s the probablty that the student guesses wrongly for all three questons? Gve the reason for your answers. b. () What s the probablty that the student guesses correctly for only one of the questons and ncorrectly for the remanng two questons? In order to pass the test a student must have answered correctly for at least two of the three questons. () What s the probablty to pass the test for a student who guesses at the correct answer completely at random for each queston? [Hnt: You may base your answer on your answers on secton a and b()] c. About a partcular student we know that he guessed completely at random for all the three questons. We also know that he had at least one correct answer but we do not know f he had as much as two or three correct ones. What s the probablty that he passed the test? d. (More demandng). Another student manages to elmnate from queston two of the gven answer alternatves that she knows are wrong. She then guesses completely at random at one of the remanng two answer alternatves. For queston she manages to elmnate one answer alternatve and guesses randomly at one of the three remanng ones. For queston she guesses randomly at one of the four gven answer alternatves. What s the probablty that she passes the test,.e. answers correctly two or three questons? Problem A school uses a test of the same type as descrbed n Problem n one of ts larger courses. One term there were n = 00 students who took the test. The results are gven n the table. Number of correct answers Number of students 0 Sum 7 9 4 50 00 a. As descrbed n Problem at least two correct answers are requred to pass the test. Let p be the probablty that a randomly chosen student does not pass the test. Let Q be
5 the same probablty measured n percent. In other words: Q= 00 p. Let X be the number of students who do not pass the test among n = 00 students. Suppose that the dstrbuton of X s bnomal. () Dscuss brefly what you thnk are arguments for and/or aganst such an assumpton. () Gve an unbased estmator for Q and explan why t s unbased. () Calculate the estmate for Q based on the numbers n the ntroducton. Also gve an estmate of the standard devaton of the estmate. b. The school wshes that the course ncludng the test should be such that the probablty of not passng the test should not exceed 0%. () Do the data n the ntroducton gve evdence that the probablty of not passng for a randomly chosen student s larger than 0% for the term n queston? Choose as hypotheses, H 0 : p 0,0 and H : p > 0,0, and wrte down a sutable test statstc. Calculate both a crtcal value and the P-value (sgnfcance probablty) for your (statstcal) test. Perform the test at the 5% level of sgnfcance. () Formulate a concluson based on the (statstcal) test result. Problem a. Suppose that Z s standard normally dstrbuted: Z ~ N (0, ). () Explan why PZ< ( 0) =. () Fnd the quartles n N(0, ). b. Suppose that X ~ N ( µσ, ). () Denote the medan of X as M. Use the defnton of the medan, P(X < M) = ½ to show that the medan of X s equal to the expectaton, µ, of X µ X. [Hnt: Use that ~ N(0, ) ] σ Let Q, Q denote the lower and upper quartle n the dstrbuton N ( µσ, ). () What are the probabltes P(Q <X< Q ) and P(X> Q )? () show that Q = µ 0,67σ (where the number 0,67 s determned wth a precson of two decmal places). (v) Fnd also Q and show that the quartle range ( kvartlbredden ) s Q Q =, 4σ. c. We are nterested n the average heght for Norwegan women ( µ ), that we assume s unknown. On a lecture n statstcs at Økonomsk nsttutt n 999 there were female students present who all gave nformaton about ther heght. Let x denote the heght n cm for woman no., where =,,,. The results are gven n the table: 4 5 6 7 8 9 0 x 58 68 64 76 75 68 7 7 75 7 6 68 75 As an ad for the calculatons below we gve x = 0, x = 7 675 = = As s usual for heght measurements we assume that the numbers are observatons of random varables X, X,, X that are assumed to be ndependent and normally dstrbuted, N ( µσ, ), where µ and σ are unknown. () Calculate a 90% confdence
6 nterval for µ. () Do you have any crtcal comments about estmatng the average heght of Norwegan women n ths way? Our small sample can be consdered as a plot study -.e. as an ntroducton to a larger study. () In the large study we want a 90% confdence nterval for µ wth a length that does not exceed cm. How many observatons (approxmately) do we need to acheve ths? You may assume here that σ s known and that ts value s equal to the estmate you found n the plot study. d. Let N denote the number of observatons that s needed to obtan a 90% confdence nterval for µ wth length at most cm. N depends on the unknown parameter σ, and must therefore be consdered as unknown. How uncertan s the estmate for N you calculated n secton c? Answer the queston by calculatng a 95% confdence nterval for N based on the data n secton c. [ Hnt: Calculate frst a 95% confdence nterval for σ.]