Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag TMA4245 Statistikk Eksame 9. desember 2013 Oppgave 1 I kortspillet Blackjack får ma de høyeste geviste hvis de to første kortee ma får er et ess samme med ete e tier, e kekt, e dame eller e koge. Dette kalles «å få e blackjack». I kasioer der ma spiller Blackjack for peger, blader ma gjere 8 kortstokker som ma trekker disse kortee fra. (Hesikte med dette er å gjøre det vaskeligere å «telle kort», det vil si å rege seg fram til hvor mage ess og billedkort som er igje i stokke.) Det er da så mage kort i stokke at vi ka betrakte dette som e situasjo «med tilbakeleggig», altså at ma trekker ett og ett kort fra e valig kortstokk og legger forrige kort tilbake før ma trekker et ytt. E valig kortstokk har 52 kort, med 4 farger som har hver si tier, kekt, dame, koge og ess. a) Hva er sasylighete for å få e blackjack? Hva er sasylighete for å få e blackjack hvis det første kortet du har fått er et ess? La oss si at e spiller som teller kort har fuet ut at sasylighete for å få blackjack å er 0.06, at sasylighete for å få et ess som første kort er 0.1 og at sasylighete for at det første kortet ditt var et ess hvis du har fått e blackjack er 0.4. Bruk disse tallee til å rege ut hva sasylighete å er for å få e blackjack hvis det første kortet du har fått er et ess. Lars er på ferie i Las Vegas, og går i på det største kasioet ha fier. Ha setter seg ved Blackjack-bordet og bestemmer seg for å spille fram til ha vier og for å doble isatse for hvert spill. Ha satser é dollar i første spill, to dollar i adre spill, og så videre fram til ha vier. Ata (for ekelthets skyld) at ha alltid får igje det dobbelte av det ha satset hvis ha vier, at sasylighete for at ha vier er 0.3 i hvert spill, og at Lars slutter å spille etter å ha vuet é gag. b) La X være atall gager Lars spiller før ha gir seg. Hva er sasylighetsfordelige til X? Ata i reste av oppgave at Lars går tom for peger og dermed slutter å spille, hvis ha ikke har vuet etter å ha spilt fem gager. La W være atall dollar Lars vier i kasioet (uavhegig av hvor mye ha har satset først). Hva er forvetigsverdie til W? La Y være geviste Lars sitter igje med etter at isatse er trukket fra. Hva er forvetigsverdie til Y? eksdes13-oppg-b 8. april 2016 Side 1
Oppgave 2 Aget Joh Bag går regelmessig til skytetreig. Erfarig sier at has sasylighet for et treff er p = 0.8. I e treigssesjo skyter ha 20 skudd. Ata at skuddee er uavhegige og at hvert ekeltskudd er ete e treff eller bom. a) Hva er forvetet atall treff? Hva er sasylighete for at ha treffer flere e forvetet? Hva er de betigete sasylighete for at ha treffer 20 år vi vet at ha treffer flere e forvetet? Sjefe bestemmer at Joh skal ha e y pistol. De håper at dee skal gi forbedret treffsasylighet. De øsker å udersøke om dette holder, og Joh bruker de ye pistole i e valig treigssesjo med 20 skudd. b) Formuler problemet som e hypotesetest. Bruk de valige ormalapproksimasjoe til å gjeomføre hypoteseteste på sigifikasivå α = 0.1 år observert atall treff er 18. c) Forklar hvorda teste ka gjeomføres eksakt ved bruk av biomisk fordelig. Hva blir P-verdie til de eksakte teste år ha treffer på 18 skudd? Ata sigifikasivå α = 0.1 for teste. Reg ut teststyrke for de eksakte teste år sa treffsasylighet er p = 0.9. Oppgave 3 Mediae til et datasett, X, er de midterste verdie. Hvis vi har stokastiske (tilfeldige) variabler X 1, X 2,..., X og order dem etter størrelse slik at X (1) < X (2) <... < X (), så er mediae defiert som X = { X( +1 1 2 2 ) hvis er et oddetall, ( ) X ( 2 ) + X ( 2 +1) hvis er et partall. Når de stokastiske variablee våre er uavhegige og ormalfordelte med forvetigsverdi µ og varias σ 2, altså X i N(µ, σ 2 ), og vi har at atallet variabler,, er stort, ka vi ata at variase til mediae er Var( X) = 1 4 ( f(µ) ) 2, der f(x) er sasylighetstetthete til ormalfordelige. a) For dette tilfellet, vis at der gjeomsittet X = 1 i=1 X i. Var( X) = π Var( X), 2 X er e forvetigsrett estimator for forvetigsverdie µ. Hvorfor foretrekker vi valigvis X framfor X som estimator for µ?
Figur 1: Høydee til 30 rekrutter, kaskje fra 1814. Statistisk setralbyrå har data for høydee til malige orske rekrutter til hære hvert år tilbake til 1878. I dee oppgave ka du ata at du vet med sikkerhet at høydee til rekruttee i et hvilket som helst år er ormalfordelte. På Terigmoe leir har løytat Muthe fuet et skjema med høydee på 30 rekrutter som ha meer må være fra 1814. Papiret er gulet og blekket har falmet e del, me løytate får e av sie åværede rekrutter til å skrive dataee i i et regeark etter beste eve. Figur 1 viser et histogram av disse dataee. b) For dette datasettet, vil mediae X være større e, midre e eller omtret like stor som gjeomsittet X? Ville du ha brukt mediae eller gjeomsittet til å estimere forvetigsverdie µ her? Begru svaret. Oppgave 4 I medisi er det yttig å studere vekte til yfødte som fuksjo av deres termialder (gestatioal age eller tid side ufagelse). Data er her termialder x i (uker) og vekt y i (gram) for i = 1,..., babyer, og = 24. For dette datasettet har vi i=1 x iy i = 2 752 667, i=1 x2 i = 35 727, i=1 x i = 925 og i=1 y i = 71 194. Ata e lieær regresjosmodell: Y i = β 0 + β 1 x i + ɛ i, i = 1,...,, der ɛ 1,..., ɛ atas
Figur 2: Kryssplott av termiuke og fødselsvekt for 12 gutter og 12 jeter. uavhegige og ormalfordelte med forvetig 0 og varias σ 2. a) Bruk oppsummerige av tallmateriale gitt over til å rege ut estimatee for skjærigspukt og stigigstallet for regresjosmodelle: ˆβ 0 og ˆβ 1. Vi reger ut et estimat for σ 2 ved s 2 = 1 2 i=1 (y i ˆβ 0 ˆβ 1 x i ) 2 = 194 2. Reg ut et 95 proset kofidesitervall for stigigstallet. b) Bruk data til å fie et 90 proset prediksjositervall for vekte til e yfødt i termiuke 40. Hvor bredt er 90 proset prediksjositervallet for termiuke 42 sammeliget med det vi fat for uke 40? Figur 2 viser et kryssplott av termiuke og vekt. I dette plottet er data delt i i to grupper: gutter og jeter. Det er b = 12 gutter (ummerert 1 til b ) og 12 jeter (ummerert i = b +1 til ). Vi foreslår følgede modell for data Y i = β b + β 1 x i + ɛ i, i = 1,..., b. Y i = β g + β 1 x i + ɛ i, i = b + 1,...,.
der vi fortsatt atar at ɛ 1,..., ɛ er uavhegige og ormalfordelte med forvetig 0 og varias σ 2. c) Bruk plottet til å forklare hvorfor dee modelle ka være hesiktsmessig. Forklar videre hvilke elemeter av modelle som ka være uøsket. Fasit Reg ut miste kvadratsums estimater (eller maximum likelihood estimater) for parametree i modelle, her beevt ved ˆβ b, ˆβg og ˆβ 1. I tillegg til summee gitt tidligere i oppgave har vi at b i=1 y i = 36 258, b i=1 x i = 460, i= b +1 y i = 34 936 og i= b +1 x i = 465. 1. a) 0.04734, 0.3077, 0.24 b) 6.567, -4.4 2. a) 16, 0.41, 0.028 b) ikke forkast H 0 c) 0.21, 0.39 3. b) mediae er midre e gjeomsittet 4. a) -1465, 115, [69,161] b) [2789,3481], 690, 732 c) -1587, -1747, 120.22