STK1000 Innføring i anvendt statistikk Eksamensdag: Tirsdag 12. desember 2017

Eksamen : STK000 Innførng anvendt statstkk Eksamensdag: Trsdag 2. desember 207 Alle deloppgaver teller lkt vurderngen av besvarelsen. Lkke tl! Dette er et løsnngsforslag. Studenter som har kommet frem tl svaret på andre måter og begrunnet det fornuftg har også fått uttellng. I oppgave 2 vl også t-test g god uttellng dersom det begrunnes bra og det er konsstens besvarelsen. Oppgave John Arbuthnot blr av mange tldelt æren for å ha beregnet verdens første p-verd. Nullhpotesen hans om at det blr født lke mange gutter som jenter ble undersøkt ved å studere dåpsstatstkken London mellom 629 og 70. Han observerte at 82 år på rad ble det født (og døpt) flere gutter enn jenter. I denne oppgaven skal v se nærmere på om det var nødvendg med observasjoner over 82 år, eller om John Arbuthnot kunne klart seg med ett år. a) Beregn sannsnlgheten for å observere flere guttefødsler enn jentefødsler 82 år på rad, dersom sannsnlgheten for å føde en gutt er lk sannsnlgheten for å føde en jente. Under antakelsen om uavhengghet: 0.5 82 = 2.07 0-25 0.0000000000000000000000002 La den stokastske varabelen X være antall guttefødsler 629. Hvlken sannsnlghetsfordelng har X? X er bnomsk fordelt, X~bn(n, p), her X~bn(990, 0.5) Hvlke tre forutsetnnger må være oppflt for at X skal ha denne fordelngen? V har ) n = 990 uavhengge forsøk (observasjoner), 2) hvert med 2 mulge utfall; guttefødsel («Suksess») eller kke guttefødsel («Fasko»), 3) og P(«Suksess») = P(guttefødsel)=p er lk for hver av de 990 fødslene. Når dette er oppflt, vl X = Antall suksesser = Antall gutter være bnomsk fordelt med parametere n=990 og p=0.5

b) Ta utgangspunkt X og parameteren p fordelngen fra oppgave a). Formuler nullhpotesen og den alternatve hpotesen for hvor stor andel gutter som blr født 629. p = andel guttefødsler 629 H0: p = 0.5 (Lk sannsnlghet for gutt som jente) H: p 0.5 (Ikke lk sannsnlghet for gutt og jente) G et punktestmat for p, og beregn et 95% konfdensntervall for p. Fra tabellen: n=528+4683=990 fødsler, hvorav 528 var gutter. Punktestmat for p: 528 p ˆ 0.527 ( 52.7%) 990 95% konfdensntervall for p er gtt ved: pˆ ( pˆ) pˆ.96 SE( pˆ) pˆ.96 n [0.57, 0.537] G en tolknng av konfdensntervallet, og forklar hvlken konklusjon du kommer frem tl på hpotesetesten hvs du bruker et sgnfkansnvå på 0.05. Intervallet nneholder den sanne p med skkerhet 95%. Sden H0-verden p=0.5 kke er ntervallet, forkaster v H0 på nvå 0.05. c) Anta at den sanne andelen guttefødsler er 0.52. Hvor mange fødsler (n) måtte du observere for å få forkastet en tosdg H0 på nvå 0.05? (Hnt: Ta utgangspunkt nedre grense et 95% konfdensntervall, som oppgave b).) Hvs v skal forkaste H0 for et tosdg alternatv på nvå 0.05, må den nedre grensen et 95% konfdensntervall være akkurat på/over 0.05. V løser altså lgnngen 0.50 0.52.96 n=2398 0.52 ( 0.52) n Oppgave 2 Da STK000-studenter høsten 206 ble spurt om hvor mange hverdagsklær de har skapet stt, fordelte antallet klær seg på 20 menn og 3 kvnner på følgende måte: Deskrptv statstkk for de 20 mennene:

Mn. st Qu. Medan Mean 3rd Qu. Max. sd 5.0 27.5 42.5 49.0 59.0 57.0 34.3 Deskrptv statstkk for de 3 kvnnene: Mn. st Qu. Medan Mean 3rd Qu. Max. sd 8.0 40.0 50.0 85.0 05.0 330.0 75.2 Utskrftene vser resultatene fra en to-utvalgs t-test og en Wlcoxon Rank Sum test: > t.test(hverdag~kjonn) Welch Two Sample t-test data: hverdag b kjonn t = 2.326, df = 45.082, p-value = 0.02483 alternatve hpothess: true dfference n means s not equal to 0 95 percent confdence nterval: 4.780768 67.383748 sample estmates: mean n group Kvnne mean n group Mann 85.03226 48.95000 > wlcox.test(hverdag~kjonn) Wlcoxon rank sum test wth contnut correcton data: hverdag b kjonn W = 399.5, p-value = 0.08544 alternatve hpothess: true locaton shft s not equal to 0 a) Hvlke oppsummerngstall fra den deskrptve statstkken beskrver gruppene best? Begrunn svaret. Boksplottene (og den deskrptve statstkken) vser at dette er skjevfordelte data. Da oppsummeres gruppene best med medan og kvartler (evt 5-talls-oppsummerng): Menn: medan = 43 klesplagg, og 50% av mennene har mellom 28 og 59 klesplagg. Kvnner: medan = 50 klesplagg, og 50% av kvnnene har mellom 40 og 05 klesplagg. b) Sett opp hpoteser for å teste om det er forskjell på antall klær mellom kjønnene. H0: Kvnner og menn har lke mange klær H: Kvnner og menn har kke lke mange klær Forklar hvlken test du velger og hvorfor. Ford v her har skjevfordelte data med outlere hver gruppe, vl kke t-test være aktuelt, og når v har så små antall gruppene, vl heller kke CLT (z-test) slå nn, så her bør v bruke Wlcoxon rank sum test. Hpotesene er derfor kke formulert med parametere, sden det velges en kke-parametrsk test. Velg sgnfkansnvå 0.05. Hvlken konklusjon trekker du og hvorfor? Utskrften vser at p-verden fra WRS test er 0.085, altså større enn 0.05, og H0 beholdes.

Oppgave 3 Blant kke-gravde voksne er det funnet en sammenheng mellom hø bod mass ndex (BMI), altså (vekt kg)/(høde m) 2, og hø nsulnresstens. Insulnresstensen reflekteres høe blodsukkerverder, speselt etter at man har spst. I en stude av 30 gravde kvnner ønsket man å undersøke sammenhengen mellom kvnnenes BMI før gravdteten, og deres blodsukkernvåer (målt mmol/l) to tmer etter matnntak, sste halvdel av svangerskapet. Følgende regresjonsanalse ble gjort: > summar(lm(blodsukker ~ BMI )) Call: lm(formula = blodsukker ~ BMI ) Resduals: Mn Q Medan 3Q Max -2.8228-0.7290-0.2273 0.7749 3.58 Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 2.77942 0.88482 3.4 0.00209 ** BMI 0.08225 0.03897 2. 0.03676 * --- Sgnf. codes: 0 *** 0.00 ** 0.0 * 0.05. 0. Resdual standard error:.69 on 28 degrees of freedom Multple R-squared: 0.03363, Adjusted R-squared: 0.02608 F-statstc: 4.454 on and 28 DF, p-value: 0.0367 a) Hva er effektmålet her? Analsen som er gjort er en regresjonsanalse der responsvarabelen (blodsukker utskrften) relateres tl forklarngsvarabelen x (BMI utskrften) og uttrkkes ved regresjonsmodellen 0 x, ~ N(0, ) Da er regresjonsparameteren effektmålet, altså tallet som oppsummerer sammenhengen mellom forklarngsvarabelen x og responsvarabelen Hvordan tolkes det? vser hvor mange enheters øknng som forventes når x øker med en enhet. G et estmat for sammenhengen mellom mors BMI før svangerskapet og hennes blodsukkernvå to tmer etter matnntak, sste halvdel av svangerskapet. Beregn et 95% konfdensntervall for denne sammenhengen. Estmat for : ˆ 0. 082 95% konfdensntervall for er gtt ved: ˆ t ( ˆ n SE ) 0.08225 t 0.03897 0.025, 2 0.025,28 t0.025,28 fnnes kke tabellen boka, så v må velge enten 0.025, 00 t eller t 0.025, 000 qt(0.025,00) # -.9840 qt(0.025,000) # -.9623 [0.005, 0.60] med df=00 [0.006, 0.59] med df=000

Forskerne mstenkte at vektøknngen svangerskapet kunne være en vktg faktor dette. Det ble lagt tl grunn forsknng fra kke-gravde, som vste at selv en moderat øknng BMI førte tl økt nsulnresstens hos personer som ble fulgt opp over td. Helseråd som gs tl gravde om vektøknng svangerskapet har som mål å redusere uheldge konsekvenser av overvekt, både for den gravde og barnet hun bærer. Anbefalt vektøknng vl derfor være en konsekvens av kvnnenes BMI før svangerskapet. Overvektge kvnner anbefales en mndre vektoppgang enn normalvektge kvnner. b) Kan vektøknngen svangerskapet antas å være en en konfunderende varabel (confounder eller lurkng varable) for sammenhengen mellom mors BMI før svangerskapet og hennes blodsukkernvå to tmer etter matnntak, sent svangerskapet? Ne. Begrunn svaret. Her er det grunn tl å tro at vektøknng er en konsekvens (respons) av BMI før svangerskapet. Selv om det er grunn tl å anta at vektøknngen påvrker blodsukkeret, vl vektøknngen svangerskapet være en mellomlggende faktor mellom BMI før svangerskapet, og blodsukkerverder sste del av svangerskapet. Da er vektøknng en medator, kke en confounder. Kommenter følgende utskrft ls av det du nettopp svarte. Det avhenger av problemstllngen om v skal korrgere for en medator eller kke (ta den med analsen eller kke). Hvs v kke korrgerer, vl det estmerte effektmålet være den totale effekten av BMI før svangerskapet, på blodsukkerverder (og noe av denne effekten kan for eksempel skldes vektøknng). Hvs v er nteressert den totale effekten av BMI, beholder v estmatet fra oppgave a). Hvs v dermot er nteressert den delen av effekten av BMI som skldes andre tng enn vektøknng svangerskapet, velger v det justerte effektestmatet fra analsen under. V ser da at dette utvalget har det svært lte å s for effektestmatet om v velger det ujusterte eller justerte estmatet. > summar(lm(blodsukker ~ BMI + vektoknng)) Call: lm(formula = blodsukker ~ BMI + vektoknng) Resduals: Mn Q Medan 3Q Max -2.8334-0.6902-0.237 0.802 3.5537 Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 2.63692 0.97384 2.708 0.0077 ** BMI 0.08268 0.0392 2.3 0.03653 * vektoknng 0.0789 0.05023 0.356 0.7223 --- Sgnf. codes: 0 *** 0.00 ** 0.0 * 0.05. 0. Resdual standard error:.73 on 27 degrees of freedom Multple R-squared: 0.03459, Adjusted R-squared: 0.0939 F-statstc: 2.275 on 2 and 27 DF, p-value: 0.069

Oppgave 4 Et av datasettene man fnner R er et datasett med høde, omkrets og tømmervolumet 3 felte krsebærtrær. Omkretsen tl trærne ( cm) er målt brsthøde, 37 cm over bakken. I denne oppgaven er tømmervolumet kovertert tl lter. Man kan gå ut fra at en lter tlsvarer en vedkubbe. Dersom man plotter tømmervolumet (kalt vedkubbe utskrften) og omkretsen på treet x (kalt omkrets utskrften) et scatterplot, ser man at den kan uttrkkes ved regresjonsmodellen 0 x, ~ N(0, ). Gjennomsntt og standardavvk er x 05. 7, 25. 0 sd, og 854. 3, sd 465. 5. Utskrften vser en regresjonsanalse som ble gjort av dsse 3 trærne: > summar(lm(vedkubber~omkrets)) Call: lm(formula = vedkubber ~ omkrets) Resduals: Mn Q Medan 3Q Max -228.386-87.972 4.303 98.96 27.468 Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) -046.223 95.2903-0.98 7.62e-2 *** omkrets 7.9769 0.8779 20.48 < 2e-6 *** --- Sgnf. codes: 0 *** 0.00 ** 0.0 * 0.05. 0. Resdual standard error: 20.4 on 29 degrees of freedom Multple R-squared: 0.9353, Adjusted R-squared: 0.933 F-statstc: 49.4 on and 29 DF, p-value: < 2.2e-6 x a) Hvordan må sammenhengen mellom x og scatterplottet se ut for at det skal være fornuftg å bruke denne regresjonsmodellen? Det må være en lneær sammenheng, og varasjonen rundt lnja må være ganske lk hele observasjonsområdet. G estmater og tolknng av estmatene for parameterne 0 og. Estmat for 0 : 046 ˆ0 Estmat for : ˆ 8. 0 0 vser hvor regresjonslnja krsser -aksen. Dette er vktg å ha med for å få en best mulg tlpassng av lnja tl observasjonene. OBS: Sden observasjonene gjelder trær med en gjennomsnttlg omkrets på 06 cm (sd=25), gr det kke menng å oppg dette som «det forventede antall vedkubber for et tre med 0 cm omkrets er -046». vser hvor mange ekstra vedkubber v kan forvente (8 vedkubber) når omkretsen tl treet øker med cm.

b) Beregn et 95% predksjonsntervall for tømmervolum målt vedkubber for et tre med en omkrets på 94.2 cm (dameter 30 cm). 95% predksjonsntervall for når x=94.2 cm er gtt ved: t n SE( ˆ) ˆ 0.025, 2 ˆ ˆ ˆ 0 94.2 046.223 7.9769 94.2 647.3 t 0.025,29 2.0452 2 ( ( x* x) (94.2 05.7) SE ˆ) s 20.4 2 n ( n ) sd 3 3025 2 x 647.3±2.0452 22.7 [396,898] 2 22.7 c) Utskrften under vser en tlsvarende regresjonsanalse for trærnes omkrets mot trærnes høde (målt meter). Et tlhørende 95% predksjonsntervall for høden tl et tre med en omkrets på 94.2 cm (dameter 30 cm) er [9.2, 26.2]. Forklar hva et predksjonsntervall vser. Det vser hvlket ntervall v kan forvente å fnne høden (eller tømmervolumet, oppgave b) ) tl 95% av trærne med en omkrets på 94.2 cm. G en tolknng av de to predksjonsntervallene fra b) og c). Oppgave b): 95 % av trærne med en omkrets på 94.2 cm har et tømmervolum mellom 396 og 898 lter (vedkubber). Oppgave c): 95 % av trærne med en omkrets på 94.2 cm har en høde mellom 9.2 og 26.2 meter. For de 3 krsebærtrærne: Hva gr omkretsen tl treet en mest press predksjon av: tømmervolumet eller høden på treet? Begrunn svaret. Bredden på predksjonsntervallet for tømmervolum er (898-396)lter = 502 lter. Det er stor varasjon, men sammenlgnet med den store varasjonen tømmervolum alle dsse 3 trærne ( 854. 3, sd 465. 5 ), er bredden på predksjonsntervallet kke stort mer enn et standardavvk. Andel forklart varans, «r-squared» modellen fra a) og b) er 0.93. Det ser tlsnelatende ut tl å være et mer presst predksjonsntervall enn b), for bredden er 7 meter. Men sammenlgner v med deskrptv statstkk for høden, > round(c(mean(trehodemeter), sd(trehodemeter)),) [] 23.2.9 Ser v at predksjonsntervallet for høden er mer enn 3 ganger standardavvket tl høden, og det er derfor et ntervall med lte pressjon. Dette ser v også på at andel forklart varans, «r-squared» denne modellen er 0.24 Enten v bruker andel forklart varans eller predksjonsntervallenes bredder, vser begge at tømmervolumet er det som blr mest presst predkert av omkretsen.

> round(c(mean(trehodemeter), sd(trehodemeter)),) [] 23.2.9 > summar(lm(trehodemeter~omkrets)) Call: lm(formula = trehodemeter ~ omkrets) Resduals: Mn Q Medan 3Q Max -3.8349-0.8439 0.0964 0.7537 3.034 Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 8.9074.33603 4.52.49e-4 *** omkrets 0.04027 0.023 3.272 0.00276 ** --- Sgnf. codes: 0 *** 0.00 ** 0.0 * 0.05. 0. Resdual standard error:.688 on 29 degrees of freedom Multple R-squared: 0.2697, Adjusted R-squared: 0.2445 F-statstc: 0.7 on and 29 DF, p-value: 0.002758 SLUTT