STK H-26 Løsnngsforslag Alle deloppgaver teller lkt vurderngen av besvarelsen. Oppgave a) De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Medan og kvartler for hver gruppe. x og sd gr gode oppsummernger av data som er tlnærmet normalfordelte (rmelg symmetrske og med lette haler), jfr regelen for x 2 sd og x 3 sd Medan og kvartler er robuste tall og egner seg for å beskrve data som kke er symmetrske om mdten. b) Hypoteser og hypotesetester Gjelder alle: Alternatv formulerng for de normalfordelte: H: Gruppene er lke Eller H: Gruppene er kke lke Eller Alternatv formulerng for de skjevfordelte (ford n er stor og CLT trolg slår nn) Eller Eller Der er forventnngsverden den normalvektge gruppa (gruppe ) og er forventnngsverden den overvektge gruppa (gruppe ) To-utvalgs t-test Alternatv formulerng for de ekstremt skjevfordelte Rangsum = Rangsum Rangsum Rangsum Der Rangsummene er summen av rangerngene tl verdene de to gruppene. Wlcoxon rank sum test Ford n er stor, antas det at man kan bruke to-utvalgs t-test både for de normalfordelte dataene og de skjevfordelte dataene, unntatt de 4 ekstremt skjeve. Dsse er trolg for skjeve tl at CLT (Sentralgrenseteoremet) har slått nn nok ved denne utvalgsstørrelsen. Wlcoxon rank sum test er tryggest her. c) Sgnfkansnvået er den (subjektvt vurdert) maksmalt akseptable sannsynlgheten for Type I-fel. P(Type I-fel) = P(Forkaste H H ).5 Med 2 tester og P(Type I-fel) = P(Forkaste H H ) =.5 hver test: Forventer 2*.5= sgnfkante tester. Ved tre tester: P(Type I-fel) = P(Forkaste H H ) = P(Mnst én H forkastes Alle 3 H er sanne) = = P(Alle H beholdes H ) = -.95 3 =.426:
Oppgave 2 a) Regresjonsmodellen: y x, ~ N(, ), uavhengge. Korrelasjonsanalyse for om det er en sammenheng mellom prs og nøyaktghet: Korrelasjonen «populasjonen» (den sanne korrelasjonen) er ρ. H : Ingen sammenheng mellom prs og nøyaktghet, ρ = H : Det er en sammenheng mellom prs og nøyaktghet, ρ (Alternatvt ensdge hypoteser, der nøyaktgheten øker med prsen ) Regresjonsanalyse for prs og nøyaktghet: y x H : Ingen sammenheng mellom prs og nøyaktghet, β = H : Det er en sammenheng mellom prs og nøyaktghet, β (Alternatvt ensdge hypoteser, der nøyaktgheten øker med prsen) Jeg har valgt tosdge hypoteser ford det er mest konservatvt, og jeg kke vet noe om verken produksjon av meterstokker, deres nøyaktghet, eller prsmodeller som blr brukt. (Alternatvt Jeg har valgt ensdge hypoteser ford det er grunn tl å undersøke om nøyaktgheten øker med prs.) Både korrelasjonsanalysen basert på Pearson s r, og regresjonsanalysen gr en p-verd for (H : ˆ =) på.397, som vl g konklusjonen «Behold H» på alle sgnfkansnvåer under.397. V beholder derfor H, og konkluderer med at det er ngen sgnfkant sammenheng mellom nøyaktghet og prs. Pearson's product-moment correlaton p-value =.3969 Coeffcents: Estmate Std. Error t value Pr(> t ) prs.752.22.867.397 Oppgave 3 a) Effektmål: Et tall som oppsummerer effekten av (varasjon ) blodsukker på (varasjon ) fødselsvekt. I en regresjonsanalyse er det regresjonskoeffsenten som vser stgnngstallet tl regresjonslnja ( regresjonslgnngen y x ). er stgnngstallet tl regresjonslnja. Det vser hvor mange enheters forskjell fødselsvekt (y) som forventes når blodsukkeret (x) øker med en enhet. Estmat: ˆ 72
95% konfdensntervall: b) En konfunderende varabel er en varabel som både påvrker responsvarabelen og forklarngsvarabelen en regresjonsanalyse (common cause), og dermed også påvrker sammenhengen (estmatet for effektmålet) mellom de to varablene. V må ha ekspertkunnskap om problemet for å avgjøre om en varabel er en konfounder. Ja, mors body mass ndex (bm) kan ses å være en konfunderende varabel for sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt, ford: Her har v nok opplysnnger oppgaveteksten tl å kunne anta at bm kan påvrke (det målte) blodsukkeret, altså forklarngsvarabelen, og at bm også kan fødselsvekta (responsvarabelen) gjennom andre mekansmer enn blodsukkeret. I så fall vl estmatet for sammenhengen mellom blodsukker og fødselsvekt være based/felaktg, hvs v kke tar hensyn tl bm analysen. c) Nytt estmat for sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt: ˆ 94 Nytt 95% konfdensntervall : Ne, det er kke en sgnfkant sammenheng mellom mors blodsukkernvå og barnets fødselsvekt.
Begrunnelse : Dette tlsvarer en hypotesetest for H : Ingen sammenheng mellom mors blodsukkernvå og barnets fødselsvekt, β =, mot H : Det er en sammenheng mellom mors blodsukkernvå og barnets fødselsvekt, β en regresjonsmodell med tre parametere, y x 2x2, der x er blodsukker og x 2 er bm, som vst den sste utskrften oppgaven. Der ser v at p- verden er.28, hvlket betyr at H beholdes på nvå.5. Begrunnelse 2: 95% KI for fra c) nneholder H -verden =, og det forteller oss det samme som hypotesetesten, nemlg at v beholder H (på nvå.5). Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 2964.5 336.97 8.798 7.3e-6 *** blodsukker 93.763 87.426.72.2848 bm 9.883 8.397 2.368.89 * Den sgnfkante sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt som v så oppgave a) forsvnner altså når v korrgerer for den konfunderende varabelen bm, og det er derfor grunn tl å tro at sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt kke var reell, men skyldtes konfunderng. Oppgave 4 a) Fra utskrften ser v at estmatet for parameterne og er ˆ 3. 7, og ˆ. 92. Tolknng: ˆ vser hvor regresjonslgnnga skjærer y-aksen. Hvs øretermometer og sentraltemperaturen vste det samme (som de deelt sett burde gjøre), vlle denne vært. At ˆ >, vser at sentraltemperaturen er ltt høyere enn øretemperaturen. Tlsvarende vser ˆ stgnngstallet tl regresjonslnja. Igjen, hvs øretermometer og sentraltemperaturen vste det samme (som de deelt sett burde gjøre), vlle denne vært. Hypotesetestene som reflekteres de to første p-verdene utskrften: H : β =, mot H : β (p-verd.4) og
H : β =, mot H : β (p-verd <.) b) 95% predksjonsntervall for sentraltemperaturen når øretemperaturen vser 38 ºC: c) 95% konfdensntervall for forventet forskjell på de to målemetodene: Kommentar: Både regresjonsanalysen tdlgere oppgaven og konfdensntervallet vser at det er en statstsk sgnfkant forskjell på øretemperaturen og sentraltemperaturen, mer spesfkt at sentraltemperaturen (den rktge temperaturen) er høyere enn det øretemperaturen vser. Det er derfor grunn tl å være forsktg med å bruke øretemperatur, speselt hvs man har med krtsk syke pasenter å gjøre, eller pasenter som kke tåler å ha høy feber.