Det medisinske fakultet Institutt for kreftforskning og molekylær medisin Eksamensoppgave i ST3001 Onsdag 16. desember 2010, kl. 9.00 13:00 ntall studiepoeng: 7.5 Tillatte hjelpemidler: Kalkulator og alle skrevne og trykte hjelpemidler. ntall sider (inkludert forside): 7 Kontaktperson under eksamen: Grethe lbrektsen, mob. 954 98 743 Sensurfrist: 17. januar 2011 Sensuren kunngjøres på internett http://studweb.ntnu.no/ 1
OPPGVE 1. Histogrammet viser fordeling av verdier av vekstendring (målt i gram) over en 3-månedersperiode i et rotteforsøk (diett-studie), med tilpasset normalkurve. a) Hva kjennetegner en kontinuerlig, normalfordelt variabel? - Hva er et passende sentral- og spredningsmål for en kontinuerlig, normalfordelt variabel? - synes vektendring å være tilnærmet normalfordelt, utfra histogrammet ovenfor? - Hva er gjennomsnittlig vektendring i dette datamaterialet, sånn omtrentlig, utfra det du kan lese av i histogrammet? b) Median-verdien er ofte brukt som sentralmål når data er skjevfordelt. - Hvordan definerer vi median-verdien? - Hva er et passende mål på spredning i verdier når data er skjevfordelt? - Hva kan være en passende grafisk framstilling når data er skjevfordelt? c) Hva kjennetegner en kategorisk variabel, og gi et eksempel på en slik type variabel. - Hvordan kan du presentere fordeling av verdier til en kategorisk variabel, gitt at du har et datamaterialet med opplysninger? 2
OPPGVE 2. I en studie har man målt tid til blod koagulerer blant pasienter som har fått medikament og B, h.h.v (2 uavhengige grupper). Empirisk (observert) gjennomsnitt X, standardavvik (SD) og standardfeil (SE) i hver gruppe er: Medikament : X 8.75min, _ SD( X ) = 0.5822, _ SE( X ) = 0.2377, _ n = 6 = B =.74 min, _ SD( X B) = 0.8182, _ SE( X B) = 0.3093, _ nb Medikament B: X 9 = 7 Standardfeil til differansen i gjennomsnittsverdiene, SE( X XB ), under antagelse om at varians er den samme i hver gruppe, er 0.40. a) Hvilken statistisk test passer det å bruke for å undersøke om gjennomsnittlig koaguleringstid (forventet verdi i populasjon) er forskjellig mellom pasienter behandlet med medikament og medikament B, hhv. b) Sett opp en nullhypotese og en alternativ hypotese for testen (tosidig test), både spesifikt i.f.t. verdi av parameter/parametre du vil teste på, og beskriv også kort med ord betydning av uttrykket. c) Sett opp et uttrykk for teststørrelsen for å undersøke om gjennomsnittsverdi er forskjellig mellom 2 uavhengige grupper. Sett inn verdier i uttrykket ut fra opplysninger gitt i start av oppgaven (du trenger ikke å regne ut verdi av teststørrelsen). d) Teststørrelsen har absoluttverdi 2.475 (positivt eller negativt fortegn). Kritisk verdi for denne testen, på 5%-nivå, og med 11 frihetsgrader (det er totalt 13 studie-deltagere), er 2.201. - Hva mener vi med kritisk verdi og hva forteller den om p-verdi for testen? - Hvordan vil du beskrive det endelige resultat fra denne analysen. e) Hva uttrykker p-verdien tilhørende den statistiske testen (beskriv i ord, ikke bare i.f.t. om resultat er signifikant eller ei)? f) Hvilken antagelse(r) er gjort for at resultat fra testen ovenfor skal være gyldig? 3
OPPGVE 3 SPSS utskriften nedenfor viser resultat fra en analyse på sammenheng mellom kjønn (sex) og røyking (smokesta). Data er hentet fra en studie som har innhentet opplysninger om 654 barn og unges røykevaner. smokesta * sex Crosstabulation Sex jente gutt Total smokesta Total ikke-røyker Røyker Count 279 310 589 Expected Count 286.4 302.6 589.0 % within smokesta 47.4% 52.6% 100.0% % within sex 87.7% 92.3% 90.1% Count 39 26 65 Expected Count 31.6 33.4 65.0 % within smokesta 60.0% 40.0% 100.0% % within sex 12.3% 7.7% 9.9% Count 318 336 654 Expected Count 318.0 336.0 654.0 % within smokesta 48.6% 51.4% 100.0% % within sex 100.0% 100.0% 100.0% Chi-Square Tests symp. Sig. (2- Exact Sig. (2- Exact Sig. (1- Value Df sided) sided) sided) Pearson Chi-Square 3.739 a 1.053 Continuity Correction b 3.250 1.071 Likelihood Ratio 3.754 1.053 Fisher's Exact Test.067.036 Linear-by-Linear ssociation 3.733 1.053 N of Valid Cases 654 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 31,61. b. Computed only for a 2x2 table 4
a) Sett opp et uttrykk for teststørrelsen for Kji-kvadrat testen på om det er sammenheng mellom kjønn (sex) og røyking (smoke). Sett inn verdier fra SPSS utskriften i uttrykket (du trenger ikke regne ut verdien). b) Expected count (forventet verdi) inngår i uttrykket for teststørrelsen til kjikvadrat testen. - Hva er expected count (forventet antall) i denne sammenheng? - Hvordan kan du enkelt beregne verdi av expected count i en bestemt celle (rubrikk) i kryss-tabellen, og hva er grunnlaget for denne beregningen? c) Beskriv resultat fra analysen, basert på opplysninger i SPSS-utskriften. d) Hva er antagelsen for at resultat fra kji-kvadrat-testen skal være gyldig - er antagelsen oppfylt i dette tilfellet? 5
OPPGVE 4 SPSS output nedenfor viser resultat fra enkel linær regresjonsanalyse for sammenheng mellom fastende blod-glukose (B_glukose, mmol/l) og gjennomsnittlig sammentreknings-hastighet for venstre ventrikkel (Vcf, % per sekund), målt ved ekkokardiografi, blant 23 diabetes-pasienter. 6
a) Sett opp et uttrykk for regresjonsmodellen som beskriver linær sammenhengen mellom blodglukose (B_glukose) og sammentrekningshastighet (Vcf), basert på informasjon i SPSS-output. - Hvordan tolker du verdien av regresjonskoeffisienten for blodglukose? - Hva ligger i antagelsen om linær sammenheng mellom blodglukose og sammentrekningshastighet (Vcf) i denne modellen? b) SPSS-utskriften viser også 95% konfidensintervall for regresjonskoeffisienten. - Hvilken informasjon gir et 95% konfidensintervall? - Hva kan du si om p-verdi for test på linær sammenheng mellom blodglukose og sammentrekningshastighet, dersom et 95% konfidensintervall ikke omslutter verdien 0? c) Hvor mye av variasjon (spredning i verdier) i sammentrekningshastighet i venstre ventrikkel (Vcf) kan forklares av variasjon i blodglukose-verdier, basert på denne regresjonsanalysen? - synes det å være en sterk linær sammenheng mellom blodglukose og sammentrekningshastighet i dette datamaterialet? 7