Det medisinske fakultet Institutt for kreftforskning og molekylær medisin Eksamensoppgave i ST3001 fredag 25. mai 2012, kl. 9.00 13:00 Antall studiepoeng: 7.5 Tillatte hjelpemidler: Kalkulator og alle skrevne og trykte hjelpemidler. Antall sider (inkludert forside): 7 Kontaktperson under eksamen: Grethe Albrektsen, mob. 954 98 743 Eksamensresultat: 18. juni 2012 Sensuren kunngjøres på internett http://studweb.ntnu.no/ 1
VIKTIG - Les nøye gjennom oppgaveteksten før du begynner. - Svar kort og presist. - Husk å nummerere hvert spørsmål/svar. Du trenger ikke å gjenta hele oppgaveteksten i din besvarelse. OPPGAVE 1 Gjennomsnitt og standardavvik er vanlig å oppgi som sentral- og spredningsmål for en kontinuerlig, normalfordelt variabel. a) Hva kan du si om fordeling av verdier av en kontinuerlig, normalfordelt variabel som har forventet verdi (gjennomsnitt) 2.5 og standardavvik på 1.0? b) Hva er standardfeil et uttrykk for? c) Hvordan defineres (hva er) medianverdi, og når passer det å oppgi median-verdi som sentralmål (typisk verdi) i et empirisk datamateriale? d) Hva vil gi en passende grafisk framstilling av fordeling av verdier av en kontinuerlig variabel? 2
OPPGAVE 2 Høyde og vekt blir hvert år registrert på ungdommer som skal inn til førstegangstjeneste i Norge. Rekruttene ansees å være et representativt utvalg av ungdom i den norske befolkning (spesifikt alderstrinn og kjønn). I en studie ønsker man å utnytte disse dataene for å undersøke om kroppsmasse, målt som Body Mass Index (BMI) har endret seg i løpet av en 10-års periode (fra 2000 til 2010). a) Hvilken statistisk test-metode (metoder) kan anvendes for å undersøke om BMI (på kontinuerlig skala) blant 19-årige mannlige rekrutter er forskjellig i år 2000 og 2010? Gi en kort beskrivelse av hva som testes (sammenlignes) i.f.t. valgt metode hvilke forutsetninger (antagelser) som ligger til grunn for metoden(e) du har valgt b) BMI kan deles inn i 4 kategorier; undervektig, normalvektig, overvektig, eller ekstremt overvektig. hvilken statistisk test-metode (metoder) kan anvendes for å undersøke om BMI (kategorisert variabel) er forskjellig i 2000 og 2010? gi en kort beskrivelse av hvilke forutsetninger (antagelser) som ligger til grunn for metoden(e) du har valgt c) I den samme studien ønsker man også å undersøke om BMI (på kontinuerlig skala) har økt jevnt hvert år fra 2000 til 2010 (årstall ansees å være en kontinuerlig variabel). hvilken statistisk metode (metoder) kan anvendes for å undersøke dette? gi en kort beskrivelse av hvilke forutsetninger (antagelser) som ligger til grunn for metoden(e) du har valgt. 3
OPPGAVE 3 I en studie som omfattet 60 personer som ikke trente regelmessig, ble kolesterol-konsentrasjonen i blodet målt før og etter en 4-ukers intervensjonsperiode bestående av organisert trening (moderat-høy intensitet). På datafilen er kolesterolnivåer før og etter intervensjon registrert med variabelnavn CHOLbefore og CHOLafter, hhv. Studien hadde som formål å undersøke om intervensjon (trening) hadde effekt på kolesterolnivået. Analyse av data ved hjelp av en paret T-test gav følgende resultat (SPSS utskrift): Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 CHOLbefore 5.566 60.4937.0637 CHOLafter 5.390 60.6581.0850 Paired Samples Correlations N Correlation Sig. Pair 1 CHOLbefore & CHOLafter 60.766.000 Paired Samples Test Paired Differences 95% Confidence Interval of the Std. Error Difference Mean Std. Deviation Mean Lower Upper Pair 1 CHOLbefore CHOLafter.1763.4232.0546.0669.2856 Paired Samples Test T Df Sig. (2-tailed) Pair 1 3.226 59.002 4
a) Hvorfor er det benyttet en paret (ett-utvalgs) T-test? b) Definér nullhypotese og alternativ hypotese for den statistiske testen som er anvendt (paret T-test, to-sidig test) i relasjon til verdi av parameter som testes tolkningsmessig (beskriv kort) c) Hva uttrykker p-verdi for den statistiske testen (paret T-test)? i relasjon til sannsynlighetsfordeling til teststørrelsen tolkningsmessig betydning d) Hva er antagelsen(e) på den statistiske testen (paret T-test) - hvilken alternativ statistisk metode (test) kunne vært anvendt dersom antagelsen(e) ikke er oppfylt? e) Beskriv resultatet fra analysen, basert på opplysninger i SPSS-utskriften. Rapporter estimert verdi (punkt- og intervall-estimat) av endring i kolesterolnivå resultat fra den statistiske testen f) Det er mulig å gjøre feil, dvs. trekke feil konklusjon, når resultat fra studien (basert på empirisk datamateriale, utvalg) overføres til populasjonsnivå (generalisering av resultater). - hvilke type(r) feil kan vi gjøre? 5
OPPGAVE 4 I en studie blant barn og unge i alderen 3-19 år ble det benyttet enkel linær regresjonsanalyse for å undersøke sammenheng mellom alder (age, ett-års intervall) og lungekapasitet, målt ved forced expiratoy volume, FEV (liter/sek.). Analyse av data gav følgende resultat (SPSS utskrift): Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1.756 a.572.572.56753 a. Predictors: (Constant), age ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 280.919 1 280.919 872.184.000 a Residual 210.001 652.322 Total 490.920 653 a. Predictors: (Constant), age b. Dependent Variable: fev Coefficients a Unstandardized Coefficients Standardized Coefficients 95.0% Confidence Interval for B Lower Upper Model B Std. Error Beta t Sig. Bound Bound 1 (Constant).432.078 5.541.000.279.585 Age.222.008.756 29.533.000.207.237 a. Dependent Variable: fev 6
a) Sett opp et (matematisk) uttrykk for den linære regresjons-modellen som beskriver linær sammenheng mellom alder (år) og lungekapasitet, målt ved FEV. Bruk opplysninger i SPSS utskriften. b) Hvordan tolker du verdien av regresjonskoeffisienten? c) Hva er forventet verdi av FEV for en 10-åring, basert på den linære regresjonsmodellen? d) Er det en sterk grad av linær sammenheng mellom alder og lungekapasitet, målt ved FEV? Begrunn svaret. 7