MASTER I IDRETTSVITENSKAP 2014/2016 Individuell skriftlig eksamen i STA 400- Statistikk Fredag 13. mars 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator Eksamensoppgaven består av 10 sider inkludert forsiden Sensurfrist: 10.april 2015 1
Det er totalt 20 spørsmål. For spørsmål 1 til 10 skal dere skrive opp hvilket svar som er korrekt. Det skal kun oppgis ett korrekt svar per spørsmål. Korrekt svar på ett spørsmål gir 3 poeng, galt svar gir -0,75 poeng og intet svar gir 0 poeng For spørsmål 11 til 20 skal dere skrive et kort og konsist svar. Hvert av spørsmålene kan gi opptil 7 poeng. Alle besvarelsene må skrives på egne besvarelsesark som ellers vanlig ved skriftlig eksamen. Selve oppgaveteksten skal ikke leveres inn. 2
Angi for spørsmål 1 til 10 hvilket av de fem svaralternativene som er korrekt. Det skal kun oppgis ett korrekt svaralternativ per spørsmål. Spørsmål 1: Boxplot beskriver grafisk egenskapene til en variable. Hvilke statistiske estimater kan man ikke enkelt lese fra plottet? A Minimum B C D E 25. persentilen Avstanden mellom minimum og maksimum gjennomsnitt 50. persentilen Spørsmål 2: Hvilken test brukes ofte som et ikke-parametrisk alternativ til t-test for to uavhengige utvalg (engelsk: independent samples t-test)? A Variansanalyse B Mann-Whitney U test C Friedman D Wilcoxen signed-rank test E Binomial test Spørsmål 3: For hvilken variabel vil standardavviket og variansen være like? A En variabel med forventing (engelsk: mean) lik 1.0 B En variabel uttrykt som en T skår C En variabel med standardavvik lik 1.0 D En variabel der standardavviket er lik medianen E En variabel hvis varians er lik to ganger standardavviket 3
Spørsmål 4: Du skal undersøke om en nyutviklet fotkrem reduserer risiko for gnagsår for soldater. Totalt 400 soldater deles i to grupper der den ene gruppen bruker fotkrem og den andre ikke. Du teller opp antall hendelser av gnagsår etter endt forsøk og presenterer de i en krysstabell. Fotkrem Gnagsår Ja Nei Ja 20 180 Nei 165 Hvilken formel estimerer odds ratio for gnagsår hvis soldater bruker fotkrem i forhold til ikke bruk av fotkrem? A B C D E 20 400 400 400 400 20 20 165 180 20 180 165 180 165 20 4
Spørsmål 5: Se igjen på resultatene om fotkrem og gnagsår i spørsmål 4. Hvilken formel estimerer rate ratio for gnagsår hvis soldater bruker fotkrem i forhold til ikke bruk av fotkrem? A B C D E 20 400 400 400 400 20 20 165 180 20 180 165 180 165 20 Spørsmål 6: Du gjennomfører et forsøk der 20 studenter fra Idretthøgskolen og 17 fra Statistikkhøgskolen skal løpe raskest mulig rundt Sognsvann. For å teste om det er signifikant forskjell mellom studenter fra de to høgskolene, utfører du en t-test for to uavhengige utvalg (engelsk: independent samples t-test). For hvilket 95% konfidensintervall kan man si at det er signifikant forskjell på 5% i forventet tid i å løpe rundt Sognsvann mellom studenter fra de to høgskolene. A (-2.3 5,4) B (-5,4 2,3) C (-0,3 3,3) D (-0,05 0,05) E (1,0 3,0) Spørsmål 7: Du vil uttrykke assosiasjonen mellom to ordinale variable. Hvilken test vil du anbefale? A ANOVA B ANCOVA C Pearson korrelasjon D Spearman korrelasjon E Generell lineær modell 5
Spørsmål 8: Du trener et idrettslag på 30 personer og tester deres fysiske prestasjon ved å måle hvor lang tid hver person bruker for å løpe rundt Sognsvann. Denne testen gjennomføres hver mandag ettermiddag i en periode over 10 uker altså 10 repeterte målinger per person. For å vurdere om idrettslaget blir noe bedre i løpet av disse 10 ukene, så regner du ut Pearson korrelasjon mellom fysisk prestasjon og uke for hele ditt datasett. Hvor mange personer antar den statistiske testen at du har i ditt utvalg A 30 B 10 C 300 D 20 E 150 Spørsmål 9: Du har en tilfeldig variabel X med N observasjoner som er normalfordelt med forventning μ og varians σ 2. Hvilken formel gir deg en ny variable med forventningen er lik 0 og standardavviket er lik 1,0? A ( x x) 2 B C D n 1 ( x x) X µ σ σ X µ ( x x) E n 1 2 2 Spørsmål 10: I løpet av forelesningene er det nevnt at t-testen ble utviklet av en forsker som arbeidet med mat- og drikkevarer. Ved hvilken bedrift arbeidet denne statistikeren? A Guinness B Nestlé C Coca Cola D Unilever E Carlsberg 6
For spørsmål 11 til 20 skal dere skrive et kort og konsist svar. Spørsmål 11: Nedenfor er en enkel lineær regresjonsmodell skrevet med statistiske symboler. Hva uttrykker symbolet ε og hvilke statistiske forutsetninger antar vi at det har? y = β + β x + ε ε ~ N 0 i 0 1 i1 i, 2 ( σ ) Spørsmål 12: Hva er et residualplott og hvordan kan det brukes for å kvalitetssikre en regresjonsanalyse? Spørsmål 13: Her vises sammenhengen mellom blodtrykk og kroppsmasseindeks i ett utvalg med tilhørende regresjonsanalyse fra SPSS. Skriv opp regresjonsmodellen og forklar hva den sier oss om forholdet mellom kroppsmasseindeks og blodtrykk. 7
Spørsmål 14: Basert på analysene i spørsmål 13, - hvor mye reduseres gjennomsnittlig blodtrykk hvis en person slanker seg fra en kroppsmasseindeks på 32 til en kroppsmasseindeks på 22? Spørsmål 15: Basert på regresjonsanalysene til spørsmål 13, kan du si noe om hvor mye av variasjonen i blodtrykk som er forklart av kroppsmasseindeks? Spørsmål 16: De kliniske analysene av blodtrykk i spørsmål 13 er analysert på nytt i SPSS, men denne gangen i forhold til alder og kjønn som vist nedenfor. Det er utført både t-tester og regresjonsanalyse/generell lineær modell 8
Hvilket estimat vil du anbefale hvis du ønsker å undersøke om kjønn har en fysiologisk effekt på blodtrykk? Begrunn svaret. Spørsmål 17: De statistiske analysene av dataene i spørsmål 16 er utført på nytt med en annen statistisk modell der vi har inkludert et interaksjonsledd for kjønn og alder. Sammenlignet med resultatene i spørsmål 16, så gir denne modellen inntrykk av at gjennomsnittlig forskjell i blodtrykk mellom menn og kvinner er 18,8 og at denne forskjellen er statistisk signifikant. Kan du forklare hva som er den vesentlige forskjell på dette estimatet fra regresjonsanalysen/den generelle lineære modellen i spørsmål 16 Spørsmål 18: Basert på analysene i spørsmål 17, har kvinner eller menn høyest gjennomsnittlig blodtrykk ved 60 års alder? (nøyaktige utregninger er ikke nødvendig, men gi en begrunnelse for ditt svar) 9
Spørsmål 19: Vi har gruppert personer med hensyn til blodtrykk over og under 160 og utført en logistisk regresjonsanalyse. Resultat fra regresjonsanalysen viser at alder gir en odds ratio på 1,048 med hensyn til blodtrykk. Kan du beskrive med egne ord hva dette egentlig betyr? Spørsmål 20: Kan du beskrive statistisk-matematisk hvorfor det er slik at når vi opphøyer koeffisienten til en variabel X fra en logistisk regresjonsmodell i det naturlige tallet e, så gir det oss odds ratio? Ta gjerne utgangpunkt i følgende ligninger p log = β 1 p p odds = = e 1 p 0 + β X 1 β0 +β1x β0 β1x = e e 10