MASTR I IDRTTSVITNSKAP 2014/2016 Utsatt individuell skriftlig eksamen i STA 400- Statistikk Mandag 24. august 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator ksamensoppgaven består av 10 sider inkludert forsiden Sensurfrist: 14. september 2015 1
Det er totalt 20 spørsmål. For spørsmål 1 til 10 skal dere skrive opp hvilket svar som er korrekt. Det skal kun oppgis ett korrekt svar per spørsmål. Korrekt svar på ett spørsmål gir 3 poeng, galt svar gir -0,75 poeng og intet svar gir 0 poeng For spørsmål 11 til 20 skal dere skrive et kort og konsist svar. Hvert av spørsmålene kan gi opptil 7 poeng. Alle besvarelsene må skrives på egne besvarelsesark som ellers vanlig ved skriftlig eksamen. Selve oppgaveteksten skal ikke leveres inn. 2
Angi for spørsmål 1 til 10 hvilket av de fem svaralternativene som er korrekt. Det skal kun oppgis ett svaralternativ per spørsmål. Spørsmål 1: Boxplot beskriver grafisk egenskapene til en variable. Hvilke statistiske estimater kan man ikke enkelt lese fra plottet? A B C D Minimum 25. persentilen Avstanden mellom minimum og maksimum 50. persentilen Standardavviket Spørsmål 2: Hvilken test brukes ofte som et ikke-parametrisk alternativ til t-test for parrede observasjoner (engelsk: paired samples t-test)? A B C D Variansanalyse Mann-Whitney U test Friedman Wilcoxen signed-rank test Binomial test Spørsmål 3: For hvilken variabel vil standardavviket og variansen være like? A n variabel med standardavvik lik 1.0 B n variabel der standardavviket er lik medianen C n variabel hvis varians er lik to ganger standardavviket D n variabel med forventing (engelsk: mean) lik 1.0 n variabel uttrykt som en T skår Spørsmål 4: Du gjennomfører et forsøk der 25 studenter fra Idrettshøgskolen og 17 fra Statistikkhøgskolen skal løpe raskest mulig rundt Sognsvann. For å teste om det er signifikant forskjell mellom studenter fra de to høgskolene, utfører du en t-test for to uavhengige utvalg (engelsk: independent samples t-test). For hvilket 95% konfidensintervall kan man si at det er signifikant forskjell på 5% i forventet tid i å løpe rundt Sognsvann mellom studenter fra de to høgskolene. A (-3.3 5,4) B (2,0 3,5) C (-0,5 2,3) D (-0,05 0,05) C (-0,3 3,3) 3
Spørsmål 5: Du skal undersøke om en nyutviklet fotkrem reduserer risiko for gnagsår for soldater. Totalt 400 soldater deles i to grupper der den ene gruppen bruker fotkrem og den andre ikke. Du teller opp antall hendelser av gnagsår etter endt forsøk og presenterer de i en krysstabell. Fotkrem Gnagsår Ja Nei Ja 20 180 Nei 35 165 Hvilken formel estimerer odds ratio for gnagsår hvis soldater bruker fotkrem i forhold til ikke bruk av fotkrem? A B C D 20 35 180 165 35 20 165 180 400 400 20 35 180 165 20 35 20 35 400 400 4
Spørsmål 6: Hva er forventningen (forventning heter på engelsk mean) til en Z-fordelt variabel? A 10 B 1 C 0 D Lik standardavviket σ µ Spørsmål 7: Hvilken formel kan du bruke for å estimere variansen til en normalfordelt variabel? A n 1 ( x x) B ( x x) C 2 2 ( x x) n 1 ( x x) D n 1 2 ( x x) n 1 2 Spørsmål 8: Du har sagt at signifikansnivået er 5%, men for hvilken p-verdi er testen signifikant? A P 0,05 B P større enn 5% C 0,05 < P D P = 1/5 P > 0,05 Spørsmål 9: Du vil uttrykke assosiasjonen mellom to normalfordelte kontinuerlige variable. Hvilken test vil du anbefale? A B C D ANOVA ANCOVA Pearson korrelasjon Spearman korrelasjon Generell lineær modell 5
Spørsmål 10: Du trener et idrettslag på 20 personer og tester deres fysiske prestasjon ved å måle hvor lang tid hver person bruker for å løpe rundt Sognsvann. Denne testen gjennomføres hver mandag ettermiddag i en periode over 10 uker altså 10 repeterte målinger per person. For å vurdere om idrettslaget blir noe bedre i løpet av disse 10 ukene, så regner du ut Pearson korrelasjon mellom fysisk prestasjon og uke for hele ditt datasett. Hvor mange personer antar den statistiske testen at du har i ditt utvalg A 200 B 10 C 30 D 20 100 For spørsmål 11 til 20 skal dere skrive et kort og konsist svar. Spørsmål 11: Hva er forskjellen på statistisk type I og type II feil? Spørsmål 12: Hvordan vil du undersøke med grafer og/eller plott av dataene om en variabel er normalfordelt? Spørsmål 13: Hva er en konfunder (engelske navn er confounder)? Spørsmål 14: Her vises sammenhengen mellom blodtrykk og kroppsmasseindeks i ett utvalg med tilhørende regresjonsanalyse fra SPSS. Skriv opp regresjonsmodellen og forklar hva den sier oss om forholdet mellom kroppsmasseindeks og blodtrykk. 6
Spørsmål 15: Basert på analysene i spørsmål 14, - hvor mye endres gjennomsnittlig blodtrykk hvis en person legger på seg fra en kroppsmasseindeks på 20 til en kroppsmasseindeks på 30? Spørsmål 16: Du måler styrke i både høyre og venstre arm hos 15 utvalgte studenter. Forskjell i styrke mellom høyre og venstre arm analyseres vanligvis statistisk med en paret t- test. Hvilke statistisk forutsetninger legger du til grunn hvis du istedenfor bruker en t-test for to uavhengige utvalg (eng. independent samples t-test)? Spørsmål 17: Gjør kort rede for forskjellen på parametriske og ikke-parametriske statistiske tester og ved hvilke type data de bør brukes. 7
Spørsmål 18: Data fra en studie om kaffedrikking og armstyrke er her analysert med SPSS på forskjellig vis. Hva er effekten av kaffedrikking på styrke i benkpress? Begrunn ditt svar basert på analysene fra SPSS 8
Spørsmål 19: Hva er sentralgrenseteoremet og hvordan kan det ha betydning ved valg av parametrisk eller ikke-parametriske statistiske tester. 9
Spørsmål 20: Vi har gruppert personer med hensyn til blodtrykk over og under 160 og utført en logistisk regresjonsanalyse. Resultat fra regresjonsanalysen viser at alder gir en odds ratio på 1,048 med hensyn til blodtrykk. Kan du beskrive med egne ord hva dette egentlig betyr? Lykke til!! 10