STUDIEÅRET 2014/2015 Utsatt individuell skriftlig eksamen i STA 200- Statistikk Mandag 24. august 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator. Formelsamling blir delt ut på eksamen Eksamensoppgaven består av 8 sider inkludert forsiden Sensurfrist: 14. september 2015 1
Eksamen består av både flervalgs- og kortsvarsoppgaver. På flervalgsoppgavene er det kun ett riktig svar per oppgave. Riktig svar gir 2-4 poeng (se hver oppgave), mens feil svar gir -1 poeng. Hvis oppgaven ikke besvares gis det 0 poeng. På kortsvarsoppgavene kan du skrive inntil 10 linjer. Det blir gitt 0-4 poeng per oppgave. Besvarelsen skal skrives på egne ark som ellers ved vanlig skriftlig eksamen. Dere skal ikke vise utregninger. Vedlagt: Formelark og tabeller Oppgave 1 (Hver deloppgave gir 1 poeng) Helsedirektoratet har gjennomført flere store kartleggingsundersøkelser av hvor aktive den norske befolkningen er. I disse kartleggingsundersøkelsene har man benyttet en rekke ulike målemetoder, blant annet spørreskjema. Nedenfor følger eksempler på hva deltakerne ble bedt om å svare på i et av disse spørreskjemaene. a) Deltakerne ble bedt om å oppgi alder (år) høyde i centimeter (cm) og kroppsvekt i kilo (kg). De gjennomsnittlige resultatene så slik ut: Deskriptive data Kvinne Mann Alder (år) 43.8 45.2 Høyde (cm) 167.5 180.7 Vekt (kg) 69.8 85.9 Hvilket nivå ligger data på (alder, høyde og vekt)? 1. Nominal 2. Kontinuerlige 3. Ordinal 4. Diskret b) Deltakerne ble også bedt om å vurdere sin egen helse på en fem punkts skala der 1=Meget god, 2=God, 3=Verken god eller dårlig, 4=Dårlig og 5=Meget dårlig. Hvilket nivå ligger data på? 1. Nominal 2. Diskret 3. Ordinal 4. Kontinuerlig 2
Oppgave 2 Beregn gjennomsnitt ( ) og standardavviket (SD) til følgende utvalg (regn med 1 desimal): 4 10 2 5 5 6 7 11 7 1. =6.3, SD = 2.8 2. =6.6, SD = 3.6 3. =6.3, SD = 4.1 4. =7.0, SD = 2.2 Oppgave 3 Syntes du sommeren kunne vært litt varmere? Det syntes kanskje de som selger is også. Tallene i tabellen under viser en tenkt sammenheng mellom dagtemperatur og inntekter fra salg av iskrem for samme dag. Tenk deg at tallene stammer fra en iskremkiosk i Oslo, seks dager i juli 2015. Dag(x) Mandag Tirsdag Onsdag Torsdag Fredag Lørdag Temperatur i grader (x) 16 20 15 17 22 25 Iskremsalg i kroner (y) 550 1500 850 450 1200 2250 Gjennomsnittlig ( Gjennomsnittlig ( ) temperatur i perioden er 19.2 grader ) iskremsalg i perioden er 1133 kr a) Bruk disse verdiene og regn ut Pearsons korrelasjonskoeffisient. Hvor stor blir r? (Oppgaven gir 4 poeng) 1. r = ca 0.77 2. r = ca. 0.88 3. r = ca 0.51 4. r = ca -0.94 b) Hvilket utsagn om korrelasjon er korrekt: 1. Korrelasjonskoeffisienten brukes til å påvise en årsak-virkning sammenheng 2. Korrelasjonskoeffisienten brukes til å si noe om hvor stor sannsynlighet det er for at det er signifikant forskjell mellom to uavhengige grupper 3. Korrelasjonskoeffisienten angir styrken på en eventuell samvariasjon mellom to variabler 4. Korrelasjonsanalyser kan ikke brukes på ordinale variabler 3
Oppgave 4 Tabellen viser en 2x2 krysstabell over 2894 kvinner og menn. Personene ble spurt om i hvilken grad de selv tror de oppfyller gjeldende anbefalinger for fysisk aktivitet (utfører minst 150 minutter med fysisk aktivitet av moderat intensitet per uke). Du ønsker å undersøke hvorvidt det er kjønnsforskjeller i andelen som tror de oppfyller anbefalingene. Kvinne Mann Totalt Oppfyller anbefalingene 900 850 1750 Oppfyller ikke anbefalingene 664 480 1144 Totalt 1564 1330 2894 Følgende hypoteser ble satt opp: H0: Det er ingen kjønnsforskjeller i hvorvidt man tror man oppfyller anbefalingene for fysisk aktivitet H1: Det er kjønnsforskjeller i hvorvidt man tror man oppfyller anbefalingene for fysisk aktivitet a) Gjennomfør en kji-kvadrat test. Hva blir verdien til kji-kvadrat? (Oppgaven gir 4 poeng) 1. Kji-kvadrat ligger mellom 2.5 og 3.5 2. Kji-kvadrat ligger mellom 0.5 og 1.5 3. Kji-kvadrat ligger mellom 12 og 13 4. Kji-kvadrat ligger mellom 92 og 93 b) Slå opp i tabell for kritisk verdi for kji-kvadrat. Hva er kritisk verdi for kji-kvadrat (5% signifikansnivå)? 1. 9.49 2. 3.84 3. 7.81 4. 5.99 c) Hva kan vi konkludere med? 1. H0 beholdes 2. H0 forkastes 4
Oppgave 5 En gruppe studenter fra NIH kaster spyd, og resultatene blir angitt i meter (m). Histogrammet viste at data var skjevfordelte. Ved hjelp av Mann-Whitney U-rangsum ønsker vi å undersøke om det er signifikant forskjell i kastlengde mellom studentene på SPM (gruppe 1) og studentene på FAH (gruppe 2). Vi setter opp følgende hypoteser: H0: Gruppene er like H1: Gruppene er forskjellige Person Gruppe Kastlengde (m) 1 1 35 2 1 37 3 1 50 4 1 25 5 1 56 6 1 30 7 1 33 8 1 29 9 2 37 10 2 39 11 2 64 12 2 49 13 2 59 14 2 56 15 2 54 a) Beregn rangsummen og verdien av U for begge gruppene. Hvor stor er den laveste U? (Oppgaven gir 4 poeng) 1. U = 8 2. U = 13.5 3. U = 15.0 4. U = 48 b) Slå opp i kritisk verdi for Mann Whitneys U. Hva er kritisk verdi for U? 1. 17 2. 19 3. 10 4. 15 c) Hva kan vi konkludere med? 1. Vi konkluderer med at H0 forkastes 5
2. Vi kan ikke konkludere på bakgrunn av dette 3. Vi konkluderer med at H0 beholdes Oppgave 6 Hva betyr det at signifikansnivået er 5% (α = 0.05)? 1. Det betyr at vi beholder arbeidshypotesen (H1) og sier at den er riktig 2. Det avhenger helt av datasettet vårt og vil variere fra gang til gang 3. Hvis nullhypotesen (H0) er riktig vil vi i 5% av tilfellene godta denne 4. Hvis nullhypotesen (H0) er riktig, godtar vi 5% sjanse for å gjøre en forkastningsfeil Oppgave 7 En gruppe studenter på NIH testet maksimalt oksygenopptak til ti maratonløpere og ti langrennsløpere på landslaget. Deltakerne er interessert i om gjennomsnittlig maksimalt oksygenopptak er forskjellig og kommer til deg som statistiker og spør om råd for å besvare dette. Data viser seg å være tilnærmet normalfordelt. Hvilken statistisk test vil du anbefale dem for å undersøke om denne forskjellen er statistisk signifikant? Hvilken test vil du bruke? 1. T-test for uavhengige grupper 2. Kji-kvadrat 3. T-test for parrede observasjoner 4. Spearmans rho 5. Wilcoxon 6. Mann Whitney U rangsum 6
Oppgave 8 Du har samlet inn data på kroppshøyde hos en gruppe basketballspillere og en gruppe fotballspillere. Kroppshøyden (cm) er oppgitt i tabellen under. Du ønsker å undersøke om det er forskjell i kroppshøyden mellom de to gruppene. Anta at dataene er normalfordelte i begge gruppene. Gruppe 1 Basketspillerne Gruppe 2 Fotballspillerne 205 185 198 175 178 198 195 190 199 189 189 172 195 190 201 187 202 198 a) Hvilke hypoteser er riktige? 1. H 0: Det er ingen forskjeller i høyde mellom gruppene; H 1=Det er en signifikant forskjell mellom høyde i de to gruppene 2. H 0: Det er en signifikant forskjeller i høyde mellom gruppene; H 1=Det er ingen forskjell mellom høyde i de to gruppene 3. H 0: Det er forskjell i høyde mellom gruppene; H 1=Det er ikke mulig å teste om det er en forskjell i høyde mellom gruppene. 4. H 0: Det er ingen samvariasjon i høyde mellom gruppene; H 1=Det er en sterk samvariasjon mellom høyde i de to gruppene b) For gruppe 1 (basketspillerne) er gjennomsnittlig høyde 196 cm og standardavviket er 7.7. For gruppe 2 (fotballspillerne) er gjennomsnittlig høyde 185.8 cm og standardavviket er 8.5. Bruk disse opplysningen og gjennomfør en t-test for uavhengige grupper. Hvor stor er t? (Oppgaven gir 4 poeng) 1. t = ca ±2.7 2. t = ca ±2.0 3. t = ca ±0.9 4. t = ca ±4.5 7
c) Slå opp i tabellen og finn kritisk verdi for t (5% signifikansnivå). 1. Kritisk verdi for t er 2.086 2. Kritisk verdi for t er 1.725 3. Kritisk verdi for t er 2.201 4. Kritisk verdi for t er 1.746 d) Hvordan vil du konkludere? a. H0 forkastes b. H0 beholdes c. Det er ikke mulig å konkludere KORTSVARSOPPGAVER Husk: Svar kort (inntil 10 linjer per oppgave). Bruk gjerne stikkord. Oppgave 9: Tabell 1 under har to mål for sentraltendens (samlingsmål) og et mål for spredning. Hva viser tabellen? Tabell 1. Husholdningens samlede bruttoinntekt i kroner fordelt etter kjønn. Kjønn Gjennomsnitt Standardavvik Median Kvinne 865.000 650.000 780.000 Mann 881.000 920.000 780.000 Totalt 870.000 800.200 780.000 Oppgave 10: Hva betyr det å gjøre en statistisk type II feil når du driver med hypotesetesting? Oppgave 11: Hva er forskjellen på kategoriske og kontinuerlige variabler? Oppgave 12: En gruppe gutter fra idrettsklubbene BUL (n=22) og Sandnes IL (n=28) kastet kule. Resultatene ble notert i meter. Vi ønsker å teste om gjennomsnittlig kastlengde er lik i de to gruppene. Beskriv to ulike statistiske tester du kan bruke for å undersøke dette. Begrunn svaret. 8