Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet er på 6 sider. Vedlegg: Tillatte hjelpemidler: Svarark. Lærebok, ordliste for STK1000, godkjent kalkulator. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Svarene føres på eget svarark. Alle 20 oppgaver teller likt. For hver oppgave skal du merke av for bare ett svaralternativ. Du får ett poeng for hvert riktige svar, maksimum 20 poeng. Dersom du svarer feil eller lar være å krysse av på et spørsmål, får du null poeng. Du blir altså ikke straffet med minuspoeng for å svare feil. Lykke til! Oppgave 1. Vi har følgende ordnete datasett 6 14 21 25 33 36 38 46 50 51 56 62 71 74 78 82 87 89 99 100 Da er medianen A 51 B 56 C 53.5 D 50.5 Oppgave 2. Lengden av menneskers graviditet fra unnfangelse til fødsel varierer ifølge en fordeling som er tilnærmet normal med forventning 266 dager og standard avvik 16 dager. Mellom hvilke verdier vil de midterste 95% av alle graviditeter falle? A [250,282] B [234,297] C [218,314] D [200,290] Oppgave 3. Kvartilene til en fordeling er de verdier slik at 25% av sannsynlighetsmassen faller nedenfor 1. kvartil og 25% av sannsynlighetsmassen faller ovenfor 3. kvartil. For standard normal fordelingen, dvs normalfordelingen med forventning 0 og standard avvik 1, hva er kvartilene? A -1 og 1 B 0 og 2 C -0.674 og 0.674 D 0 og 0.674 (Fortsettes på side 2.)
Deleksamen i STK1000, Onsdag 13. oktober 2010. Side 2 Oppgave 4. Under finner du et enkelt histogram av 116 observasjoner av ozon i New York fra mai til september 1973. Fra histogrammet ser vi at fordelingen er A unimodal, symmetrisk og klokkeformet B Tilnærmet normal C Skjev mot venstre D Skjev mot høyre Oppgave 5. En forsker ønsker å se på sammenhengen mellom inntekt og kjønn for vitenskapelig ansatte på universitetet. Hun velger et tilfeldig utvalg på 100 vitenskapelig ansatte blandt kvinner og et tilfeldig utvalg på 100 vitenskapelig ansatte blandt menn. En god måte å beskrive sammenhengen er ved A Et kryss-plott B Et histogram av alle inntektsverdier C Boksplot ved siden av hverandre for hvert kjønn D Normal kvantil plott Oppgave 6. Plottet nedenfor viser et kryssplott mellom vind hastighet (miles per hour, mph) og ozon (in parts per billon, ppb) i New York. Fitted Line Plot Ozone = 96,87-5,551 Wind 160 S 26,4673 R-Sq 36,2% R-Sq(adj) 35,6% 120 Oz o n e 80 40 0 0 5 10 15 20 Wind (Fortsettes på side 3.)
Deleksamen i STK1000, Onsdag 13. oktober 2010. Side 3 Vi vil her konsentrere oss om den tilpassende regresjonslinjen Ozon = 96.87 5.551Wind Følgende fortolkning av resultatene er riktig: Med en økning av 1 enhet i vind hastighet vil A ozon nivået gjennomsnittelig minke med 96.87 enheter B ozon nivået gjennomsnittelig minke med 5.551 enheter C ozon nivået gjennomsnittelig minke med tilnærmet 50% D det være umulig å si noe om hva som skjer med ozon nivået Oppgave 7. Ved å referere til plottet i problem 6, så betyr verdien R-sq=36.2% at A 36.2% av observasjonene følger en klar lineær sammenheng mellom vind hastighet og ozon nivå B 36.2% av variasjonene i ozon nivåene kan bli forklart av variasjoner i vind hastighet C 36.2% of variasjonene i ozon nivåene kan bli forklart av den lineære sammenhengen mellom vind hastighet og ozon nivå D Det er en korrelasjon på 0.362 mellom ozon nivå og vind hastighet Oppgave 8. Ved igjen å referere til problem 6, så er estimatene av skjæringspunktet og stigningsforholdet funnet ved minste kvadraters regresjon. Hvilke av de følgende utsagn er ikke riktige? A Estimatene er oppnådd ved å minimere kvadratsummen av de vertikale avstandene mellom regresjonslinjen og observasjonene B Estimatene er oppnådd ved å minimere kvadratsummen av de horisontale avstandene mellom regresjonslinjen og observasjonene C Estimatene er oppnådd ved å minimere kvadratsummen av residualene D Estimatene er oppnådd ved å gjøre R-sq så stor som mulig Oppgave 9. La (x 1, y 1 ),..., (x n, y n ) være et dataset og la a og b være minste kvadraters estimater for regresjonslinjen y = a + bx. En av de følgende utsagnene om korrelasjonen r og kvadratet av korrelasjonen r 2 er riktig: A r er stigningsforholdet i regresjonslinjen B r 2 gir variasjonen rundt regresjonslinjen C Fortegnet til r angir om regresjonslinjen er stigende eller synkende D r er skjæringspunktet i regresjonslinjen Oppgave 10. En prosess kalles tilfeldig hvis A Individuelle utfall er usikre og de er umulig å predikere B Man har ingen ide om hva som kommer til å skje C Ufall skjer i en 50-50 split D Individuelle utfall er usikre men skjer i et predikterbart mønster over tid (Fortsettes på side 4.)
Deleksamen i STK1000, Onsdag 13. oktober 2010. Side 4 Oppgave 11. Anta X er en diskret tilfeldig variabel med sannsynlighetsfordeling gitt ved x i 0 1 2 3 4 5 P (X = x i ) 0.1 0.2 0.2 0.3 0.1? Hva er P (X > 3)? A 0.3 B 0.4 C 0.2 D 0.5 Oppgave 12. Ved å refere til sannsynlighetsfordeling i forrige problem, hva er forventningen µ X og standard avviket σ x? A µ X = 3 og σ x = 2.04 B µ X = 2.4 og σ x = 2.04 C µ X = 3 og σ x = 1.428 D µ X = 2.4 og σ x = 1.428 Oppgave 13. Betrakt to hendelser A og B der P (A) = 0.3, P (B) = 0.7 og P (A eller B) = 0.79. Hvilke av de følgende utsagn kan ikke være riktige? A B er komplement av A C A og B er uavhengige Oppgave 14. parameter B A og B er disjunkte (ikke overlappende) D A er en delmengde av B En observator basert på n observasjoner er forventningsrett hvis for en A observatoren er lik parameteren B observatoren vil være tilnærmet lik parameteren når n er stor C variabiliteten til observatoren er liten D forventningen til observatoren er lik parameteren Oppgave 15. Randomisering i forbindelse med utvelgelse av individer er viktig for å A skape rettferdighet mellom individer C få liten variabilitet B redusere forventningsskjevhet D få en symmetrisk og unimodal fordeling på responsene Oppgave 16. Betrakt et spill der kostnaden ved å spille er 20 NOK. Hvis du vinner et spill så mottar du 100 NOK mens hvis du taper mottar du ingenting. Sannsynligheten for å vinne et enkelt spill er 0.1 og de ulike spill har uavhengige utfall.. Anta du spiller tre spill på rad og du er interessert i den tilfeldige variabelen X som er hvor mye du har tjent etter tre spill? A Utfallsrommet er { 60, 40, 140, 240} og sannsynligheten for X = 240 er 0.001 B Utfallsrommet er {0, 100, 200, 300} og sannsynligheten for X = 300 er 0.729 C Utfallsrommet er {80, 160, 240, 320} og sannsynligheten for X = 160 er 0.243 D Utfallsrommet er { 80, 0, 160, 240} og sannsynligheten for X = 0 er 0.243 (Fortsettes på side 5.)
Deleksamen i STK1000, Onsdag 13. oktober 2010. Side 5 Oppgave 17. En foreleser ved Universitetet i Oslo er interessert i meningene studentene har om fler-valgs eksamener i sitt kurs. Han velger et tilfeldig utvalg av 50 mannlige studenter og 50 kvinnelige studenter som følger kurset og spør om deres mening. Dette er et eksempel på A Et systematisk utvalg B Et stratifisert utvalg C Et enkelt tilfeldig utvalg D Et parvis design Oppgave 18. De fire histogrammene nedenfor viser hver histogrammer over 1000 realisasjoner av x, gjennomsnittet, av individuelle standard normalfordelte variable. Histogrammene skiller seg fra hverandre ved at de er basert på n = 1, 5, 10 eller 50 individuelle observasjoner. Hvilket av histogrammene svarer til n = 50? A A B B C C D D Oppgave 19. Et tilfeldig utvalg av størrelse n = 200 er trukket fra den Norske befolkning og de er bedt om å svare ja eller nei på om Treholt saken bør tas opp igjen eller ikke. Hva er parameteren av interesse i dette tilfellet? A Andelen som svarer ja blandt de 200 utvalgte individer B Andelen som ville svart ja blandt hele Norges befolkning C Antall som svarer ja blandt de 200 utvalgte individer D Gjennomsnittet av responsene (Fortsettes på side 6.)
Deleksamen i STK1000, Onsdag 13. oktober 2010. Side 6 Oppgave 20. Ved å teste for et bestemt hormon i en urinprøve kan en avgjøre om en kvinne er gravid. En graviditetstest er ikke feilfri. For en graviditetstest har en at: Hvis en kvinne er gravid, er det en sannsynlighet på 0.98 for at testen vil indikere at kvinnen er gravid hvis en kvinne ikke er gravid, er det en sannsynlighet på 0.01 for at testen likevel vil indikere at kvinnen er gravid. Vi antar at det er en sannsynlighet på 0.25 for at en kvinne som tar en graviditetstest er gravid. En kvinne tar en graviditetstest, og testen indikerer at hun er gravid. Da er sannsynligheten for at hun virkelig er gravid lik A 0.980 B 0.245 C 0.970 D 0.030 SLUTT