UNIVERSITETET I OSLO

Like dokumenter
UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

STK1000 Obligatorisk oppgave 1 av 2

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Prøvemidtveiseksamen TMA4240 Statistikk H2004

Seksjon 1.3 Tetthetskurver og normalfordelingen

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Inferens i fordelinger

TMA4245 Statistikk Eksamen desember 2016

UNIVERSITETET I OSLO

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2018

UNIVERSITETET I OSLO

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

UNIVERSITETET I OSLO

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

Skoleeksamen i SOS Kvantitativ metode

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Tabell 1: Beskrivende statistikker for dataene

UNIVERSITETET I OSLO

Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie,

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

UNIVERSITETET I OSLO

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

Kapittel 4.4: Forventning og varians til stokastiske variable

UNIVERSITETET I OSLO

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 16. april 2015 kl

Kapittel 4.3: Tilfeldige/stokastiske variable

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Seksjon 1.3 Tetthetskurver og normalfordelingen

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4240 Statistikk Høst 2007

Oppfriskning av blokk 1 i TMA4240

UNIVERSITETET I OSLO

Løsning eksamen desember 2016

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

EKSAMENSOPPGAVE. Eksamen i: STA Brukerkurs i statistikk 1 Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9

Regneøvelser STK1000 Høsten 2017

UNIVERSITETET I OSLO

Medisinsk statistikk Del I høsten 2009:

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

HØGSKOLEN I STAVANGER

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ST0202 Statistikk for samfunnsvitere

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg.

ST0202 Statistikk for samfunnsvitere

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).

UNIVERSITETET I OSLO

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

UNIVERSITETET I OSLO

Denne uken: Kapittel 4.3 og 4.4

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

Eksamensoppgave i ST0103 Brukerkurs i statistikk

ECON240 VÅR / 2016 BOKMÅL

UNIVERSITETET I OSLO

Kapittel 3: Studieopplegg

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

Transkript:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Fredag 28. oktober 2016 Tid for eksamen: 14.00 16.00 Oppgavesettet er på 6 sider Tillatte hjelpemidler: Godkjent kalkulator, Lærebok (alle utgaver) Ordliste for STK1000 Vedlegg: Svarark Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Svarene føres på eget svarark. Alle 20 oppgaver teller likt. For hver oppgave skal du merke av for bare ett svaralternativ. Du får ett poeng for hvert riktige svar, maksimalt 20 poeng. Dersom du svarer feil eller lar være å krysse av på en oppgave, får du null poeng. Du blir altså ikke straffet med minuspoeng for å svare feil. Legg merke til at i spørsmålene er noen av svaralternativene avrundet. Lykke til! Oppgave 1 Her ser du et histogram og et tilhørende boksplott for det daglige sukkerinntaket for 200 gravide kvinner på Rikshospitalet. Hvilken påstand er feil:

A Fordelingen er skjev. B Fordelingen har flere outliere eller ekstremverdier. C Gjennomsnittet og standardavviket er gode oppsummeringstall for denne fordelingen. D Fordelingen er entoppet eller unimodal. Oppgave 2 Her ser du deskriptiv statistikk for de samme dataene. Hvilken påstand er feil: Min. 1st Qu. Median Mean 3rd Qu. Max. sd 2.1000 24.825 37.800 44.737 56.575 236.400 30.5165 A Ca 50 av kvinnene i undersøkelsen spiser mindre enn 25 gram sukker daglig. B 50% av kvinnene i undersøkelsen spiser mellom 25 og 45 gram sukker daglig. C Minst 50 av kvinnene spiser mer enn 50 gram sukker daglig. D Ca 95% av kvinnene spiser mellom 0 og 105.7 gram sukker daglig. Oppgave 3 Hva er variansen for observasjonene (daglig sukkerinntak for gravide kvinner) i oppgave 2? A 931.3 B 61.0 C 31.75 D 234.3 Oppgave 4 Hvis du får oppgitt at på et spørreskjema om livskvalitet, der minimumsscore er 0, og maksimumsscore er 100, så er gjennomsnittet 88.4, og standardavviket 12.3, hvordan ser du for deg at fordelingen er da: A Den er symmetrisk om gjennomsnittet B Det er umulig å vite C Den er skjev med høyrehale D Den er skjev med venstrehale Oppgave 5 Hvilken påstand er riktig: A I en normalfordeling er 99% av verdiene mellom μ 2.81 σ og μ + 2.81 σ B I en normalfordeling er 80% av verdiene mellom μ 1.28 σ og μ + 1.28 σ C I en normalfordeling er 95% av verdiene mellom μ 1.645 σ og μ + 1.645 σ D I en normalfordeling er 97.5% av verdiene mellom μ 1.96 σ og μ + 1.96 σ

Oppgave 6 Temperaturmålinger hos en frisk person kan antas å være fordelt som N(37.0, 0.3). Da er sannsynligheten for at en måling av en frisk person viser mer enn 37.5 A 0.0764 B 0.0344 C 0.0475 D 0.9525 Oppgave 7 Her ser du vekstkurver (som viser sammenhengen mellom vekt og alder), basert på Vekststudien i Bergen (BGS), SYSBARN-undersøkelsen, og WHOs internasjonale vekstkurver for gutter og jenter i alderen 0-5 år. Linjene viser 2.5-, 50- og 97.5- prosentilene (percentilene). Figuren er hentet fra Tidsskriftet for Den norske legeforening 2009;129: 281-6 Ta utgangspunkt i de nye, norske vekstkurvene fra BGS, altså de heltrukne linjene. Hvilken påstand stemmer ikke: A 95% konfidensintervall for forventet vekt i kg for en 4- årig jente er [13, 21.1] B Over 50% av 4-årige jenter veier mer enn 15 kg C 95% av 4-årige jenter veier mellom 13 og 21.1 kg D Vektfordelingen for 4-åringer er relativt symmetrisk, men litt høyreskjev. Oppgave 8 I en studie av barns motoriske ferdigheter, laget amerikanske forskere et spørreskjema som ga en totalscore. Denne scoren ble undersøkt i et utvalg av amerikanske barn, og beregnet slik at den fulgte en N(50,10)-fordeling. Hvilken påstand er feil: A Et barn som scorer 30 har en z-score på -2.

B Sannsynligheten for at et barn scorer lavere enn -2 er 2.3% C Gjennomsnittet av to barns scorer vil være fordelt som N(50, 7.1) D Sannsynligheten for at to uavhengige barn scorer lavere enn -2, er 4.6% Oppgave 9 Hvis vi samler nok data, altså at utvalgsstørrelsen n blir stor nok, så vil tre av disse påstandene være sanne. Hvilken av dem skjer ikke? A Gjennomsnittet vil ligne mer og mer på forventningsverdien i populasjonen. B Histogrammet over dataene vil bli normalfordelt. C Fordelingen til gjennomsnittet blir normalfordelt. D Histogrammet over dataene vil ligne på populasjonsfordelingen. Oppgave 10 Hvis vi har to tilfeldige utvalg, ett på n=25, som gir et gjennomsnitt x 25 og et standardavvik sd 25, og ett på n=100, som gir et gjennomsnitt x 100 og et standardavvik sd 100, og histogrammene for begge utvalgene ser rimelig symmetriske ut, så vil tre av påstandene være riktige. Hvilken påstand er feil? A Percentilene i de to utvalgene er like, altså i samme størrelsesorden. B Estimeringsusikkerheten (standardavvikene) til de to gjennomsnittene er ganske like, altså i samme størrelsesorden. C Gjennomsnittene i de to utvalgene er ganske like, altså i samme størrelsesorden. D Standardavvikene i de to utvalgene er ganske like, altså i samme størrelsesorden. Oppgave 11 En prosess kalles tilfeldig hvis A Individuelle utfall er usikre og de er umulig å predikere B Man har ingen idé om hva som kommer til å skje C Utfallene man er interessert fordeler seg i to grupper med 50% i hver gruppe D Individuelle utfall er usikre men skjer i et forutsigbart mønster over tid Oppgave 12 Randomisering i forbindelse med utvelgelse av individer er viktig for å A skape rettferdighet mellom individer B redusere skjevhet (bias) C få liten variabilitet D få en symmetrisk og entoppet (unimodal) fordeling av responsvariabelen Oppgave 13 Betrakt et spill der kostnaden ved å spille er 20 NOK. Hvis du vinner et spill, mottar du 100 NOK mens hvis du taper, mottar du ingenting. Sannsynligheten for å vinne et enkelt spill er

0.1, og de ulike spillene har uavhengige utfall. Anta du spiller tre spill på rad og du er interessert i den tilfeldige variabelen X som er hvor mye du har tjent etter tre spill. A Utfallsrommet er {0; 100; 200; 300} og sannsynligheten for X = 300 er 0.729 B Utfallsrommet er {-20; 80; 160; 240} og sannsynligheten for X = 160 er 0.243 C Utfallsrommet er {-60; 40; 140; 240} og sannsynligheten for X = 240 er 0.001 D Utfallsrommet er {-60; 40; 140; 240} og sannsynligheten for X = 40 er 0.027 Oppgave 14 Den empiriske korrelasjonen mellom blodsukker målt tidlig og sent i svangerskapet (vist i figuren over) er ett tallene oppgitt under. Angi hvilket. A 0.54 B 0.36 C -0.62 D 0.82 Oppgave 15 En diskret tilfeldig variabel X antar verdiene 1 til 4, med sannsynligheter gitt i følgende tabell x 1 2 3 4 Sum P(X=x) 0.4 0.3 0.2 0.1 1 Da er forventningen til X, μ X, lik A 1.8 B 1.9 C 2.0 D 2.1 Oppgave 16 For X gitt i forrige oppgave blir standardavviket lik A 1.1 B 1.0 C 5.0 D 1.2 Oppgave 17 Variabelen X i de to forrige oppgavene viser fordelingen av gjester til middag, i en barnefamilie med tre barn. La variabelen Y være det totale antallet personer rundt middagsbordet. Da er Y = X + 5. Hvilken påstand er feil:

A E(Y) = μ Y = 7, hvis man runder av til en desimal. B X og Y er korrelerte. C Standardavviket til Y er lik standardavviket til X D Standardavviket til Y er større enn standardavviket til X Oppgave 18 La A og B være to disjunkte hendelser, hver med positiv sannsynlighet. Da er A P(A B)=P(A)P(B) B P(A B)=P(A) C P(A B)=0 D P(A B)=1 Oppgave 19 La A og B være to uavhengige hendelser, hver med positiv sannsynlighet. Da er A P(A B)=P(A)P(B) B P(A B)=P(A) C P(A B)=0 D P(A B)=1 Oppgave 20 En kvinne tar en mammografiundersøkelse. Sannsynligheten for at mammografiet viser tegn på brystkreft hvis kvinnen har brystkreft er 0.95. Sannsynligheten er 0.034 for at mammografiet viser tegn på kreft selv om kvinnen egentlig ikke har kreft.vi vet også at sannsynligheten for at en tilfeldig kvinne har brystkreft er 0.005. Anta at mammografiet viser tegn på brystkreft. Hva er da sannsynligheten for at kvinnen virkelig har brystkreft? A 0.27 B 0.16 C 0.13 D 0.10 SLUTT