UNIVERSITETET I OSLO



Like dokumenter
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Eksamenssettet består av to deler. Ved bedømmelsen teller del A 30 % og del B 70 %. Innenfor hver del teller alle deloppgaver likt.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

10.1 Enkel lineær regresjon Multippel regresjon

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

Kapittel 3: Studieopplegg

Eksamensoppgave i ST3001

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Et lite notat om og rundt normalfordelingen.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Øving 1 TMA Grunnleggende dataanalyse i Matlab

UNIVERSITETET I OSLO

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

UNIVERSITETET I OSLO

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

UNIVERSITETET I OSLO

Et lite notat om og rundt normalfordelingen.

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Seksjon 1.3 Tetthetskurver og normalfordelingen

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

STK1000 Obligatorisk oppgave 1 av 2

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Kort overblikk over kurset sålangt

UNIVERSITETET I OSLO

Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE

Statistikk og dataanalyse

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Eksamen i. MAT110 Statistikk 1

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

Eksamensoppgave i TMA4255 Anvendt statistikk

Skoleeksamen i SOS Kvantitativ metode

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.

UNIVERSITETET I OSLO

Kapittel 1: Data og fordelinger

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I SOS1120 KVANTITATIV METODE 30. NOVEMBER 2006 (4 timer)

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

FØRSTE OBLIGATORISKE OPPGAVE STK1000 HØSTEN 2009

Inferens i regresjon

UNIVERSITETET I OSLO

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

Transkript:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 7. oktober 2009. Tid for eksamen: 15:00 17:00. Oppgavesettet er på 8 sider. Vedlegg: Ingen Tillatte hjelpemidler: Lærebok, ordliste for STK1000, godkjent kalkulator. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Husk å fylle inn kandidatnummer under. Kandidatnr: Alle 20 oppgaver teller likt. For hver oppgave skal du merke av for bare ett svaralternativ. Du får ett poeng for hvert riktige svar, maksimum 20 poeng. Dersom du svarer feil eller lar være å krysse av på et spørsmål, får du null poeng. Du blir altså ikke straffet med minuspoeng for å svare feil. Lykke til! Oppgave 1. Den diskrete tilfeldige variablen X har sannsynlighetsfordeling x i 100 0 y P (X = x i ) 0.3 1/2 p 3 hvor tallene y og p 3 ikke er oppgitt. Da er a) det ikke mulig å si hva p 3 er uten å vite verdien til y X p3 = 0.20 p 3 = 0.30 p 3 = 0.80 Oppgave 2. Den diskrete tilfeldige variablen X har sannsynlighetsfordeling x i 1 0 z P (X = x i ) 1/6 2/3 1/6 hvor tallet z ikke er oppgitt. Forventningen til X er 1.5. Da må z være a) 1 b) 1.5 c) 2.5 X d) 10 (Fortsettes på side 2.)

Eksamen i STK1000, Onsdag 7. oktober 2009. Side 2 Oppgave 3. Under er tetthetskurven til en N(0, σ) fordelt variabel. 0.00 0.02 0.04 0.06 0.08 0.10 0.12 10 5 0 5 10 x Uten noen annen informasjon enn tegningen over kan man se hva standardavviket σ skal være utifra STK1000-teori. Det er nemlig slik at σ er lik a) 1 X b) 3 c) 5 d) 9 Oppgave 4. I følgende ordnete datasett med n = 8 observasjoner har observasjonen merket med? falt ut. 24, 56, 56.78,?, 700, 1405, 1560.3, 2800 Hvis vi vet at medianen m = 650, vil den manglende observasjonen verdien a) være lik 700 b) være mellom 56.78 og 378.39 c) ikke kunne bestemmes X d) være lik 600 Oppgave 5. To tilfeldige variabler X og Y har standardavvik σ X = 3 og σ Y = 1. Korrelasjonen mellom X og Y er 0.5. Da har X Y standardavvik lik X a) 3.606 b) 3.162 c) 13 d) 2 Oppgave 6. Temperaturmålinger hos en frisk person kan antas å være N(µ, σ) med µ = 37.0 og σ = 0.3. Da er sannsynligheten for at en (Fortsettes på side 3.)

Eksamen i STK1000, Onsdag 7. oktober 2009. Side 3 måling av en frisk person viser mer enn 37.5 a) 0.0764 b) 0.0344 X c) 0.0475 d) 0.9525 Oppgave 7. Vi fortsetter med å jobbe med temperaturmålinger som i forrige oppgave. For en viss temperaturverdi er sannsynligheten omtrent 0.75 for at en temperaturmåling skal være mindre enn denne verdien. Temperaturverdien er X a) 37.2 b) 37.4 c) 37.6 d) 40.0 Oppgave 8. X. Under er tetthetskurven til en kontinuerlig tilfeldig variabel 0 1 Da er forventningen (µ X ) lik a) 0 b) 0.25 X c) 0.5 d) 0.75 Oppgave 9. Anta man observerer tusen uavhengige normalfordelte variabler X 1, X 2,..., X 1000 som alle har fordeling N(0, σ). Da er gjennomsnittet 1 1000 Xi a) cirka 1000σ siden man legger sammen tusen tall som har et typisk avvik på σ X b) cirka 0 c) Binomisk fordelt med n = 1000 d) cirka σ Oppgave 10. og En kvinne tar en mammografiundersøkelse. La S = {kvinnen har brystkreft} M = {mammogrammet viser tegn på kreft}. Anta at P (M S) = 0.95, P (M S c ) = 0.035 og P (S) = 0.007. Da er P (M) lik a) 0.00665 b) 0.0622 c) 0.16 X d) 0.041405 Oppgave 11. En polygraf, det vil si en løgndetektormaskin, brukes ofte på ansatte i sensitive stillinger i USA. En slik maskin må kalibreres. Man stiller da forsøkspersoner, som man vet om lyver eller ikke, spørsmål og ser hvordan maskinen reagerer. Grensen for når maskinen sier at en person lyver er da fastsatt i forhold til dette. Definer begivenhetene (Fortsettes på side 4.) M = {maskinen viser indikasjon på at man lyver}

Eksamen i STK1000, Onsdag 7. oktober 2009. Side 4 og L = {Personen lyver}. En typisk ferdigkalibrert maskin har P (M L) = 0.88 og P (M L c ) = 0.14. Det er dessuten rimelig å anta at flertallet man bruker løgndetektortesten på i en ansettelsesprosess vil snakke sant, og vi antar derfor P (L c ) = 0.99. Da er sannsynligheten for at man ikke lyver, gitt at løgndetektoren påstår at man lyver, det vil si P (L c M), lik a) 0.86 X b) 0.94 c) 0.001 d) 0.0597 Oppgave 12. I et medisintisk studium målte man FGP ( Fasting plasma glucose ) og HbA (som svarer ca til prosentandel røde blodlegemer som har glukose molekyler festet på seg) på 18 diabetespasienter. Under vises resultatet Minitab gir av en regresjonsanalyse til datasettet. Regression Analysis: fpg versus hba The regression equation is fpg = 66,4 + 10,4 hba Predictor Coef SE Coef T P Constant 66,43 46,52 1,43 0,173 hba 10,408 4,731 2,20 0,043 S = 63,8156 R-Sq = 23,2% R-Sq(adj) = 18,4% Da er stigningstallet til regresjonslinjen a) 66.4 b) 63.8156 c) 46.52 X d) 10, 4 Oppgave 13. Følgende datasett er konstruert for anledningen. Dette konstruerte datasettet er utgjort av to variabler som er kodet under navnene P F og QR og har 11 observasjoner. Minitab gir ut følgende regresjonsanalyse og plott av datasettet sammen med regresjonslinjen. (Fortsettes på side 5.)

Eksamen i STK1000, Onsdag 7. oktober 2009. Side 5 Regression Analysis: QR versus PF The regression equation is QR = - 0,99 + 1,33 PF Predictor Coef SE Coef T P Constant -0,995 2,435-0,41 0,692 PF 1,3325 0,3144 4,24 0,002 S = 2,01972 R-Sq = 66,6% R-Sq(adj) = 62,9% Under er en liste med fire utsagn, hvor av bare ett er feil. Kryss av på hvilket utsagn som ikke er sant. a) Regresjonslinjen skjærer y-aksen i 0.99 og har et positivt stigningstall X b) Det er en klar linær sammenheng i datasettet c) Korrelasjonen mellom QR og P F er 0.816 d) Jo høyere P F er, jo høyere er typisk også QR Oppgave 14. I en fordeling som er skjev mot høyre er typisk X a) medianen mindre enn gjennomsnittet b) mange observasjoner feilregistreringer c) medianen nesten lik gjennomsnittet hvis standardavviket er stort nok d) medianen er større enn gjennomsnittet Oppgave 15. Under er et histogram over antall dødsfall i 301 forskjellige fylker i USA forårsaket av brystkreft hos kvinner i 1960. Histogrammet er a) tilnærmet normalfordelt X b) tydelig høyreskjevt c) tydelig venstreskjevt d) tydelig flertoppet (Fortsettes på side 6.)

Eksamen i STK1000, Onsdag 7. oktober 2009. Side 6 Oppgave 16. Her er oppsummerende statistikk av datasettet om antall dødsfall av brystkreft fra forrige oppgave. Descriptive Statistics: Antall dødsfall Variable N N* Mean SE Mean StDev Minimum Q1 Antall dødsfall 301 0 11288 794 13780 445 2932 Variable Median Q3 Maximum Antall dødsfall 6445 14039 88456 Da er IQR X a) 11107 b) 2932 c) 14039 d) 13780 Oppgave 17. En medisinsk undersøkelse målte kolesterol i blodet og BMI til 30 tilfeldig valgte kvinner. BMI står for body mass index regnes ut ved å ta vekt delt på høyde opphøyd i annen, hvor man måler vekt i kilogram og høyde i meter. Under følger noen Minitabutskrifter av en regresjonsanalyse som ble gjort for å undersøke sammenhengen mellom kolesterol og BMI. Regression Analysis: Kolesterol versus BMI The regression equation is Kolesterol = - 1,10 + 0,306 BMI Predictor Coef SE Coef T P Constant -1,101 2,156-0,51 0,614 BMI 0,30629 0,09256 3,31 0,003 S = 1,13059 R-Sq = 28,1% R-Sq(adj) = 25,5% Unusual Observations (Fortsettes på side 7.)

Eksamen i STK1000, Onsdag 7. oktober 2009. Side 7 Obs BMI Kolesterol Fit SE Fit Residual St Resid 10 29,2 6,740 7,843 0,594-1,103-1,15 X 17 22,7 8,830 5,852 0,211 2,978 2,68R 25 24,3 9,270 6,342 0,231 2,928 2,65R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage. Under følger fire utsagn, hvor bare ett av dem er feil. krysse av på det ene svaralternativet som ikke er riktig. a) Kolesterol og BMI har en positiv sammenheng b) Residualene har ikke et veldig tydelig mønster Her skal du altså c) r 2 = 28.1% viser at mye variasjon ikke blir forklart X d) Minitab skriver ut at man har innflytelsesrike observasjoner ( observation whose X value gives it large leverage ). Man kan derfor ikke si noe om sammenhengen mellom BMI og kolesterol. Oppgave 18. Her er oppsummerende statistikk for BMI til datasettet i forrige oppgave. Descriptive Statistics: BMI; Kolesterol Variable N N* Mean SE Mean StDev Minimum Q1 BMI 30 0 23,180 0,414 2,268 18,900 21,800 Variable Median Q3 Maximum BMI 22,700 24,300 29,200 Da er variansen til BMI lik X a) ca 5.14 b) ca 0.173 c) ca 2.27 d) ca 0.28 (Fortsettes på side 8.)

Eksamen i STK1000, Onsdag 7. oktober 2009. Side 8 Oppgave 19. Vi fortsetter med datasettet fra de to siste oppgavene. Fra informasjonen i utskriftene til de to siste oppgavene er standardavviket (det vil her si s y ) til kolesterolobservasjonene a) ca 3.929 X b) ca 1.31 c) ubestemmelig fra opplysningene i utskriftene d) ca 2.47 Oppgave 20. Under er et kvantilplott som sammenlikner et datasett med normalfordelingen. Man kan da si at a) observasjonene må være normalfordelte b) observasjonene er tydelig flertoppet X c) det er grunn til å tvile på at observasjonene er normalfordelte d) det er for få observasjoner (N = 50) til å bruke et kvantilplott Det var det!