UNIVERSITETET I OSLO



Like dokumenter
UNIVERSITETET I OSLO

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Løsningsforslag øving 9, ST1301

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA-2004.

Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

EKSAMENSOPPGAVER STAT100 Vår 2011

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

UNIVERSITETET I OSLO

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

UNIVERSITETET I OSLO

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin.

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

UNIVERSITETET I OSLO

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Institutt for økonomi og administrasjon

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

Prøveeksamen i STK3100/4100 høsten 2011.

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

UNIVERSITETET I OSLO

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer)

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

vekt. vol bruk

EKSAMENSOPPGAVE STA-1001.

Eksamensoppgave i ST3001

UNIVERSITETET I OSLO

Forelesning 7 STK3100

UNIVERSITETET I OSLO

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Forelesning 13 Regresjonsanalyse

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Eksamensoppgave i ST3001

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Forelesning 9 STK3100

HØGSKOLEN I STAVANGER

Forelesning 8 STK3100

EKSAMENSOPPGAVE. Eksamen i: STA 1002 Statistikk og sannsynlighet 2. Dato: Fredag 1. juni Tid: Kl 09:00 13:00. Sted: Åsgårdvegen 9

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

UNIVERSITETET I OSLO

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

MA Universitetet i Agder Institutt for matematiske fag EKSAMEN. Emnekode: MA-202 Emnenavn: Statistikk 2

Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = for produkt 2.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgave i TMA4267 Lineære statistiske modeller

BST Anvendt Makroøkonomi

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Forelesning 7 STK3100/4100

UNIVERSITETET I OSLO

Beiteskader av hjort i vernet skog og vurdering av problem med introduserte arter: Mjelvabotnen naturreservat

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Høye skårer indikerer høye nivåer av selvkontroll.

Tidspunkt for eksamen: 12. mai ,5 timer

UNIVERSITETET I OSLO

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

SOS 31 MULTIVARIAT ANALYSE

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Variansanalyse og lineær regresjon notat til STK2120

Transkript:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: Bio 2150A Biostatistikk og studiedesign Eksamensdag: 6. desember 2013 Tid for eksamen: 14:30-17:30 (3 timer) Oppgavesettet er på 6 sider Vedlegg: Ingen Tillatte hjelpemidler: Kalkulator, samt egenprodusert hjelpemiddel bestående av opp til ti tosidige A4-ark med valgfri tekst, formler, ligninger, figurer, tabeller etc.; håndskrevet eller trykt. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Eksamen teller 70% av avsluttende karakter. Legg merke til at oppgavene er gitt forskjellig vekt. Oppgave 1 (40%) Francis Galton målte i 1885 høyden av 930 voksne barn og deres respektive foreldre (205 foreldrepar). For foreldrene bestemte han gjennomsnittshøyden for hvert foreldrepar (variabel forelder), hvor han korrigerte for kjønn og økte høyden av kvinner med en faktor 1.08. Variabelen barn angir høyden av voksne barn i cm. En grafisk framstilling av resultatet av de to variablene barn og forelder i datasettet galton er vist på figuren. a. Regresjonslinjen er den heltrukne linjen på figuren. Beskriv kort metoden som benyttes og hvilke R-kommandoer som kan brukes for å trekke denne regresjonslinjen. 1

b. Hvilke forutsetninger må være oppfylt for å kunne utføre lineær regresjon? c. Analysen du utførte i delspørsmål a) gir utskriften nedenfor. Hvordan tolker du de to koeffisientestimatene i denne modellen? Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 60.81149 7.13963 8.517 <2e-16 *** forelder 0.64629 0.04114 15.711 <2e-16 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 5.686 on 926 degrees of freedom Multiple R-squared: 0.2105, Adjusted R-squared: 0.2096 F-statistic: 246.8 on 1 and 926 DF, p-value: < 2.2e-16 d. Hva representerer den prikkete linjen på figuren? e. Hvordan vil du definere forskjellen mellom statistisk residual og statistisk error? f. En ANOVA-tabell for regresjonen viser følgende. Sett inn verdiene merket med?, og vis hvordan du kommer fram til verdien for R 2 vist i delspørsmål c), samt hvordan du i R kan finne den kritiske tabellverdien for F. Df Sum Sq Mean Sq F value Pr(>F) forelder 1 7980?? <2e-16 *** Residuals 926 29937? g. Bestem 95% konfidensintervall for skjæringspunkt (intercept) og stigningstall. h. Hva menes med 95% konfidensbånd og 95% prediksjonsintervall? i. Figuren i begynnelsen av oppgaven viser et fenomen kalt Regresjon mot gjennomsnitt ( Regression to the mean ). Hva betyr dette uttrykket i denne sammenhengen og hvilke konsekvenser har det? j. Diskuter ulempene med nullhypotesetesting og bruk av α = 0.05 i økologiske undersøkelser, og om det finnes noe bedre alternativ? Oppgave 2 (35%) Tusenbeinkreps (Anostraca) er en orden av krepsdyr innen klassen Branchiopoda (bladføttinger). De fleste artene lever i ekstreme habitater som saltsjøer, tidevannspytter og grunne høyfjellssjøer, blant annet fordi de er svært sensitive for predasjon fra fisk, amfibier, etc. og fordi de har robuste hvileegg som tåler godt uttørking eller bunnfrysing. Tusenbeinkrepsen Branchinecta paludosa finnes sirkumpolart i innsjøer nord for 60 N. I en periode rundt 1970 registrerte fiskeforskeren Per Aass forekomst av B. paludosa i høyfjellsdammer innenfor et område på rundt 900 km 2 i Rondane, Dovrefjell og Lesjafjellet, i et høydeintervall 2

som strakte seg fra rett over tregrensa (ca. 900 meter) og opp til mer enn 1600 meter over havet. I 2011 oppsøkte NIVA-forskeren Markus Lindholm de samme dammene og registrerte forekomst av B. paludosa på nytt. En analyse av disse funnene sammenliknet med Per Aass registreringer 40 år tidligere ble i 2012 publisert i fagtidsskriftet Freshwater Biology (57, 2591 2601). Følgende utskrift er basert på et datasett ekstrahert fra Tabell 1 i Lindholm m. fl. (2012), hvor den først variabelen er høyde over havet (meter) og de to siste er forekomst av B. paludosa i henholdsvis 1970 og 2011. > bp <- read.table("lindholm.2012.txt", sep = "\t", header = TRUE) > summary(bp) alt Bp.1970 Bp.2011 Min. : 916 absent :45 absent :63 1st Qu.:1082 present:76 present:58 Median :1158 Mean :1167 3rd Qu.:1234 Max. :1631 a. Hvilke datatyper er de 3 variablene i datasettet, og hvor mange observasjoner var det i alt? b. Estimer sannsynlighetene for forekomst av B. paludosa i henholdsvis 1970 og 2011. c. Hva er en odds? Estimer oddsene for forekomst av B.paludosa i 1970 og 2011, og odds ratio for forekomst i 2011 i forhold til 1970. Du gjør deretter kommandoen > (bp.x <- with(bp, table(bp.1970, Bp.2011))) Bp.2011 Bp.1970 absent present absent 44 1 present 19 57 d. Hva kalles dataobjektet som produseres av table()-funksjonen, og hvordan tolker du radene og kolonnene i dette objektet? e. Hva slags figur vil kommandoen plot(bp.x) gi oss? Vi lager et nytt R-objekt med følgende kommando: bp2 <- data.frame(alt=c(bp$alt, bp$alt), Bp=factor(c(bp$Bp.1970, bp$bp.2011)), year=factor(rep(c(1970, 2011), each=121))) f. Ut fra det du vet om bp skal du ha informasjon nok til å skrive ned hvilket resultat du forventer å få av kommandoen summary(bp2). Du lager en glm av bp2 og får følgende utskrift: > summary(m <- glm(bp ~ year, data = bp2, family = binomial)) 3

Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) 0.5241 0.1881 2.786 0.00533 ** year2011-0.6068 0.2617-2.318 0.02043 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 332.68 on 241 degrees of freedom Residual deviance: 327.25 on 240 degrees of freedom g. Hva slags modellobjekt blir m og hvilke forutsetninger er denne modellen basert på? h. Hvordan tolker du koeffisientestimatet for year2011? Lag et 95% konfidensintervall for odds ratioen du estimerte i delspørsmål c). Oppgave 3 (25%) Følgende datasett som ble brukt av R.A. Fisher, angir kroppsvekten i kg (variabel Bwt) og vekten av hjertet i gram (variabel Hwt) hos voksne katter fordelt på kjønn (variabel Sex; hunner (F), hanner (M)) > library(mass) > summary(cats) Sex Bwt Hwt F:47 Min. :2.000 Min. : 6.30 M:97 1st Qu.:2.300 1st Qu.: 8.95 Median :2.700 Median :10.10 Mean :2.724 Mean :10.63 3rd Qu.:3.025 3rd Qu.:12.12 Max. :3.900 Max. :20.50 a. Hvordan vil du gå fram for å plotte datapunktene i datasettet cats som vist på figuren nedenfor? 4

b. For summary(lm(hwt ~ Bwt * Sex, data=cats)) får man følgende utskrift. Hvordan vi du beskrive feltene A til F i oppsummering av modellen? c. Ved plotting av modellen får man følgende. Hvordan tolker du disse plottene? 5

6