EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

Like dokumenter
EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

UNIVERSITETET I OSLO

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Prøveeksamen i STK3100/4100 høsten 2011.

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I TMA4285 TIDSREKKEMODELLER Fredag 7. desember 2012 Tid: 09:00 13:00

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I TMA4245 Statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

EKSAMEN I TMA4240 Statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4295 Statistisk inferens

EKSAMEN I TMA4285 TIDSREKKJEMODELLAR Fredag 7. desember 2012 Tid: 09:00 13:00

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

TMA4265 Stokastiske prosesser

Eksamensoppgave i ST0103 Brukerkurs i statistikk

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Introduksjon til Generaliserte Lineære Modeller (GLM)

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Eksamensoppgave i ST0103 Brukerkurs i statistikk

EKSAMEN I FAG TMA4240 STATISTIKK

Eksamensoppgåve i TMA4245 Statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

vekt. vol bruk

EKSAMEN I TMA4300 BEREGNINGSKREVENDE STATISTIKK Torsdag 16 Mai, 2013

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I EMNE TMA4245 STATISTIKK

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4275 Levetidsanalyse

Eksamensoppgave i TMA4250 Romlig Statistikk

Eksamensoppgave i TMA4275 Levetidsanalyse

i=1 t i +80t 0 i=1 t i = 9816.

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

EKSAMEN I EMNE TMA4245 STATISTIKK

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgåve i TMA4295 Statistisk inferens

TMA4265 Stokastiske prosessar

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4275 Levetidsanalyse

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

TMA4265 Stokastiske prosesser

TMA4245 Statistikk Eksamen desember 2016

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

HØGSKOLEN I STAVANGER

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA-2004.

Introduksjon til Generaliserte Lineære Modeller (GLM)

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Tilleggsoppgaver for STK1110 Høst 2015

UNIVERSITETET I OSLO

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Forelesning 7 STK3100/4100

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

TMA4265 Stokastiske prosesser ST2101 Stokastisk simulering og modellering

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

TMA4240 Statistikk 2014

EKSAMEN I TMA4255 ANVENDT STATISTIKK

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4255 Anvendt statistikk

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller

Forelesning 7 STK3100/4100

TMA4240 Statistikk Eksamen desember 2015

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 13. desember, 2012 Tid: 09:00 13:00 Tillatte hjelpemidler: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Calculator HP30S / CITIZEN SR-270X Gult, stemplet A4-ark med egne håndskrevne notater. Sensur: 28. desember, 2011 Oppgave 1 Nedbør i Trondheim i morgen? NTNU matematikkstudenten Konrad Kontrollfrik liker å være forberedt til neste dag, og han vil vite om det blir nedbør eller ikke i morgen tidlig. Han lager derfor statistiske modeller for nedbør forekomst, og vurderer tre forklaringsvariabler: 1. Mengde nedbør (i mm) ifølge værvarselet i morgen (F ore). 2. Ein binær variabel F orebin som indikerer om vervarselet seier nedbør (F orebin = 1) eller ikke nedbør (F orebin = 0). 3. En variabel OF som indikerer hvordan gårsdagens varsel og dagens observasjon stemmer; OF = 0: ingen nedbør observert, og ingen nedbør i varsel.

TMA4315 Generaliserte Lineære Modeller Side 2 av?? OF = 1:nedbør observert, men ingen nedbør i varsel OF = 2: ingen nedbør observert, men nedbør i varsel OF = 3: nedbør observert, og nedbør i varsel Konrad har fått tak i data for 100 påfølgende dager. Data for dei første ti er gitt i Tabell 1. Han bruker R for å tilpasse disse modellene (se redigert utskrift under); model 1 gir result1, model 2 gir result2 og model 3 gir result3. summary(result1) glm(formula = Occur ~ -1 + Fore + ForeBin + as.factor(of), family = binomial(link = "logit"),data = OccurData) Deviance Residuals: Min 1Q Median 3Q Max -2.1714-0.6614-0.5975 0.7493 2.2624 Fore 0.4609 0.2294 2.009 0.044494 * ForeBin 0.8883 0.6559 1.354 0.175641 as.factor(of)0-1.6327 0.4349-3.755 0.000174 *** as.factor(of)1-1.1941 0.9690-1.232 0.217818 as.factor(of)2-2.5144 0.6764-3.717 0.000202 *** as.factor(of)3-1.7609 0.5983-2.943 0.003249 ** Null deviance: 138.63 on 100 degrees of freedom Residual deviance: 101.09 on 94 degrees of freedom AIC: 113.09 > summary(result2)

TMA4315 Generaliserte Lineære Modeller Side 3 av?? glm(formula = Occur ~ Fore + ForeBin + OF, family = binomial(link = "logit"), data = OccurData) (Intercept) -1.6438 0.4280-3.840 0.000123 *** Fore 0.5204 0.2224 2.340 0.019286 * ForeBin 0.7344 0.6396 1.148 0.250832 OF -0.1355 0.2026-0.669 0.503589 Null deviance: 125.37 on 99 degrees of freedom Residual deviance: 103.19 on 96 degrees of freedom AIC: 111.19 > summary(result3) glm(formula = Occur ~ Fore, family = binomial(link = "logit"), data = OccurData) Deviance Residuals: Min 1Q Median 3Q Max -2.1246-0.6984-0.6146 0.7471 1.8759 (Intercept) -1.5707 0.3152-4.983 6.27e-07 *** Fore 0.6683 0.1856 3.601 0.000317 *** Null deviance: 125.37 on 99 degrees of freedom Residual deviance: 104.81 on 98 degrees of freedom AIC: 108.81

TMA4315 Generaliserte Lineære Modeller Side 4 av?? Occure Fore ForeBin OF 1 3.0 1 3 0 0.5 1 3 0 0.0 0 2 0 0.7 1 0 0 0.4 0 2 1 0.4 0 0 Tabell 1: Data fra ti dager i Konrad sitt datasett om nedbør forekomst, ingen nedbør(occure= 0) eller nedbør (Occure = 1). Også tilgjengelig; mengde nedbør frå værvarsel i mm, binær varsel og OF variabelen. a) Sett opp matematisk de generaliserte lineære modellene (GLM) som er brukt. Spesifiser og diskuter antagelser. Skriv videre ut designmatrisa X for dei første 6 observasjonene for hver modell. Når det er relevant, spesifiser hvilken strategi som er brukt for å sikre identifiserbarhet. Beskriv kort forskjellene mellom model 1 og model 2. b) Basert på resultata fra R svar på de følgende spørsmåla: Ifølge model 1 : Hva er sannsynligheten for nedbør dersom varselet er på 5mm og OF = 0? Ifølge model 2 :Hva er sannsynligheten for nedbør dersom varselet er på 5mm og OF = 3? Ifølge model 3 : Hva er odds ratio mellom en dag med varsel 0mm og ein dag med 5mm? c) Konrad vil nå sammenligne modeller: Sett opp ei hypotese for å sammenligne modell 1 mot modell 3 ved å bruke likelihood ratio testen (dvs basert på deviance), og utfør testen. Hvilken modell vil du foretrekke, modell 1, modell 2 eller modell 3. Hvorfor? d) Konrad er også interessert i nedbør forekomst på Trondheim Lufthavn Værnes og på Vassfjellet. Han har observasjoner og varsel også for disse stedene; Location {Trondheim, Vaernes, Vassfjellet} for de same 100 dagene. Han tilpasser tre modeller ved å kjøre R kommandoene under: res4 = glm(occur~fore, family=binomial(link="logit"),data=occurdatatvv) res5 = glm(occur~fore + Location, family=binomial(link="logit"),data=occurdatatvv) res6 = glm(occur~fore*location, family=binomial(link="logit"),data=occurdatatvv) Forklar kort de tre modellene, og lag skisser for å illustrerer.

TMA4315 Generaliserte Lineære Modeller Side 5 av?? Se på modellen som er brukt for å få res4, og diskuter om antagelsene for GLMer er oppfylt nå. Foreslå alternativ modell. Oppgave 2 Nedbør i Trondheim som snø, sludd eller regn? Gitt at det blir nedbør i morgen, så er Konrad interessert i hvilken type nedbør det blir. Vi kaller denne størrelsen C, og klassifiserer nedbør i tre klasser; snø (C = 1), sludd (C = 2) og regn (C = 3). Videre vil vi undersøke om temperaturvarselet er en god forklaringsvariabel. a) La C i være nedbørsklassen for dag i, og la t i være temperaturvarselet som er gyldig for dag i. Foreslå en passende modell for C. Spesifiser modellen matematisk, og forklar den med ord/figur(er). Spesielt forklar hvordan parametrene skal bli tolket. Oppgave 3 Nedbør i Trondheim, mengde Vi vil nå modellere mengda av nedbør i løpet av et døgn, gitt at det er nedbør, og kaller denne størrelsen Y. Det er vanlig å modellere Y som gammafordelt Y Ga(α, β), med tetthet; f Y (y) = 1 β α Γ(α) yα 1 exp( y/β). I denne oppgava skal vi anta det er N observasjoner, hver gammafordelt Y i Ga(α i, µ i /α i ). Her er α i ene antatt kjent, det vil si at dei er nuisance parametre. a) Vis at gammafordelinga er medlem i den eksponensielle familien når µ i er parameteren av interesse. Bruk dette til å finne uttrykk for forventningverdien og variansen til Y i, som funksjon av (α i, µ i ). Fra dette tolk α i. b) Forklar hva en mettet (saturated) modell er. Sett opp log-likelihood funksjonen uttrykt med µ i, og bruk dette til å finne maximum likelihood estimatorene for µ i -ene i den mettede modellen. Finn deviancen (basert på alle N observasjonene). c) Vi vil nå lage en modell for mengde nedbør (gitt at det er nedbør) med nedbørvarsel som forklaringsvariabel. La Y i være mengde nedbør på dag i, og la x i være nedbørsvarselet som er gyldig for dag i. Sett opp en GLM for dette, og begrunn valget ditt for link-funksjon og lineærkomponent.