EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

Like dokumenter
EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

UNIVERSITETET I OSLO

vekt. vol bruk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

STK juni 2016

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i TMA4275 Levetidsanalyse

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Prøveeksamen i STK3100/4100 høsten 2011.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

Eksamensoppgave i TMA4267 Lineære statistiske modeller

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

UNIVERSITETET I OSLO

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Tilleggsoppgaver for STK1110 Høst 2015

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Forelesning 6 STK3100

Forelesning 7 STK3100

Forelesning 7 STK3100/4100

i=1 t i +80t 0 i=1 t i = 9816.

EKSAMENSOPPGAVE STA-2004.

Generaliserte Lineære Modeller

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 Statistikk

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Generaliserte Lineære Modeller

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4245 Statistikk

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

EKSAMENSOPPGAVE STA-1001.

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Forelesning 10 STK3100

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4275 Levetidsanalyse

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Eksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer)

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2009

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

TMA4240 Statistikk Eksamen desember 2015

Forelesning 11 STK3100/4100

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

TMA4240 Statistikk Høst 2015

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin.

Eksamensoppgåve i TMA4240 Statistikk

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Forelesning 8 STK3100

Eksamensoppgave i TMA4295 Statistisk inferens

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

UNIVERSITETET I OSLO Matematisk Institutt

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

UNIVERSITETET I OSLO

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

HØGSKOLEN I STAVANGER

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00 Tillatte hjelpemidler: Alle trykte og håndskrevne hjelpemidler. Godkjent enkel kalkulator. Sensur: 11. januar 2007 Oppgave 1 Tabell 1 viser resultatene av en studie for sammenligning av to injeksjonsplaner for det nevroleptiske preparatet perphenazine decanoate (fra P. Knudsen, L. B. Hansen, K. Højholdt, N. E. Larsen, Acta Psychiatrica Scandinavica, 1985). En gruppe på 19 psykotiske pasienter ble gitt injeksjoner hver annen uke, mens en annen gruppe på 19 pasienter ble gitt injeksjoner hver tredje uke. Pasientene ble fulgt i seks måneder, og eekten av behandlingen ble da evaluert. Kliniske evalueringer ble gjort med en seks-punkts skala kalt CGI (Clinical Global Impression), der høyere score betyr dårligere tilstand for pasienten. De 12 radene i Tabell 1 svarer til 12 ulike kombinasjoner av de tre forklaringsvariablene x 1 = x 2 = { 0 hvis injeksjoner gis hver annen uke 1 hvis injeksjoner gis hver tredje uke { 0 hvis kvinne 1 hvis mann x 3 = CGI ved start av behandling (initiell CGI).

TMA4315 Generaliserte lineære modeller Side 2 av 5 Behandlings- Endelig intervall Initiell CGI (uker) Kjønn CGI 0 1 2 2 Kvinne 2 1 0 0 2 Kvinne 3 3 1 0 2 Kvinne 4 0 1 0 2 Mann 3 4 4 1 2 Mann 4 0 2 1 2 Mann 5 0 0 1 3 Kvinne 2 1 0 0 3 Kvinne 3 2 1 0 3 Kvinne 4 1 2 0 3 Mann 2 3 1 0 3 Mann 3 0 5 0 3 Mann 4 0 3 0 x 1 x 2 x 3 y 0 y 1 y 2 Tabell 1: Data for nevroleptisk behandling. De tilhørende responser er opptellinger for hver kombinasjon av forklaringsvariabler: y 0 = antall som etter behandling har CGI = 0 y 1 = antall som etter behandling har CGI = 1 y 2 = antall som etter behandling har CGI = 2 Merk at ingen pasienter hadde endelig CGI (i det følgende betegnet kun CGI) over 2 etter behandlingen. Anta at CGI for en pasient med forklaringsvektor x = (x 1, x 2, x 3 ) har verdier 0, 1, 2 med sannsynligheter π j = P (CGI = j x) for j = 0, 1, 2. Antallene y = (y 0, y 1, y 2 ) for en rad i tabellen antas å være resultatet av en multinomisk fordelt vektor Y = (Y 0, Y 1, Y 2 ) med sannsynlighetsvektor π = (π 1, π 2, π 3 ) som altså avhenger av x. Merk at x 3 i hele oppgaven skal betraktes som en numerisk kovariat, dvs. ikke som en faktor. a) Sett opp og begrunn kort en proportional odds modell for de gitte dataene. Anta at det ikke er interaksjoner mellom de tre forklaringsvariablene x 1, x 2, x 3. Uttrykk π j for j = 0, 1, 2 som funksjoner av β-parametrene i modellen og forklaringsvektoren x.

TMA4315 Generaliserte lineære modeller Side 3 av 5 Modell Devians I 17.68 B+I 17.66 K+I 10.64 B*I 14.43 K*I 10.63 B+K+I 10.56 B*K+I 10.33 B*I+K 8.52 B+K*I 10.51 B*K+B*I 8.33 B*K+I*K 10.31 B*I+K*I 8.47 B*K+B*I+I*K 8.28 B*K*I 8.28 Tabell 2: Devianser for alle modeller som inneholder initiell CGI. b) Kvotientene P (CGI j x)/p (CGI > j x) for j = 0, 1 kalles de kumulative odds ratioer for en pasient med forklaringsvektor x. Vis at dersom initiell CGI øker med 1 i modellen i (a), vil de kumulative odds ratioene multipliseres med e β 3, der β 3 er koesienten til x 3 i de lineære prediktorene i modellen. Gi en praktisk fortolkning av verdien på e β 3. Gi tilsvarende fortolkninger av verdiene på e β 1 og e β 2. c) Beskriv den saturerte modell for dataene i denne oppgaven. Hvor mange frie parametre har den? Hvordan ville du gå fram for å beregne deviansen for modellen i punkt (a)? Du skal her kun skissere en fremgangsmåte uten å gjøre alle beregninger. Hvor mange frihetsgrader har deviansen i dette tilfellet? Begrunn svaret. Tabell 2 viser utregnede devianser for alle proportional odds modeller som inneholder forklaringsvariabelen initiell CGI (dvs. x 3 ). Her er B=Behandlingsintervall, K=Kjønn, I=Initiell CGI. Når bokstaver knyttes med produkttegn *, betyr det at de tilsvarende forklaringsvariablene er med i modellen, sammen med alle interaksjoner (produkter) mellom to (eller tre) av dem. For eksempel betyr B+K*I modellen der x 1, x 2, x 3, x 2 x 3 er med som forklaringsvariabler, mens B+K+I er modellen der x 1, x 2, x 3 er med i modellen uten interaksjoner (dvs. modellen i punkt (a)) og B*K*I er modellen der alle de tre variabler, alle produkter av to av dem, og produktet av alle tre, er med i modellen.

TMA4315 Generaliserte lineære modeller Side 4 av 5 d) Beskriv modellen som svarer til B*K+B*I. Hvor mange parametre har den? Hva blir antall frihetsgrader for deviansen for denne modellen? En statistiker har plukket ut modellene K+I, B+K+I, B*I+K og B*K+B*I som kandidater til beste modell. Hvilken av disse modellene ville du velge som den beste basert på de gitte devianser? Begrunn ved å formulere relevante hypoteser og utføre de tilsvarende hypotesetester. En (noe redigert) R-utskrift fra modellen B+K+I er gitt nedenfor. Du skal bruke den i besvarelsen av punkt (e) nedenfor. Call: vglm(formula = cbind(y0, y1, y2) ~ behand + kjonn + initcgi, family = cumulative(parallel = TRUE), data = neuro) Coefficients: Value Std. Error t value (Intercept):1 8.47538 3.34065 2.53705 (Intercept):2 12.87221 3.90906 3.29292 behand -0.21992 0.75607-0.29088 kjonn -2.15758 0.88752-2.43103 initcgi -2.27249 0.69850-3.25339 Number of linear predictors: 2 Dispersion Parameter for cumulative family: 1 Residual Deviance: 10.55521 on?? degrees of freedom Log-likelihood: -24.18958 on?? degrees of freedom Estimert kovariansmatrise for estimatorene, basert på utskrifter fra R: 11.1599 12.7043-1.7892-1.3418-1.8574 12.7043 15.2808-1.8714-1.6839-2.2749-1.7892-1.8714 0.5716 0.0921 0.0985-1.3418-1.6839 0.0921 0.7877 0.1982-1.8574-2.2749 0.0985 0.1982 0.4879

TMA4315 Generaliserte lineære modeller Side 5 av 5 e) Anta at modellen fra punkt (a) gjelder. Bruk R-utskriften til å estimere e β k for k = 1, 2, 3. Finn et tilnærmet kondensintervall for e β 1. Gi en kommentar i lys av ditt valg av modell i punkt (d). Estimer sannsynligheten for å få endelig CGI lik 0 for en kvinne som får injeksjoner hver annen uke og har initiell CGI lik 5. Forklar hvordan du kan nne et estimert standardavvik for dette estimatet. Du trenger her ikke å gjøre alle beregningene. Oppgave 2 La Y 1, Y 2,..., Y N være uavhengige og eksponensialfordelte stokastiske variabler, der Y i har tetthet f(y i ; θ i ) = θ i e θ iy i for y i > 0, θ i > 0, i = 1, 2,..., N. a) Vis at Y i ene har fordelinger som kommer fra den samme eksponensielle famile. Bruk generelle formler fra pensum til å nne µ i = E(Y i ) og σ 2 i = var(y i ) uttrykt ved θ i. b) Vis at log-likelihood funksjonen for dataene y 1,..., y n kan skrives N l = { θ i y i + ln θ i } i=1 Bruk dette til å vise at deviansen for en generalisert lineær modell med estimerte forventninger ˆµ i = ŷ i, er N { ( )} yi ŷ i yi D = 2 ln i=1 ŷ i ŷ i c) Med notasjon fra forrige punkt, sett opp uttrykk for Pearson-residualene, r i, i den gitte situasjonen. La X 2 = N i=1 r2 i være Pearsons kjikvadratobservator. Begrunn at D X 2. d) Anta at man vil teste nullhypotesen H 0 : θ 1 = θ 2 = = θ N mot den alternative hypotesen at alle θ i er fritt varierende parametre, som ikke alle er like. Bruk punktene (b) og (c) til å nne to testobservatorer for dette problemet. Hvilke tilnærmede fordelinger har de under H 0?