Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Like dokumenter
Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Tilleggsoppgaver for STK1110 Høst 2015

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

EKSAMENSOPPGAVER STAT100 Vår 2011

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

EKSAMENSOPPGAVE STA-2004.

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMENSOPPGAVE STA-1001.

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

Eksamensoppgåve i TMA4295 Statistisk inferens

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4265 Stokastiske prosessar

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

TMA4265 Stokastiske prosessar

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

EKSAMEN I TMA4285 TIDSREKKJEMODELLAR Fredag 7. desember 2012 Tid: 09:00 13:00

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4275 Levetidsanalyse

Eksamensoppgave i TMA4255 Anvendt statistikk

Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag

Forelesning 7 STK3100

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Eksamensoppgave i TMA4275 Levetidsanalyse

Forelesning 3 STK3100

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer

vekt. vol bruk

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i TMA4250 Romleg Statistikk

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

EKSAMEN I EMNE TMA4245 STATISTIKK

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4295 Statistisk inferens

EKSAMEN I TMA4285 TIDSREKKEMODELLER Fredag 7. desember 2012 Tid: 09:00 13:00

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer

TMA4265 Stokastiske prosesser

EKSAMEN I TMA4255 ANVENDT STATISTIKK

STK juni 2016

Eksamensoppgave i TMA4275 Levetidsanalyse

EKSAMEN I FAG TMA4240 STATISTIKK

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Eksamensoppgave i SØK1004 Statistikk for økonomer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Transkript:

Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå til): 9.00 13.00 Hjelpemiddelkode/Tillatne hjelpemiddel: Gult, stempla A4-ark med eigne handskrivne notat, bestemd enkel kalkulator, Tabeller og formler i statistikk (Tapir forlag), Matematisk formelsamling (K. Rottmann) Annan informasjon: I vurderinga tel kvart av dei åtte bokstavpunkta likt. Målform/språk: nynorsk Sidetal: 4 Sidetal vedlegg: 0 Kontrollert av: Dato Sign Merk! Studentane finn sensur i Studentweb. Har du spørsmål om sensuren må du kontakte instituttet ditt. Eksamenskontoret vil ikkje kunne svare på slike spørsmål.

TMA4267, 22. mai 2015 nynorsk Side 1 av 4 > model1<-lm(period~length+amplitude+mass) > summary(model1) Call: lm(formula = Period ~ Length + Amplitude + Mass) Residuals: Min 1Q Median 3Q Max -0.109411-0.023820 0.001007 0.027937 0.063272 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 0.4391125 0.0138346 31.740 < 2e-16 *** Length 0.0197488 0.0002723 72.526 < 2e-16 *** Amplitude 0.0448392 0.0296440 1.513 0.13367 Mass 0.0232896 0.0070989 3.281 0.00144 ** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 0.03644 on 96 degrees of freedom Multiple R-squared: 0.9828, Adjusted R-squared: 0.9823 F-statistic: 1827 on 3 and 96 DF, p-value: < 2.2e-16 > sres1<-rstudent(model1) > plot(model1$fitted.values,sres1) > library(mass) > boxcox(model1,lambda=seq(1,3,.1)) sres1 log Likelihood 3 2 1 0 1 110 120 130 140 150 160 170 0.6 0.8 1.0 1.2 1.4 95% model1$fitted.values 1.0 1.5 2.0 2.5 3.0 λ Figur 1: Modellen i oppgåve 1a: R-kode og -utskrift (venstre), residualplott (oppe til høgre) og Box Cox-plott (nede til høgre). Oppgåve 1 Svingetida for ein pendel vart studert, og 100 kombinasjonar av lengda til pendelen (målt i cm), amplituden (største utslaget av svingingane frå den loddrette jamvektslinja til ei av sidene, målt i radianar) og masse (kg) vart variert. Ein multippel regresjonsmodel vart tilpassa. Figur 1 viser R-kode og -utskrift, eit residualplott og eit Box Cox-plott. a) Skriv opp den tilpassa regresjonsmodellen, og kommenter modelltilpassinga kort. Kva konklusjonar kan du trekke frå residualplottet? Foreslå ein transformasjon på grunnlag av Box Cox-plottet.

Side 2 av 4 TMA4267, 22. mai 2015 nynorsk > model2<-lm(period^2~length+amplitude+mass-1) > summary(model2) Call: lm(formula = Period^2 ~ Length + Amplitude + Mass - 1) Residuals: Min 1Q Median 3Q Max -0.121375-0.023555-0.003389 0.023144 0.086937 Coefficients: Estimate Std. Error t value Pr(> t ) Length 0.0403534 0.0002672 151.008 <2e-16 *** Amplitude 0.0610402 0.0262051 2.329 0.0219 * Mass -0.0045451 0.0066159-0.687 0.4937 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 0.03976 on 97 degrees of freedom Multiple R-squared: 0.9991, Adjusted R-squared: 0.9991 F-statistic: 3.566e+04 on 3 and 97 DF, p-value: < 2.2e-16 sres2 3 2 1 0 1 2 1.5 0.5 1.0 1.5 2.0 model2$fitted.values > sres2<-rstudent(model2) > plot(model2$fitted.values,sres2) > pendulum<-as.data.frame(cbind(period,length,amplitude,mass)) > library(leaps) > best<-regsubsets(period^2~.,data=pendulum,intercept=false) > summary(best)$which Length Amplitude Mass 1 TRUE FALSE FALSE 2 TRUE TRUE FALSE 3 TRUE TRUE TRUE > summary(best)$cp [1] 4.569336 1.471964 3.000000 > plot(best,scale="cp") Cp 3 4.6 Length Amplitude Mass Figur 2: Modellen i oppgåve 1b: R-kode og -utskrift (venstre), residualplott (oppe til høgre) og ein grafisk tabell over beste delmengder, der Mallows C P blir brukt som observator for å ordne modellane (nede til høgre). Merk at opplysningane i den grafiske tabellen òg er i R-utskrifta. Tilnærmingsformelen T 2π L/g for svingetida T for ein pendel, der L er lengda og g 9.8 m/s 2 er tyngdeakselerasjonen, viser at det kan vere rimeleg å bruke kvadratet av svingetida i staden for svingetida som responsvariabel i ein regresjonsmodell, og også at konstantleddet (skjæringspunktet) blir sløyfa. Figur 2 viser R- kode og -utskrift, eit residualplott og eit plott av beste delmengd-seleksjon basert på Mallows C P for slike modellar. b) Føretrekker du den opphavlege modellen eller den nye modellen som nettopp er nemnd? Kva undermodell av den nye modellen ville du velje, dersom du skulle velje ein? Grunngje kort svara dine.

TMA4267, 22. mai 2015 nynorsk Side 3 av 4 > model3<-lm(log(period)~log(length)+log(1+amplitude^2/16+11*amplitude^4/3072)) > summary(model3) Call: lm(formula = log(period) ~ log(length) + log(1 + Amplitude^2/16 + 11 * Amplitude^4/3072)) Residuals: Min 1Q Median 3Q Max -0.09906-0.01002 0.00126 0.01266 0.08019 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -1.617849 0.015979-101.247 <2e-16 *** log(length) 0.502433 0.004809 104.474 <2e-16 *** log(1 + Amplitude^2/16 + 11 * Amplitude^4/3072) 1.260754 0.570785 2.209 0.0295 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 0.02705 on 97 degrees of freedom Multiple R-squared: 0.9912, Adjusted R-squared: 0.9911 F-statistic: 5491 on 2 and 97 DF, p-value: < 2.2e-16 Figur 3: Modellen i oppgåve 1c: R-kode og -utskrift. Den meir eksakte formelen T = 2π L (1 + 1 g 16 θ2 + 11 3072 θ4 + ), eller ln T = ln(2π/ g)+ 1 1 ln L+ln(1+ 2 16 θ2 + 11 3072 θ4 + ), der θ er amplitude, viser at det kan vere rimeleg å bruke ein tredje modell, der både responsvariabelen og kovariatane er transformerte. Figur 3 viser R-kode og -utskrift. c) Korleis stemmer estimata av koeffisientane med den fysiske modellen gitt over? Finn eit estimat av g, tyngdeakselerasjonen, og eit 95 %-konfidensintervall for g. Oppgåve 2 Anta ein lineær regresjonsmodell Y = Xβ + ɛ, der Y er ein n-dimensjonal stokastisk vektor, X ei designmatrise av storleik n p, β ein p-dimensjonal parametervektor (koeffisientvektor) og ɛ n-dimensjonal multinormal med forventningsverdi 0 og kovariansematrise σ 2 I, der I er identitetsmatrisa av storleik n n. Anta vidare at søylene i X er ortogonale. a) Vis at minstekvadratestimatoren for β j, element j i β, berre avheng av søyle j i X (dvs. kovariatvektor j) og Y. I eit tovegs faktorielt ikkje-replikert 2 2 -forsøk er nivåa koda 1 og 1. Responsvektoren er (6 4 10 7) T, som svarer til nivåa ( 1 1 1 1) T av den første faktoren og ( 1 1 1 1) T av den andre faktoren. b) Estimer interaksjonseffekten (to gongar koeffisienten) av dei to faktorane.

Side 4 av 4 TMA4267, 22. mai 2015 nynorsk Oppgåve 3 Anta ein lineær regresjonsmodell Y = Xβ + ɛ, der Y er ein n-dimensjonal stokastisk vektor, X ei designmatrise av storleik n p, β ein p-dimensjonal parametervektor og ɛ n-dimensjonal multinormal med forventningsverdi 0 og kovariansmatrise σ 2 I, der I er identitetsmatrisa av storleik n n. Vi ser på ein redusert modell som berre inkluderer dei r første kovariatane, der r < p. La X 0 vere designmatrisa som berre består av dei første r søylene i X. La ˆβ (0) = (X0 T X 0 ) 1 X0 T Y vere minstekvadratestimatoren av parametrene i undermodellen, og la ˆβ 0 vere ˆβ (0) utvida med nullar, slik at ˆβ 0 har lengd p, det vil seie ˆβ 0 T = ( ˆβT (0) 0 T), der 0 er nullvektoren av lengd p r. Vi ønsker å måle kor god undermodellen er ved J 0 = 1 σ 2 (β ˆβ 0 ) T X T X(β ˆβ 0 ), som vart kalla «the scaled sum of squared errors» av Mallows. Det er sjølvsagt eit problem at parametrane β (og σ 2 ) er ukjende. Vi antar at den opphavlege modellen er «sann», slik at EY = Xβ. a) Kva er kovariansmatrisa til ˆβ(0)? Finn kovariansmatrisa Cov(β ˆβ 0 ) til β ˆβ 0. Vis at trasen til 1 σ 2 X T X Cov(β ˆβ 0 ) er r. La H 0 = X 0 (X0 T X 0 ) 1 X0 T vere projeksjonsmatrisa som projiserer på søylerommet til X 0 («hattematrisa» til undermodellen). b) Vis at E(X(β ˆβ 0 )) = (I H 0 )Xβ. Finn EJ 0. (Vink: Bruk traseformelen, E(Z T AZ) = tr(a Cov Z) + (EZ T )A(EZ).) La SSE 0 = Y T (I H 0 )Y vere feilkvadratsummen (residualkvadratsummen) til undermodellen. c) Vis at han har forventningsverdi E SSE 0 = (n r)σ 2 + β T X T (I H 0 )Xβ. Kombiner uttrykka for EJ 0 and E SSE 0 for å vise at EJ 0 = 1 σ 2 E SSE 0 n + 2r. Diskuter kort korleis dette motiverer bruk av Mallows sin C P -observator i seleksjon av undermodellar.