Forelesning 3 STK3100

Størrelse: px
Begynne med side:

Download "Forelesning 3 STK3100"

Transkript

1 Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater 3. Koding av kategoriske kovariater 4. Hat-matrise 5. Residualer Fødselsvekt Y i, indikator for gutt x i1, indikator for jente x i2, svangerskapslengde x i3. Generell (apriori) modell tillater ulike vekstrater for gutter og jenter: Y i = β 1 x i1 + β 2 x i2 + β 3 x i3 x i1 + β 4 x i3 x i2 + ε i Vil teste nullhypotesen H 0 : β 3 = β 4, dvs. samme veksthastighet, som er gitt ved modell Y i = β 1 x i1 + β 2 x i2 + β 3 x i3 + ε i Forelesning 3 STK3100 p. 1/44 Forelesning 3 STK3100 p. 3/44 Lineær modell: Uavhengige responser, i = 1,...,n, der Y i N(µ i,σ 2 ) µ i = β 1 x i1 + β 2 x i2 + + β p x ip = β x i der x ij -ene er forklaringsvariable eller kovariater for respons nr. i og og β j -ene regresjonsparametre. Alternativt kan vi skrive dette som Y i -ene er uavhengige med forventning µ i = β x i konstant varians Var(Y i ) = σ 2 Y i -ene er normalfordelt Forelesning 3 STK3100 p. 2/44 Notasjon - Data Respons for "individ" nr. i: Y i,i = 1,...n Vektor av responser Y = x ij = Forklaringsvariabel nr j,j = 1,...,p for individ nr. i Kovariatmatrise eller Designmatrise for forklaringsvariablene: x 11 x 12 x 1p x 21 x 22 x 2p X =.... x n1 x n2 x np Y 1 Y 2. Y n Forelesning 3 STK3100 p. 4/44

2 Designmatrise for apriorimodell. fødselvekter: Y i = β 1 x i1 + β 2 x i2 + β 4 x i4 + β 5 x i5 + ε i der x i1 = indikatorvariabel for gutt, x i2 = indikatorvariabel for jente, x i4 = x i1 x i3 = produkt av varighet og indikator gutt og x i5 = x i2 x i3 = produkt av varighet og indikator jente Designmatrisen blir da, når det er nummerert slik at de første 12 individene er gutter, 1 0 x 1, x 12,3 0 X = x 13, x 24,3 Forelesning 3 STK3100 p. 5/44 Kvadratsum / Likelihood På matriseform kan vi skrive µ = (µ 1,...,µ n ) = Xβ. Dermed kan kvadratsummen kan skrives n S(β) = (Y i µ i ) 2 = (Y Xβ) (Y Xβ) i=1 Likelihood for Y 1,...,Y n blir da L(β) = [ ] n 1 i=1 2πσ 2 exp( 1(Y 2 i µ i ) 2 ) = (2πσ 2 ) n/2 exp( 1 2 S(β)) Forelesning 3 STK3100 p. 7/44 Designmatrise for nullhypotesemodell Y i = fødselvekt individ nr. i x i1 = x i2 = x i3 = indikatorvariabel for gutt indikatorvariabel for jente svangerskapslengde Nullhypotesemodellen blir da Y i = β 1 x i1 + β 2 x i2 + β 3 x i3 + ε i Nå blir designmatrisen 1 0 x 1, x 12,3 X = 0 1 x 13, x 24,3 Estimering: MK = ML Med Y vektor av responser og X designmatrisen blir log-likelihood l(β) = 1 2σ 2(Y Xβ) (Y Xβ) + K (der K ikke inneholder β) og score-ligninger så MLE = MKE gis ved såsant X X er inverterbar. 1 σ 2( X Y + X Xˆβ)) = 0, ˆβ = (X X) 1 X Y Forelesning 3 STK3100 p. 6/44 Forelesning 3 STK3100 p. 8/44

3 R-tilpasning fødselsvekt, begge modeller > lm(vekt factor(kjonn)+uker-1,data=fvekt) Call: lm(formula = vekt factor(kjonn) + uker - 1, data = fvekt) factor(kjonn)1 factor(kjonn)2 uker > x4<-uker*(kjonn==1) > x5<-uker*(kjonn==2) > lm(vekt factor(kjonn)+x4+x5-1,data=fvekt) Call: lm(formula = vekt factor(kjonn) + x4 + x5-1, data = fvekt) factor(kjonn)1 factor(kjonn)2 x4 x Fordelingsegenskaper Siden E[Y] = Xβ fås E[ˆβ] = (X X) 1 X E[Y] = (X X) 1 X Xβ = β, dvs. forventningsrett. Dessuten er kovarians-matrisen til Y gitt som σ 2 I der I er en nxn identitetsmatrise, dermed blir kovariansmatrisen til ˆβ og vi har altså (X X) 1 X σ 2 IX(X X) 1 = σ 2 (X X) 1 ˆβ N(β,σ 2 (X X) 1 ) eksakt siden ˆβ er en lineærkombinasjon av normale Y i. Forelesning 3 STK3100 p. 9/44 Forelesning 3 STK3100 p. 11/44 Eks: Fødselsvekt Variansen σ 2 estimeres forventningsrett ved fłdselsvekt (g) H0 Apriori n ˆσ 2 i=1 = (Y i ˆβ x i ) 2 n p Dessuten har vi at (n p)ˆσ 2 σ 2 = 1 n p (Y X ˆβ) (Y X ˆβ) χ 2 n p, igjen et eksakt resultat når Y i -ene er normalfordelt svangerskapslengde (uker) Felles (H 0 ) stigningskoeffisient: Apriori for gutter og for jenter. Forelesning 3 STK3100 p. 10/44 Forelesning 3 STK3100 p. 12/44

4 Likelihood Ratio Test (LRT) Anta at Mod 0 er et spesialtilfelle av Mod 1 og at vi vil teste nullhypotesen H 0 : Mod 0 er sann under antagelse på forhånd (apriori) av at Mod 1. LRT består da i å forkaste hvis = 2(ˆl l ) er stor der ˆl og l er maksimal loglikelihood under hhv. Mod 1 og Mod 0. Vi har da tilnærmet under H 0 at = 2(ˆl l ) χ 2 q når q antall færre parametre i Mod 0. F-test og LRT Dessuten er = S(β ) S(ˆβ) σ 2 eksakt og ˆσ 2 uavhengige, dermed får vi at F = [S(β ) S(ˆβ)]/q F ˆσ 2 q,n p dvs. Fisher-fordelt med q og n p frihetsgrader under H 0 : β p q+1 = = β p = 0 når Y i -ene er normale. Dette resultatet kan brukes til å teste f.eks. ingen effekt av en kovariat x som inngår i modellen både med leddet x og x 2. Men mer typisk brukes det til å teste om det er en effekt av en kategorisk kovariat. Forelesning 3 STK3100 p. 13/44 Forelesning 3 STK3100 p. 15/44 LRT og lineærnormale modeller Anta at Mod 0 gis ved H 0 : β p q+1 = = β p = 0 samt at σ 2 er kjent. La dessuten ˆβ og β være MLE/MKE under hhv. apriorispesifikasjon og H 0 slik at Da blir β p q+1 = = β p = 0 = 2(ˆl l ) = S(β ) S(ˆβ) σ 2. For lineærnormale modeller holder dessuten χ 2 q eksakt. En noe mer generell nullhypotese, de J & H La C være en q p matrise. Vi kan mer generelt være interessert i å teste H 0 : Cβ = 0 Spesielt får vi testen presentert foran ved å sette C = Vi antar at rangen til C er lik q(< p). Forelesning 3 STK3100 p. 14/44 Forelesning 3 STK3100 p. 16/44

5 En noe mer generell F-test, de J & H La som før X være designmatrisen og ˆβ paramterestimat for apriorimodellen, X og β er designmatrise og parameterestimater under nullhypotesen. Vi kan skrive kvadratsummen S(ˆβ) = (Y Xˆβ) (Y Xˆβ) = Y Y ˆβ X Y Y Xˆβ ˆβ X Xˆβ = Y Y ˆβ X Y siden ˆβ X Xˆβ = ˆβ X X(X X) 1 X Y = ˆβ X Y. Tilsvarende fås for nullhypotesemodellen S(β ) = Y Y β X Y der X er designmatrisen generert av Cβ = 0. Dermed blir F-observatoren F = (S(β ) S(ˆβ))/q ˆσ 2 = (ˆβ X Y β X Y)/q F ˆσ 2 q,n p Forelesning 3 STK3100 p. 17/44 Noen ganger inndeles lineære modeller i 1. Multippel lineær regresjon Kun "skala"-kovariater 2. Variansanalyse - ANOVA Kun kategoriske kovariater 3. Kovariansanalyse Både kategoriske kovariater og skala-kovariater Denne inndelingen er imidlertid ikke så vanlig innen GLM-rammen, vi har typisk både skala- og kategoriske kovariater, og snakker uansett om multippel regresjon. Forelesning 3 STK3100 p. 19/44 F-test for ulik veksthastighet mellom kjønn > mod0<-lm(vekt factor(kjonn)+uker-1,data=fvekt) > mod1<-lm(vekt factor(kjonn)+x4+x5-1,data=fvekt) > anova(mod0,mod1) Model 1: vekt factor(kjonn) + uker - 1 Model 2: vekt factor(kjonn) + x4 + x5-1 Res.Df RSS Df Sum of Sq F Pr(>F) Siden n = 24,p = 4 og q = 1 blir F = ( )/ /20 = 0.19 Eks: Kategoriske kovariater Y = Inntekt etter kjønn og sosioøkonomisk gruppe: Sted 1 Sted 2 Sted 3 Mann Kvinne Altså to kategoriske kovariater = faktorer i R-terminologi: 1. Kjønn med 2 nivåer 2. Sted med 3 nivåer Ikke-signifikante relativt til F-fordeling, p=0.66. Forelesning 3 STK3100 p. 18/44 Forelesning 3 STK3100 p. 20/44

6 Parametrisering med enveis variansanalyse Sammenligning av forventning mellom J grupper: Modell: Anta at individ i er i gruppe j. Da er Y i N(µ j,σ 2 ) La for j = 1,...,J 1 hvis i er i gruppe j x ij = 0 ellers Da kan vi skrive dette som en lineær modell uten konstantledd µ j = E[Y i ] = µ 1 x i1 + µ 2 x i2 + + µ J x ij Denne parametriseringen er imidlertid kan imidlertid ikke benyttes med flere kategoriske kovariater (for flere kovariater samtidig). Forelesning 3 STK3100 p. 21/44 Eks: Designmatrise for Sted uten konstantledd > enveisfit<-lm(inntekt factor(sted)-1,x=t) > enveisfit$x factor(sted)1 factor(sted)2 factor(sted) Forelesning 3 STK3100 p. 23/44 Eks: Inntekt over sted Ser bort fra kjønn. Kun en faktor og altså enveis ANOVA. > inntekt<-c(300,350,370,360,400,370,420,390,400,430,420,410,300,320,310, > kjonn<-c(rep(1,12),rep(2,12)) > sted<-rep(c(1,1,1,1,2,2,2,2,3,3,3,3),2) > lm(inntekt factor(sted)-1) factor(sted)1 factor(sted)2 factor(sted) > summary(lm(inntekt factor(sted)-1)) Estimate Std. Error t value Pr(> t ) factor(sted) <2e-16 *** factor(sted) <2e-16 *** factor(sted) <2e-16 *** Signif. codes: 0 *** ** 0.01 * Forelesning 3 STK3100 p. 22/44 Hjørnepunkt-parametrisering = "treatment-kontrast" Vi kan velge en av gruppene som referansegruppe, f.eks. gruppe 1 og skrive om enveis ANOVA til µ j = E[Y i ] = µ 1 + (µ 2 µ 1 )x i2 + + (µ J µ 1 )x ij = β 1 + β 2 x i2 + + β J x ij der altså β 1 = µ 1 og β j = µ j µ 1 for j > 1. Denne parametriseringen er naturlig hvis man vil sammenligne J 1 nye behandlinger med en tradisjonell behandling. Hjørnepunkt-parametrisering / treatment-contrast er default i R. Forelesning 3 STK3100 p. 24/44

7 Eksempel inntekt med hjørnepunkt-parametrisering > summary(lm(inntekt factor(sted))) Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** factor(sted) ** factor(sted) *** Signif. codes: 0 *** ** 0.01 * Residual standard error: on 21 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 2 and 21 DF, p-value: > anova(lm(inntekt factor(sted))) Response: inntekt Df Sum Sq Mean Sq F value Pr(>F) factor(sted) *** Residuals Forelesning 3 STK3100 p. 25/44 Sum-parametrisering (kontrast) Tradisjonelt i ANOVA benyttes imidlertid ofte "sum-parametrisering" med der µ j = E[Y i ] = α 0 + α 1 x i1 + α 2 x i2 + + α J x ij α 1 + α α J = 0 Merk at J j=1 x ij = 1 og med konstantledd α 0 i modellen er det overparametrisert uten en restriksjonen som J j=1 α j = 0 Med sum-parametrisering blir α J = (α α J 1 ) og µ j = α 0 + α 1 x i1 + + α J 1 x i,j 1 (α α J 1 )x ij = α 0 + α 1 (x i1 x ij ) + + α J 1 (x i,j 1 x ij ) = α 0 + α 1 x i1 + + α J 1 x i,j 1 Forelesning 3 STK3100 p. 27/44 Eks: Designmatrise for Sted med treatment-kontrast Sum-parametrisering (kontrast), forts. > enveisfit<-lm(inntekt factor(sted),x=t) > enveisfit$x (Intercept) factor(sted)2 factor(sted) Forelesning 3 STK3100 p. 26/44 Sum-parametriseringen gir altså J parametre i - på samme måte som hjørnepunkt-paramterisering - men med kovariater x ij = x ij x ij Sum-kontrast spesifiseres i R ved options(contrasts=c("contr.sum","contr.poly")) Se bare bort fra "contr.poly" som benyttes for en spesiell type kategorisk kovariat. For å komme tilbake til hjørnepunk/treatment-parametrisering: options(contrasts=c("contr.treatment","contr.poly")) Forelesning 3 STK3100 p. 28/44

8 Eks: Inntekt over sted med sum-kontrast > options(contrasts=c("contr.sum","contr.poly")) > summary(lm(inntekt factor(sted))) Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** factor(sted) *** factor(sted) Residual standard error: on 21 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 2 and 21 DF, p-value: > anova(lm(inntekt factor(sted))) Response: inntekt Df Sum Sq Mean Sq F value Pr(>F) factor(sted) *** Residuals Forelesning 3 STK3100 p. 29/44 Signif. codes: 0 *** ** 0.01 * Toveis variansanalyse uten interaksjon Y i N(E[Y i ],σ 2 ) uavhengige med nivå j på faktor 1 med ialt J nivåer nivå k på faktor 2 med ialt K nivåer Med hjørnepunkt-parametrisering kodes 1. faktor ved x ij = 1 mens x ij = 0 og 2. faktor ved z ik = 1 mens z ik = 0 slik at forventningen blir (med β 1 = α 1 = 0) E[Y i ] = β 0 + J β j x ij + j=2 K α k z ik = β 0 + β j + α k k=2 Forelesning 3 STK3100 p. 31/44 Eks: Designmatrise for Sted uten sum-kontrast Eks: Toveis-Anova med hjørnepunkt > options(contrasts=c("contr.sum","contr.poly")) > enveisfit<-lm(inntekt factor(sted),x=t) > enveisfit$x (Intercept) factor(sted)1 factor(sted) Forelesning 3 STK3100 p. 30/44 > options(contrasts=c("contr.treatment","contr.poly")) > toveisfit<-lm(inntekt factor(sted)+factor(kjonn),x=t) > summary(toveisfit) Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** factor(sted) e-05 *** factor(sted) e-07 *** factor(kjonn) e-06 *** Residual standard error: on 20 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 3 and 20 DF, p-value: 6.012e-08 > anova(toveisfit) Response: inntekt Df Sum Sq Mean Sq F value Pr(>F) factor(sted) e-07 *** factor(kjonn) e-06 *** Residuals Forelesning 3 STK3100 p. 32/44

9 Toveis ANOVA uten interaksjon med sum-kontrast Y i N(E[Y i ],σ 2 ) uavhengige med nivå j på faktor 1 med ialt J nivåer nivå k på faktor 2 med ialt K nivåer Toveis anova med interaksjon Y i N(E[Y i ],σ 2 ) uavhengige med nivå j på faktor 1 med ialt J nivåer nivå k på faktor 2 med ialt K nivåer Med x ij ogz ik som ved hjørnepunkt-parametrisering kodes nå 1. faktor ved x ij = x ij x ij og 2. faktor ved z ik = z ik z ik og E[Y i ] = α 0 + β j + γ k + (βγ) jk, dvs. et nivå for hver kombinasjon nivå j på faktor 1 og nivå k på faktor 2. Forelesning 3 STK3100 p. 33/44 Forelesning 3 STK3100 p. 35/44 Eks: Toveis-anova med sum-parametrisering > options(contrasts=c("contr.sum","contr.poly")) > toveisfit<-lm(inntekt factor(sted)+factor(kjonn),x=t) > summary(toveisfit) Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** factor(sted) e-07 *** factor(sted) factor(kjonn) e-06 *** Residual standard error: on 20 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 3 and 20 DF, p-value: 6.012e-08 > anova(toveisfit) Response: inntekt Df Sum Sq Mean Sq F value Pr(>F) factor(sted) e-07 *** factor(kjonn) e-06 *** Residuals Forelesning 3 STK3100 p. 34/44 Eks: Toveis-anova med sum-parametrisering > toveisfit<-lm(inntekt factor(sted)+factor(kjonn) +factor(sted)*factor(kjonn)) > anova(toveisfit) Response: inntekt Df Sum Sq Mean Sq F value Pr(>F) factor(sted) e-06 *** factor(kjonn) e-05 *** factor(sted):factor(kjonn) Residuals Signif. codes: 0 *** ** 0.01 * Forelesning 3 STK3100 p. 36/44

10 Predikerte verdier og Hat-matrisen Med estimater MKE ˆβ = (X X) 1 X Y får vi predikerte verdier for µ i og for Y i ved ˆµ i = Ŷi = ˆβ x i For vektoren Y = (Y 1,...,Y n ) blir disse gitt ved der Ŷ = Xˆβ = X(X X) 1 X Y = HY H = X(X X) 1 X kalles Hat-matrisen fordi den "setter hatt på" Y. H og M idempotent og symmetriske For en symmetrisk matrise A er A = A En idempotent matrise A tilfredstiller A 2 = AA = A. Resultat: H og M er symmetriske og idempotente. Viser at H er idempotent: HH = X(X X) 1 X X(X X) 1 X = X(X X) 1 X = H Siden dette også gjelder for M (oppgave!) får vi Mσ 2 IM = σ 2 MM = σ 2 M = σ 2 (I H) Forelesning 3 STK3100 p. 37/44 Forelesning 3 STK3100 p. 39/44 Residualer på matriseform La ê i = Y i Ŷi = Y i ˆµ i være de vanlige residualene og ê = (ê 1,...,ê n ) vektoren av residualer. Da finner vi ê = Y Ŷ = IY HY = (I H)Y = MY der I er nxn identitetsmatrisen og M = I H. Siden ê er lineært avhengig av Y er de normalfordelt med forventning E[ê] = ME[Y] = (I H)E[Y] = (I X(X X) 1 X )Xβ = 0 Studentiserte residualer og "leverage" Med H = [h ij ] n i,j=1 får vi at standardavviket til residualen ê i er lik σ (1 h ii ), dvs. avhenger av h ii. Dette foreslår at vi bør se på Studentifiserte residualer heller enn ê i = Y i Ŷi. r i = ê i ˆσ 1 h ii Størrelsene h ii kalles "leverage" = "moment på vektstang" og angir evnen til å påvirke ˆβ: Influens. og kovariansmatrise Mσ 2 IM = σ 2 M = σ 2 (I H) hvor første likhet vises på neste side. Forelesning 3 STK3100 p. 38/44 Oppgave: Vis at for enkel lineær regresjon, Y i = β 0 + β 1 x i + ε i, blir leverage h ii = 1 n + (x i x) 2 n i=1 (x i x) 2 Forelesning 3 STK3100 p. 40/44

11 Delta-Betas og Cook s distanse Observasjoner Y i,x i som har stor innflytelse på ˆβ kan også observeres ved såkalte Delta-Betas (eller noen ganger df-betas) i ˆβj = ˆβ j ˆβ j(i) der ˆβ j(i) er MKE for β j observasjon utelates fra estimeringen. Utfra uttrykk som leverage og influens kan man vel vente at det er en sammenheng mellom i ˆβj og leverages h ii. Denne kan uttrykkes som gjennom Cook s avstand Delta-Betas og Cook s distanse, forts. II En intuitiv begrunnelse for disse kriteriene fås ved å legge merke til at 1 pˆσ 2(ˆβ β) X X(ˆβ β) F p,n p og siden senter i F-fordelinger 1 vil en endring i D i 1 være verdt å merke seg. h ii D i = 1 ri 2 = 1 p 1 h ii pˆσ 2(ˆβ ˆβ (i) ) X X(ˆβ ˆβ (i) ) der ˆβ (i) ) = (ˆβ 1(i),..., ˆβ p(i) ). Forelesning 3 STK3100 p. 41/44 Forelesning 3 STK3100 p. 43/44 Delta-Betas og Cook s distanse, forts. Man ser av denne ligningnen at estimatene påvirkes betydelig dersom Studentisert residual r i er stor Leverage h ii er stor Som en tommelfingerregel bør verdier sjekkes hvis D i > 0.5 Eksempel: Fødselsvekt mot kjønn og sv.lengde Residualplottet nederst til høyre gir Cook s distanse D i, max-verdi 0.5. Residuals Residuals vs Fitted Fitted values Standardized residuals Normal Q Q Theoretical Quantiles 8 4 alltid hvis D i > 1 (Cook & Weisberg, 1999, Applied Regression Including Computing and Graphics). Standardized residuals Scale Location 9 8 Standardized residuals Residuals vs Leverage Cook s distance Fitted values Leverage Forelesning 3 STK3100 p. 42/44 Forelesning 3 STK3100 p. 44/44

Forelesning 7 STK3100

Forelesning 7 STK3100 ( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 22. mai 2014 Eksamenstid (fra til): 09.00-13.00

Detaljer

Variansanalyse og lineær regresjon notat til STK2120

Variansanalyse og lineær regresjon notat til STK2120 Variansanalyse og lineær regresjon notat til STK2120 Ørulf Borgan februar 2013 Formålet med dette notatet er å beskrive sammenhengen mellom variansanalyse med faste effekter og multippel lineær regresjon

Detaljer

Forelesning 8 STK3100/4100

Forelesning 8 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka: MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at

Detaljer

Forelesning 8 STK3100

Forelesning 8 STK3100 $ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell

Detaljer

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader. FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 4. juni 2016 Eksamenstid (fra til): 09.00

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.

Detaljer

Forelesning 6 STK3100

Forelesning 6 STK3100 Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede

Detaljer

EKSAMENSOPPGAVER STAT100 Vår 2011

EKSAMENSOPPGAVER STAT100 Vår 2011 EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:

Detaljer

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Mandag 24. september 2018. Klokkeslett: 09-13. Sted: Administrasjonsbygget K1.04 Tillatte hjelpemidler: «Tabeller og

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2 MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall

Detaljer

Fasit og løsningsforslag STK 1110

Fasit og løsningsforslag STK 1110 Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

Generelle lineære modeller i praksis

Generelle lineære modeller i praksis Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige

Detaljer

Kp. 12 Multippel regresjon

Kp. 12 Multippel regresjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Eksamensoppgåve i TMA4267 Lineære statistiske modellar Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå

Detaljer

Løsningsforslag eksamen 27. februar 2004

Løsningsforslag eksamen 27. februar 2004 MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)

Detaljer

Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag

Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag Oppgave 1 a) Verdien av uttrykkene blir som følger: >

Detaljer

vekt. vol bruk

vekt. vol bruk UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 19. mai 2017 Eksamenstid (fra til): 09.00

Detaljer

Oppgave N(0, 1) under H 0. S t n 3

Oppgave N(0, 1) under H 0. S t n 3 MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1

Detaljer

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator Side 1 av 11 sider EKSAMENSOPPGAVE I STA-1002 Eksamen i : STA-1002 Statistikk og sannsynlighet 2 Eksamensdato : 3. juni 2011. Tid : 09-13. Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent

Detaljer

EKSTRAOPPGAVER I STK1110 H2017

EKSTRAOPPGAVER I STK1110 H2017 EKSTRAOPPGAVER I STK0 H207. Simuleringer for å illustrere store talls lov og sentralgrenseteoremet Oppgave.. I denne oppgaven skal vi bruke kommandoen rbinom(n,size,prob). Kommandoen trekker n tilfeldige

Detaljer

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Detaljer

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne

Detaljer

Ridge regresjon og lasso notat til STK2120

Ridge regresjon og lasso notat til STK2120 Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle

Detaljer

Løsningsforslag: STK2120-v15.

Løsningsforslag: STK2120-v15. Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene

Detaljer

Oppsummering av STK2120. Geir Storvik

Oppsummering av STK2120. Geir Storvik Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

FORMELSAMLING TIL STK1100 OG STK1110

FORMELSAMLING TIL STK1100 OG STK1110 FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 11. november 2017) 1. Sannsynlighet La A, B, A 1, A 2,..., B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-

Detaljer

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Torsdag 31. mai 2018. Klokkeslett: 09-13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på

Detaljer

Forelesning 10 STK3100

Forelesning 10 STK3100 Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon

Detaljer

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler EKSAMENSOPPGAVER Institutt: Eksamen i: Tid: IKBM STAT100 Torsdag 13.des 2012 STATISTIKK 09.00-12.30 (3.5 timer) Emneansvarlig: Solve Sæbø ( 90065281) Tillatte hjelpemidler: C3: alle typer kalkulator, alle

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),

Detaljer

EKSAMENSOPPGAVE STA-2004.

EKSAMENSOPPGAVE STA-2004. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Torsdag 28. september 2017. Klokkeslett: 09 13. Sted: Tillatte hjelpemidler: Teorifagsbygget. «Tabeller og formler i

Detaljer

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september 2011. Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september 2011. Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator Side 1 av 11 sider EKSAMENSOPPGAVE I STA-1002 Eksamen i : STA-1002 Statistikk og sannsynlighet 2 Eksamensdato : 26. september 2011. Tid : 09-13. Sted : Administrasjonsbygget. Tillatte hjelpemidler : -

Detaljer

Lineære modeller i praksis

Lineære modeller i praksis Lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y én eller flere uavhengige variabler:

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA440 Statistikk Høst 009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Løsningsskisse Oppgave a) n 8, i x i 675, x 37.5, i y i 488, i x i 375, i x iy i

Detaljer

Ekstraoppgaver STK3100 h10

Ekstraoppgaver STK3100 h10 Ekstraoppgaver STK3100 h10 Oppgave 1 En-veis variansanalyse modellen kan formuleres som Y ij = µ + α i + ɛ ij (1) der α i = 0 og ɛ ij er i.i.d N(0, σ 2 ). Her representerer er Y ij j te observasjon fra

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

Forelesning 4 STK3100

Forelesning 4 STK3100 ! * 2 2 2 Bevis : Anta Forelesning 4 STK3 september 27 S O Samuelsen Plan for annen forelesning: Likelihood-egenskaper 2 Konsistens for ML 3 Tilnærmet fordeling for ML 4 Likelihoodbaserte tester 5 Multivariat

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 7 Fagleg kontakt under eksamen: Mette Langaas (988 47 649) NYNORSK EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25. mai

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2. Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 17.30. Oppgavesettet er

Detaljer

Forelesning STK september 2011

Forelesning STK september 2011 Forelesning STK3100 12. setember 2011 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer En Mettet (saturate) moell er en moell

Detaljer

Prøveeksamen i STK3100/4100 høsten 2011.

Prøveeksamen i STK3100/4100 høsten 2011. Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan

Detaljer

Eksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer)

Eksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer) EKSAMENSOPPGAVE Institutt: IKBM Eksamen i: STAT100 Statistikk emnekode emnenavn Tid: Tirsdag 13.12 2016 09.00 12.30 (3.5 timer) ukedag og dato kl. fra til og antall timer Emneansvarlig: Solve Sæbø Navn

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Onsdag 8. august

Detaljer

Ekstraoppgaver for STK2120

Ekstraoppgaver for STK2120 Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0

Detaljer

Forelesning 11 STK3100/4100

Forelesning 11 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom

Detaljer

Oppgave 1. Kilde SS df M S F Legering Feil Total

Oppgave 1. Kilde SS df M S F Legering Feil Total MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig

Detaljer

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt Bjørn H. Auestad Kp. 11: Regresjonsanalyse 1 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties

Detaljer

Checking Assumptions

Checking Assumptions Merlise Clyde Duke University November 16, 2016 Linear Model Linear Model: Y = µ + ɛ Assumptions: µ C(X) µ = Xβ ɛ N(0 n, σ 2 I n ) Focus on Wrong mean for a case or cases Wrong distribution for ɛ Cases

Detaljer

Oppgave 14.1 (14.4:1)

Oppgave 14.1 (14.4:1) MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) Modell: Oppgave 4. (4.4:) Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk

Detaljer

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1 MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21

Detaljer

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler EKSAMENSOPPGAVER Institutt: Eksamen i: Tid: Emneansvarlig: IKBM STAT100 Torsdag 12. des 2013 Solve Sæbø STATISTIKK 09.00-12.30 (3.5 timer) Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Detaljer

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»

Detaljer

Prøveeksamen STK2100 (fasit) - vår 2018

Prøveeksamen STK2100 (fasit) - vår 2018 Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen

Detaljer

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider. EKSAMENSOPPGAVE Fakultet KBM Eksamen i: STAT 100 Statistikk Tidspunkt 19. mai 017 09.00-1.30. 3,5 timer Kursansvarlig: Trygve Almøy Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

Detaljer

Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).

Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett). Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og 10.37 (alle er basert på samme datasett). ############ OPPGAVE 10.32 # Vannkvalitet. n=49 målinger i ulike områder. # Forutsetter at datasettene til boka (i

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer