Forelesning 5 STK3100

Størrelse: px
Begynne med side:

Download "Forelesning 5 STK3100"

Transkript

1 Devians Forelesning 5 STK setember 2008 S. O. Samuelsen Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer 4. Observert og forventet informasjon 5. Otimeringsrutiner 6. Iterative revektee minste kvarater (IRwLS) Forelesning 5 STK /40 Eks: Y i N(µ i,σ 2 ): Den mettee moellen har µ i = Y i l = n 2 log(2πσ2 ) 1 2σ 2 (Y i µ i ) 2 l = n 2 log(2πσ2 ) Derme finner vi at likelihoo ratio mellom mettet moell og en vilkårlig moell blir 2( l l) = 1 (Y σ 2 i µ i ) 2 og foreslår en generalisering av kvaratsum til GLM. Vi efinerer generelt Deviansen ve = 2( l l) er altså l er log-likelihoo for en mettee moellen. Forelesning 5 STK /40 En Mettet (saturate) moell er en moell som har en arameter er observasjon. Sesielt er alle anre moeller nøstet i en mettee moellen. Eks: Biller Den mettee moellen har ulike sannsynligheter π i for hver giftose og tilassee sannsynligheter blir π i = Y i /n i. For GLM får vi en erfekt tilasning til ata Y i slik at reikerte forventninger µ i = Y i. Den mettee moellen får også maksimal onåelig likelihoo l over alle tenkelige moeller. Forelesning 5 STK /40 Devians = 2( l l) Merk: Minimering av D er ekvivalent me maksimering av likelihooen. Eksemler å Devianser: Poisson: = 2 n [Y i log(y i /λ i ) (Y i λ i )] Binomisk, π i = Y i /n i : = 2 n [Y i log( π i π i ) + (n i Y i ) log( 1 π i 1 π i )] Et ar anre begreer: Nullevians = Devians me Moell: µ i = µ eller g(µ i ) = β 0, vs. kun konstantle i moellen Resiual evians = Devians i aktuell moell g(µ i ) = β 0 + β 1 x i β x i, vs. eviansen innsatt MLE ˆβ Forelesning 5 STK /40

2 LRT og Devians Ariori MLE ˆβ = (ˆβ 1,..., ˆβ ) gir Devians ˆ = 2[ l ˆl] = 2[ l l(ˆβ)] Uner nullhyotesen er β q+1 = = β = 0. Da fås MLE β = (β 1,...,β q, 0,..., 0) som gir evians = 2[ l l ] = 2[ l l(β )]. Likelihoo ratio testen gis nå ve at uner H 0 G = 2[l(ˆβ) l(β )] = ˆ χ 2 q. Vi gjør altså LRT ve å beregne evianser for moellene som sammenlignes! Test for H 0 : β = β 0 : Wal-test Me ˆβ MLE for β og se stanarfeil for ˆβ : Z = ˆβ β 0 se N(0, 1) (tilnærmet) Likelihoo-Ratio-test: Ariori MLE ˆβ = (ˆβ 1,..., ˆβ ) Uner nullhyotesen fås MLE β = (β 1,...,β 1,β 0 ) Likelihoo ratio testen gis a ve at tilnærmet G = 2[l(ˆβ) l(β )] = ˆ χ 2 1 (kjikvaratforelt me 1 frihetsgra). Forelesning 5 STK /40 Forelesning 5 STK /40 Eksemel: Biller Ariori moell: logit(π i ) = β 0 + β 1 x i Nullhyotese: β 1 = 0 Nullevians: = Resiual evians: ˆ = LRT: G = ˆ = , vs. soleklar forkastning sml. χ 2 1 Ariori moell: logit(π i ) = β 0 + β 1 x i + β 2 x 2 i Nullhyotese: β 2 = 0 Devians uner H 0 : = Resiual evians: ˆ = LRT: G = ˆ = 8.03, -veri P(χ 2 1 > 8.03) = , vs. signifikant avvik LR-test for H 0 : β = β 0 i R For å utføre enne LR-testen i R benyttes et som kalles offset. Uner nullhyotesen er lineær reiktor η i = β 0 + β 1 x i1 + + β 1 x i, 1 + β 0 x i er β 0 x i er kjente størrelser. Disse må sesifiseres i rogrammet! I R gjøres ette ve å legge inn offset(beta0*x) i moellformelen, f.eks. > glm(y x1+x2+x3+offset(beta40*x4),family=oisson) Da vil arametrene β 0,β 1,β 2 og β 3 estimeres uner en forutsetning at β 4 = β 40. Forelesning 5 STK /40 Forelesning 5 STK /40

3 Eks. Biller: H 0 : β 1 = 40 uner logit-lineær moell β 0 + β 1 x i. Wal-test: Vi hae ˆβ 1 = me se 1 = Vi får Z 1 = = og (tosiig) -veri blir 2P(Z 1 > 1.966) = LR-test: Finn ˆ = = evians ariori Finner = = evians når β 1 = 40. Differansen G = ˆ = 3.49 Devians og gooness-of-fit tester Uner gitte forutsetninger gjeler tilnærmet ˆ χ 2 n 1 uner moell η i = β 0 + β 1 x i1 + + β x i Sesielt gjeler ette når Y i Bin(n i,π i ) er n i π i > 5 og n i (1 π i ) > 5 Y i Po(µ i ) og µ i > 5 Dette kan brukes til å teste om moellen svikter. ersom P(χ 2 n 1 > ˆ ) er liten er et grunn til å tvile å moellen. som skal være trukket fra en tilnærmet χ 2 1 uner nullhyotesen, gir -veri P(χ 2 1 > 3.49) = Forelesning 5 STK /40 Forelesning 5 STK /40 LR-Biller: H 0 : β 1 = 40 i R > glmfit0biller<-glm(cbin(doe,ant-doe) Dose,family=binomial) > glmfit2biller<-glm(cbin(doe,ant-doe) offset(40*dose), family=binomial) > anova(glmfit2biller,glmfit0biller,test="chisq") Analysis of Deviance Table Moel 1: cbin(doe, Ant - Doe) offset(40 * Dose) Moel 2: cbin(doe, Ant - Doe) Dose Resi. Df Resi. Dev Df Deviance P(> Chi ) > glmfit2biller Coefficients: (Intercet) Degrees of Freeom: 7 Total (i.e. Null); 7 Resiual Null Deviance: Resiual Deviance: AIC: Resiual evians i lineær-normal moell Me ˆµ i = ˆβ 0 + ˆβ 1 x i ˆβ x i blir resiual-eviansen ˆ = 1 σ 2 (Y i ˆµ i ) 2 = (n 1)ˆσ2 σ 2 er ˆσ 2 = n (Y i ˆµ i ) 2 /(n 1) er forventningsrett for σ 2. Men når Y i N(β 0 + β 1 x i β x i,σ 2 ) er essuten uten tilnærmelse. ˆ χ 2 n 1 Resultatet egner seg ikke til gooness-of-fit testing for lineærnormale moeller sien vi må estimere σ 2. I moeller uten (eller me kjent) sreningsle blir et annerlees. Forelesning 5 STK /40 Forelesning 5 STK /40

4 Eks: Biller Me (logit)-lineær moell β 0 + β 1 x i ble ˆ = Hvis ette er en go moell bure a ˆ = ikke være en ekstrem veri i forhol til χ 2 6. Vi finner P(χ 2 6 > 11.23) = 0.082, altså en inikasjon å at et er mulig å forbere moellen. Vi finner a også at kvaratleet i en utviee moellen er signifikant. Kvaratlesmoellen får resiualevians og me P(χ 2 5 > 3.195) = 0.67 er et ikke lenger antyning til moell-avvik. Pearson Kjikvarat X 2 Utrykket 1 σ 2 (Y i ˆµ i ) 2 kan også generaliseres ve Pearson Kjikvarat: X 2 = (Y i ˆµ i ) 2 Var(Y i ) Som resiualevians ˆ vil X 2 være tilnærmet χ 2 n 1 uner forutsetning av at Y i -ene er tilnærmet normalforelte. Binomisk Poisson X 2 = n (Y i n iˆπ i ) 2 X 2 = n n iˆπ i (1 ˆπ i ) (Y i ˆµ i ) 2 ˆµ i Forelesning 5 STK /40 Forelesning 5 STK /40 Kravene n i π i > 5 og n i (1 π i ) > 5 kan sjekkes: Beregner n iˆπ i > 5 og n i (1 ˆπ i ) > 5 > glmfit0biller<-glm(cbin(doe,ant-doe) Dose,family=binomial) > roun(ant*glmfit0biller$fit,2) > roun(ant*(1-glmfit0biller$fit),2) > glmfit1biller<-glm(cbin(doe,ant-doe) Dose+I(Doseˆ2),family=binomial) > roun(ant*glmfit1biller$fit,2) > roun(ant*(1-glmfit1biller$fit),2) Noen reikerte verier er litt små i forhol til kravet, gooness-of-fit testene å forrige sie er antagelig noe konservative. Pearson X 2 for billeataene Pearson X 2 er ikke imlementert i R, men lett å beregne: > yhat<-ant*glmfit0biller$fit > varhat<-ant*glmfit0biller$fit*(1-glmfit0biller$fit) > X2<-sum((Doe-yhat)ˆ2/varhat) > X2 [1] > 1-chisq(X2,6) [1] > yhat<-ant*glmfit1biller$fit > varhat<-ant*glmfit1biller$fit*(1-glmfit1biller$fit) > X2<-sum((Doe-yhat)ˆ2/varhat) > X2 [1] > 1-chisq(X2,5) [1] Altså X 2 nokså lik ˆ her. Forelesning 5 STK /40 Forelesning 5 STK /40

5 Pearson-resiualer efineres ve r Pi = Y i ˆµ i Var(Y i ) 0.5 og er altså en irekte generalisering av vanlige resiualer e i = (Y i ˆµ i )/ˆσ hvor et tas hensyn til at varians tyisk avhenger av forventningen i GLM. Merk at Pearson X 2 = n r2 Pi. > roun(resiuals(glmfit0biller,tye="earson"),2) > sum(resiuals(glmfit0biller,tye="earson")ˆ2) [1] Deviansresiualer for binomiske ata r i = sign(y i n iˆπ i ) 2[Y i log( π i ˆπ i ) + (n i Y i ) log( 1 π i 1 ˆπ i )] ser ikke umielbart ut som resiualer, men gir verier ofte ikke avviker mye fra Pearson-resiualer > roun(resiuals(glmfit0biller,tye="eviance"),2) > sum(resiuals(glmfit0biller,tye="eviance")ˆ2) [1] De er essuten efault i R: roun(resiuals(glmfit0biller),2) Forelesning 5 STK /40 Forelesning 5 STK /40 Deviansresiualer Sammenligning av resiualene Vi kan også efinere resiualer basert å biragene til eviansen me (logit-)lineær moell: ˆ = 2 [ l i ˆl i ] er l i og ˆl i er log-likelihoo-birag i mettet moell og ve MLE ˆβ. Sesifikt efineres Devians-resiualer ve r i = sign(y i ˆµ i ) 2( l i ˆl i ) = slik at vi onår ˆ = n r2 i. + 2( l i ˆl i ) hvis Y i > ˆµ i 2( l i ˆl i ) hvis Y i < ˆµ i resiualer Deviansresiualer Pearson-resiualer Dose Forelesning 5 STK /40 Forelesning 5 STK /40

6 Sammenligning av resiualene Anscomberesiualer, forts. me moell: logit(π i ) = β 0 + β 1 x i + β 2 x 2 i For V (µ i ) = µ i blir transformasjonen h() resiualer = 3 : h(µ) = log(µ) (Invers gaussisk foreling) 3 : h(µ) = rµ r for r = 3/(3 ) For binomisk variansfunksjon V (π) = π(1 π) finnes ikke ekslistitt h(), må benytte numerisk integrasjon. Poeng me Anscomberesiualer: Nærmere normalforelte resiualer Viser seg å være tilnærmet like eviansresiualer Dose Ser ingen kurvatur i lottet nå! Forelesning 5 STK /40 Forelesning 5 STK /40 Anscomberesiualer For valgte funksjoner h() kan man generelt efinere resiualer ve r ia = h(y i) h(ˆµ i ) Var[h(Y i )] 0.5 Det viser seg at h() gitt ve h (µ) = V (µ) 1/3 gir trejeorensmoment E[h(Y i ) E(h(Y i ))] 3 0 tilnærmet symmetrisk foreling bere tilnærming til normalforeling Isåfall blir også Var[h(Y i )] φ i h (µ i ) 2 V (µ i )(= φ i V (µ i ) 1/3 ) og Anscombe-resiualene r ia = h(y i) h(ˆµ i ) φi h (ˆµ i ) V (ˆµ i ) Eks. Anscomberesiualer for billene M1<-glm(cbin(Doe,Ant-Doe) Dose,family=binomial,ata=biller) attach(biller) y0<-doe/ant n<-length(ant) varfu<-function(i) i*(1-i) her<-function(i) varfu(i)ˆ(-1/3) anscomberes<-numeric(0) for (i in 1:n) { i0<-m1$fit[i] anscomberes[i]<-integrate(her,i0,y0[i])$value anscomberes[i]<-anscomberes[i]*sqrt(ant[i])/(her(i0)*sqrt(varfu(i0))) } > roun(anscomberes,2) [1] Forelesning 5 STK /40 Forelesning 5 STK /40

7 Sammenligning Scorefunksjon og estimeringsligninger for GLM Anscombe, evians og Pearson resiualer: Komonent j i scorefunksjonen U(β) = (U 1 (β),...,u (β)) uttrykkes erme resiualer a a a a a a a a a Devians Pearson Anscombe U j (β) = l(β) β j = U ij (β) = 1 φ x ij Y i µ i g (µ i )V (µ i ) Vi finner altså MLE ˆβ ve å løse ligningene, j = 1,...,, U j (ˆβ) = 1 φ x ij er ˆµ i er estimert forventning me β = ˆβ. Y i ˆµ i g (ˆµ i )V (ˆµ i ) = Dose Forelesning 5 STK /40 Forelesning 5 STK /40 Log-likelihoo for GLM Me log-likelihoo-birag l i (β) = log(f(y i ;θ i,φ) blir log-likelihoo l(β) = l i (β) = [ θ iy i a(θ i ) + log(c(y i ))] φ sien Y i -ene er uavhengige me tetthet f(y i ;θ i,φ) Observert /forventet informasjonsmatrise (generell link) Observert informasjon J(β) = 2 l β 2 Forventet informasjon ble a (vist sist) [ J (β) = E[ J(β)] = 1 1 x ij x ik φ g (µ i ) 2 V (µ i ) ] j,k=1 Forelesning 5 STK /40 Forelesning 5 STK /40

8 Kanonisk link: Observert info = Forventet info Observert informasjon J(β) = [ J kj (β)] j,k=1 er J kj (β) = U j β k = 1 n φ x ij η i µ i (Y i µ i ) β k η i µ i = 1 n φ x 1 ijx ik = J g (µ i ) jk(β) sien J kj (β) ikke avhenger av noe stokastisk. Vi finner essuten at J kj (β) = J jk (β) = 1 φ x ij x ik V (µ i ) sien θ i = η i g 1 (θ i ) = µ i = a (θ i ) V (µ i ) = a (θ i ) = 1 g (µ i ). Score og Informasjon å matriseform Vi kan uttrykke score U(β) = 1 φ X Wg (µ)(y µ) og forventet informasjon J = 1 φ X WX er (Y µ) = (Y 1 µ 1,...,Y n µ n ), x 11 x 12 x 1 x 21 x 22 x 2 X = esignmatrisen =.... x n1 x n2 x n og 1 W = iag( g (µ 1 ) 2 V (µ 1 ),, 1 g (µ n ) 2 V (µ n ) ), 1 vs. iagonalmatrisen me leene g (µ i ) 2 V (µ i langs iagonalen. ) Forelesning 5 STK /40 Forelesning 5 STK /40 Eksemel: Logistisk regresjon, binære Y i : E[Y i ] = π i V (π i ) = Var(Y i ) = π i (1 π i ) Så me g(π i ) = logit(π i ) = log( π i 1 π i ) = η i blir Dessuten [ J = x ij x ik π i (1 π i ) g (µ i ) = 1 π i π i = ] j,k=1 1 π i (1 π i ) = 1 V (π i ).. samt at g (µ) = iag(g (µ 1 ),,g (µ n )), Forelesning 5 STK /40 Forelesning 5 STK /40

9 Newton-Rahson og Fisher-Scoring La l(θ) være en generell likelihoo me scorefunksjon U(θ), observert informasjon J(θ) og forventet informasjon J (θ). Da oateres anslag θ (k) til nytt anslag θ (k+1) ve Newton-Rahson: θ (k+1) = θ (k) + J(θ (k) ) 1 U(θ (k) ) Fisher-scoring: θ (k+1) = θ (k) + J (θ (k) ) 1 U(θ (k) ) Iterasjonen fortsetter til l(θ (k+1) ) l(θ (k) ) < ǫ = (f.eks.) Motivasjon: Newton s algoritme Fisher-scoring billeata # 0) Definerer esignmatrise og matrise av resonser X<-cbin(re(1,8),Dose) Y<-matrix(Doe,ncol=1) # 1) Initier betaol og loglikelihoo 0<-sum(Doe)/sum(Ant) betaol<-matrix(c(log(0/(1-0)),0),ncol=1) loglikol<-sum(y*log(0/(1-0)))+sum(antall*log(1-0)) esilon< logliknew<-loglikol+2*esilon iterasjon<-0 rint(aste("iterasjon nr.",iterasjon," Loglik=",loglikol)) 0 = f(x ) f(x) + (x x)f (x) x x f(x)/f (x) xny = xg f(xg)/f (xg) Forelesning 5 STK /40 Forelesning 5 STK /40 Fisher-scoring for GLM Nytt anslag for β: β (k+1) = β (k) + J (β (k) ) 1 U(β (k) ) = β (k) + (X W (k) X) 1 X W (k) g (µ (k) )(Y µ (k) ) er µ (k),g (µ (k) ) og W (k) er µ,g (µ) og W evaluert i β (k). Ogave: Anta Y i N(µ i,σ 2 ) me µ i = β jx ij. Vis at at Fisher-scoring-algoritmen konverger i 1. iterasjon til minste kvaraters estimator ˆβ = (X X) 1 X Y uavhengig av startveri β (0). Fisher-scoring billeata, forts. #2) Iterer til loglikelihoo enres lite <-1/(1+ex(-X%*%betaol)) while(logliknew-loglikol>esilon){ iterasjon<-iterasjon+1 loglikol<-logliknew mu<-matrix(antall*,ncol=1) W<-iag(antall**(1-)) U<-t(X)%*%(Y-mu) J<-t(X)%*%W%*%X betanew<-betaol+solve(j)%*%u betaol<-betanew <-1/(1+ex(-X%*%betaol)) logliknew<-sum(y*log(/(1-)))+sum(antall*log(1-)) rint(aste("iterasjon nr.",iterasjon," Loglik=",logliknew)) rint(cbin(betanew,sqrt(iag(solve(j))))) } Forelesning 5 STK /40 Forelesning 5 STK /40

10 Fisher-scoring billeata, Iterasjon > source("fisher-biller-2") [1] "Iterasjon nr. 0 Loglik= " [1] "Iterasjon nr. 1 Loglik= " [,1] [,2] Dose [1] "Iterasjon nr. 2 Loglik= " [,1] [,2] Dose [1] "Iterasjon nr. 3 Loglik= " [,1] [,2] Dose [1] "Iterasjon nr. 4 Loglik= " [,1] [,2] Dose Vektet minste kvaraters metoe Y i N(µ i,σ 2 /w i ) me µ i = β jx ij og w i = kjente vekter Da blir log-likelihoo l(β) = 1 2σ 2 n (Y i µ i ) 2 w i + K og vektet minste kvaraters estimatoren blir er ˆβ = (X WX) 1 X WY Y = søylevektor av resonsene X = esignmatrisen W = iag(w 1,...,w n ) Forelesning 5 STK /40 Forelesning 5 STK /40 Fisher-scoring billeata, Iterasjon forts. [1] "Iterasjon nr. 5 Loglik= " [,1] [,2] Dose # glm i R (til sammenligning) Value St. Error t value (Intercet) Dose GLM Fisher-scoring = IRLS-algoritmen = Iteratively Reweighte Least-Squares Algoritmen. Me (k) = g (µ (k) )(Y µ (k) ) β (k+1) = β (k) + (X W (k) X) 1 X W (k) (k) = (X W (k) X) 1 [X W (k) Xβ (k) + X W (k) (k) ] = (X W (k) X) 1 X W (k) Z (k) er Z (k) = Xβ (k) + g (µ (k) )(Y µ (k) ) altså som vektet minste kvaraters estimator me "resonser" Z (k) vekter W (k) som begge må oateres i hver iterasjon. Forelesning 5 STK /40 Forelesning 5 STK /40

Forelesning STK september 2011

Forelesning STK september 2011 Forelesning STK3100 12. setember 2011 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer En Mettet (saturate) moell er en moell

Detaljer

Forelesning 6 STK3100

Forelesning 6 STK3100 Forelesning STK3 september 7 S O Samuelsen Plan for forelesning: Mer om evians GLM resiualer 3 Test for H : Offset Observert forventet informasjon Optimeringsrutiner Iterative revektee minste kvarater

Detaljer

Forelesning 6 STK3100

Forelesning 6 STK3100 Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning

Detaljer

Eksponensielle klasser

Eksponensielle klasser Eksponensielle klasser, de Jong & Heller, Kap. 3 Eksponensielle klasser STK3100-1. september 2008 Sven Ove Samuelsen En stokastisk variabel Y sies å ha fordeling i den eksponensielle fordelingsklasse dersom

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader. FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:

Detaljer

FORMELSAMLING TIL STK1100 OG STK1110

FORMELSAMLING TIL STK1100 OG STK1110 FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 11. november 2017) 1. Sannsynlighet La A, B, A 1, A 2,..., B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål

Detaljer

Forelesning 5 STK3100/4100

Forelesning 5 STK3100/4100 Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning

Detaljer

Forelesning 11 STK3100/4100

Forelesning 11 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet

Detaljer

Oppsummering av STK2120. Geir Storvik

Oppsummering av STK2120. Geir Storvik Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle

Detaljer

Forelesning 10 STK3100

Forelesning 10 STK3100 Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

Eksponensielle klasser og GLM

Eksponensielle klasser og GLM !! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med

Detaljer

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser

Detaljer

Forelesning 3 STK3100

Forelesning 3 STK3100 Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater

Detaljer

Forelesning 7 STK3100

Forelesning 7 STK3100 Parameterfortolkning logistisk regresjon Forelesning 7 STK3100 6. oktober 2008 S. O. Samuelsen Plan for forelesning: 1. Parameterfortolkning logistisk regresjon 2. Parameterfortolkning andre linkfunksjoner

Detaljer

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

Forelesning 8 STK3100

Forelesning 8 STK3100 $ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel

Detaljer

Forelesning 8 STK3100/4100

Forelesning 8 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -

Detaljer

Prøveeksamen i STK3100/4100 høsten 2011.

Prøveeksamen i STK3100/4100 høsten 2011. Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan

Detaljer

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

Ekstraoppgaver for STK2120

Ekstraoppgaver for STK2120 Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell

Detaljer

Løsningsforslag eksamen 27. februar 2004

Løsningsforslag eksamen 27. februar 2004 MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

Forelesning 11 STK3100/4100

Forelesning 11 STK3100/4100 Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

Forelesning 7 STK3100

Forelesning 7 STK3100 ( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater

Detaljer

Forelesning 9 STK3100

Forelesning 9 STK3100 Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved

Detaljer

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag

Detaljer

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som: Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger.

Detaljer

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene. Estimering 2 -Konfidensintervall Dekkes av kap. 9.4-9.5, 9.10, 9.12 og forelesingsnotatene. En (punkt-)estimator ˆΘ gir oss et anslag på en ukjent parameterverdi, men gir oss ikke noen direkte informasjon

Detaljer

Løsningsforslag: STK2120-v15.

Løsningsforslag: STK2120-v15. Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.

Detaljer

Determinanter. Kapittel 6. Determinanter for 2 2-matriser. La oss beregne arealet av dette parallellogrammet. Vi tegner på noen hjelpelinjer:

Determinanter. Kapittel 6. Determinanter for 2 2-matriser. La oss beregne arealet av dette parallellogrammet. Vi tegner på noen hjelpelinjer: Kapittel 6 Determinanter En matrise inneholer mange tall og erme mye informasjon så mye at et kan være litt overvelene Vi kan konensere ne all informasjonen i en kvaratisk matrise til ett enkelt tall som

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve

Detaljer

Ridge regresjon og lasso notat til STK2120

Ridge regresjon og lasso notat til STK2120 Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

7. november 2011 Geir Storvik

7. november 2011 Geir Storvik Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA440 Statistikk Høst 009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Løsningsskisse Oppgave a) n 8, i x i 675, x 37.5, i y i 488, i x i 375, i x iy i

Detaljer

Kp. 12 Multippel regresjon

Kp. 12 Multippel regresjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction

Detaljer

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

LØSNINGSFORSLAG ) = Dvs

LØSNINGSFORSLAG ) = Dvs LØSNINGSFORSLAG 12 OPPGAVE 1 D j er differansen mellom måling j med metode A og metode B. D j N(µ D, 0.1 2 ). H 0 : µ D = 0 mot alternativet H 1 : µ D > 0. Vi forkaster om ˆµ D > k Under H 0 er ˆµ D =

Detaljer

FORMELSAMLING TIL STK1100 OG STK1110

FORMELSAMLING TIL STK1100 OG STK1110 FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 16. november 2009) 1. Sannsynlighet La A, B, A 1, A 2,...,B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test) Kategoriske data, del I: Kategoriske data - del (Rosner, 10.3-10.7) 1 januar 009 Stian Lydersen To behandlinger og to utfall. (generelt: variable, verdier). x tabell. Uavhengige observasjoner Sammenheng

Detaljer

Kapittel 6 - modell seleksjon og regularisering

Kapittel 6 - modell seleksjon og regularisering Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,

Detaljer

6.5 Normalapproksimasjon til. binomisk fordeling

6.5 Normalapproksimasjon til. binomisk fordeling ....3.4.5..5..5..5...4.6.8....4.6.8....3.4..5..5 Kaittel 6: Kontinuerlige sannsynsfordelingar TMA445 Statistikk Ka 6.5-6.8. 6.5: Normal aroksimasjon til binomisk fordeling, 6.6-6.8: Eksonensialfordeling,

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

Ekstraoppgaver STK3100 h10

Ekstraoppgaver STK3100 h10 Ekstraoppgaver STK3100 h10 Oppgave 1 En-veis variansanalyse modellen kan formuleres som Y ij = µ + α i + ɛ ij (1) der α i = 0 og ɛ ij er i.i.d N(0, σ 2 ). Her representerer er Y ij j te observasjon fra

Detaljer

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i Løsningsskisse TMA440 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 18 96, b 99 40 33 30 Eksamensdato: 30. november

Detaljer

Prøveeksamen STK2100 (fasit) - vår 2018

Prøveeksamen STK2100 (fasit) - vår 2018 Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2. Eksamensdag: Tirsdag 2. juni 2009. Tid for eksamen: 14.30 17.30. Oppgavesettet

Detaljer

Notater i ST2304 H. T. L. 1 Fordelingsfunksjonene i R α-kvantilen... 3

Notater i ST2304 H. T. L. 1 Fordelingsfunksjonene i R α-kvantilen... 3 Notater i ST2304 H. T. L Innhold 1 Fordelingsfunksjonene i R 2 1.1 α-kvantilen....................................... 3 2 Fisher test for ubalanserte modeller 4 2.1 Test mellom alternative modeller...........................

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave Scriptet run confds.m simulerer n data x,..., x n fra en normalfordeling med

Detaljer

STK Oppsummering

STK Oppsummering STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter

Detaljer

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter Observatorer STK00 - Observatorer - Kap 6 Geir Storvik 4. april 206 Så langt: Sannsynlighetsteori Stokastiske modeller Nå: Data Knytte data til stokastiske modeller Utgangspunkt Eksempel høyde Oxford studenter

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på

Detaljer

Oppgave 1. Kilde SS df M S F Legering Feil Total

Oppgave 1. Kilde SS df M S F Legering Feil Total MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig

Detaljer

vekt. vol bruk

vekt. vol bruk UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Kapittel 2: Hendelser

Kapittel 2: Hendelser Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

TMA4240 Statistikk H2015

TMA4240 Statistikk H2015 TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka: MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamen: ECON2130 Statistikk 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 29.05.2019 Sensur kunngjøres: 19.06.2019 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 5 sider Tillatte hjelpemidler:

Detaljer

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Detaljer

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ: Punktestimator STK00 - Bootstrapping og simulering - Kap 7 og eget notat Geir Storvik 8. april 206 Trekke ut informasjon om parametre fra data x,..., x n Parameter av interesse: θ Punktestimator: Observator,

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave

Detaljer

Fasit for tilleggsoppgaver

Fasit for tilleggsoppgaver Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x

Detaljer

La U og V være uavhengige standard normalfordelte variable og definer

La U og V være uavhengige standard normalfordelte variable og definer Binormalfordelingen Definisjon Noe av hensikten med å innføre begrepet betinget sannsynlighet er at kompliserte modeller ofte kan bygges ut fra enkle betingede modeller. Når man spesifiserer betingelser

Detaljer

Medisinsk statistikk Del I høsten 2009:

Medisinsk statistikk Del I høsten 2009: Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X

Detaljer