Forelesning 6 STK3100/4100
|
|
- Helena Bakken
- 7 år siden
- Visninger:
Transkript
1 Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/ oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk regresjon 4. Parameterfortolkning andre linkfunksjoner 5. Goodness-of-fit: Hosmer-Lemeshow-test
2 Forelesning 6 STK3100/4100 p. 2/4 Binomiske responser Anta Y i Bin(n i,π i ) er uavhengige. Da har vi data fra en eksponensiell klasse. f(y,θ i,φ i ) = ( ni y ) π y i (1 π i) n i y i =c(y) exp(yθ i a(θ i )) der θ i = log(π i /(1 π i )),a(θ i ) = n i log(1 + exp(θ i )) mens spredningsleddet φ i = 1 er kjent og c(y) = ( n i y ). Som kjent blir E[Y i ] = a (θ i ) = n i exp(θ i ) 1+exp(θ i ) = n iπ i = µ i og Var[Y i ] = φ i a (θ i ) = n i exp(θ i ) (1+exp(θ i )) 2 = n i π i (1 π i ).
3 Forelesning 6 STK3100/4100 p. 3/4 Binomiske eller binære responser Anta Y i Bin(n i,π i ) er uavhengige. Kan alltid definere 1 for j = 1,...,Y i Y i,j = 0 for j = Y i + 1,...,n i som gir oss binære data.
4 Forelesning 6 STK3100/4100 p. 4/4 Binære responser eller grupperte data? Y i Bin(n i,π i ),i = 1,...,k eller Y i Bin(1,π i ),i = 1,...,n = i n i Estimering ekvivalent ved begge representasjoner Testing for sammenlikning av modeller også ekvivalent Goodness-of-fit test (devians) blir forskjellig! χ 2 n q n = k for grupperte data n = k i=1 n i for binære data Krav devians goodness-of-fit test: Y i Bin(n i,π i ) der n i π i > 5 og n i (1 π i ) > 5
5 Biller > dim(beetle) [1] 8 3 > glm(cbind(dode,ant-dode) Dose,family=binomial,data=beetle) Coefficients: (Intercept) Dose Degrees of Freedom: 7 Total (i.e. Null); Null Deviance: Residual Deviance: AIC: Residual > dim(beetle2) [1] > glm(dode Dose,family=binomial,data=beetle2) Coefficients: (Intercept) Dose Degrees of Freedom: 480 Total (i.e. Null); Null Deviance: Residual Deviance: AIC: Residual Forelesning 6 STK3100/4100 p. 5/4
6 GLM binære responser Uavhengige binære Y i med suksess-sannsynlighet π i (n i = 1 her) Lineær prediktor η i = β T x i Linkfunksjon g(π i ) = η i Vi har så langt hovedsaklig sett på link-funksjonen som gir π i g(π i ) = log( ) = logit(π i ) 1 π i π i = exp(η i) 1 + exp(η i ) = g 1 (η i ) Spesielt er dette den kanoniske link-funksjonen, i.e. kanonisk parameter θ i = η i Som kjent gir logit-linken logistisk regresjon. Forelesning 6 STK3100/4100 p. 6/4
7 Forelesning 6 STK3100/4100 p. 7/4 Krav til linkfunksjon for binære responser g() bør være glatt (deriverbar) strengt monoton (voksende) verdier over alle reelle tall g([0, 1]) = R eller ekvivalent g 1 (R) = [0, 1] g 1 (η) kumulativ fordelingsfunksjon for kontinuerlig fordeling på R Logit-linken tilfredstiller disse kravene. Spesielt er g 1 (η) kumulativ i "logistisk fordeling" der tettheten er exp(η) (1 + exp(η)) 2
8 Kumulativ og tetthet i "standard" logistisk fordeling Kumulativ logistisk fordeling Tetthet logistisk fordeling F(x) f(x) x Tettheten er symmetrisk om x = 0, så forventningen er lik 0. Dessuten kan det vises at variansen i standard-logistisk x x 2 exp(x) (1 + exp(x)) 2dx = π2 3 = Forelesning 6 STK3100/4100 p. 8/4
9 Forelesning 6 STK3100/4100 p. 9/4 Probit-link: Invers av kumulativ for standard-normal Siden kravet til en link-funksjon er at den er invers av en kumulativ er en naturlig kandiat til link: g(η) = Φ 1 (η) der Φ(y) = y 1 2π exp( 1 2 x2 )dx. Siden tettheten i standardnormalfordelingen er symmetrisk om y = 0 får vi ofte resultater tilsvarende logist regresjon med probit link (probit analyse). Imidlertid Normalfordelingen har lettere haler enn logistisk fordeling, kan ha situasjoner der probit passer bedre
10 Forelesning 6 STK3100/4100 p. 10/4 Kumulativ og tetthet for logit og probit Kumulative fordelingsfunksjoner Tettheter F(x) logistisk probit (skalert) f(x) x x
11 Forelesning 6 STK3100/4100 p. 11/4 Sammenlikning estimater E[Y i ] =g 1 (η i ) g 1 (0) + (g 1 ) (0)η i ηi l logit = φ(0)η p i probit Dvs for η i 0, ηi l η p φ(0)/0.25 = (8/π) 1.6 eller β l j 1.6 β p j
12 R-utskrift Biller: Logit vs. Probit > logfit<-glm(cbind(dode,ant-dode) Dose,binomial(link=logit),beetle > profit<-glm(cbind(dode,ant-dode) Dose,binomial(link=probit),beetl > logfit Coefficients: (Intercept) Dose Degrees of Freedom: 7 Total (i.e. Null); 6 Residual Null Deviance: Residual Deviance: AIC: > profit Coefficients: (Intercept) Dose Degrees of Freedom: 7 Total (i.e. Null); 6 Residual Null Deviance: Residual Deviance: AIC: > logfit$coef/profit$coef (Intercept) Dose Forelesning 6 STK3100/4100 p. 12/4
13 Forelesning 6 STK3100/4100 p. 13/4 Akaike informasjonskriterium (AIC) defineres generelt ved AIC = 2ˆl + 2q der q = antall parametre i modellen og ˆl maksimum log-likelihood under modellen. Akaike-kriteriet benyttes ved å velge den modellen med minst AIC-verdi.
14 Forelesning 6 STK3100/4100 p. 14/4 R-utskrift Biller: Logit > summary(logfit) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) <2e-16 *** Dose <2e-16 *** --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for binomial family taken to be 1) Null deviance: on 7 degrees of freedom Residual deviance: on 6 degrees of freedom AIC: 41.43
15 Forelesning 6 STK3100/4100 p. 15/4 R-utskrift Biller: Probit > summary(profit) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) <2e-16 *** Dose <2e-16 *** --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for binomial family taken to be 1) Null deviance: on 7 degrees of freedom Residual deviance: on 6 degrees of freedom AIC: Number of Fisher Scoring iterations: 4
16 clog-log-link basert på Gumbel-fordelingen Linken η i = g(π i ) = log( log(1 π i )) kalles den "komplementære log-log-linken" Dens inverse er gitt ved π i = 1 exp( exp(η i )) = F(η i ) som er kumulativ for (den standardiserte) Gumbelfordelingen. Egenskaper: ikke er symmetrisk veldig lette haler mot + haler som logistisk fordeling mot forventning er - Eulers s konstant 0.58 varians π 2 / Forelesning 6 STK3100/4100 p. 16/4
17 Forelesning 6 STK3100/4100 p. 17/4 Kumulativ og tetthet Gumbelfordeling Kumulative fordelingsfunksjon Gumbel Tetthet Gumbel F(x) f(x) x x
18 Forelesning 6 STK3100/4100 p. 18/4 R-utskrift Biller: Clog-log > clogfit<-glm(cbind(dode,ant-dode) Dose,binomial(link=cloglog),bee > summary(clogfit) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) <2e-16 *** Dose <2e-16 *** Null deviance: on 7 degrees of freedom Residual deviance: on 6 degrees of freedom AIC: Number of Fisher Scoring iterations: 4 > logfit$coef/clogfit$coef (Intercept) Dose
19 Forelesning 6 STK3100/4100 p. 19/4 Sammenlikning med AIC > AIC(logfit,profit,clogfit) df AIC logfit profit clogfit cloglog-link gir best tilpasning.
20 Tilpassede sannsynligheter for billedata med logistisk regresjon og cloglog-link: andel dode biller logistisk cloglog dose (log_10) Cloglog-linken treffer observerte andeler bedre enn logistisk regr., svarer til residual-devians på 3.45 for cloglog og for logistisk regresjon. Forelesning 6 STK3100/4100 p. 20/4
21 Forelesning 6 STK3100/4100 p. 21/4 2. ordens ledd > form = cbind(dode,ant-dode) Dose+I(Doseˆ2) > logfit2<-glm(form,binomial(link=logit),beetle) > profit2<-glm(form,binomial(link=probit),beetle) > clogfit2<-glm(form,binomial(link=cloglog),beetle) > AIC(clogfit,logfit2,profit2,caufit2,clogfit2) df AIC clogfit logfit profit clogfit
22 Tilpassede sannsynligheter for billedata også med logistisk regresjon og 2. gradsledd i Dose andel dode biller logistisk cloglog logistisk, 2. gradsledd dose (log_10) 2. gradsledd ga en devians på 3.19 sammenlignet med 3.44 for cloglog-linken. AIC-verdier ble med 2. gradsledd og for cloglog. Forelesning 6 STK3100/4100 p. 22/4
23 Forelesning 6 STK3100/4100 p. 23/4 GLM Binomiske / binære responser Y i Bin(n i,π i ) der linkfunskjonen g(π i ) = η i = β T x i er invers av kontinuerlig kumulativ fordelingsfunksjon på R. Følgende linkfunksjoner er implementert i R: Logistisk regresjon: g(π i ) = log(π i /(1 π i )) ekvivalent med g 1 (η i ) = exp(η i) 1+exp(η i ) Probit-analyse: g(π i ) = Φ 1 (π i ) clog-log-link g(π i ) = log( log(1 π i )) ekvivalent med π i = 1 exp( exp(η i )) "Cauchit-analyse" g(π i ) = tan(π(π i 0.5)) log-link g(π i ) = log(π i ) (ikke invers av kumulativ over R)
24 Forelesning 6 STK3100/4100 p. 24/4 Parameterfortolkning logistisk regresjon Vi definerer odds for begivenhet ved: π = Odds 1 π For logistisk regresjon blir oddsen, med η = β T x, Odds = exp(η) 1+exp(η) 1 exp(η) 1+exp(η) = exp(η) 1+exp(η) 1 1+exp(η) = exp(η) dvs η = log Odds
25 Forelesning 6 STK3100/4100 p. 25/4 Parameterfortolkning logistisk regresjon: Odds-ratio La x k = x k,k j,x j = x j + 1, dvs x x = (0,...,0, 1, 0,...,0), Forholdet mellom oddsene med kovariater x og x, kalt odds-ratioen, (med π = e η /(1 + e η ) og η = β T x ) OR j = π 1 π π 1 π = exp(β j ) = Odds Odds = exp(η η) = exp(β T (x x)) eller omvendt β j = log(or j ), dvs. regresjonsparametrene fortolkes som log-odds-ratioer eller relativ endring i odds (på log skala)
26 Forelesning 6 STK3100/4100 p. 26/4 Odds-ratio Relativ Risk når sannsynlighetene er små En "relativ risk" er definert som forholdet mellom to sannsynligheter, f.eks. RR = π π Spesielt når både π og π er små blir 1 π 1 og 1 π 1. Dermed får vi OR = π π 1 π 1 π π π = RR Dvs for små sannsynligheter måler exp(β j ) (tilnærmet) relativ endring i sannsynlighet når x j øker med en enhet.
27 Forelesning 6 STK3100/4100 p. 27/4 Tilnærmelsen OR RR Relativ risk Odds-ratio π π = π = π = π = π = π = π =
28 Forelesning 6 STK3100/4100 p. 28/4 Sannsynlighetene er nær 0.5 Anta π = δ og π = 0.5 δ. Da blir 1 π = 0.5 δ = π og 1 π = δ = π slik at OR = π π 1 π 1 π = ( ) π 2 = RR 2 π dvs. ikke tilnærmelse mellom størrelsene og OR avviker vesentlig mer fra 1 enn RR
29 Forelesning 6 STK3100/4100 p. 29/4 Uttrykket odds: Spill I ett pengespill satser man en innsats 1 og får deretter utbetalt U = G hvis man vinner. Hvis man taper får man ikke innsatsen tilbake. Gevinsten etter å ha spilt er derfor 1 hvis en taper spillet G = hvis en vinner spillet G 0 Vi antar at sannsynlighet for å tape er π. Hvis spillet er rettferdig er 0 = E[G] = G 0 (1 π) 1 π, dvs. G 0 = π 1 π = Odds for å tape
30 Forelesning 6 STK3100/4100 p. 30/4 Parameter-fortolkning med clog-log-link π =1 exp( exp(β T x)) eller η =β T x = log( log(1 π)) For π liten er log(1 π) π (Taylor) som gir η log(π) π exp(η) og dermed RR j = π π exp(β j)
31 Forelesning 6 STK3100/4100 p. 31/4 Eksempel: Studie av dødelighet med Wilm s tumor 444 døde, 3471 overlevende > glm(d unfav+factor(stg),family=binomial(link=logit), data=nwts)$coef (Intercept) unfav factor(stg)2 factor(stg)3 factor(stg) > glm(d unfav+factor(stg),family=binomial(link=cloglog), data=nwts)$coef (Intercept) unfav factor(stg)2 factor(stg)3 factor(stg)
32 Fortolkning av parametre med probitanalyse Noen ganger har vi kontinuerlige responser, Y i0 N(β T x i,σ 2 ) (f.eks. normalfordelt), men velger å studere 1 hvis Y i0 < γ = terskelverdi Y i = 0 hvis ikke Eks. Y i0 = fødselsvekt Y i = 1 hvis Y i0 < 2500 gram 0 hvis ikke Eks. Psykometriske målinger, Y i0 = score på depresjonsskala 1 hvis Y i0 > terskelverdi Y i = 0 hvis ikke Forelesning 6 STK3100/4100 p. 32/4
33 Forelesning 6 STK3100/4100 p. 33/4 Underliggende skala 1 hvis Y i0 < γ = terskelverdi Y i = 0 hvis ikke tetthet Y0
34 Forelesning 6 STK3100/4100 p. 34/4 Probit, forts. Hvorfor binære respons? Tradisjon for tabellanalyse Direkte score Y i0 kan være svært skjevfordelt Direkte score er kanskje ikke registert, bare noe vi forestiller oss ("latent" variabel) Vi finner sammenhengen mellom Y i0 N(β T x i,σ 2 ) Y i = I(Y i0 γ) ved π i = P(Y i = 1) = P(Y i0 γ) = Φ( γ σ (β σ ) x i )
35 Forelesning 6 STK3100/4100 p. 35/4 Sammenheng parametre i probit og underliggende skala Forventning for E[Y i0 ] = β T x i = β 0 + β 1 x i1 + + β p x ip svarer altså til probitmodell der α 0 = γ β 0 σ Φ 1 (π i ) = α 0 + α 1 x i1 + + α p x ip α j = β j for j = 1,...,p σ Merk: Standardavviket σ for den underliggende skalaen er ikke mulig å identifisere.
36 Forelesning 6 STK3100/4100 p. 36/4 Eksempel: Fødselsvekt og svangerskapsvarighet > summary(lm(vekt svlengde+sex)) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) svlengde e-06 *** sex * --- Residual standard error: on 21 degrees of freedom Multiple R-Squared: 0.64, Adjusted R-squared: F-statistic: on 2 and 21 DF, p-value: 2.194e-05 Vi får altså estimert ˆσ =
37 Forelesning 6 STK3100/4100 p. 37/4 Eksempel: Fødselsvekt og svangerskapsvarighet, forts. > lavvekt<-1*(vekt<2800) > table(lavvekt) > > glm(lavvekt svlengde+sex,family=binomial(link=probit))$coef (Intercept) svlengde sex > -lm(vekt svlengde+sex)$coef/177.1 (Intercept) svlengde sex Definerer Y i = 1 hvis fødselsvekten er mindre enn 2800 gram. Får probit-estimater ˆα j ˆβ j ˆσ fra lineær regresjon.
38 Forelesning 6 STK3100/4100 p. 38/4 Goodness of fit-tester for binomiske data Hvis Y i Bin(n i,π i ) og (a) n i π i > 5 og (b) n i (1 π i ) > 5 for i = 1,...,N er tilnærmet Residual devians Pearson kjikvadrat = 2( l ˆl) χ 2 N p X 2 = n i=1 (Y i n iˆπ i ) 2 n iˆπ i (1 ˆπ i ) χ2 N p der l er log-likelihood i mettet modell, ˆl log-likelihood for den tilpassede modellen med p parametre og ˆπ i estimerte sannsynligheter i denne modellen. Hvis D og X 2 er vesentlig større enn N p tyder det på at modellen passer dårlig. Ofte er imidlertid Y i -ene binære og betingelsen (a) og (b) er da ikke oppfylt.
39 Forelesning 6 STK3100/4100 p. 39/4 To strategier for goodness-of fit med binære data Med kategoriske kovariater: Aggreger til binomiske data Hosmer-Lemeshow test Aggregering består i å Tell opp antall individer etter alle nivåer av de kategoriske variablene Tell opp antall Y i = 1 etter alle nivåer av de kategoriske variablene Gjør glm-tilpasning på aggregerte data Modellen er OK hvis D og X 2 små i forhold til χ 2 der Ñ p Ñ er antall komb. av nivåer over de kategoriske variablene Krever forventet antall suksesser/fiaskoer i hver gruppe > 5
40 Eks. Aggregering: Wilm s tumor > table(nwts$unfav) > table(nwts$stg) > nwts2 = aggregate(nwts$d,by=list(nwts$unfav,nwts$stg),fun=table) Group.1 Group.2 x.0 x > nwts2 = data.frame(unfav=nwts2$group.1,stg=nwts2$group.2, n=nwts2$x[,1]+nwts2$x[,2],d=nwts2$x[,2]) Forelesning 6 STK3100/4100 p. 40/4
41 Forelesning 6 STK3100/4100 p. 41/4 Eks. Aggregering: Wilm s tumor > glmfit = glm(cbind(d,n-d) as.factor(unfav)+as.factor(stg),data=nw > glmfit (Intercept) unfavaggr factor(stgaggr)2 factor(stgaggr)3 factor(stga Degrees of Freedom: 7 Total (i.e. Null); 3 Residual Null Deviance: Residual Deviance: 3.33 AIC: > X2<-sum(residuals(glmfit,type="pearson")ˆ2) > X2 [1]
42 Forelesning 6 STK3100/4100 p. 42/4 Eks. Aggregering: Wilm s tumor Siden residual devians D = 3.33 X 2 = 3.26 = Pearson kjikvadrat er lite sammenlignet med residualt antall frihetsgrader df = 3 virker modellen OK. Men er forventet antall suksesser og "fiaskoer" > 5? Ja, beregner disse: > round((nwts2$n*glmfit$fit,2) > round((nwts2$n*(1-glmfit$fit),2)
43 Hosmer-Lemeshow test Hvis mange kategoriske variable eller skala-kovariater vil ikke aggregering hjelpe. Kan istedet bruke Hosmer-Lemeshow test: Gjør glm-tilpasning Ordner individene etter tilpassede sannsynligheter ˆπ (1) ˆπ (2) ˆπ (n) Lager 10 like store grupper etter ordningen Beregner π gr = gj.sn. av ˆπ (i) i gruppe gr = 1, 2,...,10 Beregner antall observasjoner n gr og antall suksesser Y gr i gruppe gr Beregner Hosmer-Lemeshow X 2 hl = 10 gr=1 (Y gr n gr π gr ) 2 n gr π gr (1 π gr ) Hvis modellen er OK has tilnærmet X 2 hl χ2 8, dvs. df = 10 2 = 8 Forelesning 6 STK3100/4100 p. 43/4
44 Forelesning 6 STK3100/4100 p. 44/4 Eks. Xhl 2 : Wilm s tumor > glmfit<-glm(d unfav+factor(stg)+yr.regis+age, data=nwts,family=binomial) > library(mkmisc) > HLgof.test(glmfit$fit,nwts$d) $C Hosmer-Lemeshow C statistic data: glmfit$fit and nwts$d X-squared = , df = 8, p-value = $H Hosmer-Lemeshow H statistic data: glmfit$fit and nwts$d X-squared = , df = 8, p-value =
45 Eks. X 2 hl : Wilm s tumor > glmfit<-glm(d unfav+factor(stg)+yr.regis+age,family=binomial) > kuttoff<-sort(glmfit$fit)[c(round(length(d)*(1:10)/10))] > gr<-rep(1,length(d)) > for (i in 1:9) gr<-gr+(glmfit$fit>kuttoff[i]) > table(gr) > ngr<-as.numeric(table(gr)) > ngr [1] > dgr<-numeric(0) > for (i in 1:10) dgr[i]<-sum(d[gr==i]) > dgr [1] > for (i in 1:10) pigr[i]<-mean(glmfit$fit[gr==i]) > round(pigr,3) [1] > X2HL<-sum((dgr-ngr*pigr)ˆ2/(ngr*pigr*(1-pigr))) > X2HL [1] > 1-pchisq(X2HL,8) [1] Forelesning 6 STK3100/4100 p. 45/4
Forelesning 6 STK3100/4100
Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk
DetaljerForelesning 7 STK3100
Parameterfortolkning logistisk regresjon Forelesning 7 STK3100 6. oktober 2008 S. O. Samuelsen Plan for forelesning: 1. Parameterfortolkning logistisk regresjon 2. Parameterfortolkning andre linkfunksjoner
DetaljerForelesning 6 STK3100
Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede
DetaljerForelesning 8 STK3100
$ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel
DetaljerGeneraliserte Lineære Modeller
Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =
DetaljerGeneraliserte Lineære Modeller
Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir
DetaljerForelesning 10 STK3100
Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller
Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert
DetaljerPrøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
DetaljerForelesning 7 STK3100/4100
Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning
DetaljerForelesning 5 STK3100/4100
Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning
DetaljerForelesning 7 STK3100
( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet
DetaljerForelesning 7 STK3100/4100
Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),
DetaljerForelesning 11 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom
DetaljerForelesning 9 STK3100
Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerEKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:
DetaljerForelesning 3 STK3100
Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater
DetaljerEksponensielle klasser
Eksponensielle klasser, de Jong & Heller, Kap. 3 Eksponensielle klasser STK3100-1. september 2008 Sven Ove Samuelsen En stokastisk variabel Y sies å ha fordeling i den eksponensielle fordelingsklasse dersom
DetaljerForelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
DetaljerTilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
DetaljerEksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
DetaljerForelesning 9 STK3100
> = = @ A ( A ( + + arameterfortolkning listisk regresjon Forelesning STK300 oktober 00 S O Samuelsen lan for forelesning arameterfortolkning listisk regresjon arameterfortolkning andre linkfunksjoner
DetaljerForelesning STK september 2011
Forelesning STK3100 12. setember 2011 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer En Mettet (saturate) moell er en moell
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerEksponensielle klasser og GLM
!! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3
DetaljerLogistisk regresjon 1
Logistisk regresjon Hovedideen: Binær logistisk regresjon håndterer avhengige, dikotome variable Et hovedmål er å predikere sannsynligheter for å ha verdien på avhengig variabel for bestemte (sosiale)
DetaljerEKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og
Detaljer7. november 2011 Geir Storvik
Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerMedisinsk statistikk Del I høsten 2009:
Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X
DetaljerLøsningsforslag STK1110-h11: Andre obligatoriske oppgave.
Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at
DetaljerForelesning 6 STK3100
Forelesning STK3 september 7 S O Samuelsen Plan for forelesning: Mer om evians GLM resiualer 3 Test for H : Offset Observert forventet informasjon Optimeringsrutiner Iterative revektee minste kvarater
DetaljerForelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Mandag 24. september 2018. Klokkeslett: 09-13. Sted: Administrasjonsbygget K1.04 Tillatte hjelpemidler: «Tabeller og
DetaljerForelesning 11 STK3100/4100
Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 22. mai 2014 Eksamenstid (fra til): 09.00-13.00
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: Bio 2150A Biostatistikk og studiedesign Eksamensdag: 6. desember 2013 Tid for eksamen: 14:30-17:30 (3 timer) Oppgavesettet er
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR
Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 5 Nynorsk Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Torsdag
DetaljerForelesning 9 STK3100/4100
Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser
DetaljerST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon
ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-
Detaljerj=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.
FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerEKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 4. juni 2016 Eksamenstid (fra til): 09.00
DetaljerEKSAMENSOPPGAVE STA-2004.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Torsdag 28. september 2017. Klokkeslett: 09 13. Sted: Tillatte hjelpemidler: Teorifagsbygget. «Tabeller og formler i
DetaljerKategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)
Kategoriske data, del I: Kategoriske data - del (Rosner, 10.3-10.7) 1 januar 009 Stian Lydersen To behandlinger og to utfall. (generelt: variable, verdier). x tabell. Uavhengige observasjoner Sammenheng
DetaljerDEL 1 GRUNNLEGGENDE STATISTIKK
INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................
DetaljerTMA4240 Statistikk H2015
TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).
DetaljerGenerelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerBioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag Oppgave 1 a) Verdien av uttrykkene blir som følger: >
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
DetaljerFormelsamling i medisinsk statistikk
Formelsamling i medisinsk statistikk Versjon av 6. mai 208 Dette er en formelsamling til O. O. Aalen (red.): Statistiske metoder i medisin og helsefag, Gyldendal, 208. Gjennomsnitt x = n (x + x 2 + x 3
DetaljerTillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler
EKSAMENSOPPGAVER Institutt: Eksamen i: Tid: IKBM STAT100 Torsdag 13.des 2012 STATISTIKK 09.00-12.30 (3.5 timer) Emneansvarlig: Solve Sæbø ( 90065281) Tillatte hjelpemidler: C3: alle typer kalkulator, alle
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
DetaljerLøsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015
Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 R-kode for alle oppgaver er gitt bakerst. Oppgave 1 (a) Boksplottet antyder at verdiene er høyere for kvinner enn for menn.
DetaljerLogistisk regresjon 2
Logistisk regresjon 2 SPSS Utskrift: Trivariat regresjon a KJONN UTDAAR Constant Variables in the Equation B S.E. Wald df Sig. Exp(B) -,536,3 84,56,000,25,84,08 09,956,000,202 -,469,083 35,7,000,230 a.
DetaljerIntroduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R
Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6
DetaljerEKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerOppsummering av STK2120. Geir Storvik
Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30
DetaljerForelesning 5 STK3100
Devians Forelesning 5 STK3100 22. setember 2008 S. O. Samuelsen Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer 4. Observert og forventet informasjon 5. Otimeringsrutiner
Detaljervekt. vol bruk
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerPrøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
DetaljerÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.
ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 0, s. 1 (Det tas forbehold om feil i løsningsforslaget.) a) Gjennomsnitt: x = 1 Emp. standardavvik: Median: 1 (1.33 + 1.) = 1.35
DetaljerKapittel 6 - modell seleksjon og regularisering
Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,
DetaljerFra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).
Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og 10.37 (alle er basert på samme datasett). ############ OPPGAVE 10.32 # Vannkvalitet. n=49 målinger i ulike områder. # Forutsetter at datasettene til boka (i
DetaljerEkstraoppgaver STK3100 h10
Ekstraoppgaver STK3100 h10 Oppgave 1 En-veis variansanalyse modellen kan formuleres som Y ij = µ + α i + ɛ ij (1) der α i = 0 og ɛ ij er i.i.d N(0, σ 2 ). Her representerer er Y ij j te observasjon fra
DetaljerLøsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007
Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Oppgave 1: Pengespill a) For hver deltaker har vi følgende situasjon: Deltakeren får en serie oppgaver. Hver runde har to mulige utfall: Deltakeren
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerInferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30
DetaljerEksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer
Institutt for matematiske fag Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer Faglig kontakt under eksamen: Ola H. Diserud Tlf.: 93218823 Eksamensdato: Onsdag 21. mai 2014
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon
DetaljerNotater i ST2304 H. T. L. 1 Fordelingsfunksjonene i R α-kvantilen... 3
Notater i ST2304 H. T. L Innhold 1 Fordelingsfunksjonene i R 2 1.1 α-kvantilen....................................... 3 2 Fisher test for ubalanserte modeller 4 2.1 Test mellom alternative modeller...........................
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.
DetaljerTMA4240 Statistikk Høst 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte
DetaljerEksamensoppgåve i TMA4267 Lineære statistiske modellar
Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 11. november 2017) 1. Sannsynlighet La A, B, A 1, A 2,..., B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerHØGSKOLEN I STAVANGER
HØGSKOLEN I STAVANGER Avdeling for TEKNISK NATURVITEN- EKSAMEN I: TE199 SANNSYNLIGHETSREGNING MED STATISTIKK SKAPELIGE FAG VARIGHET: 4 TIMER DATO: 5. JUNI 2003 TILLATTE HJELPEMIDLER: KALKULATOR OPPGAVESETTET
DetaljerEksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer)
EKSAMENSOPPGAVE Institutt: IKBM Eksamen i: STAT100 Statistikk emnekode emnenavn Tid: Tirsdag 13.12 2016 09.00 12.30 (3.5 timer) ukedag og dato kl. fra til og antall timer Emneansvarlig: Solve Sæbø Navn
DetaljerRidge regresjon og lasso notat til STK2120
Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle
DetaljerEKSAMEN I FAG TMA4275 LEVETIDSANALYSE
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist 975 89 418 EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Fredag 26. mai 2006
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik
Detaljer