7. november 2011 Geir Storvik
|
|
- Ernst Christiansen
- 7 år siden
- Visninger:
Transkript
1 Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller Estimeringsmetoder Penalized quasi-likelihood Maksimum likelihood Laplace approksimasjon Gauss-Hermite integrasjon (Diskusjon om REML egnet for GLMM) Hypotesetesting Modell-seleksjon Prediksjon p. 1/3 p. 2/3 Sammenlikning ulike estimeringsmetoder #Penalized quasi-likelihood > library(mass) > DE.PQL<-glmmPQL(Ecervi.01 CLength * fsex, + random = 1 ffarm, family = binomial, data = DeerEcervi) #ML: Laplace approximation with lmer > library(lme4) > DE.lme4<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), #ML: Laplace approx with glmmml > library(glmmml) > DE.glmmML<-glmmML(Ecervi.01 CLength * fsex, + cluster = ffarm,family=binomial, data = DeerEcervi) #ML: Gauss-Hermite with glmmml > DE.glmmML2<-glmmML(Ecervi.01 CLength * fsex,method="ghq", + cluster = ffarm,family=binomial, data = DeerEcervi) Merk: Ingen gjør REML, selv om lmer tilsynelatende gjør dette (fra hjelpesiden) Sammenlikninger Default Gauss-Hermite (20) Estimates SE Estimates SE GLM Intercept Length Sex Length Sex glmmpql Intercept Length Sex Length Sex lmer Intercept Length Sex Length Sex glmmml Intercept Length Sex Length Sex
2 Tolkning parametre Lineære blandede modeller: Y ij =X T ij β + Z T ij b i + ε ij b i N(0,D) E[Y ij b i ] =X T ij β + Z T ij b i E[Y ij ] =X T ij β En enhets endring i X ijk tilsvarer endring i forventning på β k både i individbasert betinget forventing E[Y ij b i ], og populasjonsbasert forventning E[Y ij ] Tolkning parametre (forts) Hypotetiske data om sann sannsynlighet for å få en sykdom før og etter behandling Individ Baseline Post-Baseline Forskjell Log(Odds Ratio) A B C Populasjons gjennomsnitt / Antar i populasjon like mange av typene A, B og C. Absolutt forskjell: Gjennomsnittelig forbedring kontra forbedring av totale gjennomsnitt = = 0.13 Ikke like enkelt med GLMM. p. 5/3 p. 6/3 Tolkning parametre (forts) Individ Baseline Post-Baseline Forskjell Log(Odds Ratio) A B C Populasjons gjennomsnitt / Log-odds: = Gjennomsnittelig forbedring på individnivå: Halvere odds exp( 0.697) = (Tilnærmet riktig også innen hver gruppe) log 0.37(1 0.37) 0.5(1 0.5) = Forbedring på populasjonsnivå: Reduksjon på 40% i odds: exp( 0.532) = Tolkning av parametre - generelt I GLMM: Målsetning med inferens enten individet eller populasjon Regresjonskoeffisienter har tolkning i endring av E[Y ij b i ], dvs individnivå (transformert gjennom link-funksjon). Marginale modeller: For LMM Y i N(X i β,z i DZ T i + Σ i ) Tolkning av β kan også gjøres på populasjonsnivå. For GLMM: Y i har ingen enkel marginal modell. Vanskelig å tolke parametre på populasjonsnivå.
3 Hjorte-data > fit<-lmer(ecervi.01 CLength + fsex +(1 ffarm), > summary(fit) Estimate Std. Error z value Pr(> z ) (Intercept) * CLength <2e-16 *** fsex * Endring i odds når lengde øker med 1 enhet: Odds-ratio = π 1 π π 1 π = exp(0.0517) = Hjorte-data og interaksjoner > DE.lme4<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), > summary(de.lme4) Estimate Std. Error z value Pr(> z ) (Intercept) ** CLength e-08 *** fsex ** CLength:fSex ** Female=1: Endring i odds når lengde øker med 1 enhet: Odds-ratio = π 1 π π 1 π = exp( ) = Male=2: Endring i odds når lengde øker med 1 enhet: p. 9/3 Odds-ratio = π 1 π π 1 π = exp( ) = p. 10/3 Inferens Konfidensintervaller Testing av hypoteser Sammenlinke test observatorer med deres fordeling under null hypotese Velge beste modell Sammenlikner tilpasning av ulike modeller Hypotesetesting/informasjonskriterier Evaluere forskjell i tilpasning mellom modeller Konfidensintervaller PQL > intervals(de.pql) Approximate 95% confidence intervals lower est. upper (Intercept) CLength fsex CLength:fSex attr(,"label") [1] "" Random Effects: Level: ffarm lower est. upper sd((intercept)) Within-group standard error: lower est. upper
4 Konfidensintervaller lmer Wald-basert (for hånd) DE.lme4<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), family = binomial, data = DeerEcervi) #Confidence intervals est = c( , , , ) se = c( , , , ) M = cbind(est -1.96*se,est+1.96*se) rownames(m) = c("(intercept)","clength","fsex2","clength:fsex2") colnames(m) = c("0.025%","0.975%") M 0.025% 0.975% (Intercept) CLength fsex CLength:fSex Testing av tilfeldige effekter LR ok for testing av tilfeldige effekter Krever korreksjon mhp randeffekter (H 0 : σ 2 a = 0 på randen av lovlige verdier) Bedre enn Wald tester som krever flere antagelser p. 13/3 p. 14/3 Rand-effekter Vanlig teori for LR tester: LR tilnærmet χ 2 v der v er forskjell i antall parametre. Krever at H 0 spesifiserer parameter i det indre av parameter-rom H 0 : σa 2 = 0 på randen Alternativ teori (i enkle situasjoner) LR tilnærmet en mikstur av χ 2 v og χ 2 v 1 For v = 1, kan dele vanlig p-verdi på 2. IC er har tilsvarende problemer Hjortedata - testing av tilfeldig effekt > DE.lme4.ml<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), > DE.lme4.ml2<-lmer(Ecervi.01 CLength * fsex +(1+CLength ffarm), > anova(de.lme4.ml,de.lme4.ml2,test="chisq") Data: DeerEcervi Models: DE.lme4.ml: Ecervi.01 CLength * fsex + (1 ffarm) DE.lme4.ml2: Ecervi.01 CLength * fsex + (1 + CLength ffarm) Df AIC BIC loglik Chisq Chi Df Pr(>Chisq) DE.lme4.ml DE.lme4.ml * --- Signif. codes: 0 *** ** 0.01 * Merk: 2 frihetsgrader, ny varians og korrelasjon! P-verdi LR > 1-0.5*pchisq(6.9303,2)-0.5*pchisq(6.9303,1) [1]
5 Hypotesetesting av faste effekter LR tester ikke anbefalt for testing av faste effekter da ikke god for små til moderate datasett. Krever forholdet mellom totalt antall observasjoner og antall faste effekter er stort antall nivåer for en tilfeldig effekt er stor Ingen dispersjonsparameter: Wald Z, χ 2 tester Med dispersjonsparameter: Wald t, F tester Avhenger av effektivt frihetsgrader i residualer Vanskelig å beregne da effektivt antall frihetsgrader for tilifeldige effekter ligger mellom 1 (variansparameter) og I 1 (en parameter for hvert nivå av tilfeldig effekt. (Liten σ 2 a gir sterke restriksjoner på b i -ene) Hjortedata - testing av interaksjon > DE.lme4.ml2<-lmer(Ecervi.01 CLength * fsex +(1+CLength ffarm), + family = binomial, data = DeerEcervi,REML=FALSE) > summary(de.lme4.ml2) Generalized linear mixed model fit by the Laplace approximation Formula: Ecervi.01 CLength * fsex + (1 + CLength ffarm) Data: DeerEcervi AIC BIC loglik deviance Random effects: Groups Name Variance Std.Dev. Corr ffarm (Intercept) CLength Number of obs: 826, groups: ffarm, 24 Estimate Std. Error z value Pr(> z ) (Intercept) ** CLength e-05 *** fsex * CLength:fSex ** p. 17/3 P-verdi: for Wald z test p. 18/3 Prediksjon Usikkerhet i prediksjon Ofte interessert i prediksjon av (ikke-lineære funksjoner) av tilfeldige effekter, f. eks Anta av interesse ψ = h(v T β) µ ij = g 1 (X ij β + Z ij b i ) Som for LMM, kan gjøres på ulike nivåer: Nivå 0: µ ij = g 1 (X ij β) der h er monoton (voksende). Har Usikkerhetsanslag? ψ = h(v T β) Nivå 1: µ ij = g 1 (X ij β + Z ij b i ) b i = E[b i Y, β, θ].
6 Usikkerhet i faste effekter Betrakt først v T β: I R: var[v T β] = v T Var[β]v > v = matrix(c(1,rikz$nap[1]),ncol=1) > mu = t(v)%*%mglmmpql$coef$fixed > V = t(v)%*%vcov(mglmmpql)%*%v > c(mu-1.96*sqrt(v),mu+1.96*sqrt(v)) [1] Har h = exp: L <v T β < U h(l) <h(v T β) < h(u) > exp(c(mu-1.96*sqrt(v),mu+1.96*sqrt(v))) [1] Usikkerhet i prediksjon (forts) Anta av interesse der h er monoton (voksende). To kilder til usikkerhet: Usikkerhet i estimat for β Usikkerhet i b i h(v T β + w T b i ) Ikke opplagt hva man skal gjøre her! Mulig tilnærming: Kun ta hensyn til usikkerhet i b i. Eksempel: Hjortedata, anta av interesse nytt individ uten data. For hun-hjort (fsex=1) p ij = exp{ Length ij + a i} 1 + exp{ Length ij + a i } p. 21/3 p. 22/3 Hjortedata For hun-hjort (fsex=1) logit(p ij ) = Length ij + a i, a i N(0, ) Mulig tilnærming: Anta β = b β, ta hensyn til usikkerhet i a i. a i [ , ] med sanns Kan lage konfidensbånd for p ij for ulike verdier av Length ved å putte inn a i = , 0, Probability of presence of E. cervi L Ugle data Tigge oppførsel av ugler i søskenflokk. NCalls Antall kall før ankomst av forelder (respons) SexParent(SexP) Mor eller far FoodTreatment (FoodT)Ekstra føde tilsatt (Satiated) eller deler av føde fjernet (Deprived) ArrivalTime (ArrT) Tidspunkt for ankomst av forelder ( ) LBroodSize Antall unger i reir fnest Faktor som identifiserer reir Length
7 Modell for ugle data NCalls is Poisson(µ is ) log(µ is ) =η is η is =offset(lbroodsize is ) + β 1 SexP is + β 2 FoodT is + β 3 ArrT is + β 4 SexP is FoodT is + β 5 SexP is ArrT is + a i a i N(0, σa 2 ) Ugle data - R kode > Owls$LBroodSize<-log(Owls$BroodSize) > O1.lmer<-lmer(NCalls offset(lbroodsize)+sexp*foodt+ + SexP*ArrT+(1 fnest),data=owls,family=poisson) > summary(o1.lmer) Data: Owls AIC BIC loglik deviance Random effects: Groups Name Variance Std.Dev. fnest (Intercept) Number of obs: 599, groups: fnest, 27 Estimate Std. Error z value Pr(> z ) (Intercept) e-10 *** SexPMale FoodTSatiated < 2e-16 *** ArrT < 2e-16 *** SexPMale:FoodTSatiated SexPMale:ArrT p. 25/3 p. 26/3 Ugle data - flere tilfeldige effekter? > O1.lmer<-lmer(NCalls offset(lbroodsize)+sexp*foodt+ + SexP*ArrT+(1 fnest),data=owls,family=poisson) > O1.lmer2<-lmer(NCalls offset(lbroodsize)+sexp*foodt+ +> anova(o1.lmer,o1.lmer2,test="chisq") Data: Owls Models: O1.lmer: NCalls offset(lbroodsize) + SexP * FoodT + SexP * ArrT + O1.lmer: fnest) O1.lmer2: NCalls offset(lbroodsize) + SexP * FoodT + SexP * ArrT O1.lmer2: ArrT fnest) Df AIC BIC loglik Chisq Chi Df Pr(>Chisq) O1.lmer O1.lmer < 2.2e-16 *** Testing av faste effekter Trinnvis modell-seleksjon med Wald-test Skript Owl.R Justert P-verdi: > 1-0.5*pchisq(177.37,2)-0.5*pchisq(177.37,1) [1] 0 Merk: anova gir her både AIC/BIC og LR Bør også korrigere AIC/BIC
8 Problemer med GLMM Bolker et al 2009: 311 av 537 GLMM analyser innen økologi og evolusjon var gjort utilfredsstillende! Hypotesetesting Holdbarhet av trinnvis regresjon Bruk av Bayesiansk statistikk Bolker et al (2009) ML underestimerer varianser, men er mest nyttig for å sammenlikne modeller med ulike faste effekter. PQL enklest, tilgjengelig i mange pakker, men gir forventningsskjeve parameterestimater hvis varianser til tilfeldige effekter er store (spesielt binære data) Virker dårlig for Poisson data når µi < 5 eller binomiske data når n i p i < 5 eller n i (1 p i ) < 5 Vanskelig å bruke til inferens (usikkerhetsanslag, testing) Finnes forbedringer, ikke så lett tilgjengelige MCMC/Bayesianske metoder et godt alternativ (ikke i dette kurset) Tilnærmet likt ML for informative datasett Takler lett mange tilfeldige effekter Mange andre problemer p. 29/3 p. 30/3
Forelesning 11 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom
DetaljerForelesning 11 STK3100/4100
Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering
DetaljerPrøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
DetaljerForelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
DetaljerForelesning 9 STK3100/4100
Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser
DetaljerForelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
DetaljerForelesning 7 STK3100/4100
Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning
DetaljerIntroduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R
Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6
DetaljerForelesning 7 STK3100/4100
Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller
Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert
DetaljerAnvendt medisinsk statistikk, vår Repeterte målinger, del II
Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerOppsummering av STK2120. Geir Storvik
Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle
DetaljerGenerelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
DetaljerKlassisk ANOVA/ lineær modell
Anvendt medisinsk statistikk, vår 008: - Varianskomponenter - Sammensatt lineær modell med faste og tilfeldige effekter - Evt. faktoriell design Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin
DetaljerGeneraliserte Lineære Modeller
Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerForelesning 8 STK3100
$ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerForelesning 6 STK3100
Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet
DetaljerTilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
DetaljerDatamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)
Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Beskrive fordelinger (sentraltendens, variasjon og form): Observasjon y i Sentraltendens
DetaljerLineære modeller i praksis
Lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y én eller flere uavhengige variabler:
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerKapittel 3: Studieopplegg
Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere
DetaljerGeneraliserte Lineære Modeller
Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =
Detaljer10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:
DetaljerEKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerForelesning 10 STK3100
Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon
DetaljerForelesning 6 STK3100/4100
Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning
DetaljerPrøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
DetaljerST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon
ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-
DetaljerOppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag
DetaljerKapittel 6 - modell seleksjon og regularisering
Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,
DetaljerForelesning 5 STK3100/4100
Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning
DetaljerForelesning 7 STK3100
( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall
DetaljerEKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og
DetaljerForelesning 6 STK3100/4100
Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk
DetaljerSOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE
1 SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE Eksamensdag: 8 desember 1997 Eksamensstad: Dragvoll, paviljong C, rom 201 Tid til eksamen: 6 timar Vekt: 5 for SOS301 og 4 for SOS31/ SOS311 Talet på sider
DetaljerECON240 VÅR / 2016 BOKMÅL
ECON240 VÅR / 2016 BOKMÅL UNIVERSITETET I BERGEN EKSAMEN UNDER SAMFUNNSVITENSKAPELIG GRAD [ DATO og KLOKKESLETT FOR EKSAMEN (START OG SLUTT) ] Tillatte hjelpemidler: Matematisk formelsamling av K. Sydsæter,
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR
Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 5 Nynorsk Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Torsdag
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på
DetaljerHØGSKOLEN I STAVANGER
EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.
DetaljerSTK2100. Obligatorisk oppgave 1 av 2
14. februar 2018 Innleveringsfrist STK2100 Obligatorisk oppgave 1 av 2 Torsdag 1. mars 2018, klokken 14:30 gjennom Devilry (https:devilry.ifi.uio.no). Praktiske instruksjoner Første side av din innlevering
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,
DetaljerEksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer
Institutt for matematiske fag Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer Faglig kontakt under eksamen: Ola H. Diserud Tlf.: 93218823 Eksamensdato: Onsdag 21. mai 2014
DetaljerKrysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.
SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan
DetaljerForelesning 3 STK3100
Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater
DetaljerSimulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen
Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen gir testobservatoren t mer spredning enn testobservatoren
DetaljerFordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger
Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerInferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
DetaljerLøsningsforslag: STK2120-v15.
Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene
DetaljerEKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
DetaljerEKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerKapittel 2: Hendelser
Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en
DetaljerTMA4240 Statistikk Høst 2007
TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,
DetaljerEksamensoppgåve i TMA4267 Lineære statistiske modellar
Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30
DetaljerLøsningsforslag STK1110-h11: Andre obligatoriske oppgave.
Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at
DetaljerAnalyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger
Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK 1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 1. juni 2006. Tid for eksamen: 09.00 12.00. Oppgavesettet er på
DetaljerOppgave N(0, 1) under H 0. S t n 3
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1
DetaljerOppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk Eksamensdag: Torsdag 2. desember 2010. Tid for eksamen: 09.00 13.00. Oppgavesettet er på
DetaljerEkstraoppgaver for STK2120
Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerStatistikk og dataanalyse
Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel
DetaljerLøsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y
Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerLøsningsforslag eksamen STAT100 Høst 2010
Løsningsforslag eksamen STAT100 Høst 2010 Oppgave 1 a) To-utvalg, parvise data. La Y være tilfeldig variabel som angir antall drepte i periode 1 og tilsvarende X for periode 2. Vi antar parvise avhengigheter
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: Bio 2150A Biostatistikk og studiedesign Eksamensdag: 6. desember 2013 Tid for eksamen: 14:30-17:30 (3 timer) Oppgavesettet er
DetaljerKvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin.
Eksamen STAT100, Høst 2011 (lettere revidert). Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30
DetaljerForelesning 9 STK3100
Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved
DetaljerDEL 1 GRUNNLEGGENDE STATISTIKK
INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerMASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl
MASTER I IDRETTSVITENSKAP 2018/2020 Individuell skriftlig eksamen i STA 400- Statistikk Mandag 18. mars 2019 kl. 10.00-12.00 Eksamensoppgaven består av 5 sider inkludert forsiden Sensurfrist: 8.april 2019
DetaljerEKSAMENSOPPGAVE STA-1001.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Mandag 28. mai 2018. Klokkeslett: 09-13. Sted: Tillatte hjelpemidler: Administrasjonsbygget B154/AUDMAX. «Tabeller og
DetaljerEKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Mandag 9. mai 017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerLøsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015
Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 R-kode for alle oppgaver er gitt bakerst. Oppgave 1 (a) Boksplottet antyder at verdiene er høyere for kvinner enn for menn.
Detaljer