Forelesning 11 STK3100/4100
|
|
- Oda Johansen
- 6 år siden
- Visninger:
Transkript
1 Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering p. 1
2 Modell klasser Normal Eksponensiell klasse lm glm Faste effekter lmm glmm Faste og tilfeldige effekter glmm = Generalized Linear Mixed Models (generaliserte lineære blandede modeller) p. 2
3 GLMM Tillater innbygging av avhengigheter mellom observasjoner Modell-struktur svært likt lineære blande modeller Felt stadig i utvikling (i forskningsfronten) Mange tilnærminger Ganske teknisk Vanskelig dokumentasjon p. 3
4 Eksempel: Biomangfold i sjøen Antall arter RIKZ målt innenfor 9 områder. 5 observasjoner innen hvert område (ulike sites ) Ønsker å forklare variasjon ved NAP : Høyde ved stasjon i forhold til gj.snittelig høyde Exposure: Index kombinert fra ulike ting (felles for hvert område) Totalt 45 obsevasjoner Analysert tidligere med normalfordelt respons (log-transformert) Telledata: Mer rimelig med Poisson fordeling p. 4
5 Biodiversitet > Mglm2 = glm(richness NAP,family=quasipoisson,data = RIKZ) > summary(mglm2) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** NAP e-05 *** --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for quasipoisson family taken to be ) Null deviance: on 44 degrees of freedom Residual deviance: on 43 degrees of freedom AIC: NA Tar ikke hensyn til avhengigheter innen Beach (quasipoisson: Samme som poisson men estimerer også dispersjon) p. 5
6 Biodiversitet og GLMM > library(mass) > MglmmPQL = glmmpql(richness NAP,random= 1 fbeach,family=poisson,data > summary(mglmmpql) Linear mixed-effects model fit by maximum likelihood Random effects: Formula: 1 fbeach (Intercept) Residual StdDev: Variance function: Structure: fixed weights Formula: invwt Fixed effects: Richness NAP Value Std.Error DF t-value p-value (Intercept) e-11 NAP e-06 Merk: P-verdier forskjellige! p. 6
7 LMM - alternativ modell-spesifisering LMM: Y ij =X ij β +Z ij b i +ε ij b i uif N(0,D) ε ij uif N(0,σ 2 ) Alternativ formulering: E[Y ij b i ] =X ij β +Z ij b i Var[Y ij b i ] =σ 2 b i uif N(0,D) og gittb i -ene så er alle Y ij uavhengige og normalfordelte. p. 7
8 GLMM LMM: E[Y ij b i ] =µ ij = X ij β +Z ij b i Var[Y ij b i ] =σ 2 b i uif N(0,D) og gittb i -ene så er alle Y ij uavhengige og normalfordelte. GLMM E[Y ij b i ] =µ ij g(µ ij ) =X ij β +Z ij b i b i uif N(0,D) og gittb i -ene så er alle Y ij uavh. fra en fordeling innen den eksponensiell klasse p. 8
9 E. cervi L1 i hjort Ecervi.01 tilstedeværelse av E. cervi L1 (i ekskrementer) fsex kjønn Length lengde på dyr Farm Farm (24 ulike) > DE.glm<-glm(Ecervi.01 CLength * fsex, data = DeerEcervi, + family = binomial) > summary(de.glm) Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) e-09 *** CLength e-06 *** fsex CLength:fSex * Repeterte målinger innen samme farm. Tar ikke hensyn til mulige avhengigheter innen farmer. > table(deerecervi$farm) AL AU BA BE CB CRC HB LN MAN MB MO NC NV PN RN RO SAU SE TI TN VISO VY p. 9
10 Hjort og farm Mulig utvidelse > DE.glm<-glm(Ecervi.01 CLength * fsex+ffarm, data = DeerEcervi, + family = binomial) > anova(de.glm,test="chisq") Df Deviance Resid. Df Resid. Dev P(> Chi ) NULL CLength e-16 *** fsex ffarm < 2.2e-16 *** CLength:fSex ** Problemer ffarm klart signifikant Bruker 23 frihetsgrader Kan vise at også interaksjon mellom ffarm og CLength signifikant, ytterligere 22 frihetsgrader Ikke av interesse å se på forskjell mellom farmer Hvordan predikere for farmer der vi ikke har data? p. 10
11 GLMM for hjortedata GLM GLMM Y ij Bin(1,p ij ) logit(p ij ) =α+β 1 Length ij +β 2 Sex ij +β 3 Length ij Sex ij +α Farm i Y ij Bin(1,p ij ) logit(p ij ) =α+β 1 Length ij +β 2 Sex ij +β 3 Length ij Sex ij +a i a i N(0,σ 2 a) Betydning av Farm måles nå gjennom σ 2 a. Reduserer antall parametre relatert til Farm fra 23 til 1! p. 11
12 GLMM og R Mange mulige funksjoner. Vil her se på glmmpql: > library(mass) > DE.PQL<-glmmPQL(Ecervi.01 CLength * fsex, + random = 1 ffarm, family = binomial, data = DeerEcervi) > summary(de.pql) Random effects: Formula: 1 ffarm (Intercept) Residual StdDev: Variance function: Structure: fixed weights Formula: invwt Fixed effects: Ecervi.01 CLength * fsex Value Std.Error DF t-value p-value (Intercept) CLength fsex CLength:fSex p. 12
13 glmmpql - tolkning av output Random effects: Formula: 1 ffarm (Intercept) Residual StdDev: ˆσ 2 a = = 2.14 Residual StdDev: Standard avvik av working residuals. Svarer ikke til noen parameter her! p. 13
14 GLMM og likelihood Vanlig GLM LMM GLMM Likelihood kan skrives opp direkte Y i multivariat normalfordelt, likelihood kan igjen skrives opp direkte. f(y i β,θ) = f(y i b i,β,d)db i b i = f(y ij b i,β,d)db i Vanskelig integral å beregne! Må i tillegg optimere b i j L(β,θ) = i f(y i β,θ) mhp β,θ der D = D(θ). STORT numerisk problem p. 14
15 Numeriske integrering Anta g(µ ij ) = X ij β +b i Vi har f(y ij b i,β,θ) =e (θ ijy ij a(θ ij ))/φ logc(y ij ;φ), θ ij = θ ij (µ ij (β,b i )) L(β,θ) = e j [(θ ijy ij a(θ ij ))/φ logc(y ij ;φ)] 1 e b2 i /(2σ2 b ) db i i b i 2πσb = 1 h(b i ) e b2 i /(2σ2 b ) db i i b i 2πσb = h (v i )e v 2 idv i, v i = b i / 2σb 2 i v i Gauss-Hermite kvadratur: h (v i )e v 2 idv i v i d h (x k )w k k=1 der (w k,x k ) er designet til å gi presise approksimasjoner når h er polynomisk Kan generaliseres tilg(µij ) = X ij β +Z ij b i, men krever lav dimensjon på b i Må kunne gruppere data i klustre Sterkt linket til gaussiske fordeling påbi p. 15
16 Laplace tilnærminger l(β,θ) = i { } log f(y i b i )f(b i D)db i b i = i { } log e g i(b i ) db i b i Taylor approksimasjon (en dimensjon): g i (b i ) g i (ˆb i )+g i (ˆb i )(b i ˆb i )+ 1 2 g i (ˆb i )(b i ˆb i ) 2 Velgˆb i : g i (ˆb i ) = 0 og anta g i (ˆb i ) < 0 (maks-punkt) som gir (der vi definerer σ 2 i = 1/g i (ˆb i )) log e gi(b) db i log b i =log b i e g(ˆb)+ 1 2σ 2 i {e g i(ˆb i ) 2πσ i (b ˆb) 2 db 1 e 1 2σ i 2 b i 2πσi =g i (ˆb i )+ 1 2 log(2π)+ 1 2 log(σ2 i ) (b i ˆb i ) 2 db i } =g i (ˆb i )+ 1 2 log(2π) 1 2 log( g i (ˆb i )) p. 16
17 Laplace tilnærming - generell dimensjon l(β,θ) i { g i (ˆb i ) q 2 log(2π) 1 2 log 2 g i (ˆb i ) b i b T i } Merk: g i avhenger av β,θ! Må optimerel(β,θ) mhp β,θ. Enklere enn numerisk integrasjon Mindre nøyaktig, men bra nok? Vist seg å fungere svært godt i veldig høye dimensjoner! p. 17
18 Penalized Quasi-likelihood Idé: Bruke noe enklere enn likelihood funksjon. L(β,θ) = f(y β,θ) = b f(y b, β)f(b θ)db Se istedet på og maksimer mhp β,θ og b! L PQL (b,β,θ) = f(y,b β,θ) = f(y b,β)f(b θ) l PQL (b,β,θ) = logf(y b,β) 1 2 bt Db logf(y b,β) er vanlig log-likelihood hvis vi oppfatter b som parameter(e). 1 2 bt Db er et straffeledd (presser b mot null) Egenskaper PQL estimater mindre presise enn ML. Asymptotiske resultater krever økende antall observasjoner for hver tilfeldig effekt (dvs typisk økende antall observasjoner innen hver gruppe) p. 18
19 REML Også for GLMM, vil ML-estimater av varianskomponenter være forventningsskjeve (bli for små). Mulig med REML justeringer også for GLMM. Noe mer komplisert her p. 19
20 Sammenlikning estimeringsmetoder Skrondal og Rabe-Hesketh (2004): Ingen klar vinner mellom ML og REML REML: Devians testing ikke mulig for faste effekter REML mindre sensitiv til outliere p. 20
21 Inferens Under passende regularitetsbetingelser gjelder vanlige ML-resultater: ˆθ er konsistent ˆθ er asymptotisk normal ˆθ er asymptotisk effisient Cov[ˆθ] er tilnærmet lik den inverse av Fisher informasjonsmatrisen, som igjen er tilnærmet lik den observerte informasjonsmatrisen Gjelder også for alternative (approksimative) estimeringsmetoder, men kovariansmatrisene noe forskjellige Kovariansmatriser (minst) like vanskelig å beregne som estimater. Programvare gjør dette for oss p. 21
22 Eksempler Kun vist resultater med glmmpql som bruker PQL metoden. Finnes også rutiner som gjør ML: lmer/glmer, glmmml, men er mindre robuste ML metoder generelt bedre enn PQL, men ML metoder ikke utviklet godt nok ennå Mange gode Bayesianske løsninger. p. 22
Forelesning 11 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom
DetaljerForelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
Detaljer7. november 2011 Geir Storvik
Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller
DetaljerForelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
DetaljerForelesning 9 STK3100/4100
Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser
DetaljerForelesning 7 STK3100/4100
Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning
DetaljerPrøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller
Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert
DetaljerForelesning 7 STK3100/4100
Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),
DetaljerGeneraliserte Lineære Modeller
Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir
DetaljerGeneraliserte Lineære Modeller
Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =
DetaljerForelesning 6 STK3100
Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
DetaljerAnvendt medisinsk statistikk, vår Repeterte målinger, del II
Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:
DetaljerEKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerForelesning 5 STK3100/4100
Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet
DetaljerEksponensielle klasser
Eksponensielle klasser, de Jong & Heller, Kap. 3 Eksponensielle klasser STK3100-1. september 2008 Sven Ove Samuelsen En stokastisk variabel Y sies å ha fordeling i den eksponensielle fordelingsklasse dersom
DetaljerTilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
DetaljerKapittel 6 - modell seleksjon og regularisering
Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,
DetaljerForelesning 6 STK3100/4100
Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning
DetaljerForelesning 8 STK3100
$ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerForelesning 10 STK3100
Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon
DetaljerOppsummering av STK2120. Geir Storvik
Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag
DetaljerForelesning 7 STK3100
( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater
DetaljerIntroduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R
Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6
DetaljerForelesning 9 STK3100
Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30
DetaljerLøsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015
Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 R-kode for alle oppgaver er gitt bakerst. Oppgave 1 (a) Boksplottet antyder at verdiene er høyere for kvinner enn for menn.
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerForelesning 6 STK3100/4100
Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk
Detaljer10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
DetaljerST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon
ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-
DetaljerEKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerEKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Mandag 24. september 2018. Klokkeslett: 09-13. Sted: Administrasjonsbygget K1.04 Tillatte hjelpemidler: «Tabeller og
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerSTK Oppsummering
STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerForelesning 3 STK3100
Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater
DetaljerEkstraoppgaver for STK2120
Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerEksamensoppgåve i TMA4267 Lineære statistiske modellar
Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå
DetaljerKlassisk ANOVA/ lineær modell
Anvendt medisinsk statistikk, vår 008: - Varianskomponenter - Sammensatt lineær modell med faste og tilfeldige effekter - Evt. faktoriell design Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin
DetaljerPrøveeksamen STK vår 2017
Prøveeksamen STK2100 - vår 2017 Geir Storvik Vår 2017 Oppgave 1 Anta en lineær regresjonsmodell p Y i = β 0 + β j x ij + ε i, j=1 ε i uif N(0, σ 2 ) Vi kan skrive denne modellen på vektor/matrise-form:
DetaljerBioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag Oppgave 1 a) Verdien av uttrykkene blir som følger: >
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall
DetaljerFra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).
Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og 10.37 (alle er basert på samme datasett). ############ OPPGAVE 10.32 # Vannkvalitet. n=49 målinger i ulike områder. # Forutsetter at datasettene til boka (i
DetaljerFasit og løsningsforslag STK 1110
Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),
DetaljerGenerelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
DetaljerOppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerLøsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y
Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall
DetaljerEKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR
Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 5 Nynorsk Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Torsdag
DetaljerEksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
DetaljerStatistisk analyse av data fra planlagte forsøk
Statistisk analyse av data fra planlagte forsøk 19. mars 2019 9.00 10.30 Skypemøte 2 i NLR s kurs i forsøksarbeid 2019 Torfinn Torp Temaer Noen sentrale begreper, framgangsmåte etc., via et eksempel. Noen
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: Bio 2150A Biostatistikk og studiedesign Eksamensdag: 6. desember 2013 Tid for eksamen: 14:30-17:30 (3 timer) Oppgavesettet er
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
DetaljerPrøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerForelesning STK september 2011
Forelesning STK3100 12. setember 2011 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer En Mettet (saturate) moell er en moell
DetaljerInferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
DetaljerObservatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter
Observatorer STK00 - Observatorer - Kap 6 Geir Storvik 4. april 206 Så langt: Sannsynlighetsteori Stokastiske modeller Nå: Data Knytte data til stokastiske modeller Utgangspunkt Eksempel høyde Oxford studenter
DetaljerEksponensielle klasser og GLM
!! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3
DetaljerMOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21
DetaljerEKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerPunktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:
Punktestimator STK00 - Bootstrapping og simulering - Kap 7 og eget notat Geir Storvik 8. april 206 Trekke ut informasjon om parametre fra data x,..., x n Parameter av interesse: θ Punktestimator: Observator,
DetaljerSiden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.
Estimeringsmetoder Momentmetoden La X, X 2,..., X n være uavhengige variable som er rektangulært fordelte på intervallet [0, θ]. Vi vet da at forventningsverdiene til hver observasjon og forventningen
DetaljerLøsningsforslag eksamen 27. februar 2004
MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerEksamensoppgave i TMA4275 Levetidsanalyse
Institutt for matematiske fag Eksamensoppgave i TMA4275 Levetidsanalyse Faglig kontakt under eksamen: Bo Lindqvist Tlf: 975 89 418 Eksamensdato: Lørdag 31. mai 2014 Eksamenstid (fra til): 09:00-13:00 Hjelpemiddelkode/Tillatte
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 22. mai 2014 Eksamenstid (fra til): 09.00-13.00
DetaljerOppgave 1. Kilde SS df M S F Legering Feil Total
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig
Detaljerj=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.
FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da
DetaljerInferens i regresjon
Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons
DetaljerVariansanalyse og lineær regresjon notat til STK2120
Variansanalyse og lineær regresjon notat til STK2120 Ørulf Borgan februar 2013 Formålet med dette notatet er å beskrive sammenhengen mellom variansanalyse med faste effekter og multippel lineær regresjon
DetaljerTidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.
Fakultet: KBM Eksamen i: STAT100 STATISTIKK Tidspunkt: Fredag 18. mai 2018 14.00 17.30 (3.5 timer) Kursansvarlig: Trygve Almøy 95141344 Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.
Detaljervekt. vol bruk
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerOppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
DetaljerI enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x
Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren
DetaljerTMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerUtfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerTid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.
EKSAMENSOPPGAVE, bokmål Institutt: IKBM Eksamen i: STAT100 STATISTIKK Tid: 29. mai 2012 09.00-12.30 (3.5 timer) Emneansvarlig: Trygve Almøy (Tlf: 95141344) Tillatte hjelpemidler: C3: alle typer kalkulator,
Detaljer