7. november 2011 Geir Storvik

Størrelse: px
Begynne med side:

Download "7. november 2011 Geir Storvik"

Transkript

1 Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller Estimeringsmetoder Penalized quasi-likelihood Maksimum likelihood Laplace approksimasjon Gauss-Hermite integrasjon (Diskusjon om REML egnet for GLMM) Hypotesetesting Modell-seleksjon Prediksjon p. 1/3 p. 2/3 Sammenlikning ulike estimeringsmetoder #Penalized quasi-likelihood > library(mass) > DE.PQL<-glmmPQL(Ecervi.01 CLength * fsex, + random = 1 ffarm, family = binomial, data = DeerEcervi) #ML: Laplace approximation with lmer > library(lme4) > DE.lme4<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), #ML: Laplace approx with glmmml > library(glmmml) > DE.glmmML<-glmmML(Ecervi.01 CLength * fsex, + cluster = ffarm,family=binomial, data = DeerEcervi) #ML: Gauss-Hermite with glmmml > DE.glmmML2<-glmmML(Ecervi.01 CLength * fsex,method="ghq", + cluster = ffarm,family=binomial, data = DeerEcervi) Merk: Ingen gjør REML, selv om lmer tilsynelatende gjør dette (fra hjelpesiden) Sammenlikninger Default Gauss-Hermite (20) Estimates SE Estimates SE GLM Intercept Length Sex Length Sex glmmpql Intercept Length Sex Length Sex lmer Intercept Length Sex Length Sex glmmml Intercept Length Sex Length Sex

2 Tolkning parametre Lineære blandede modeller: Y ij =X T ij β + Z T ij b i + ε ij b i N(0,D) E[Y ij b i ] =X T ij β + Z T ij b i E[Y ij ] =X T ij β En enhets endring i X ijk tilsvarer endring i forventning på β k både i individbasert betinget forventing E[Y ij b i ], og populasjonsbasert forventning E[Y ij ] Tolkning parametre (forts) Hypotetiske data om sann sannsynlighet for å få en sykdom før og etter behandling Individ Baseline Post-Baseline Forskjell Log(Odds Ratio) A B C Populasjons gjennomsnitt / Antar i populasjon like mange av typene A, B og C. Absolutt forskjell: Gjennomsnittelig forbedring kontra forbedring av totale gjennomsnitt = = 0.13 Ikke like enkelt med GLMM. p. 5/3 p. 6/3 Tolkning parametre (forts) Individ Baseline Post-Baseline Forskjell Log(Odds Ratio) A B C Populasjons gjennomsnitt / Log-odds: = Gjennomsnittelig forbedring på individnivå: Halvere odds exp( 0.697) = (Tilnærmet riktig også innen hver gruppe) log 0.37(1 0.37) 0.5(1 0.5) = Forbedring på populasjonsnivå: Reduksjon på 40% i odds: exp( 0.532) = Tolkning av parametre - generelt I GLMM: Målsetning med inferens enten individet eller populasjon Regresjonskoeffisienter har tolkning i endring av E[Y ij b i ], dvs individnivå (transformert gjennom link-funksjon). Marginale modeller: For LMM Y i N(X i β,z i DZ T i + Σ i ) Tolkning av β kan også gjøres på populasjonsnivå. For GLMM: Y i har ingen enkel marginal modell. Vanskelig å tolke parametre på populasjonsnivå.

3 Hjorte-data > fit<-lmer(ecervi.01 CLength + fsex +(1 ffarm), > summary(fit) Estimate Std. Error z value Pr(> z ) (Intercept) * CLength <2e-16 *** fsex * Endring i odds når lengde øker med 1 enhet: Odds-ratio = π 1 π π 1 π = exp(0.0517) = Hjorte-data og interaksjoner > DE.lme4<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), > summary(de.lme4) Estimate Std. Error z value Pr(> z ) (Intercept) ** CLength e-08 *** fsex ** CLength:fSex ** Female=1: Endring i odds når lengde øker med 1 enhet: Odds-ratio = π 1 π π 1 π = exp( ) = Male=2: Endring i odds når lengde øker med 1 enhet: p. 9/3 Odds-ratio = π 1 π π 1 π = exp( ) = p. 10/3 Inferens Konfidensintervaller Testing av hypoteser Sammenlinke test observatorer med deres fordeling under null hypotese Velge beste modell Sammenlikner tilpasning av ulike modeller Hypotesetesting/informasjonskriterier Evaluere forskjell i tilpasning mellom modeller Konfidensintervaller PQL > intervals(de.pql) Approximate 95% confidence intervals lower est. upper (Intercept) CLength fsex CLength:fSex attr(,"label") [1] "" Random Effects: Level: ffarm lower est. upper sd((intercept)) Within-group standard error: lower est. upper

4 Konfidensintervaller lmer Wald-basert (for hånd) DE.lme4<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), family = binomial, data = DeerEcervi) #Confidence intervals est = c( , , , ) se = c( , , , ) M = cbind(est -1.96*se,est+1.96*se) rownames(m) = c("(intercept)","clength","fsex2","clength:fsex2") colnames(m) = c("0.025%","0.975%") M 0.025% 0.975% (Intercept) CLength fsex CLength:fSex Testing av tilfeldige effekter LR ok for testing av tilfeldige effekter Krever korreksjon mhp randeffekter (H 0 : σ 2 a = 0 på randen av lovlige verdier) Bedre enn Wald tester som krever flere antagelser p. 13/3 p. 14/3 Rand-effekter Vanlig teori for LR tester: LR tilnærmet χ 2 v der v er forskjell i antall parametre. Krever at H 0 spesifiserer parameter i det indre av parameter-rom H 0 : σa 2 = 0 på randen Alternativ teori (i enkle situasjoner) LR tilnærmet en mikstur av χ 2 v og χ 2 v 1 For v = 1, kan dele vanlig p-verdi på 2. IC er har tilsvarende problemer Hjortedata - testing av tilfeldig effekt > DE.lme4.ml<-lmer(Ecervi.01 CLength * fsex +(1 ffarm), > DE.lme4.ml2<-lmer(Ecervi.01 CLength * fsex +(1+CLength ffarm), > anova(de.lme4.ml,de.lme4.ml2,test="chisq") Data: DeerEcervi Models: DE.lme4.ml: Ecervi.01 CLength * fsex + (1 ffarm) DE.lme4.ml2: Ecervi.01 CLength * fsex + (1 + CLength ffarm) Df AIC BIC loglik Chisq Chi Df Pr(>Chisq) DE.lme4.ml DE.lme4.ml * --- Signif. codes: 0 *** ** 0.01 * Merk: 2 frihetsgrader, ny varians og korrelasjon! P-verdi LR > 1-0.5*pchisq(6.9303,2)-0.5*pchisq(6.9303,1) [1]

5 Hypotesetesting av faste effekter LR tester ikke anbefalt for testing av faste effekter da ikke god for små til moderate datasett. Krever forholdet mellom totalt antall observasjoner og antall faste effekter er stort antall nivåer for en tilfeldig effekt er stor Ingen dispersjonsparameter: Wald Z, χ 2 tester Med dispersjonsparameter: Wald t, F tester Avhenger av effektivt frihetsgrader i residualer Vanskelig å beregne da effektivt antall frihetsgrader for tilifeldige effekter ligger mellom 1 (variansparameter) og I 1 (en parameter for hvert nivå av tilfeldig effekt. (Liten σ 2 a gir sterke restriksjoner på b i -ene) Hjortedata - testing av interaksjon > DE.lme4.ml2<-lmer(Ecervi.01 CLength * fsex +(1+CLength ffarm), + family = binomial, data = DeerEcervi,REML=FALSE) > summary(de.lme4.ml2) Generalized linear mixed model fit by the Laplace approximation Formula: Ecervi.01 CLength * fsex + (1 + CLength ffarm) Data: DeerEcervi AIC BIC loglik deviance Random effects: Groups Name Variance Std.Dev. Corr ffarm (Intercept) CLength Number of obs: 826, groups: ffarm, 24 Estimate Std. Error z value Pr(> z ) (Intercept) ** CLength e-05 *** fsex * CLength:fSex ** p. 17/3 P-verdi: for Wald z test p. 18/3 Prediksjon Usikkerhet i prediksjon Ofte interessert i prediksjon av (ikke-lineære funksjoner) av tilfeldige effekter, f. eks Anta av interesse ψ = h(v T β) µ ij = g 1 (X ij β + Z ij b i ) Som for LMM, kan gjøres på ulike nivåer: Nivå 0: µ ij = g 1 (X ij β) der h er monoton (voksende). Har Usikkerhetsanslag? ψ = h(v T β) Nivå 1: µ ij = g 1 (X ij β + Z ij b i ) b i = E[b i Y, β, θ].

6 Usikkerhet i faste effekter Betrakt først v T β: I R: var[v T β] = v T Var[β]v > v = matrix(c(1,rikz$nap[1]),ncol=1) > mu = t(v)%*%mglmmpql$coef$fixed > V = t(v)%*%vcov(mglmmpql)%*%v > c(mu-1.96*sqrt(v),mu+1.96*sqrt(v)) [1] Har h = exp: L <v T β < U h(l) <h(v T β) < h(u) > exp(c(mu-1.96*sqrt(v),mu+1.96*sqrt(v))) [1] Usikkerhet i prediksjon (forts) Anta av interesse der h er monoton (voksende). To kilder til usikkerhet: Usikkerhet i estimat for β Usikkerhet i b i h(v T β + w T b i ) Ikke opplagt hva man skal gjøre her! Mulig tilnærming: Kun ta hensyn til usikkerhet i b i. Eksempel: Hjortedata, anta av interesse nytt individ uten data. For hun-hjort (fsex=1) p ij = exp{ Length ij + a i} 1 + exp{ Length ij + a i } p. 21/3 p. 22/3 Hjortedata For hun-hjort (fsex=1) logit(p ij ) = Length ij + a i, a i N(0, ) Mulig tilnærming: Anta β = b β, ta hensyn til usikkerhet i a i. a i [ , ] med sanns Kan lage konfidensbånd for p ij for ulike verdier av Length ved å putte inn a i = , 0, Probability of presence of E. cervi L Ugle data Tigge oppførsel av ugler i søskenflokk. NCalls Antall kall før ankomst av forelder (respons) SexParent(SexP) Mor eller far FoodTreatment (FoodT)Ekstra føde tilsatt (Satiated) eller deler av føde fjernet (Deprived) ArrivalTime (ArrT) Tidspunkt for ankomst av forelder ( ) LBroodSize Antall unger i reir fnest Faktor som identifiserer reir Length

7 Modell for ugle data NCalls is Poisson(µ is ) log(µ is ) =η is η is =offset(lbroodsize is ) + β 1 SexP is + β 2 FoodT is + β 3 ArrT is + β 4 SexP is FoodT is + β 5 SexP is ArrT is + a i a i N(0, σa 2 ) Ugle data - R kode > Owls$LBroodSize<-log(Owls$BroodSize) > O1.lmer<-lmer(NCalls offset(lbroodsize)+sexp*foodt+ + SexP*ArrT+(1 fnest),data=owls,family=poisson) > summary(o1.lmer) Data: Owls AIC BIC loglik deviance Random effects: Groups Name Variance Std.Dev. fnest (Intercept) Number of obs: 599, groups: fnest, 27 Estimate Std. Error z value Pr(> z ) (Intercept) e-10 *** SexPMale FoodTSatiated < 2e-16 *** ArrT < 2e-16 *** SexPMale:FoodTSatiated SexPMale:ArrT p. 25/3 p. 26/3 Ugle data - flere tilfeldige effekter? > O1.lmer<-lmer(NCalls offset(lbroodsize)+sexp*foodt+ + SexP*ArrT+(1 fnest),data=owls,family=poisson) > O1.lmer2<-lmer(NCalls offset(lbroodsize)+sexp*foodt+ +> anova(o1.lmer,o1.lmer2,test="chisq") Data: Owls Models: O1.lmer: NCalls offset(lbroodsize) + SexP * FoodT + SexP * ArrT + O1.lmer: fnest) O1.lmer2: NCalls offset(lbroodsize) + SexP * FoodT + SexP * ArrT O1.lmer2: ArrT fnest) Df AIC BIC loglik Chisq Chi Df Pr(>Chisq) O1.lmer O1.lmer < 2.2e-16 *** Testing av faste effekter Trinnvis modell-seleksjon med Wald-test Skript Owl.R Justert P-verdi: > 1-0.5*pchisq(177.37,2)-0.5*pchisq(177.37,1) [1] 0 Merk: anova gir her både AIC/BIC og LR Bør også korrigere AIC/BIC

8 Problemer med GLMM Bolker et al 2009: 311 av 537 GLMM analyser innen økologi og evolusjon var gjort utilfredsstillende! Hypotesetesting Holdbarhet av trinnvis regresjon Bruk av Bayesiansk statistikk Bolker et al (2009) ML underestimerer varianser, men er mest nyttig for å sammenlikne modeller med ulike faste effekter. PQL enklest, tilgjengelig i mange pakker, men gir forventningsskjeve parameterestimater hvis varianser til tilfeldige effekter er store (spesielt binære data) Virker dårlig for Poisson data når µi < 5 eller binomiske data når n i p i < 5 eller n i (1 p i ) < 5 Vanskelig å bruke til inferens (usikkerhetsanslag, testing) Finnes forbedringer, ikke så lett tilgjengelige MCMC/Bayesianske metoder et godt alternativ (ikke i dette kurset) Tilnærmet likt ML for informative datasett Takler lett mange tilfeldige effekter Mange andre problemer p. 29/3 p. 30/3

Forelesning 11 STK3100/4100

Forelesning 11 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom

Detaljer

Forelesning 11 STK3100/4100

Forelesning 11 STK3100/4100 Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering

Detaljer

Prøveeksamen i STK3100/4100 høsten 2011.

Prøveeksamen i STK3100/4100 høsten 2011. Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser

Detaljer

Forelesning 8 STK3100/4100

Forelesning 8 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning

Detaljer

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert

Detaljer

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Anvendt medisinsk statistikk, vår Repeterte målinger, del II Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Oppsummering av STK2120. Geir Storvik

Oppsummering av STK2120. Geir Storvik Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle

Detaljer

Generelle lineære modeller i praksis

Generelle lineære modeller i praksis Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige

Detaljer

Klassisk ANOVA/ lineær modell

Klassisk ANOVA/ lineær modell Anvendt medisinsk statistikk, vår 008: - Varianskomponenter - Sammensatt lineær modell med faste og tilfeldige effekter - Evt. faktoriell design Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er

Detaljer

Forelesning 8 STK3100

Forelesning 8 STK3100 $ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

Forelesning 6 STK3100

Forelesning 6 STK3100 Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Beskrive fordelinger (sentraltendens, variasjon og form): Observasjon y i Sentraltendens

Detaljer

Lineære modeller i praksis

Lineære modeller i praksis Lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y én eller flere uavhengige variabler:

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3

Detaljer

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:

Detaljer

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

Forelesning 10 STK3100

Forelesning 10 STK3100 Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning

Detaljer

Prøveeksamen STK2100 (fasit) - vår 2018

Prøveeksamen STK2100 (fasit) - vår 2018 Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag

Detaljer

Kapittel 6 - modell seleksjon og regularisering

Kapittel 6 - modell seleksjon og regularisering Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,

Detaljer

Forelesning 5 STK3100/4100

Forelesning 5 STK3100/4100 Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning

Detaljer

Forelesning 7 STK3100

Forelesning 7 STK3100 ( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2 MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall

Detaljer

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk

Detaljer

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE 1 SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE Eksamensdag: 8 desember 1997 Eksamensstad: Dragvoll, paviljong C, rom 201 Tid til eksamen: 6 timar Vekt: 5 for SOS301 og 4 for SOS31/ SOS311 Talet på sider

Detaljer

ECON240 VÅR / 2016 BOKMÅL

ECON240 VÅR / 2016 BOKMÅL ECON240 VÅR / 2016 BOKMÅL UNIVERSITETET I BERGEN EKSAMEN UNDER SAMFUNNSVITENSKAPELIG GRAD [ DATO og KLOKKESLETT FOR EKSAMEN (START OG SLUTT) ] Tillatte hjelpemidler: Matematisk formelsamling av K. Sydsæter,

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka: MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,

Detaljer

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 5 Nynorsk Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Torsdag

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.

Detaljer

STK2100. Obligatorisk oppgave 1 av 2

STK2100. Obligatorisk oppgave 1 av 2 14. februar 2018 Innleveringsfrist STK2100 Obligatorisk oppgave 1 av 2 Torsdag 1. mars 2018, klokken 14:30 gjennom Devilry (https:devilry.ifi.uio.no). Praktiske instruksjoner Første side av din innlevering

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,

Detaljer

Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer

Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer Institutt for matematiske fag Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer Faglig kontakt under eksamen: Ola H. Diserud Tlf.: 93218823 Eksamensdato: Onsdag 21. mai 2014

Detaljer

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005. SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan

Detaljer

Forelesning 3 STK3100

Forelesning 3 STK3100 Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater

Detaljer

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen gir testobservatoren t mer spredning enn testobservatoren

Detaljer

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

Løsningsforslag: STK2120-v15.

Løsningsforslag: STK2120-v15. Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene

Detaljer

EKSAMENSOPPGAVER STAT100 Vår 2011

EKSAMENSOPPGAVER STAT100 Vår 2011 EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test

Detaljer

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

Kapittel 2: Hendelser

Kapittel 2: Hendelser Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en

Detaljer

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,

Detaljer

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Eksamensoppgåve i TMA4267 Lineære statistiske modellar Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at

Detaljer

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives

Detaljer

Statistikk og havressurser

Statistikk og havressurser Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.

Detaljer

Statistikk og havressurser

Statistikk og havressurser Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK 1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 1. juni 2006. Tid for eksamen: 09.00 12.00. Oppgavesettet er på

Detaljer

Oppgave N(0, 1) under H 0. S t n 3

Oppgave N(0, 1) under H 0. S t n 3 MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk Eksamensdag: Torsdag 2. desember 2010. Tid for eksamen: 09.00 13.00. Oppgavesettet er på

Detaljer

Ekstraoppgaver for STK2120

Ekstraoppgaver for STK2120 Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Løsningsforslag eksamen STAT100 Høst 2010

Løsningsforslag eksamen STAT100 Høst 2010 Løsningsforslag eksamen STAT100 Høst 2010 Oppgave 1 a) To-utvalg, parvise data. La Y være tilfeldig variabel som angir antall drepte i periode 1 og tilsvarende X for periode 2. Vi antar parvise avhengigheter

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: Bio 2150A Biostatistikk og studiedesign Eksamensdag: 6. desember 2013 Tid for eksamen: 14:30-17:30 (3 timer) Oppgavesettet er

Detaljer

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin.

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin. Eksamen STAT100, Høst 2011 (lettere revidert). Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30

Detaljer

Forelesning 9 STK3100

Forelesning 9 STK3100 Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved

Detaljer

DEL 1 GRUNNLEGGENDE STATISTIKK

DEL 1 GRUNNLEGGENDE STATISTIKK INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis

Detaljer

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl MASTER I IDRETTSVITENSKAP 2018/2020 Individuell skriftlig eksamen i STA 400- Statistikk Mandag 18. mars 2019 kl. 10.00-12.00 Eksamensoppgaven består av 5 sider inkludert forsiden Sensurfrist: 8.april 2019

Detaljer

EKSAMENSOPPGAVE STA-1001.

EKSAMENSOPPGAVE STA-1001. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Mandag 28. mai 2018. Klokkeslett: 09-13. Sted: Tillatte hjelpemidler: Administrasjonsbygget B154/AUDMAX. «Tabeller og

Detaljer

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Mandag 9. mai 017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»

Detaljer

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 R-kode for alle oppgaver er gitt bakerst. Oppgave 1 (a) Boksplottet antyder at verdiene er høyere for kvinner enn for menn.

Detaljer