Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller

Størrelse: px
Begynne med side:

Download "Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller"

Transkript

1 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/ august 2011 Geir Storvik (Oppdatert av tidligere presentasjon laget av Sven Ove Samuelsen)

2 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 2/34 Plan for dagen 1. Introduksjon, Litteratur, Program 2. Eksempler 3. Uformell definisjon av GLM 4. Blandede modeller 5. Plan for kurset

3 Aktivt forskningsfelt, mye fremdeles uferdig Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 3/34 Introduksjon Generaliserte lineære modeller Utvidelse av multippel regresjon / anova. Sentral klasse av modeller Skal vi se på hvordan binære data, telledata og kategoriske (multinomiske) data kan analyseres innen rammen av regresjon. Innkluderer logistisk regresjon, Poisson regresjon Blandede modeller/modeller med tilfeldige effekter Kan kombineres med lineære/generaliserte lineære modeller Kraftig modellverktøy

4 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 4/34 Målsetning Grundig innføring i generaliserte lineære modeller lære å benytte disse modellene til konkrete analyser kjenne den matematiske bakgrunnen for analysene. Kjennskap til blandede modeller lære å benytte disse modellene til konkrete analyser i enkle situasjoner kjenne til tilnærminger og utfordringer ved analyse av slike modeller Emnet skal altså ha både et praktisk og et teoretisk perspektiv. Eksempler fra mange fagfelt: medisin / biologi, samfunnvitenskap / økonomi, forsikring

5 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 5/34 Litteratur Hovedlærebok Generalized Linear Models for Insurance Data av Piet de Jong og Gillian Z. Heller. boka kan kjøpes i Akademika. hjemmeside: Inneholder de fleste data settene som benyttes. Tilleggslærebok Mixed Effects Models and Extensions in Ecology with R av Alain Zuur og andre. ebook, kan lastes ned fra webben. kun utvalgte kapitler Støtteliteratur på GLM

6 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 6/34 Statistikk-program Vi skal bruke programpakken R som kjører under de vanlige operativsystemer og som kan lastes ned gratis fra I hovedsak skal vi benytte rutiner som er implementert i R. Det vil ikke bli behov for å programmere mye på egenhånd. Hjemmeside for R:

7 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 7/34 Dataeksempel 1: Fødselsvekt og svangerskapslengde Gutter Jenter Varighet(uker) Fødselsvekt (gram) Varighet (uker) Fødselsvekt (gram) Gj.sn En er interessert i å studere veksthastigheten pr. uke i slutten av svangerskapet, og om denne er forskjelig for de to kjønn.

8 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 8/34 Spredningsplott for Eks 1. fłdselsvekt (g) o + Gutter Jenter svangerskapslengde (uker)

9 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 9/34 Typisk modell for Eks 1: Lineær regresjon For k = 1,..., 12 og j = 1, 2 (der j = 1 angir gutt og j = 2 jente) Y jk = x jk = fødselsvekt for baby nr. k kjønn nr. j svangerskapsvarighet for baby nr. k kjønn nr. j antas Y jk = α j + βx jk + ε jk der ε jk N(0,σ 2 ), dvs. normalfordelte med forventning 0 og samme varians σ 2 og dessuten uavhengige. Regresjonsparametre: β = α j = stigningskoeffisient konstantledd for kjønn j

10 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 10/34 Minste kvadraters tilpasning for Eks 1. fłdselsvekt (g) Gutter Jenter svangerskapslengde (uker) Estimater: ˆα 1 = 1610, ˆα 2 = 1773, ˆβ = 121

11 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 11/34 Modellspesifikasjonen for Eks 1 kan alternativt skrives: Linearitet: E[Y jk ] = µ jk = α j + βx jk Konstant varians: Var[Y jk ] = σ 2 Normalitetsantagelse: Y jk N(µ jk,σ 2 ) Uavhengige responser: Y jk -ene uavhengige I STK3100/4100 ser vi på utvidelser av lineære regresjonsmodeller til Linearitet etter transformasjon via "link-funksjon" g(): g(µ jk ) = α j + βx jk Variansen avhenger av forventningen til responsene Andre fordelinger: Binomiske, Poisson, Gamma,... Innkludering av flere tilfeldige effekter (blandede

12 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 12/34 Dataeksempel 2: Dødelig giftdose for biller Ca. 60 biller ble utsatt for hver av 8 ulike konsentrasjoner av CS 2, og antallet som døde ved hver av konsentrasjonene ble registrert. Dose (log 10 CS 2 mg l 1 ) Antall biller Antall døde Ønsker å studere sammenhengen mellom dose og dødelighet.

13 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 13/34 Eks. 2: Andel døde biller andel dode biller dose (log_10)

14 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 14/34 I Eks. 2: Dødelighet for biller er det rimelig å anta at Y i = antall døde biller med dose x i er binomisk fordelt Y i bin(n i,π i ) der π i = sannsynligheten for at en bille dør med dose x i og n i = antall biller som får dose x i En lineær modell for π i tilpasset med vanlig minste kvadrater er problematisk fordi 0 π i 1 i motsetning til lineært utrykk α + βx i Var(Y i ) = n i π i (1 π i ), ikke-konstant (heteroskedastisk) variansstruktur

15 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 15/34 Vanlig løsning for Eks. 2: Logistisk regresjon Logistisk regresjonsmodell: Da blir 0 π i 1 π i = exp(α + βx i) 1 + exp(α + βx i ) Tilpasser så den logistiske regresjonsmodellen med Maximum Likelihood (ML). Tar hensyn til binomiske responser (og ikke-konstant varians) Effisiente estimater (tilnærmet med "mye" data)

16 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 16/34 Logistisk regresjon for Eks. 2: Andel døde biller MLE: ˆα = 60.72, ˆβ = Predikerte sannsynligheter: ˆπ = exp(ˆα+ˆβx) 1+exp(ˆα+ˆβx) andel dode biller dose (log_10)

17 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 17/34 Estimering logistisk regresjon Storvik: "Numerical optimization of likelihoods: Additional literature for STK2120" gir en Newton-Rahpson rutine i R for å tilpasse logistisk regresjon til disse dataene. Heldigvis er dette allerede implementert R. Bruk kommando glm(cbind(dode,ant-dode) Dose,family=binomial) glm = Generalisert Lineær Modell family=binomial angir at vi har binære eller binomiske data Ved binomiske data angir cbind(dode,ant-dode) antall suksesser og antall ikke-suksesser

18 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 18/34 Dataeksempel 3: Antall barn blant gravide de Jong & Heller: Data over antall tidligere barn blant 141 gravide kvinner i ulike aldre. Ikke uventet synes antall barn å øke med alder. antall barn gjennomsnittlig antall barn alder alder

19 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 19/34 Dataeksempel 3b: Antall bilskader de Jong & Heller: Data over antall rapporte bilskader på poliser (siste år). Forklaringsvariable: Bilens verdi Bilens alder Type bil Førerens kjønn Førerens alder I begge eksempler: Antall, dvs. tellevariable, kanskje Poissonfordeling.

20 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 20/34 I eks. 3: Y i = Antall barn tidligere for mor nr. i kan det være rimelig å anta at Y i er Poissonfordelt med forventning µ i der µ i avhenger av x i = mors alder. Tilsvarende Eks 2: Forventningene µ i > 0 Variansen til Y i er lik µ i, dvs. ikke-konstant varians Vanlig løsning: Poisson-regresjon Y i Po(µ i ) der µ i = exp(α + βx i ) Dette er også en generalisert lineær modell og kan tilpasses ved glm-rutinen. Må bare spesifisere at data er antatt Poissonfordelte ved family=poisson

21 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 21/34 Poisson-regresjon for eks. 3 MLE for (α,β) ble (ˆα, ˆβ) = ( , ) Får dermed tilpassede forventninger ˆµ i = exp(ˆα + ˆβx i ) forventet antall barn o Observert i 5 årsgrupper Tilpasset med glm

22 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 22/34 Definisjon av GLM Uavhengige responser: Y 1,Y 2,...,Y n Vektorer av forklaringsvariable x 1,x 2,...,x n der x i = (x i1,x i2,...,x ip ) er p-dimensjonale. En GLM = Generalisert Lineær Modell er definert ved Y 1,Y 2,...,Y n kommer fra samme eksponensiell klasse (Eksponensielle klasser defineres senere, nok å vite at normalfordelinger, binomiske, Poisson-, gammafordelinger etc. utgjør eksp. klasser) Lineære komponenter (prediktorer) η i = β 0 + β 1 x i1 + + β p x ip Linkfunksjon g(): Med µ i = E[Y i ] kobles forventningen til lineær komponent ved at g(µ i ) = η i

23 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 23/34 Lineær regresjon er en GLM Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) = µ i er identitetsfunksjonen Spesielt gjør R-kommandoene lm for lineær regresjon og glm essensielt det samme bare med litt forskjellig utskrift. Lineær regresjon er spesielt default-spesifikasjonen av for glm

24 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 24/34 Eks. 1: Fødselsvekter > lm(vekt sex+svlengde) Call: lm(formula = vekt sex + svlengde) Coefficients: (Intercept) sex svlengde > glm(vekt sex+svlengde) Call: glm(formula = vekt sex + svlengde) Coefficients: (Intercept) sex svlengde Degrees of Freedom: 23 Total (i.e. Null); Null Deviance: Residual Deviance: AIC: Residual

25 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 25/34 Logistisk regresjon er en GLM Responser (Y i -er) fra binomiske fordelinger bin(n i,π i ) Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ]/n i = π i = exp(η i) 1+exp(η i ). Dermed fås linkfunksjon g(π i ) = log( π i 1 π i ) Kaller g(π) = log( π ) = logit(π) for logit-funksjonen. 1 π > glm(cbind(dode,ant-dode) Dose,family=binomial) Call: glm(formula = cbind(dode, Ant - Dode) Dose, family = binomial) Coefficients: (Intercept) Dose Degrees of Freedom: 7 Total (i.e. Null); 6 Residual Null Deviance: Residual Deviance: AIC: 41.43

26 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 26/34 Poisson-regresjon er en GLM Responser Y i Po(µ i ) Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = exp(η i ), dvs. linkfunksjonen g(µ i ) = log(µ i ) er (den naturlige) logaritmefunksjonen > glm(children age,family=poisson) Call: glm(formula = children age, family = poisson) Coefficients: (Intercept) age Degrees of Freedom: 140 Total (i.e. Null); Null Deviance: Residual Deviance: 165 AIC: Residual

27 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 27/34 Eksempel 4 Vekt av 30 rotter målt ukentlig i 5 uker Weight days

28 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 28/34 Vanlig lineær modell Respons Y i,j er vekt av rotte i for uke j. Individuelle forskjeller i nivå. Mulig modell: Y i,j = α i + β x j + ε i,j, ε i,j N(0,σ 2 ) der x j er antall dager. Kan estimere α 1,...,α 30,β,σ 2 ved vanlig lineær regresjon.

29 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 29/34 Eksempel 4 (forts) 30 rotter utvalg av populasjon. Av interesse hele populasjonen. Alternativ modell Y i,j = α + a i + β x j + ε i,j, ε i,j N(0,σ 2 ) der nå a i N(0,σa). 2 Eksempel på blandet modell

30 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 30/34 Eksempel 4: Tilpasning i R lme(y x,random= 1 id,data=d) Linear mixed-effects model fit by REML Data: d AIC BIC loglik Random effects: Formula: 1 id (Intercept) Residual StdDev: Fixed effects: y x Value Std.Error DF t-value p-value (Intercept) x Correlation: (Intr) x -0.49

31 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 31/34 Noen utvidelser Andre GLM-er: Telledata med negativ binomisk fordeling: Overspredning Kontinuerlige, ikke-normale responser: Gammafordeling, Invers gaussisk fordeling Utvidelser av GLM: Multinomiske responser (STK3100) Blandede modeller (STK3100,STK4070) Analyse av avhengige data (STK3100,STK4060/STK4150) Levetidsdata (STK4080) Generaliserte additive modeller (STK4030)

32 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 32/34 Oversikt boka til de Jong & Heller Kap. 1: Introduksjon, Dataeksempler, Gjennomgåes ikke detaljert Kap. 2: Diverse fordelinger (med noen unntak kjent fra før) Kap. 3: Eksponensielle klasser, ML-estimering Kap. 4: Lineær modellering (stort sett kjent fra STK1110/STK2120) Kap. 5: Generaliserte lineære modeller Kap. 6: Telledata (Poissonregresjon, overspredning) Kap. 7: Katergoriske responser (binomiske data, multinomiske data) Kap. 8: Kontinuerlige responser

33 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 33/34 Oversikt boka til Zuur og andre Kap 5: Lineæare blandede modeller Kap 8: Eksponensielle klasser (støtte til de Jong & Heller) Kap 13: GLM og blandede modeller Kap 23 (sek 4-7) Bayesianske tilnærminger (hvis tid)

34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 34/34 Plan for kurset de Jong & Heller Følger stort sett kapittellindelingen Ikke slavisk, enkelte deler må fylles ut a Zuur og andre først og fremst se på modeller og eksempler. Forelesningsplan vil bli oppdatert på kurset hjemmeside etterhvert.

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell

Detaljer

Introduksjon til Generaliserte Lineære Modeller (GLM)

Introduksjon til Generaliserte Lineære Modeller (GLM) Intrduksjn til Generaliserte Lineære Mdeller (GLM) p. 1/33 Intrduksjn til Generaliserte Lineære Mdeller (GLM) STK3100-20. august 2013 Sven Ove Samuelsen fr det meste Plan fr første frelesning: 1. Intrduksjn,

Detaljer

Forelesning 8 STK3100/4100

Forelesning 8 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -

Detaljer

Prøveeksamen i STK3100/4100 høsten 2011.

Prøveeksamen i STK3100/4100 høsten 2011. Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir

Detaljer

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =

Detaljer

Eksponensielle klasser

Eksponensielle klasser Eksponensielle klasser, de Jong & Heller, Kap. 3 Eksponensielle klasser STK3100-1. september 2008 Sven Ove Samuelsen En stokastisk variabel Y sies å ha fordeling i den eksponensielle fordelingsklasse dersom

Detaljer

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag

Detaljer

Eksponensielle klasser og GLM

Eksponensielle klasser og GLM !! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3

Detaljer

Forelesning 6 STK3100

Forelesning 6 STK3100 Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede

Detaljer

Forelesning 11 STK3100/4100

Forelesning 11 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning

Detaljer

Forelesning 8 STK3100

Forelesning 8 STK3100 $ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel

Detaljer

Forelesning 11 STK3100/4100

Forelesning 11 STK3100/4100 Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering

Detaljer

Forelesning 6 STK3100/4100

Forelesning 6 STK3100/4100 Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med

Detaljer

Forelesning 7 STK3100/4100

Forelesning 7 STK3100/4100 Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet

Detaljer

Forelesning 3 STK3100

Forelesning 3 STK3100 Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater

Detaljer

Forelesning 9 STK3100/4100

Forelesning 9 STK3100/4100 Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Forelesning 10 STK3100

Forelesning 10 STK3100 Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Forelesning 5 STK3100/4100

Forelesning 5 STK3100/4100 Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning

Detaljer

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

7. november 2011 Geir Storvik

7. november 2011 Geir Storvik Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:

Detaljer

Forelesning STK september 2011

Forelesning STK september 2011 Forelesning STK3100 12. setember 2011 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer En Mettet (saturate) moell er en moell

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6

Detaljer

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag

Detaljer

Forelesning 7 STK3100

Forelesning 7 STK3100 ( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater

Detaljer

Forelesning 7 STK3100

Forelesning 7 STK3100 Parameterfortolkning logistisk regresjon Forelesning 7 STK3100 6. oktober 2008 S. O. Samuelsen Plan for forelesning: 1. Parameterfortolkning logistisk regresjon 2. Parameterfortolkning andre linkfunksjoner

Detaljer

Forelesning 9 STK3100

Forelesning 9 STK3100 Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 5 Nynorsk Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Torsdag

Detaljer

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 12 Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant

Detaljer

Oppsummering av STK2120. Geir Storvik

Oppsummering av STK2120. Geir Storvik Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Statistikk og havressurser

Statistikk og havressurser Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.

Detaljer

Forelesning 6 STK3100

Forelesning 6 STK3100 Forelesning STK3 september 7 S O Samuelsen Plan for forelesning: Mer om evians GLM resiualer 3 Test for H : Offset Observert forventet informasjon Optimeringsrutiner Iterative revektee minste kvarater

Detaljer

Statistikk og havressurser

Statistikk og havressurser Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.

Detaljer

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Anvendt medisinsk statistikk, vår Repeterte målinger, del II Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2 TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2 MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA440 Statistikk Høst 009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Løsningsskisse Oppgave a) n 8, i x i 675, x 37.5, i y i 488, i x i 375, i x iy i

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 22. mai 2014 Eksamenstid (fra til): 09.00-13.00

Detaljer

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar Kapittel 6, Kontinuerlege Sannsynsfordelingar Sjå på eit utval av ofte brukte kontinuerlege sannsynsfordelingar Uniform I går Normal I går Eksponensial I dag Gamma I dag Kji-kvadrat I dag Nokre eigenskapar

Detaljer

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren

Detaljer

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og

Detaljer

Variansanalyse og lineær regresjon notat til STK2120

Variansanalyse og lineær regresjon notat til STK2120 Variansanalyse og lineær regresjon notat til STK2120 Ørulf Borgan februar 2013 Formålet med dette notatet er å beskrive sammenhengen mellom variansanalyse med faste effekter og multippel lineær regresjon

Detaljer

vekt. vol bruk

vekt. vol bruk UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47) MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9 TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30

Detaljer

Fasit og løsningsforslag STK 1110

Fasit og løsningsforslag STK 1110 Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),

Detaljer

Kapittel 6 - modell seleksjon og regularisering

Kapittel 6 - modell seleksjon og regularisering Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,

Detaljer

Ridge regresjon og lasso notat til STK2120

Ridge regresjon og lasso notat til STK2120 Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle

Detaljer

Ekstraoppgaver for STK2120

Ekstraoppgaver for STK2120 Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0

Detaljer

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.

Detaljer

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar Kapittel 6, Kontinuerlege Sannsynsfordelingar Sjå på eit utval av ofte brukte kontinuerlege sannsynsfordelingar Uniform I går Normal I går Eksponensial I dag Gamma I dag Kji-kvadrat I dag Nokre eigenskapar

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK 1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 1. juni 2006. Tid for eksamen: 09.00 12.00. Oppgavesettet er på

Detaljer

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne

Detaljer

Inferens i regresjon

Inferens i regresjon Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons

Detaljer

La U og V være uavhengige standard normalfordelte variable og definer

La U og V være uavhengige standard normalfordelte variable og definer Binormalfordelingen Definisjon Noe av hensikten med å innføre begrepet betinget sannsynlighet er at kompliserte modeller ofte kan bygges ut fra enkle betingede modeller. Når man spesifiserer betingelser

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 301 Statistiske metoder og anvendelser. Eksamensdag: Torsdag, 2. juni, 1994. Tid for eksamen: 09.00 14.00. Oppgavesettet er

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25.

Detaljer

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Mandag 24. september 2018. Klokkeslett: 09-13. Sted: Administrasjonsbygget K1.04 Tillatte hjelpemidler: «Tabeller og

Detaljer

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Multippel regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Det er fortsatt en responsvariabel y. Måten dette gjøre på er nokså

Detaljer

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka: MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3

Detaljer