Forelesning 7 STK3100/4100
|
|
- Hildur Carlson
- 6 år siden
- Visninger:
Transkript
1 Gamma regresjon Forelesning 7 STK3100/ september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν), g(µ) = x T β ( ) ν f(y) = y 1 yν e yν/µ,y 0 Γ(ν) µ f(y) = yν 1 ν ν Γ(ν) e yν/µ ν log(µ) = y1/φ 1 φ 1/φ Γ(1/φ) θ = 1/µ, φ = 1/ν, a(θ) = log( θ) e φ 1 [yθ a(θ)] E[y] =a (θ) = 1 θ = µ, Kanonisk link: 1/µ Var[y] =φa (θ) = φ 1 θ 2 = µ2 ν Forelesning 7 STK3100/4100 p. 1/26 Forelesning 7 STK3100/4100 p. 3/26 Kontinuerlige positive responser Eksempler Forsikring: Krav størrelser/tid mellom krav og overenskomst Medisin: Størkningstid av blod Biologi: Tid i ulike utviklingsstadier i bananfluer Meterologi: Mengde regn Modeller: GLM med Gammafordeling på respons Invers Gaussisk fordeling på respons Eksempel: Størkningstid av blod u lot1 lot u: Konsentrasjon med prothrombin-fri plasma lot To typer thromboplastin y Respons, tid Forelesning 7 STK3100/4100 p. 2/26 Forelesning 7 STK3100/4100 p. 4/26
2 Første modell clot = read.table("clot.txt",header=t) clot$lot = as.factor(clot$lot) fit1 = glm(time u+lot,data=clot,family=gamma(link=log)) summary(fit) (Intercept) e-13 *** u *** lot * Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for Gamma family taken to be ) Null deviance: on 17 degrees of freedom Residual deviance: on 15 degrees of freedom AIC: Sammenlikning av modell, Wald test Lineære Gaussiske modeller, σ kjent Z = ˆβ j SEˆβj N(0, 1),Z 2 χ 2 Lineære Gaussiske modeller, σ estimert T = ˆβ j SEˆβj t n p 1,T 2 F 1,n p 1 Gamma regresjon: Dispersjonsparameter estimert, mer naturlig med t/f fordeling. lot2:log(u) *(1-pt( ,14)) [1] Interaksjonsledd klart ikke-signifikant Forelesning 7 STK3100/4100 p. 5/26 Forelesning 7 STK3100/4100 p. 7/26 Utvidet modell med interaksjon fit2 = glm(time lot+log(u)+lot:log(u),data=clot,family=gamma(link=log)) summary(fit2) (Intercept) e-14 *** lot * log(u) e-08 *** lot2:log(u) Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for Gamma family taken to be ) Null deviance: on 17 degrees of freedom Residual deviance: on 14 degrees of freedom AIC: Devians Y i Gamma(µ i, ν), uavhengige µ i = exp{x T i β} nx n h i o l(µ, ν,y) = ν y i ln(µ µ i ) ln(γ(ν)) + ν ln(νy i ) ln(y i ) i nx l(y, ν,y) = {ν [ 1 ln(y i )] ln(γ(ν)) + ν ln(νy i ) ln(y i )} 2[l(ˆµ, ν,y) l(y, ν,y)] = 2 nx nx = 2 h i ν 1 ln(y i ) + y 1 ˆµi + ln(ˆµ i ) i h ν ln( y i ) y 1 ˆµ i ˆµ i ˆµ i = Devians som definert i boka R: Devians = 2 P h n ln( y i ) y 1 ˆµ i i! ˆµ i ˆµ i Forelesning 7 STK3100/4100 p. 6/26 Forelesning 7 STK3100/4100 p. 8/26
3 Devians i R deviance(fit1) [1] phi1 = summary(fit1)$dispersiongoodness-of-fit med devianstest: nu1 = 1/phi1 D = -2*nu1*sum(log(clot$time/fit1$fit)-(clot$time-fit1$fit)/fit1$fit) [1] deviance(fit1)*nu1 [1] AIC AIC(fit1,fit2) df AIC fit fit Forelesning 7 STK3100/4100 p. 9/26 Forelesning 7 STK3100/4100 p. 11/26 Sammenlikning modeller med devians Direkte ved anova: anova(fit1,fit2,test="f") Analysis of Deviance Table Model 1: time lot + log(u) Model 2: time lot + log(u) + lot:log(u) Resid. Df Resid. Dev Df Deviance F Pr(F) Manuelt: 1-pf((deviance(fit1)-deviance(fit2))/summary(fit2)$disp,1,14) [1] Devians i anovatabell tar ikke med φ. P-verdi tar med φ. Merk: En bruker dispersjonsparameter for den største modellen. Alternative link-funksjoner Mest vanlig: log-link: log(µ) = η Plot av log(y i ) mot x i bør være nært lineær Identitetslink: µ = η Plot av y i mot x i bør være nært lineær Invers link: µ = 1/η (kanonisk link) Plot av 1/y i mot x i bør være nært lineær De to siste: µ kan være negativ Forelesning 7 STK3100/4100 p. 10/26 Forelesning 7 STK3100/4100 p. 12/26
4 Kryss-plott størkning av blod Eksempel: Krav for personlig skade y=total: Total skadekrav, kont. variabel x1 =op_time: Tid fra krav til overenkomst, kont. variabel time log(time) Modell x2 =legrep: legal represenation, binær variabel η = β0 + β1 x1 + β2 x2 + β3 x1 x2 1.5 u u /time u Forelesning 7 STK3100/4100 p. 13/26 EDA for Gamma regresjon 1e+05 claims$total claims$op_time Forelesning 7 STK3100/4100 p. 14/26 1e+03 1e+01 0e+00 Invers link ser ut til å passe best! plot(claims$op_time,claims$total,col=as.numeric(claims$legrep),log="") plot(claims$op_time,claims$total,col=as.numeric(claims$legrep),log="y") 4e+06 fit1 = glm(time lot+log(u),data=clot,family=gamma(link=log)) fit1.2 = glm(time lot+log(u),data=clot,family=gamma(link=identity)) fit1.3 = glm(time lot+log(u),data=clot,family=gamma(link=inverse)) AIC(fit1,fit1.2,fit1.3) df AIC fit fit fit e+06 claims$total Sammenlikning ulike link-funksjoner Forelesning 7 STK3100/4100 p. 15/ claims$op_time Forelesning 7 STK3100/4100 p. 16/26
5 R kode claims = read.xls("../data/persinj.xls") claims$legrep = as.factor(claims$legrep) fit = glm(total op_time+legrep+op_time:legrep,data=claims, family=gamma(link="log")) summary(fit) (Intercept) < 2e-16 *** op_time < 2e-16 *** legrep < 2e-16 *** op_time:legrep e-10 *** Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for Gamma family taken to be ) Null deviance: on degrees of freedom Residual deviance: on degrees of freedom AIC: Utvidet modell - R kode form = total op_time+legrep+x3+op_time:legrep+op_time:x3+ + legrep:x3+op_time:legrep:x3 fit2 = glm(form,data=claims,family=gamma(link="log")) summary(fit2) (Intercept) < 2e-16 *** op_time < 2e-16 *** legrep e-10 *** x3true < 2e-16 *** op_time:legrep ** op_time:x3true e-07 *** legrep1:x3true e-12 *** op_time:legrep1:x3true *** (Dispersion parameter for Gamma family taken to be ) Null deviance: on degrees of freedom Residual deviance: on degrees of freedom AIC: Forelesning 7 STK3100/4100 p. 17/26 Forelesning 7 STK3100/4100 p. 19/26 Utvidet modell Avvik mellom data for små operasjonstider Innfør ny variabel x3=i(op_time<4.6) (5% kvantil) claims$x3 = (claims$op_time<quantile(claims$op_time,0.05)) Ny modell η = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 1 x 2 + β 5 x 1 x 3 + β 6 x 2 x 3 + β 7 x 1 x 2 x 3 Sammenlikning modeller anova(fit,fit2,test="f") Analysis of Deviance Table Model 1: total op_time + legrep + op_time:legrep Model 2: total op_time + legrep + x3 + op_time:legrep + op_time:x3 + legrep:x3 + op_time:legrep:x3 Resid. Df Resid. Dev Df Deviance F Pr(F) < 2.2e-16 *** Signif. codes: 0 *** ** 0.01 * Forelesning 7 STK3100/4100 p. 18/26 Forelesning 7 STK3100/4100 p. 20/26
6 Sammenlikning modeller anova(fit2,test="f") Analysis of Deviance Table Model: Gamma, link: log Response: total Terms added sequentially (first to last) Df Deviance Resid. Df Resid. Dev F Pr(F) NULL op_time < 2.2e-16 *** legrep < 2.2e-16 *** x e-14 *** op_time:legrep e-10 *** op_time:x e-05 *** legrep:x e-16 *** op_time:legrep:x ** Signif. codes: 0 *** ** 0.01 * Kontraster Ved kategoriske variable α 1,...,α K For mange parametre, må lage begrensning/kontrast Vanlig: Behandlingskontrast: α 1 = 0. Default i R options()$contrasts unordered "contr.treatment" I R kan referansenivå velges Alternativ: Sum-kontrast: k α k = 0 ordered "contr.poly" options(contrasts=c("contr.sum","contr.sum")) options()$contrasts options()$contrasts [1] "contr.sum" "contr.sum" Forelesning 7 STK3100/4100 p. 21/26 Forelesning 7 STK3100/4100 p. 23/26 Residual/goodness-of-fit devians 1-pchisq(deviance(fit2)/summary(fit2)$disp,summary(fit2)$df.resid) [1] 1 Invers Gaussisk regresjon Modell: y IG(µ,ν), g(µ) = x T β { 1 f(y) = 2πy3 σ exp 1 ( ) } 2 y µ,y 0 2y µσ { } 1 0.5yµ 2 = 2πy3 σ exp + µ 1 y 1,y 0 σ 2 θ = 0.5µ 2, φ = σ 2, a(θ) = 2θ E[y] =a (θ) = 1 2θ = µ, Kanonisk link: 0.5µ 2 Var[y] =φa (θ) = σ 2 ( 2θ) 3/2 = σ2 µ 3 Forelesning 7 STK3100/4100 p. 22/26 Forelesning 7 STK3100/4100 p. 24/26
7 Forsikringskrav for kjøretøy Ett års forsikring for kjøretøy, 4624 hadde minst et krav. Respons: claimcst0 Krav størrelse Forklaringsvariable: agecat Alderskategorier (1-6, 1 yngst) gender Kjønn (F/M) area Bopelsregion veh_value Verdi på kjøretøy veh_age Alder på kjøretøy veh_body Type kjøretøy (13 kategorier) exposure 0-1 Forelesning 7 STK3100/4100 p. 25/26 R kode Script car.r Forelesning 7 STK3100/4100 p. 26/26
Forelesning 7 STK3100/4100
Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning
DetaljerGeneraliserte Lineære Modeller
Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir
DetaljerForelesning 5 STK3100/4100
Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning
DetaljerForelesning 11 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:
DetaljerForelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
DetaljerGeneraliserte Lineære Modeller
Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =
DetaljerForelesning 6 STK3100
Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede
DetaljerForelesning STK september 2011
Forelesning STK3100 12. setember 2011 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer En Mettet (saturate) moell er en moell
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet
DetaljerEksponensielle klasser
Eksponensielle klasser, de Jong & Heller, Kap. 3 Eksponensielle klasser STK3100-1. september 2008 Sven Ove Samuelsen En stokastisk variabel Y sies å ha fordeling i den eksponensielle fordelingsklasse dersom
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:
DetaljerForelesning 6 STK3100/4100
Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning
DetaljerForelesning 7 STK3100
( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater
DetaljerForelesning 11 STK3100/4100
Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller
Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert
DetaljerForelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
DetaljerForelesning 10 STK3100
Momenter i multinomisk fordeling Forelesning 0 STK300 3. november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon
DetaljerForelesning 6 STK3100/4100
Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk
Detaljer7. november 2011 Geir Storvik
Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
DetaljerEKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerForelesning 3 STK3100
Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater
DetaljerEKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerForelesning 9 STK3100/4100
Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser
DetaljerForelesning 8 STK3100
$ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel
DetaljerForelesning 9 STK3100
Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved
DetaljerEKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og
DetaljerIntroduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R
Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6
DetaljerTilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
DetaljerPrøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag
DetaljerEksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR
Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 5 Nynorsk Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Torsdag
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Mandag 24. september 2018. Klokkeslett: 09-13. Sted: Administrasjonsbygget K1.04 Tillatte hjelpemidler: «Tabeller og
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 4. juni 2016 Eksamenstid (fra til): 09.00
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på
DetaljerLøsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015
Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 R-kode for alle oppgaver er gitt bakerst. Oppgave 1 (a) Boksplottet antyder at verdiene er høyere for kvinner enn for menn.
DetaljerVariansanalyse og lineær regresjon notat til STK2120
Variansanalyse og lineær regresjon notat til STK2120 Ørulf Borgan februar 2013 Formålet med dette notatet er å beskrive sammenhengen mellom variansanalyse med faste effekter og multippel lineær regresjon
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 22. mai 2014 Eksamenstid (fra til): 09.00-13.00
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
Detaljervekt. vol bruk
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerEKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Fredag 26. mai 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerGenerelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Torsdag 31. mai 2018. Klokkeslett: 09-13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerAnvendt medisinsk statistikk, vår Repeterte målinger, del II
Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald
DetaljerTMA4240 Statistikk Høst 2007
TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,
DetaljerForelesning 7 STK3100
Parameterfortolkning logistisk regresjon Forelesning 7 STK3100 6. oktober 2008 S. O. Samuelsen Plan for forelesning: 1. Parameterfortolkning logistisk regresjon 2. Parameterfortolkning andre linkfunksjoner
DetaljerMOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerKapittel 6 - modell seleksjon og regularisering
Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,
DetaljerForelesning 6 STK3100
Forelesning STK3 september 7 S O Samuelsen Plan for forelesning: Mer om evians GLM resiualer 3 Test for H : Offset Observert forventet informasjon Optimeringsrutiner Iterative revektee minste kvarater
DetaljerEksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator
Side 1 av 11 sider EKSAMENSOPPGAVE I STA-1002 Eksamen i : STA-1002 Statistikk og sannsynlighet 2 Eksamensdato : 3. juni 2011. Tid : 09-13. Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerTransformasjoner av stokastiske variabler
Transformasjoner av stokastiske variabler Notasjon merkelapper på fordelingene Sannsynlighetstettheten og den kumulative fordelingen til en stokastisk variabel X betegnes hhv. f X og F X. Indeksen er altså
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.
DetaljerOppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
DetaljerEksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september 2011. Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator
Side 1 av 11 sider EKSAMENSOPPGAVE I STA-1002 Eksamen i : STA-1002 Statistikk og sannsynlighet 2 Eksamensdato : 26. september 2011. Tid : 09-13. Sted : Administrasjonsbygget. Tillatte hjelpemidler : -
DetaljerLøsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y
Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall
DetaljerLøsningsforslag eksamen 25. november 2003
MOT310 Statistiske metoder 1 Løsningsforslag eksamen 25. november 2003 Oppgave 1 a) Vi har µ D = µ X µ Y. Sangere bruker generelt trapesius-muskelen mindre etter biofeedback dersom forventet bruk av trapesius
DetaljerNotater i ST2304 H. T. L. 1 Fordelingsfunksjonene i R α-kvantilen... 3
Notater i ST2304 H. T. L Innhold 1 Fordelingsfunksjonene i R 2 1.1 α-kvantilen....................................... 3 2 Fisher test for ubalanserte modeller 4 2.1 Test mellom alternative modeller...........................
DetaljerEkstraoppgaver STK3100 h10
Ekstraoppgaver STK3100 h10 Oppgave 1 En-veis variansanalyse modellen kan formuleres som Y ij = µ + α i + ɛ ij (1) der α i = 0 og ɛ ij er i.i.d N(0, σ 2 ). Her representerer er Y ij j te observasjon fra
DetaljerEKSAMENSOPPGAVE STA-2004.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Torsdag 28. september 2017. Klokkeslett: 09 13. Sted: Tillatte hjelpemidler: Teorifagsbygget. «Tabeller og formler i
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerForelesning 5 STK3100
Devians Forelesning 5 STK3100 22. setember 2008 S. O. Samuelsen Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer 4. Observert og forventet informasjon 5. Otimeringsrutiner
DetaljerLøsningsforslag eksamen 27. februar 2004
MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: Bio 2150A Biostatistikk og studiedesign Eksamensdag: 6. desember 2013 Tid for eksamen: 14:30-17:30 (3 timer) Oppgavesettet er
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerTMA4240 Statistikk Høst 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte
DetaljerKp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt
Bjørn H. Auestad Kp. 11: Regresjonsanalyse 1 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties
DetaljerPrøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
DetaljerLøsningsforslag STK1110-h11: Andre obligatoriske oppgave.
Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30
DetaljerInferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
DetaljerEKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
DetaljerBioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag Oppgave 1 a) Verdien av uttrykkene blir som følger: >
DetaljerOppgave 1. Kilde SS df M S F Legering Feil Total
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig
DetaljerOppgaver i STK3100/4100.
Oppgaver i STK3100/4100. Datasettene som brukes i oppgavene er tilgjengelig fra kursets hjemmeside Exercise 1 Les igjennom kapittel 4 i boka. Dette stoffet vil videre i kurset antas å være kjent. Exercise
DetaljerEksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer
Institutt for matematiske fag Eksamensoppgave i ST2304 Statistisk modellering for biologer og bioteknologer Faglig kontakt under eksamen: Ola H. Diserud Tlf.: 93218823 Eksamensdato: Onsdag 21. mai 2014
DetaljerLøsningsforslag: STK2120-v15.
Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene
DetaljerPrøveeksamen STK vår 2017
Prøveeksamen STK2100 - vår 2017 Geir Storvik Vår 2017 Oppgave 1 Anta en lineær regresjonsmodell p Y i = β 0 + β j x ij + ε i, j=1 ε i uif N(0, σ 2 ) Vi kan skrive denne modellen på vektor/matrise-form:
DetaljerKp. 12 Multippel regresjon
Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction
DetaljerI enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x
Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren
DetaljerFasit og løsningsforslag STK 1110
Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),
DetaljerEksamensoppgåve i TMA4267 Lineære statistiske modellar
Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå
DetaljerLøsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007
Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Oppgave 1: Pengespill a) For hver deltaker har vi følgende situasjon: Deltakeren får en serie oppgaver. Hver runde har to mulige utfall: Deltakeren
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
Detaljer