Forelesning 10 STK3100
|
|
- Hege Arntsen
- 7 år siden
- Visninger:
Transkript
1 Momenter i multinomisk fordeling Forelesning 0 STK november 2008 S. O. Samuelsen Plan for forelesning:. Multinomisk fordeling 2. Multinomisk regresjon - ikke-ordnede kategorier 3. Multinomisk regresjon - ordnede kategorier Spesielt er Y j Bin(n,π j ) marginalt. Derfor får vi E[Y j ] = nπ j og Var[Y j ] = nπ j ( π j ) Dessuten er, for k j, Cov[Y j,y k ] = nπ j π k Dette følger ved å se på Y ij = indikator for kjennetegn j i forsøk i. Da blir Cov[Y ij,y ik ] = P(Y ij =,Y ik = ) P(Y ij = )P(Y ik = ) Forelesning 0 STK300 p. /22 = 0 π j π k og n n Cov[Y j,y k ] = Cov[ Y ij, Y ik ] = i= i= n Cov[Y ij,y ik ] = nπ j π k i= Forelesning 0 STK300 p. 3/22 Multinomisk fordeling: n uavhengige forsøk Observerer ett av J ulike kjennetegn i hvert forsøk Sannsynligheten for kjennetegn j er lik π j i hvert forsøk der altså π + π π J = Med Y j = antall forsøk med kjennetegn j sier vi at Y = (Y,Y 2,...,Y J ) er multinomisk fordelt Y Multinom(n,π,π 2,...,π J ) Punktsannsynlighetene for Y gis da ved f(y n) = n! y!y 2!...y J! πy π y π y J J for y j {0,,...,n} og J j= y j = n Forelesning 0 STK300 p. 2/22 Sammenheng med Poissonfordeling Anta at Y j Po(µ j ),j =,,J er uavhengige. Da er (Y,...,Y J J Y j = n) Multinom(n,π,...,π J ) j= der sannsynlighetene π j = µ j / J k= µ k. Dette følger av at J j= Y j Po( J k= µ k). Dermed P(Y = y,...,y J = y J J j= Y j = n) = P(Y =y,...,y J =y J ) = " Q µ y # j J j j= y j! exp( µ j) ( P J j= µ j ) n n! exp( P J j= µ j) n! µ = y µy µyn n y!y 2!...y J! ( P J j= µ j ) n n! = y!y 2!...y J! πy π y π y J J P( P J j= Y j=n) Forelesning 0 STK300 p. 4/22
2 "Multinomisk regresjon" Eks. (Faraway, "Extending the linear model with R"): Undersøkelse om hvem som stemte på Demokrater, Republikanerne eller Uavhengige ved valg i USA i 996 etter utdannelse og inntekt. > table(spid) spid Democrat Independent Republican > table(nes96$educ) MS HSdrop HS Coll CCdeg BAdeg MAdeg > table(nes96$income) $3Kminus $3K-$5K $5K-$7K $7K-$9K $9K-$0K $0K-$K $K-$2K $2K-$3K $3K-$4K $4K-$5K $5K-$7K $7K-$20K $20K-$22K $22K-$25K $25K-$30K $30K-$35K $35K-$40K $40K-$45K $45K-$50K $50K-$60K $60K-$75K $75K-$90K $90K-$05K $05Kplus Forelesning 0 STK300 p. 5/22 Nominell multinomisk logit modell: Med π ji = sannsynlighet for responskategori j for individ med kovariat x i : Merk: J j= π ji = π i = π ji = π ji π i = exp(β jx i ) + P J j=2 exp(β j x i) exp(β j x i) + P J k=2 exp(β k x i) for j > Ulike β j = (β j,...,β jp ) for hvert nivå j = 2, 3,...,J Likelihood: Med responsvektor Y i = (Y,...,Y i J i) n L = i= n i! Y!Y i 2!...Y i i J!πY i i i πy 2 2i...π Y i J Ji Forelesning 0 STK300 p. 7/22 Eks. Faraway, forts. Respons: Partivalg 3 kategorier: Demokrater, Republikanerne eller Uavhengige Multinomiske data Ikke opplagt ordning mellom kategoriene Forklaringsvariable: Utdannelse og inntekt Regresjon Regresjon for multinomiske responser med ikke-ordnede kategorier: Nominell multinomisk logit modell Nominell multinomisk logit modell: R-implementasjon Optimering av likelihooden for nominelle multinomiske data kan gjøres i R med rutinen multinom som finnes i standard-r-biblioteket nnet (kort for "nevralt nett"). > library(nnet) > mmod <- multinom(spid neduc + nincome, nes96) > mmod > multinom(spid neduc+nincome) # weights: 2 (6 variable) initial value iter 0 value final value converged Coefficients: (Intercept) neduc nincome Independent Republican Forelesning 0 STK300 p. 6/22 Residual Deviance: AIC: Forelesning 0 STK300 p. 8/22
3 Eks: Utdannelse spiller ingen rolle gitt inntekt > multinom(spid )$dev # weights: 6 (2 variable) initial value final value converged [] > multinom(spid neduc)$dev [] > multinom(spid nincome)$dev [] > multinom(spid nincome+neduc)$dev [] Dev.endring = 0.79 med bare utdannelse Dev.endring = med bare inntekt Dev.endring = 0.39 med utdannelse i tillegg til inntekt Eks: Må selv lage tabell med estimater, standardfeil, t-verdier og p-verdier: koeftab<-function(nnetmod){ koef<-summary(nnetmod)$coefficients se<-summary(nnetmod)$standard.errors koefb<-c(koef[,],koef[2,]) seb<-c(se[,],se[2,]) tval<-koefb/seb pval<-2*pnorm(-abs(koefb/seb)) tab<-cbind(koefb,seb,tval,pval) tab } > round(koeftab(mod),4) koefb seb tval pval (Intercept) nincome neduc (Intercept) nincome neduc Forelesning 0 STK300 p. 9/22 Forelesning 0 STK300 p. /22 Eks: Standardfeil fra summary.multinom mod<-multinom(spid nincome+neduc) # weights: 2 (6 variable) initial value iter 0 value final value converged > summary(mod,cor=f) Call: multinom(formula = spid nincome + neduc) Coefficients: (Intercept) nincome neduc Independent Republican Std. Errors: (Intercept) nincome neduc Independent Republican Sammenheng vanlig og nominell multinomisk logit Vi har at Y i j Y i + Y i j = m i Bin(m i,π ji /(π i + π ji )) og π ji π i + π ji = exp(β j x i) + P J k=2 exp(β k x i) + P + exp(β j x i) J j=2 exp(β j x i) + P J k=2 exp(β k x i) = exp(β jx i ) + exp(β j x i), dvs. vanlig logistisk regresjons-modell for Y i j Y i + Y i j = m i. exp(β jl ) = OR jl = oddsratio mellom nivå j og for kovariat l Parametrene kan også estimeres ved separate logistiske regresjoner. Residual Deviance: AIC: Forelesning 0 STK300 p. 0/22 Forelesning 0 STK300 p. 2/22
4 Eks: Separate logistiske regresjoner > Rep<-*(sPID=="Republican") > Ind<-*(sPID=="Independent") > summary(glm(ind nincome+neduc,family=binomial,subset=rep!=)) Estimate Std. Error z value Pr(> z ) (Intercept) e-06 *** nincome e-07 *** neduc Null deviance: on 68 degrees of freedom Residual deviance: on 66 degrees of freedom AIC: > summary(glm(rep nincome+neduc,family=binomial,subset=ind!=)) Estimate Std. Error z value Pr(> z ) (Intercept) e-05 *** nincome e-09 *** neduc Null deviance: on 704 degrees of freedom Residual deviance: on 702 degrees of freedom AIC: Forelesning 0 STK300 p. 3/22 Ordnede (ordinale) kategoriske responser Eks: Fødselsvekt ble kategorisert i et eksempel til mindre (større) enn 2800 g. Kan også benytte flere terskelverdier, f.eks g. Eks: Muligens en skala fra Demokrater via Uavhengige til Republikanere Generelt: en underliggende (typisk latent) skala Z og et sett av terskelverdier C < C 2 < < C J slik at individet kategoriseres til nivå dersom Z C Y = nivå j dersom C j < Z C j nivå J dersom C J < Z Y = j Y = J Merk: Y defineres på annen måte enn for nominelle data. Forelesning 0 STK300 p. 5/22 Eks: Sammendrag separate logistiske regresjoner Underliggende skala og terskelverdier Estimater med multinomisk og separate logistisk regresjon er tilsvarende, men ikke identiske Standardfeil er også tilsvarende, men ikke identiske Multinomisk regresjon er en full likelihood analyse Kan være like oversiktlig å gjøre de separate logistisk regresjonene C C 2 C 3 Her vil Z flyttes fram og tilbake langs x-aksen ettersom kovariater varierer. Forelesning 0 STK300 p. 4/22 Forelesning 0 STK300 p. 6/22
5 Modellering av ordinale multinomiske data Siden det er mer struktur i ordnede kategoriske data kan man modellere med færre parametre. Vi antar, at gitt kovariat x i, er den latente variablen Z i = β x i + Z 0i der P(Z 0i z) = F(z) for en passende kumulativ fordelingsfunksjon F(z). Da fås P(Y i j) = P(Z i C j ) = P(Z 0i C j β x i ) = F(C j β x i ) Merk at det bare er en parametervektor β Eks: "Democrats" < "Independent" < "Republican" Proporsjonale oddsmodeller tilasses i R med rutinen polr som finnes i MASS-biblioteket. Spesielt skal responsen - den ordnede faktoren - være spesifisert som en faktor. > library(mass) > summary(polr(as.factor(spid) nincome+neduc)) Coefficients: Value Std. Error t value nincome neduc Dessuten er C j -ene ukjente, dvs. parametre Vi får ulike modeller med ulike valg av (invers) "link"-funksjon F(z) Forelesning 0 STK300 p. 7/22 Intercepts: Value Std. Error t value Democrat Independent Independent Republican Residual Deviance: AIC: Forelesning 0 STK300 p. 9/22 Proporsjonal oddsmodell: Logit-link Anta at F(z) = exp(z)/( + exp(z)). Da blir P(Y i j) = exp(c j β x i )/( + exp(c j β x i )) og med π ji = P(Y i = j) (som ved nominelle responser) og γ ji = P(Y i j) = π i + + π ji fås og dermed blir odds-ratioen γ ji γ ji = exp(c j β x i ) Eks: Sammendrag Estimatene for nincome og neduc har lignende koeffisienter som ved nominell logit modell Estimatene for nincome og neduc har også tilsvarende grad av signifikans Residual Devians var for nominell logit og altså mindre enn proporsjonale odds γ ji uavhengig av nivået C j. γ ji γ ji γ ji = exp(β (x i x i )) Forelesning 0 STK300 p. 8/22 Forelesning 0 STK300 p. 20/22
6 Utvidelser: Probit og Cloglog Spesifikasjonen P(Y i j) = F(C j β x i ) tillater andre (inverse) linkfunksjoner Probit: F(z) = φ(z) = z exp( z 2 /2) 2π dz Clog-log: F(z) = exp( exp(z)) Cauchit: F(z) = z dz = arctan(z) + π(+z 2 ) π 2 Forelesning 0 STK300 p. 2/22 Eks: Probit og Cloglog > summary(polr(as.factor(spid) nincome+neduc,method="probit")) Coefficients: Value Std. Error t value nincome neduc Intercepts: Value Std. Error t value Democrat Independent Independent Republican Residual Deviance: AIC: > summary(polr(as.factor(spid) nincome+neduc,method="cloglog")) Coefficients: Value Std. Error t value nincome neduc Intercepts: Value Std. Error t value Democrat Independent Independent Republican Residual Deviance: AIC: Forelesning 0 STK300 p. 22/22
Forelesning 6 STK3100
Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede
DetaljerForelesning 6 STK3100/4100
Forelesning 6 STK3100/4100 p. 1/4 Forelesning 6 STK3100/4100 4. oktober 2012 Presentasjon av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning
DetaljerForelesning 6 STK3100/4100
Binomiske eller binære responser Forelesning 6 STK3100/4100 26. september 2008 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. GLM Binære data 2. Link-funksjoner 3. Parameterfortolkning logistisk
DetaljerForelesning 7 STK3100/4100
Forelesning 7 STK3100/4100 p. 1/2 Forelesning 7 STK3100/4100 8. november 2012 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Forelesning
DetaljerForelesning 8 STK3100
$ $ $ # Fortolkning av Dermed blir -ene Vi får variasjonen i '& '& $ Dermed har fortolkning som andel av variasjonen forklart av regresjonen Alternativt: pga identiteten Forelesning 8 STK3100 p3/3 Multippel
DetaljerGeneraliserte Lineære Modeller
Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =
DetaljerGeneraliserte Lineære Modeller
Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir
DetaljerForelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
DetaljerEKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:
DetaljerForelesning 7 STK3100
Parameterfortolkning logistisk regresjon Forelesning 7 STK3100 6. oktober 2008 S. O. Samuelsen Plan for forelesning: 1. Parameterfortolkning logistisk regresjon 2. Parameterfortolkning andre linkfunksjoner
DetaljerPrøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
DetaljerForelesning 7 STK3100/4100
Gamma regresjon Forelesning 7 STK3100/4100 26. september 2008 Geir Storvik Plan for forelesning: 1. Kontinuerlige positive responser 2. Gamma regresjon 3. Invers Gaussisk regresjon Modell: Har y Gamma(µ,ν),
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller
Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert
DetaljerForelesning 5 STK3100/4100
Forelesning 5 STK3100/4100 p. 1/4 Forelesning 5 STK3100/4100 27. september 2012 Presentasjon laget av S. O. Samuelsen (modifisert av Geir H12) Plan for forelesning: 1. Poissonfordeling 2. Overspredning
DetaljerForelesning 9 STK3100
Poissonfordelingen: Forelesning 9 STK3100 20. oktober 2007 S. O. Samuelsen Plan for forelesning: 1. Poissonregresjon 2. Overspredning 3. Quasi-likelihood 4. Andre GLM-er Poissonfordelingen kan oppstå ved
DetaljerEksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
DetaljerForelesning 7 STK3100
( % - -! " stimering: MK = ML Forelesning 7 STK3100 1 oktober 2007 S O Samuelsen Plan for forelesning: 1 Generelt om lineære modeller 2 Variansanalyse - Kategoriske kovariater 3 Koding av kategoriske kovariater
DetaljerTilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
DetaljerForelesning 11 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 3. oktober 20 Geir Storvik. Generaliserte lineære blandede modeller Eksempler R-kode - generell formulering av modell Tillater innbygging av avhengigheter mellom
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet
DetaljerForelesning 3 STK3100
Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag
DetaljerEksponensielle klasser
Eksponensielle klasser, de Jong & Heller, Kap. 3 Eksponensielle klasser STK3100-1. september 2008 Sven Ove Samuelsen En stokastisk variabel Y sies å ha fordeling i den eksponensielle fordelingsklasse dersom
DetaljerEksamensoppgåve i TMA4267 Lineære statistiske modellar
Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av?? Bokmål Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag
DetaljerRegresjonsmodeller. HEL 8020 Analyse av registerdata i forskning. Tom Wilsgaard
Regresjonsmodeller HEL 8020 Analyse av registerdata i forskning Tom Wilsgaard Intro Mye forskning innen medisin og helsefag dreier seg om å studere assosiasjonen mellom en eller flere eksponeringsvariabler
DetaljerForelesning 11 STK3100/4100
Forelesning 11 STK3100/4100 Plan for forelesning: 1. november 2012 Geir Storvik 1. Generaliserte lineære blandede modeller Eksempler R-kode GLMM - generell formulering av modell Likelihood og estimering
DetaljerLogistisk regresjon 1
Logistisk regresjon Hovedideen: Binær logistisk regresjon håndterer avhengige, dikotome variable Et hovedmål er å predikere sannsynligheter for å ha verdien på avhengig variabel for bestemte (sosiale)
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 22. mai 2014 Eksamenstid (fra til): 09.00-13.00
DetaljerEKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerEKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR
Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 5 Nynorsk Kontakt under eksamen: Thiago G. Martins 46 93 74 29 EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR Torsdag
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
DetaljerEKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerLøsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007
Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Oppgave 1: Pengespill a) For hver deltaker har vi følgende situasjon: Deltakeren får en serie oppgaver. Hver runde har to mulige utfall: Deltakeren
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerVariansanalyse og lineær regresjon notat til STK2120
Variansanalyse og lineær regresjon notat til STK2120 Ørulf Borgan februar 2013 Formålet med dette notatet er å beskrive sammenhengen mellom variansanalyse med faste effekter og multippel lineær regresjon
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerKp. 12 Multippel regresjon
Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction
Detaljer7. november 2011 Geir Storvik
Forelesning 13 STK3100/4100 Plan for forelesning: 7. november 2011 Geir Storvik Generaliserte lineære blandede modeller 1. Sammenlikning ulike estimeringsmetoder 2. Tolkning parametre 3. Inferens Konfidensintervaller
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerEkstraoppgaver for STK2120
Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerForelesning 6 STK3100
Forelesning STK3 september 7 S O Samuelsen Plan for forelesning: Mer om evians GLM resiualer 3 Test for H : Offset Observert forventet informasjon Optimeringsrutiner Iterative revektee minste kvarater
DetaljerIntroduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R
Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6
Detaljerj=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.
FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da
DetaljerMOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.
DetaljerForelesning 9 STK3100/4100
Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2. Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerEKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerLogistisk regresjon 2
Logistisk regresjon 2 SPSS Utskrift: Trivariat regresjon a KJONN UTDAAR Constant Variables in the Equation B S.E. Wald df Sig. Exp(B) -,536,3 84,56,000,25,84,08 09,956,000,202 -,469,083 35,7,000,230 a.
DetaljerSTK 2000 høsten 2006 Oblig I
STK 2000 høsten 2006 Oblig I Dette er oppgavesettet for første obligatoriske innleveringsprosjekt for kurset STK 2000. Det legges ut torsdag 5/x/6, og en bunke blir også tatt med til forelesningene. Leveringsfrist
DetaljerEksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september 2011. Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator
Side 1 av 11 sider EKSAMENSOPPGAVE I STA-1002 Eksamen i : STA-1002 Statistikk og sannsynlighet 2 Eksamensdato : 26. september 2011. Tid : 09-13. Sted : Administrasjonsbygget. Tillatte hjelpemidler : -
DetaljerForelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerEKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Fredag 26. mai 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerGenerelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
DetaljerForelesning STK september 2011
Forelesning STK3100 12. setember 2011 Geir Storvik (S. O. Samuelsen) Plan for forelesning: 1. Mer om evians 2. Devians og Gooness-of-fit tester 3. GLM og resiualer En Mettet (saturate) moell er en moell
DetaljerPrøveeksamen STK vår 2017
Prøveeksamen STK2100 - vår 2017 Geir Storvik Vår 2017 Oppgave 1 Anta en lineær regresjonsmodell p Y i = β 0 + β j x ij + ε i, j=1 ε i uif N(0, σ 2 ) Vi kan skrive denne modellen på vektor/matrise-form:
DetaljerOppsummering av STK2120. Geir Storvik
Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle
DetaljerEKSAMENSOPPGAVE STA-2004.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Torsdag 28. september 2017. Klokkeslett: 09 13. Sted: Tillatte hjelpemidler: Teorifagsbygget. «Tabeller og formler i
DetaljerAnvendt medisinsk statistikk, vår Repeterte målinger, del II
Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 301 Statistiske metoder og anvendelser. Eksamensdag: Torsdag, 2. juni, 1994. Tid for eksamen: 09.00 14.00. Oppgavesettet er
DetaljerUNIVERSITETET I OSLO ØKONOMISK INSTITUTT
Eksamen: ECON2130 Statistikk 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 29.05.2019 Sensur kunngjøres: 19.06.2019 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 5 sider Tillatte hjelpemidler:
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerEksponensielle klasser og GLM
!! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 11. november 2017) 1. Sannsynlighet La A, B, A 1, A 2,..., B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerForelesning 27. mars, 2017
Forelesning 27. mars, 2017 AVSNITT 5.5 Ordningsobservatorene AVSNITT 6.1 Observatorer og deres fordelinger Ordningsobservatorene La X 1,..., X n være n uavhengige stokastiske variable som alle har samme
Detaljervekt. vol bruk
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004. Dato: Mandag 24. september 2018. Klokkeslett: 09-13. Sted: Administrasjonsbygget K1.04 Tillatte hjelpemidler: «Tabeller og
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
DetaljerEKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Onsdag 8. august
DetaljerAnalysis of ordinal data via heteroscedastic threshold models
Analysis of ordinal data via heteroscedastic threshold models JL Foulley/Applibugs 1 Example Koch s 1990 data on a clinical trial for respiratory illness Treatment (A) vs Placebo (P) 111 patients (54 in
DetaljerForelesning 17 Logistisk regresjonsanalyse
Forelesning 17 Logistisk regresjonsanalyse Logistiske regresjons er den mest brukte regresjonsanalysen når den avhengige variabelen er todelt Metoden kan brukes til å: teste hypoteser om variablers effekt
Detaljer1 + γ 2 X i + V i (2)
Seminaroppgave 8 8.1 I en studie av sammenhengen mellom gjennomsnittlig inntekt og utgifter til offentlig skoledrift for ulike amerikanske stater i 1979 estimeres modellen; Y i = β 0 + β 1 X i + β 2 Xi
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: Bio 2150A Biostatistikk og studiedesign Eksamensdag: 6. desember 2013 Tid for eksamen: 14:30-17:30 (3 timer) Oppgavesettet er
DetaljerSOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU
SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår 2003 Erling Berge Institutt for sosiologi og statsvitenskap NTNU Vår 2004 Erling Berge 2004 1 Forelesing VII Logistisk regresjon
DetaljerBioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag Oppgave 1 a) Verdien av uttrykkene blir som følger: >
DetaljerST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon
ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-
DetaljerLøsningsforslag øving 9, ST1301
Løsningsforslag øving 9, ST1301 Oppgave 1 Regresjon. Estimering av arvbarhet. a) Legg inn din egen høyde, din mors høyde, din fars høyde, og ditt kjønn via linken på fagets hjemmeside 1. Last så ned dataene
DetaljerBokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:
Bokmål Institutt: IKBM Eksamen i: Stat100 Statistikk Tid: 18. mai 2010 09.00-12.30 Emneansvarlig: Trygve Almøy: 64 96 58 20 Tillatte hjelpemidler: C3: alle typer kalkulatorer, alle andre hjelpemiddel Oppgaveteksten
DetaljerMASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl
MASTER I IDRETTSVITENSKAP 2018/2020 Individuell skriftlig eksamen i STA 400- Statistikk Mandag 18. mars 2019 kl. 10.00-12.00 Eksamensoppgaven består av 5 sider inkludert forsiden Sensurfrist: 8.april 2019
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerNotater i ST2304 H. T. L. 1 Fordelingsfunksjonene i R α-kvantilen... 3
Notater i ST2304 H. T. L Innhold 1 Fordelingsfunksjonene i R 2 1.1 α-kvantilen....................................... 3 2 Fisher test for ubalanserte modeller 4 2.1 Test mellom alternative modeller...........................
Detaljer