Lineær regresjon: introduksjon

Like dokumenter
Lineær regresjon. Respons y Outcome Endepunkt Avhengig variabel Output-variabel Endogen variabel

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Forelesning 13 Regresjonsanalyse

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

Regresjonsmodeller. HEL 8020 Analyse av registerdata i forskning. Tom Wilsgaard

Kort overblikk over kurset sålangt

10.1 Enkel lineær regresjon Multippel regresjon

UNIVERSITETET I OSLO

Multippel lineær regresjon

Fra krysstabell til regresjon

Prøveeksamen i STK3100/4100 høsten 2011.

2.2 Korrelasjon. Våre øyne ikke gode til å bedømme hvor sterk en sammenheng er Trenger kvantitativt mål på sammenheng Korrelasjon et slikt mål

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Statistikk er begripelig

Forelesning 17 Logistisk regresjonsanalyse

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Logistisk regresjon 1

Inferens i regresjon

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Eksamen ST2303 Medisinsk statistikk Onsdag 3 juni 2009 kl

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamensoppgave i ST3001

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Logistisk regresjon 2

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2016

Lavkarbo-effekterog - bivirkninger

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Trening i svangerskapet

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

EXAMINATION PAPER. Exam in: STA-3300 Applied statistics 2 Date: Wednesday, November 25th 2015 Time: Kl 09:00 13:00 Place: Teorifagb.

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Høye skårer indikerer høye nivåer av selvkontroll.

Lese og presentere statistikk i medisinske forskningsartikler

Skoleeksamen i SOS Kvantitativ metode

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Forelesning 10 STK3100

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Løsningsforslag eksamen 25. november 2003

regresjonsmodeller multippel logistisk regresjon logistisk regresjon prediksjon vs assosiasjon den logistisk funksjonen (2)

Korrelasjon og lineær regresjon, litt om resultatpresentasjon

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMEN I: DOF 610 STATISTISKE METODER I MEDISINSK FORSKNING 2

Generelle lineære modeller i praksis

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Forskningsprosjektet. Repeterte målinger på én time. Eksempel 1. Eksempel 2. Eksempel

Sammenhenger. I dette kapitlet er emnet måter å studere sammenheng mellom to variable. Som tidligere er grunnleggende spørsmål:

Introduksjon til Generaliserte Lineære Modeller (GLM)

Psykososiale faktorer og livsstil som risikofaktorer for kronisk generalisert smerte: En HUNT studie

Epidemiologi - en oppfriskning. Epidemiologi. Viktige begreper Deskriptiv beskrivende. Analytisk årsaksforklarende. Ikke skarpt skille

UTSATT SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. Mars 2017 (4 timer)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

UNIVERSITETET I OSLO

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

STK1000 Uke 37, Studentene forventes å lese Ch i læreboka (MMC). Beskrive enkle (bivariate) sammenhenger mellom variabler

Epidemiologi - en oppfriskning. En kort framstilling. Er det behov for kunnskaper om epidemiologi?

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Sammenhenger. I dette kapitlet er emnet måter å studere sammenheng mellom to variable. Som tidligere er grunnleggende spørsmål:

Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

UNIVERSITETET I OSLO

PSY Kvantitativ metode

Forelesning 10 Kjikvadrattesten

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Bakgrunn. KLMED 8006 Anvendt medisinsk statistikk - Vår 2008 Repeterte målinger. Overvekt: løp for livet

Hvordan gjøre studentene fornøyd med studieprogram og læringsutbytte?

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

STK juni 2016

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SPSS Statistics-kurs 2014

Surgical Outcome of Drug-Resistant Epilepsy in Prasat Neurological Institute

Tabell 1: Antallet besøkende pasienter og gjennomsnittlig ventetid i minutter (fiktive data).

Kp. 12 Multippel regresjon

UNIVERSITETET I OSLO

Transkript:

Lineær regresjon: introduksjon Funksjon y f (x) Mengden mat (i gram) man lager til middag = Lineær funksjon (oppskrift) Scatter-plott 1 (oppskrift) y x 1 Page 1 of 15

Lineær funksjon (reell situasjon) Scatter-plott 2 (reell situasjon) y 1 x Page 2 of 15

Flere x-variabler Mengden mat (i gram) man lager til middag = Funksjon av mange variabler: Antall personer, gjestenes alder, hvilket måltid det er, hvor høyt aktivitetsnivå gjestene har etc Lineær funksjon y 1x1 2x2 3x3 4x4 5x5 Eksempel: Bruktbilpris = Page 3 of 15

Fleksibiliteten til en lineær funksjon Lineære funksjoner y 1 x y 1x1 B2x2 B3x3 B4x4 B5x5 Fortsatt lineær Fortsatt lineær Ikke-lineær funksjon Page 4 of 15

Regresjonsanalyse: Analyse av smh mellom to eller flere variabler; der den ene er definert som respons og en eller flere andre er definert som forklaringsvariabler. Respons y Outcome Endepunkt Avhengig variabel Output-variabel Endogen variabel SPSS: Dependent variable Forklaringsvariabel x Prediktor Kovariat Uavhengig variabel Eksogen variabel SPSS: Independent variable Residualer Page 5 of 15

Page 6 of 15

Ulike typer data* krever ulike regresjonsmodeller Responsvariabel* Kategorisk (syk/frisk) Kontinuerlig Sensurerte data (levetider) Regresjonsanalyse Logistisk regresjon Lineær regresjon Cox-regresjon Effektmål OR Stigningstallet B (SPSS-notasjon), som angir hvor mange enheters økning som forventes i responsen per enhets økning i forklaringsvariabelen. RR * OBS: Forklaringsvariablene kan være hvilken som helst type variabler: Binære, kategoriske (ordinale eller nominale) og kontinuerlige. Det er imidlertid enklest når de er binære eller kontinuerlige. Page 7 of 15

Effektmål: Tallfesting av det vi ønsker å studere: Kjenn din(e) måleskala(er)! Fvekt i gram 2 1 Alder 28 32 34 svangerskapsuke 36 38 Regresjonskoeffisienten β 1 angir hvor mange enheter fødselsvekten eller -scoren forventes å endre seg når forklaringsvariabelen endres med en enhet (I populasjonen). Vi estimerer β 1 med ˆ 1, basert på det vi ser i utvalget. Page 8 of 15

Gjennomsnittlig enheters reduksjon i ved å øke alderen fra til år. Fvekt i gram 2 1 Alder 28 32 34 svangerskapsuke 36 38 Mellom svangerskapsuke 28 og 38 øker barnets fødselsvekt med gjennomsnittlig gram i uka. Page 9 of 15

Tolkning av effektmål. Alder Kont. f.var Eks: alder Med regresjonslinje: 1 2 3 aldgr 4 Ordinal f.var Eks: års aldersgrupper Med regresjonslinje: 5 1 2 3 aldgr 4 5 Alder ˆ = -.3 95% KI for β [-.5, -.1] p-verdi =.2 1 2 3 aldgr 4 ˆ = -3.3 95% KI for β [-5,4, -1,1] p-verdi =.3 5 Page of 15

Grunnsko Realskol Artium Utdanningsnivå Høyskole Ordinal f.var Eks: utdanning Multitra Inkomple Ny skade/diagnose Komplett Nominal f.var Eks: skadetype Kvinne Kjønn Mann Binær f.var Eks: Kjønn Med regresjonslinje: 1 Kjønn 2 Nødvendig å lage dummy-variabler. 1 Kjønn 2 ˆ = -7. 95%KI for β [-13.6, -.4] p-verdi =.4 Page 11 of 15

Bivariat, univariat, multippel eller multivariat? Bivariate analyser er analyse av smh mellom to variabler (Ch2, Ch 7, Ch 8) Regresjonsanalyser med én responsvariabel og én forklaringsvariabel kalles ofte univariate analyser, eller «enkle» regresjonsanalyser (Ch ) Bivariate og univariate (enkle) analyser gir identiske/svært like resultater (pverdier) selv om effektmålene er forskjellige: Pearson korrelasjon gir identiske p-verdier som lineær-regresjon med én kontinuerlig forklaringsvariabel; Pearsons χ 2 gir identiske p-verdier som logistisk regresjon med én binær forklaringsvariabel. Page 12 of 15

Resultatene fra univariat regresjonsanalyse kalles ujusterte (crude, unadjusted): Ujusterte estimat, ujusterte KI, ujusterte p-verdier. Regresjonsanalyse med én respons-variabel og flere forklaringsvariabler kalles ofte multippel eller multivariabel analyse. (Ch 11) Resultatene fra multippel regresjonsanalyse kalles justerte/korrigerte (adjusted/corrected): Justerte estimat, justerte KI og justerte p-verdier. (Multivariat analyse brukes om større analysemodeller der man ser på flere (respons)variabler simultant (ofte repeterte målinger) og evt også en eller flere forklaringsvariabler. Ikke aktuelt her.) Page 13 of 15

Eksempel fra Pubmed: Epidemiology. 4 Sep;15(5):557-64. The relation between birth weight and intima-media thickness in middle-aged adults. Tilling K, Smith GD, Chambless L, Rose K, Stevens J, Lawlor D, Szklo M. Department of Social Medicine, University of Bristol, Canynge Hall, Whiteladies Road, Bristol, UK. kate.tilling@bristol.ac.uk BACKGROUND: Birth weight has been found to be inversely associated with the risk of coronary heart disease and stroke, although the mechanisms for this association remain unclear. Here, we investigate the relation between reported birth weight and atherosclerosis in middle age. METHODS: We included the 9817 participants (age 44-65) in the Atherosclerosis Risk in Communities (ARIC) study who were neither a twin nor born prematurely. Carotid atherosclerosis was assessed as intima-media thickness measured by B-mode ultrasound. We studied the association with recalled exact birth weight, and for those unable to recall exact birth weight, with recalled birth weight category. RESULTS: Mean intima-media thickness (+/- standard deviation) was.73 +/-.17 mm. Mean birth weight for the 4635 participants recalling exact birth weight was 3.49 +/-.71 kg. A further 4946 participants recalled birth weight category, with 47 (96%) reporting "medium" birth weight. In univariate analysis, birth weight and intima-media thickness were positively related. However, adjustment for confounding factors reduced the association to only a.4 mm higher intima-media thickness (95% CI = -.3 to.11) mm per 1 kg of birth weight. The same pattern of univariate positive relationship and attenuation with adjustment was seen for birth weight category and intima-media thickness. There was no evidence of interaction between adult body mass index (BMI) and birth weight, or of interaction between category of adult BMI and birth weight category. An inverse relation between birth weight category and intima-media thickness was seen only for those in the lowest category of adult BMI (BMI <25 kg/m). CONCLUSIONS: We found no evidence of a clinically significant relation between birth weight and carotid atherosclerosis. Page 14 of 15

H : «Linja skjærer y-aksen i» tilsvarer β = H : «Ingen effekt av x på y» tilsvarer «Ingen sammenheng mellom x og y» tilsvarer β 1 = Mao: Dersom KI for β 1 ikke inneholder, er det en signifikant effekt av x på y. Page 15 of 15