Forelesning 13 Regresjonsanalyse



Like dokumenter
Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Fra krysstabell til regresjon

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Eksamensoppgave i ST3001

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Høye skårer indikerer høye nivåer av selvkontroll.

Frequencies. Frequencies

Forelesning 17 Logistisk regresjonsanalyse

Frequencies. Frequencies

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

Forelesning 10 Kjikvadrattesten

Univariate tabeller. Bivariat tabellanalyse. Forelesning 8 Tabellanalyse. Formålet med bivariat analyse:

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Til bruk i metodeundervisningen ved Høyskolen i Oslo

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Institutt for økonomi og administrasjon

HØGSKOLEN I STAVANGER

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Forelesning 18 SOS1002

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SOS3003 Eksamensoppgåver

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Logistisk regresjon 2

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 02. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Forelesning 14 REGRESJONSANALYSE II. Regresjonsanalyse. Slik settes modellen opp i SPSS

Kort innføring i SPSS

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

2. Forklar med egne ord de viktigste forutsetningene for regresjonen og diskuter om forutsetningene er oppfylt i oppgave 1.

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Klassisk ANOVA/ lineær modell

Forelesning 10 Statistiske mål for bivariat tabellanalyse. Korrelasjonsmål etter målenivå. Cramers V

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Multippel lineær regresjon

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

UNIVERSITETET I OSLO

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Lineære modeller i praksis

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Gjør kort rede for seks av de åtte begrepene. Bruk inntil ½ side på hvert begrep.

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

Eksamen PSYC3101 Kvantitativ metode II Vår 2015

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

UTSATT SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. Mars 2017 (4 timer)

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

Analyse med uavhengige variabler på nominal- /ordinalnivå

SOS 31 MULTIVARIAT ANALYSE

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

PSY Kvantitativ metode

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Univariate tabeller. Statistisk uavhengighet og statistisk avhengighet. Bivariat tabellanalyse. Hvordan bør vi prosentuere denne tabellen?

Logistisk regresjon 1

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

SKOLEEKSAMEN 2. november 2007 (4 timer)

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

Forelesning 9 Statistiske mål for bivariat tabellanalyse

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i ST3001

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

10.1 Enkel lineær regresjon Multippel regresjon

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

EKSAMENSOPPGAVE FOR SOS3003: ANVENDT STATISTISK DATAANALYSE

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

EKSAMEN I SOS4020 KVANTITATIV METODE 20. mars (4 timer)

UNIVERSITETET I OSLO

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

MA Universitetet i Agder Institutt for matematiske fag EKSAMEN. Emnekode: MA-202 Emnenavn: Statistikk 2

Transkript:

Forelesning 3 Regresjonsanalyse To typer bivariat analyse: Bivariat tabellanalyse: Har enhetenes verdi på den uavhengige variabelen en tendens til å gå sammen med bestemte verdier på den avhengige variabelen? Kjønn χ EUsyn Bivariat regresjonsanalyse: Er den eventuelle sammenhengen mellom slengde og timelønn lineær? Utdanning β Hvor mye vil vi anta at lønnstakere i populasjonen tjener i timer ut fra denne tabellen? Lønnstaker: 8 3 5 8 Y = 3, s = 37, Det beste anslaget på timelønn i populasjonen blir gjennomsnitverdien på 3 kroner Er det enklere å anslå timelønna i populasjonen hvis vi vet slengden? Lønnstaker: Utdanning 8 3 5 8 8 Datamatrise med og timelønn for seks lønnstakere 3

Sammenhengen mellom i timelønn vist grafisk 8 ved års i Kroner 8 år kroner Lønnsøkning ved et år ekstra 8 Regresjonsanalyse med SPSS UTD Utdanning a Unstandardi a. Dependent Variable: LONN 8......... Generell regresjonsformel: Y = a + bx = 8 + X Prediksjonene for timelønn ut fra utover obligatorisk skole blir da: Ingen : Y = 8 + * = 8 Et år : Y = 8 + * = 9 To år : Y = 8 + * = Ti år Y = 8 + * = 8 5 Mer realistisk datamatrise med og timelønn Lønnstaker: Utdanning 8 3 3 3 5 8 Y = 5, s = 5,

Grafisk fremstilling av sammenhengen mellom og timelønn 5 5 i Kroner 5 8 Hvor skal vi sette inn regresjonslinjen her? 7 a. Dependent Variable: LONN Vi lar SPSS finne regresjonslinjen a Unstandardi 8.8 7.83.93.8.3.8.97.3.3 Regresjonslikningen blir: Y = 8,9 +,X Ingen : Y = 8,9 +,* = 8,9 Et år : Y = 8,9 +,* = 9,3 To år : Y = 8,9 +,* = 8,57 Ti år Y = 8,9 +,* = 5,9 8 Grafisk fremstilling av sammenhengen mellom og timelønn ved års 5 Y = 8,9 +,X + i Kroner 5 5 +, kroner år Lønnsøkning ved et år ekstra 8 Men dette stemmer da ikke helt! Likningen for populasjonen blir: mens likninga for utvalget blir: i Yˆ = 8,9 +, X9 Y = 8,9 +, X + e i i 3

Er det like greit om vi bare bruker gjennomsnitlønna på kr.5,? 5 5 b =? RSS ESS TSS ESS R = TSS i Kroner a. 5 Dependent Variable: LONN b =,? 8 a Unstandardi B Std. Error Beta t Sig. 8.8 7.83.93.8 Nei har signifikant effekt.3.8.97.3.3 Her ser vi nærmere på resten av statistikken som kommer ut av SPSS Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 3.9 3.9 8.5.3 a 8.57 557.3 55. 5 a. Predictors:, b. Dependent Variable: LONN ESS /( K ) 3,9 ESS 3,9 R = = =,8 F = = = 8,5 TSS 55, TSS /( n K) 557,3 Summary Adjusted Std. Error of R R Square R Square the Estimate.97 a.8.778 3. a. Predictors:, over obligatorisk skole Konklusjon: Det er bare,3% sannsynlighet for at de uavhengige variablene i modellen ikke har betydning for lønn i populasjonen Tabellen med koeffisientene er likevel den viktigste a. Dependent Variable: LONN a Unstandardi 8.8 7.83.93.8.3.8.97.3.3 b,3 t = = =,3 SE b,8 Det er bare,3% sannsynlighet for at en ikke har betydning for lønn i populasjonen Hvorfor blir pverdien den samme for variabelen og for hele regresjonsmodellen?

> Hva skjer hvis vi legger inn enda en uavhengig variabel i modellen? Lønnstaker Lønnstaker 3 5 Utdanning Utdanning 8 Y ˆ = b + b X + b X 8 8 3 3 3 Kjønn Menn Eller kanskje den blir lettere å forstå hvis vi skriver den slik: Predikert timelønn = b + b utd+ b menn Men kjønn er da ikke kontinuerlig. Hvordan kan vi da sette opp et lineært forholdet mellom kjønn og timelønn? Løsning: Vi koder om variabelen kjønn til dummyvariabelen menn 3 SPSS gir dette resultatet a Unstandardi 5..7.9.8 5..58. 9.87. MENN Menn=,..8.37 3.73.3 kvinner= a. Dependent Variable: LONN Etter kontroll for kjønnsforskjeller øker timelønna med kr.5 for hvert år med utover grunnskole Menn tjener kr. mer i timer enn kvinner selv om vi kontrollerer for sforskjellen mellom menn og kvinner Både og kjønn har statistisk signifikant betydning på 5% nivå for timelønn Likningen blir da: LØNN = 5 + 5UTD + MENN Hvordan ser dette ut grafisk? 5 Y = b + b X + b X = 5 + 5X + X 5 Menn (menn=) b =, i Kroner b =5, 5 b =5, Kvinner (menn=) 8 5 5

Klarer vi nå å tolke resultatene fra disse regresjonsmodellene? Ulike regresjonsmodeller som predikerer timelønn 989, n=3759. l B Std. Beta t Sig. Konstant 7,,5 8.7, ED 5,,8,3 9.7, R,8 Konstant 5,,55 35.7, ED 5,3,7, 3., AGE 5,55,35,3 5.8, R,35 3 Konstant,,533.8, ED,87,3, 9.97, AGE 5,,33,.3, FEMALE 7,,83,9.3, R,37 B: regresjonskoeffisienten, Std.: regresjonskoeffisientens standardfeil, t: Studen t, Sig.: signifikanssannsynligheten til t.