Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Like dokumenter
Forelesning 13 Regresjonsanalyse

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Fra krysstabell til regresjon

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Forelesning 17 Logistisk regresjonsanalyse

Eksamensoppgave i ST3001

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Forelesning 10 Kjikvadrattesten

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Frequencies. Frequencies

Frequencies. Frequencies

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

SOS3003 Eksamensoppgåver

2. Forklar med egne ord de viktigste forutsetningene for regresjonen og diskuter om forutsetningene er oppfylt i oppgave 1.

Forelesning 18 SOS1002

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

Til bruk i metodeundervisningen ved Høyskolen i Oslo

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Forelesning 14 REGRESJONSANALYSE II. Regresjonsanalyse. Slik settes modellen opp i SPSS

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

Institutt for økonomi og administrasjon

Forelesning 10 Statistiske mål for bivariat tabellanalyse. Korrelasjonsmål etter målenivå. Cramers V

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Univariate tabeller. Bivariat tabellanalyse. Forelesning 8 Tabellanalyse. Formålet med bivariat analyse:

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Høye skårer indikerer høye nivåer av selvkontroll.

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

EKSAMEN I SOSIOLOGI SOS KVANTITATIV METODE. ORDINÆR SKOLEEKSAMEN 4. april 2011 (4 timer)

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

10.1 Enkel lineær regresjon Multippel regresjon

UNIVERSITETET I OSLO

Kort overblikk over kurset sålangt

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Eksamen PSYC3101 Kvantitativ metode II Vår 2015

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 02. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

SKOLEEKSAMEN 2. november 2007 (4 timer)

UTSATT SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. Mars 2017 (4 timer)

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

Gjør kort rede for seks av de åtte begrepene. Bruk inntil ½ side på hvert begrep.

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

PSY Kvantitativ metode

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Univariate tabeller. Statistisk uavhengighet og statistisk avhengighet. Bivariat tabellanalyse. Hvordan bør vi prosentuere denne tabellen?

Lineær regresjon: introduksjon

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

STV1020 våren 2018 oppgave 31. Se nederst i dokumentet for nynorsk versjon.

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

Logistisk regresjon 1

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Generelle lineære modeller i praksis

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

SOS3003 Eksamensoppgåver

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

SKOLEEKSAMEN 29. september 2006 (4 timer)

EKSAMEN I SOS4020 KVANTITATIV METODE 20. mars (4 timer)

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

EKSAMENSOPPGAVE FOR SOS3003: ANVENDT STATISTISK DATAANALYSE

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Transkript:

Forelesning 4 Regresjonsanalyse To typer bivariat analyse: Bivariat tabellanalyse: Har enhetenes verdi på den uavhengige variabelen en tendens til å gå sammen med bestemte verdier på den avhengige variabelen? Kjønn χ 2 EUsyn Bivariat regresjonsanalyse: Er den eventuelle sammenhengen mellom slengde og timelønn lineær? Utdanning β Hvor mye vil vi anta at lønnstakere tjener i timer ut fra denne tabellen? Lønnstaker: 8 2 3 2 4 4 5 6 6 8 Y = 3, s = 37,4 Det beste anslaget på timelønn blir gjennomsnitverdien på 3 kroner Er det enklere å anslå timelønna hvis vi vet slengden? Lønnstaker: Utdanning 8 2 2 3 4 2 4 6 4 5 8 6 6 8 Datamatrise med og timelønn for seks lønnstakere

Sammenhengen mellom i timelønn vist grafisk 2 8 6 4 ved års 2 i Kroner 8 6 4 2 år kroner Lønnsøkning ved et år ekstra 2 4 6 8 Regresjonsanalyse med SPSS UTD Utdanning Unstandardi a. Dependent Variable: LONN 8......... Generell regresjonsformel: Y = a + bx = 8 + X Prediksjonene for timelønn ut fra utover obligatorisk skole blir da: Ingen : Y = 8 + * = 8 Et år : Y = 8 + * = 9 To år : Y = 8 + *2 = Ti år Y = 8 + * = 8 Mer realistisk datamatrise med og timelønn Lønnstaker: Utdanning 8 2 2 3 3 4 2 4 6 3 5 8 2 6 2 Y = 45, s = 5, 2

Grafisk fremstilling av sammenhengen mellom og timelønn 25 2 5 i Kroner 5 2 4 6 8 Hvor skal vi sette inn regresjonslinjen her? a. Dependent Variable: LONN Vi lar SPSS finne regresjonslinjen Unstandardi 84.286 7.83 4.934.8 2.43 2.82.97 4.34.3 Regresjonslikningen blir: Y = 84,29 + 2,4X Ingen : Y = 84,29 + 2,4* = 84,29 Et år : Y = 84,29 + 2,4* = 96,43 To år : Y = 84,29 + 2,4*2 = 8,57 Ti år Y = 84,29 + 2,4* = 25,69 Grafisk fremstilling av sammenhengen mellom og timelønn ved års 25 2 Y = 84,29 + 2,4X + i Kroner 5 5 + 2,4 kroner år Lønnsøkning ved et år ekstra 2 4 6 8 Men dette stemmer da ikke helt! Regresjonslikningen blir derfor: mens riktig svar for den enkelte blir: i Yˆ = 84,29 + 2, 4 X Y = 84,29 + 2, 4 X + e i i 3

Er det like greit om vi bare bruker gjennomsnitlønna på kr.45,? 25 2 5 b =? RSS ESS TSS 2 ESS R = TSS i Kroner a. 5 Dependent Variable: LONN b =2,4? 2 4 6 8 Unstandardi B Std. Error Beta t Sig. 84.286 7.83 4.934.8 2.43 2.82.97 4.34.3 Nei har signifikant effekt Her ser vi nærmere på resten av statistikken som kommer ut av SPSS Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 32.429 32.429 8.526.3 a 2228.57 4 557.43 255. 5 a. Predictors:, b. Dependent Variable: LONN ESS /( K ) 32,429 2 ESS 32,429 R = = =,822 F = = = 8,526 TSS 255, TSS /( n K) 557,43 Summary Adjusted Std. Error of R R Square R Square the Estimate.97 a.822.778 23.6 a. Predictors:, over obligatorisk skole Konklusjon: Det er bare,3% sannsynlighet for at de uavhengige variablene i modellen ikke har betydning for lønn i populasjonen Tabellen med koeffisientene er likevel den viktigste a. Dependent Variable: LONN Unstandardi 84.286 7.83 4.934.8 2.43 2.82.97 4.34.3 b 2,43 t = = = 4,34 SE b 2,82 Det er bare,3% sannsynlighet for at en ikke har betydning for lønn i populasjonen Hvorfor blir pverdien den samme for variabelen og for hele regresjonsmodellen? 4

> Hva skjer hvis vi legger inn enda en uavhengig variabel i modellen? Lønnstaker: Utdanning Menn: 8 2 2 3 3 4 2 4 6 3 5 8 2 6 2 Y ˆ = b + b X + b X 2 2 Eller kanskje den blir lettere å forstå hvis vi skriver den slik: Predikert timelønn = b + b utd+ b 2 menn Men kjønn er da ikke kontinuerlig. Hvordan kan vi da sette opp et lineært forholdet mellom kjønn og timelønn? Løsning: Vi koder om variabelen kjønn til dummyvariabelen menn SPSS gir dette resultatet Unstandardi 5. 2.472 4.9.28 5..58.2 9.487.2 MENN Menn=, 4..8.437 3.73.34 kvinner= a. Dependent Variable: LONN Etter kontroll for kjønnsforskjeller øker timelønna med kr.5 for hvert år med utover grunnskole Menn tjener kr.4 mer i timer enn kvinner selv om vi kontrollerer for sforskjellen mellom menn og kvinner Både og kjønn har statistisk signifikant betydning på 5% nivå for timelønn Likningen blir da: PRED.LØNN = 5 + 5UTD + 4MENN Hvordan ser dette ut grafisk? 25 Y = b + b X + b 2 X 2 = 5 + 5X + 4X 2 2 5 Menn (menn=) b 2 =4, i Kroner b =5, 5 b =5, Kvinner (menn=) 2 4 6 8 5

Klarer vi nå å tolke resultatene fra disse regresjonsmodellene? Ulike regresjonsmodeller som predikerer timelønn 989, n=3759. l B Std. Beta t Sig. Konstant 76,6,65 8.67, ED 5,2,8,43 29.7, R 2,84 2 Konstant 54,24,55 35.7, ED 5,3,7,44 3., AGE 5,55,35,23 5.8, R 2,235 3 Konstant 64,2,533 4.84, ED 4,87,63,4 29.97, AGE 5,42,332,22 6.32, FEMALE 7,6,83,29 2.32, R 2,37 B: regresjonskoeffisienten, Std.: regresjonskoeffisientens standardfeil, t: Studen t, Sig.: signifikanssannsynligheten til t. 6