Fra krysstabell til regresjon



Like dokumenter
Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Forelesning 13 Regresjonsanalyse

Frequencies. Frequencies

Frequencies. Frequencies

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Analyse med uavhengige variabler på nominal- /ordinalnivå

Logistisk regresjon 1

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

Lineære modeller i praksis

Logistisk regresjon 2

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i ST3001

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

SOS3003 Eksamensoppgåver

Generelle lineære modeller i praksis

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

MA Universitetet i Agder Institutt for matematiske fag EKSAMEN. Emnekode: MA-202 Emnenavn: Statistikk 2

EKSAMEN I SOS1120 KVANTITATIV METODE 2. DESEMBER 2010 (4 timer)

Løsningsforslag eksamen STAT100 Høst 2010

EKSAMEN I SOS1120 KVANTITATIV METODE 12. DESEMBER 2011 (4 timer)

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

SKOLEEKSAMEN 29. september 2006 (4 timer)

UNIVERSITETET I OSLO

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Forelesning 17 Logistisk regresjonsanalyse

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

UNIVERSITETET I OSLO

Kp. 12 Multippel regresjon

Forelesning 18 SOS1002

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

OPPGAVE 1 MA Universitetet i Agder Institutt for matematiske fag EKSAMEN. Emnekode: MA-202 Emnenavn: Statistikk 2

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

EXAMINATION PAPER. Exam in: STA-3300 Date: Wednesday 27. November 2013 Time: Kl 09:00 13:00 Place: Åsgårdsv All printed and written

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Til bruk i metodeundervisningen ved Høyskolen i Oslo

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

Eksamen PSYC3101 Kvantitativ metode II Vår 2015

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

2.2 Korrelasjon. Våre øyne ikke gode til å bedømme hvor sterk en sammenheng er Trenger kvantitativt mål på sammenheng Korrelasjon et slikt mål

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

SKOLEEKSAMEN 2. november 2007 (4 timer)

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Multippel lineær regresjon

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

EKSAMENSOPPGAVER STAT100 Vår 2011

HØGSKOLEN I STAVANGER

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Ridge regresjon og lasso notat til STK2120

UNIVERSITETET I OSLO

Kort innføring i SPSS

EKSAMENSOPPGAVE STA-2004.

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Oppgave N(0, 1) under H 0. S t n 3

UNIVERSITETET I OSLO

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Transkript:

Fra krysstabell til regresjon La oss si at vi er interessert i å undersøke i hvilken grad arbeidstid er avhengig av utdanning. Vi har ca. 3200 observasjoner (dvs. arbeidstakere som er spurt). For hver av disse har vi en bestemt kombinasjon av arbeidstid og utdanning. Vi kan nå plotte alle disse kombinasjonene i et diagram med arbeidstid langs den loddrette aksen (Y-aksen) og utdanning langs den vannrette (X-aksen): 00 80 60 Arbtid 40 20 0 0 2 4 6 8 0 Utd.år Christian Poppe, SIFO

Regresjons-tilnærmingen Spørsmålet nå er om vi kan formulere en lineær sammenheng (rett linje) som beskriver sammenhengen i figuren ovenfor på en matematisk måte. Formelen for en slik rett linje er: () = b 0 + b X i Y ˆ Y : b 0 : b : X i : predikert verdi på avhengig variabel konstant helningsskoeffisient uavhengig variabel b b X Y 0 B-koeffisienten kan substansielt fortolkes som den gjennomsnittlige endring i Y når X endres med én enhet. Christian Poppe, SIFO 2

OLS: Ordinary Least Squares (Minste Kvadratsums Metode) 20 00 ( Y i Y ) Y b 0 b X 80 ( Y i Y ) 60 ( Y Y ) 40 Y 20 0 0 2 4 6 8 SST Y Y Total Variation Total Sum of Squares 2 SSR Y Y Explained Variation Regression Sum of Squares 2 SSE Y Y Unexplained Variation Sum of Squared Errors 2 For ordens skyld: SST = SSR + SSE Et mål på forklart varians: R-kvadratet R SSR SST SSE 2 eller SST R 2 Christian Poppe, SIFO 3

Bivariat regresjon Christian Poppe, SIFO 4

Resultater Regression Variables Entered/Removed b Variables Variables Entered Removed Method a, Enter a. All requested variables entered. b. Dependent Variable: Vanlig arbeidstid i timer pr. uke Summary Std. Error Adjusted R of the R R Square Square Estimate,43 a,7,70 9,0883 a. Predictors: (Constant), Regression Residual Total a. Predictors: (Constant), ANOVA b Sum of Mean Squares df Square F Sig. 5432,830 5432,830 657,676,000 264226,639 399 82,597 38548,469 3200 b. Dependent Variable: Vanlig arbeidstid i timer pr. uke (Constant) Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig. 40,35,28 84,665,000-8,267,322 -,43-25,645,000 a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Christian Poppe, SIFO 5

Fortolkning (Constant) Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig. 40,35,28 84,665,000-8,267,322 -,43-25,645,000 a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Regresjonslinjen Y = b0 + bx hvor X = kjønn Constant = b 0 : Gjennomsnittlig Arbeidstid for den sosialgruppen som skårer null på den uavhengige variabelen Gj.snittlig arbeidstid for menn er 40,35 timer pr. uke = b : Det gjennomsnittlige tillegget eller fratrekket i arbeidstimer pr. uke for den sosialgruppen som skårer på den uavhengige variabelen Kvinner jobber i gjennomsnitt 8,267 timer mindre pr. uke enn menn b-koeffisienter kan m.a.o. fortolkes som kvantitative uttrykk for gjennomsnittsforskjeller mellom spesifikke sosiale grupper mhp. avhengig variabel. Prediksjon: Gjennomsnittlig arbeidstid for kvinner: Ỹ= b 0 + b *(kjønn) 40.35 8.267* = 32.048 timer pr. uke Vi kan sammenlikne regresjonsanalysen med resultatene fra Compare Means : Report Vanlig arbeidstid i timer pr. uke Mann Kvinne Total Std. Mean N Deviation 40,35 733 8,3207 32,0477 468 9,984 36,5236 320 9,9773 Christian Poppe, SIFO 6

Trivariat regresjon Christian Poppe, SIFO 7

Resultater Regression Variables Entered/Removed b Variables Entered Variables Removed Method Utdanning i år utover grunnskole nivå, a, Enter a. All requested variables entered. b. Dependent Variable: Vanlig arbeidstid i timer pr. uke Summary Std. Error Adjusted R of the R R Square Square Estimate,453 a,205,204 8,830 a. Predictors: (Constant), Utdanning i år utover grunnskolenivå, Regression Residual Total ANOVA b Sum of Mean Squares df Square F Sig. 62546,586 2 3273,293 40,09,000 242722,67 33 77,97 305268,753 35 a. Predictors: (Constant), Utdanning i år utover grunnskolenivå, b. Dependent Variable: Vanlig arbeidstid i timer pr. uke (Constant) Utdanning i år utover grunnskolenivå Coefficients a Unstandardized Coefficients a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Standardi zed Coefficien ts B Std. Error Beta t Sig. 38,367,290 32,237,000-7,92,320 -,399-24,768,000,657,062,7 0,597,000 Christian Poppe, SIFO 8

Fortolkning (Constant) Utdanning i år utover grunnskolenivå Coefficients a Unstandardized Coefficients a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Standardi zed Coefficien ts B Std. Error Beta t Sig. 38,367,290 32,237,000-7,92,320 -,399-24,768,000,657,062,7 0,597,000 Regresjonslinjen Y = b0 + bx b 2 X 2, hvor X = kjønn, X 2 = Utd Constant = b 0 : Gjennomsnittlig arbeidstid for den sosialgruppen som skårer null på de uavhengige variablene Gj.snittlig arbeidstid for menn uten utd etter grunnskolen er 38,367 t. pr. uke = b : Det gjennomsnittlige fratrekket i arbeidstimer pr. uke for kvinner kontrollert for utdanning, dvs når vi sammenlikner kvinner og menn med lik utdanning Kvinner jobber i gjennomsnitt 7,92 timer mindre pr. uke enn menn, kontrollert for utdanning b-koeffisienten fortolkes altså fortsatt som et kvantitativt uttrykk for gjennomsnittsforskjeller mellom spesifikke sosiale grupper, her mellom kvinner og menn med lik utdanning. NB: Dette er en gjennomsnittsforskjell som er lik på alle nivåer av utdanning (modell-premiss: linearitet). Utd = b 2 : Det gjennomsnittlige tillegget i arbeidstimer pr. uke pr ett års utdanning utover grunnskolen kontrollert for kjønn, dvs når vi sammenlikner grupper som har forskjellig utdanningslengde, men som ellers er like mhp. kjønn For hvert år med utdanning øker arbeidstiden i gjennomsnitt med 0,657 timer pr. uke, kontrollert for kjønn Christian Poppe, SIFO 9

Prediksjoner basert på trivariat analyse - 7.92 Arbeidstid 0.66 Utdanning Ỹ= b 0 + b () + b 2 (Utd) = 38.37 7.92 () +.66 (år med Utd) Menn: Kvinner: = 38.37 7.92 * (0) +.66 * (år med Utd) = 38.37 7.92 * () +.66 * (år med Utd) Arbeidstid 50 45 40 35 30 25 20 5 0 5 0 0 2 3 4 5 6 7 8 9 0 2 Utdanning Menn Kvinner Ỹ kvinner, 3 år utd = b 0 + b *() + b 2 *(3) = 38.37 7.92*() +.66*(3) = 32.43 Ỹ Menn, 3 år utd = b 0 + b *(0) + b 2 *(3) = 38.37 7.92*(0) +.66*(3) = 40.35 Christian Poppe, SIFO 0