Fra krysstabell til regresjon La oss si at vi er interessert i å undersøke i hvilken grad arbeidstid er avhengig av utdanning. Vi har ca. 3200 observasjoner (dvs. arbeidstakere som er spurt). For hver av disse har vi en bestemt kombinasjon av arbeidstid og utdanning. Vi kan nå plotte alle disse kombinasjonene i et diagram med arbeidstid langs den loddrette aksen (Y-aksen) og utdanning langs den vannrette (X-aksen): 00 80 60 Arbtid 40 20 0 0 2 4 6 8 0 Utd.år Christian Poppe, SIFO
Regresjons-tilnærmingen Spørsmålet nå er om vi kan formulere en lineær sammenheng (rett linje) som beskriver sammenhengen i figuren ovenfor på en matematisk måte. Formelen for en slik rett linje er: () = b 0 + b X i Y ˆ Y : b 0 : b : X i : predikert verdi på avhengig variabel konstant helningsskoeffisient uavhengig variabel b b X Y 0 B-koeffisienten kan substansielt fortolkes som den gjennomsnittlige endring i Y når X endres med én enhet. Christian Poppe, SIFO 2
OLS: Ordinary Least Squares (Minste Kvadratsums Metode) 20 00 ( Y i Y ) Y b 0 b X 80 ( Y i Y ) 60 ( Y Y ) 40 Y 20 0 0 2 4 6 8 SST Y Y Total Variation Total Sum of Squares 2 SSR Y Y Explained Variation Regression Sum of Squares 2 SSE Y Y Unexplained Variation Sum of Squared Errors 2 For ordens skyld: SST = SSR + SSE Et mål på forklart varians: R-kvadratet R SSR SST SSE 2 eller SST R 2 Christian Poppe, SIFO 3
Bivariat regresjon Christian Poppe, SIFO 4
Resultater Regression Variables Entered/Removed b Variables Variables Entered Removed Method a, Enter a. All requested variables entered. b. Dependent Variable: Vanlig arbeidstid i timer pr. uke Summary Std. Error Adjusted R of the R R Square Square Estimate,43 a,7,70 9,0883 a. Predictors: (Constant), Regression Residual Total a. Predictors: (Constant), ANOVA b Sum of Mean Squares df Square F Sig. 5432,830 5432,830 657,676,000 264226,639 399 82,597 38548,469 3200 b. Dependent Variable: Vanlig arbeidstid i timer pr. uke (Constant) Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig. 40,35,28 84,665,000-8,267,322 -,43-25,645,000 a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Christian Poppe, SIFO 5
Fortolkning (Constant) Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig. 40,35,28 84,665,000-8,267,322 -,43-25,645,000 a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Regresjonslinjen Y = b0 + bx hvor X = kjønn Constant = b 0 : Gjennomsnittlig Arbeidstid for den sosialgruppen som skårer null på den uavhengige variabelen Gj.snittlig arbeidstid for menn er 40,35 timer pr. uke = b : Det gjennomsnittlige tillegget eller fratrekket i arbeidstimer pr. uke for den sosialgruppen som skårer på den uavhengige variabelen Kvinner jobber i gjennomsnitt 8,267 timer mindre pr. uke enn menn b-koeffisienter kan m.a.o. fortolkes som kvantitative uttrykk for gjennomsnittsforskjeller mellom spesifikke sosiale grupper mhp. avhengig variabel. Prediksjon: Gjennomsnittlig arbeidstid for kvinner: Ỹ= b 0 + b *(kjønn) 40.35 8.267* = 32.048 timer pr. uke Vi kan sammenlikne regresjonsanalysen med resultatene fra Compare Means : Report Vanlig arbeidstid i timer pr. uke Mann Kvinne Total Std. Mean N Deviation 40,35 733 8,3207 32,0477 468 9,984 36,5236 320 9,9773 Christian Poppe, SIFO 6
Trivariat regresjon Christian Poppe, SIFO 7
Resultater Regression Variables Entered/Removed b Variables Entered Variables Removed Method Utdanning i år utover grunnskole nivå, a, Enter a. All requested variables entered. b. Dependent Variable: Vanlig arbeidstid i timer pr. uke Summary Std. Error Adjusted R of the R R Square Square Estimate,453 a,205,204 8,830 a. Predictors: (Constant), Utdanning i år utover grunnskolenivå, Regression Residual Total ANOVA b Sum of Mean Squares df Square F Sig. 62546,586 2 3273,293 40,09,000 242722,67 33 77,97 305268,753 35 a. Predictors: (Constant), Utdanning i år utover grunnskolenivå, b. Dependent Variable: Vanlig arbeidstid i timer pr. uke (Constant) Utdanning i år utover grunnskolenivå Coefficients a Unstandardized Coefficients a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Standardi zed Coefficien ts B Std. Error Beta t Sig. 38,367,290 32,237,000-7,92,320 -,399-24,768,000,657,062,7 0,597,000 Christian Poppe, SIFO 8
Fortolkning (Constant) Utdanning i år utover grunnskolenivå Coefficients a Unstandardized Coefficients a. Dependent Variable: Vanlig arbeidstid i timer pr. uke Standardi zed Coefficien ts B Std. Error Beta t Sig. 38,367,290 32,237,000-7,92,320 -,399-24,768,000,657,062,7 0,597,000 Regresjonslinjen Y = b0 + bx b 2 X 2, hvor X = kjønn, X 2 = Utd Constant = b 0 : Gjennomsnittlig arbeidstid for den sosialgruppen som skårer null på de uavhengige variablene Gj.snittlig arbeidstid for menn uten utd etter grunnskolen er 38,367 t. pr. uke = b : Det gjennomsnittlige fratrekket i arbeidstimer pr. uke for kvinner kontrollert for utdanning, dvs når vi sammenlikner kvinner og menn med lik utdanning Kvinner jobber i gjennomsnitt 7,92 timer mindre pr. uke enn menn, kontrollert for utdanning b-koeffisienten fortolkes altså fortsatt som et kvantitativt uttrykk for gjennomsnittsforskjeller mellom spesifikke sosiale grupper, her mellom kvinner og menn med lik utdanning. NB: Dette er en gjennomsnittsforskjell som er lik på alle nivåer av utdanning (modell-premiss: linearitet). Utd = b 2 : Det gjennomsnittlige tillegget i arbeidstimer pr. uke pr ett års utdanning utover grunnskolen kontrollert for kjønn, dvs når vi sammenlikner grupper som har forskjellig utdanningslengde, men som ellers er like mhp. kjønn For hvert år med utdanning øker arbeidstiden i gjennomsnitt med 0,657 timer pr. uke, kontrollert for kjønn Christian Poppe, SIFO 9
Prediksjoner basert på trivariat analyse - 7.92 Arbeidstid 0.66 Utdanning Ỹ= b 0 + b () + b 2 (Utd) = 38.37 7.92 () +.66 (år med Utd) Menn: Kvinner: = 38.37 7.92 * (0) +.66 * (år med Utd) = 38.37 7.92 * () +.66 * (år med Utd) Arbeidstid 50 45 40 35 30 25 20 5 0 5 0 0 2 3 4 5 6 7 8 9 0 2 Utdanning Menn Kvinner Ỹ kvinner, 3 år utd = b 0 + b *() + b 2 *(3) = 38.37 7.92*() +.66*(3) = 32.43 Ỹ Menn, 3 år utd = b 0 + b *(0) + b 2 *(3) = 38.37 7.92*(0) +.66*(3) = 40.35 Christian Poppe, SIFO 0