STV1020 våren 2018 oppgave 31. Se nederst i dokumentet for nynorsk versjon. DEL 2 (70 av 100 poeng): Du skal svare på alle oppgavene. Tallene i parentes viser maksimalt antall poeng per oppgave. Du skal gjennomføre en analyse av norske arbeidstakere. Analysen bygger på følgende hypotese: «Mannlige arbeidstakere jobber i gjennomsnitt 2 timer mer per uke sammenliknet med kvinnelige arbeidstakere». a) Hva er populasjonen, enhetene, og variablene i hypotesen? (3p) b) Du ønsker å teste hypotesen din på et utvalg av norske arbeidstakere. Hva slags utvalgsteknikk bør du i så fall benytte? Begrunn svaret ditt. (3p) c) Foreslå en operasjonell definisjon av begrepet arbeidstaker. (2p) d) Du intervjuer et utvalg nordmenn om deres arbeidstid, og registrerer antall timer de jobber per uke i variabelen ARBEIDSTIMER. Hva er målenivået til ARBEIDSTIMER? Begrunn svaret ditt. (6p) e) Du mistenker at forskjellen i arbeidstid mellom kvinnelige og mannlige arbeidstakere skyldes at kvinnelige arbeidstakere i større grad enn mannlige arbeidstakere jobber deltid. Tegn en kausalmodell som illustrerer dette. (3p) Du ønsker å dekomponere de bivariate sammenhengene mellom variablene KJØNN, ARBEIDSTIMER, og STILLINGSTYPE. f) Hvilke bivariate sammenhenger må du i så fall dekomponere? (2p) g) Hva er hensikten med å dekomponere de bivariate sammenhengene? (3p)
h) Du ønsker å gjennomføre en regresjonsanalyse med de tre variablene KJØNN, ARBEIDSTIMER, og STILLINGSTYPE. Skriv opp regresjonsmodellen (ligningen) på generell form. (6p) I tabell 1 er resultatene fra en regresjonsanalyse med KJØNN, ARBEIDSTIMER, og STILLINGSTYPE gjengitt. ARBEIDSTIMER er målt i antall arbeidstimer per uke. STILLINGSTYPE har to mulige verdier: deltidsstilling og fulltidsstilling. På variabelen KJØNN er mann kodet som 1. Arbeidstakere som har deltidsstilling har verdien 1 på variabelen STILLINGSTYPE
Tabell 1: Resultater fra regresjonsanalyse med ARBEIDSTIMER som avhengig variabel. b SE(b) t-verdi KONSTANT 35 KJØNN 3,5 1,6 2,14 STILLINGSTYPE 5,3 2,8 1,86 N = 103 R 2 = 0,16 i) Hvordan vil du tolke konstantleddet i tabell 2? (4p) j) Basert på resultatene i tabell 1: Hva er det forventede antallet arbeidstimer for en mannlig arbeidstaker med deltidsstilling? Vis utregningen. (5p) k) Hvordan tolker man generelt R 2 til en regresjonsmodell? Hvordan vil du, mer spesifikt, tolke R 2 i tabell 1? (3p) l) Hvordan tolker man generelt 1 R 2 til en regresjonsmodell? (2p) Tabell 2 er viser et utdrag fra t-tabellen.
Tabell 2: Utdrag fra t-tabellen. m) Du velger et signifikansnivå på 10 %. Bruk t-tabellen i tabell 2 til å gjennomføre en t-test (signifikanstest) av regresjonskoeffisienten til KJØNN i tabell 1. (5p) n) Du ønsker å inkludere variabelen SEKTOR i analysen. SEKTOR er operasjonalisert i kategoriene privat, offentlig, og ideell sektor. Hvordan vil du gå frem for å inkludere variabelen SEKTOR i regresjonsanalysen din? Forklar hvert trinn, og oppgi til slutt en regresjonsmodell (ligning) på generell form som kan brukes til analysen, og hvor arbeidstakernes sektor er inkludert. (8p) o) Du gjennomfører en ny regresjonsanalyse med KJØNN og ALDER som uavhengige variabler, og INNTEKT som avhengig variabel. Du finner at den standardiserte regresjonskoeffisienten (β1) til KJØNN er lik 0,29, og at den standardiserte regresjonskoeffisienten (β2) til ALDER er lik 0,55. Hvordan vil du tolke de to standardiserte regresjonskoeffisientene? (3p) Tabell 3 viser en ny regresjonsanalyse med INNTEKT som avhengig variabel, og KJØNN og UTDANNING som uavhengige variabler. Det er også inkludert et samspill mellom KJØNN og UTDANNING. INNTEKT er målt i antall kroner, på KJØNN er mann 0 og kvinne 1, og UTDANNING er målt i antall år.
Tabell 3: Resultater fra regresjonsanalyse med INNTEKT som avhengig variabel. b Konstant 260000 KJØNN (X1) 49000 UTDANNING (X2) 2900 SAMSPILL 440 N = 165 p) Skriv opp den estimerte regresjonsmodellen (ligningen) som gjenspeiler resultatene i tabell 3 (3p). q) Bruk så denne regresjonsmodellen til å regne ut den forventede inntekten til en kvinne med 4 års utdanning. Vis utregningen. (3p) En medstudent mener at du må inkludere flere uavhengige variabler i regresjonsmodellen i tabell 3 dersom du skal benytte minste kvadraters metode (OLS). r) Hva kan begrunnelsen for dette være? (3p) s) Hva slags konsekvenser kan det få for resultatene dine dersom du ikke følger opp rådet fra medstudenten din, men likevel beslutter å bruke OLS? (3p)
DEL 2 (70 av 100 poeng): Du skal svare på alle oppgåvene. Tala i parentes viser maksimalt tal poeng per oppgåve. Du skal gjennomføre ein analyse av norske arbeidstakarar. Analysen byggjer på følgjande hypotese: Mannlege arbeidstakarar jobbar i gjennomsnitt 2 timar meir per veke samanlikna med kvinnelege arbeidstakarar. a) Kva er populasjonen, einingane, og variablane i hypotesen? (3p) b) Du ønskjer å teste hypotesen din på eit utval av norske arbeidstakarar. Kva slags utvalsteknikk bør du i så fall bruke? Grunngje svaret ditt. (3p) c) Føreslå ein operasjonell definisjon av omgrepet arbeidstakar. (2p) d) Du intervjuar eit utval nordmenn om arbeidstida deira, og registrerer talet timar dei jobbar per veke i variabelen ARBEIDSTIMAR. Kva er målenivået til ARBEIDSTIMAR? Grunngje svaret ditt. (6p) e) Du mistenkjer at forskjellen i arbeidstid mellom kvinnelege og mannlege arbeidstakarar kjem av at kvinnelege arbeidstakarar i større grad enn mannlege arbeidstakarar jobbar deltid. Teikn ein kasualmodell som illustrerer dette. (3p) Du ønskjer å dekomponere dei bivariate samanhengane mellom variablane KJØNN, ARBEIDSTIMAR, og STILLINGSTYPE. f) Kva slags bivariate samanhengar må du i så fall dekomponere? (2p) g) Kva er meininga med å dekomponere dei bivariate samanhengane? (3p) h) Du ønskjer å gjennomføre ein regresjonsanalyse med dei tre variablane KJØNN, ARBEIDSTIMAR, og STILLINGSTYPE. Skriv opp regresjonsmodellen (likninga) på generell form. (6p)
I tabell 1 er resultata frå ein regresjonsanalyse med KJØNN, ARBEIDSTIMAR, og STILLINGSTYPE gjengjevne. ARBEIDSTIMAR er målt i talet på arbeidstimar per veke. STILLINGSTYPE har to moglege verdiar: deltidsstilling og fulltidsstilling. På variabelen KJØNN er mann koda som 1. Arbeidstakarar som har deltidsstilling har verdien 1 på variabelen STILLINGSTYPE
Tabell 1: Resultat frå regresjonsanalyse med ARBEIDSTIMAR som avhengig variabel. b SE(b) t-verdi KONSTANT 35 KJØNN 3,5 1,6 2,14 STILLINGSTYPE 5,3 2,8 1,86 N = 103 R 2 = 0,16 i) Korleis vil du tolke konstantleddet i tabell 2? (4p) j) Basert på resultata i tabell 1: Kva er det forventa talet på arbeidstimar for ein mannleg arbeidstakar med deltidsstilling? Vis utrekninga. (5p) k) Korleis tolkar ein generelt R 2 til ein regresjonsmodell? Korleis vil du, meir spesifikt, tolke R 2 i tabell 1? (3p) l) Korleis tolkar ein generelt 1 R 2 til ein regresjonsmodell? (2p) Tabell 2 er viser eit utdrag frå t-tabellen.
Tabell 2: Utdrag frå t-tabellen. m) Du vel eit signifikansnivå på 10 %. Bruk t-tabellen i tabell 2 til å gjennomføre ein t-test (signifikanstest) av regresjonskoeffisienten til KJØNN i tabell 1. (5p) n) Du ønskjer å inkludere variabelen SEKTOR i analysen. SEKTOR er operasjonalisert i kategoriane privat, offentleg, og ideell sektor. Korleis vil du gå fram for å inkludere variabelen SEKTOR i regresjonsanalysen din? Forklar kvart trinn, og gje til slutt opp ein regresjonsmodell (likning) på generell form som kan brukast til analysen, og der sektoren til arbeidstakarane er inkludert. (8p) o) Du gjennomfører ein ny regresjonsanalyse med KJØNN og ALDER som uavhengige variablar, og INNTEKT som avhengig variabel. Du finn at den standardiserte regresjonskoeffisienten (β1) til KJØNN er lik 0,29, og at den standardiserte regresjonskoeffisienten (β2) til ALDER er lik 0,55. Korleis vil du tolke dei to standardiserte regresjonskoeffisientane? (3p) Tabell 3 viser ein ny regresjonsanalyse med INNTEKT som avhengig variabel, og KJØNN og UTDANNING som uavhengige variablar. Det er også inkludert eit samspel mellom KJØNN og UTDANNING. INNTEKT er målt i talet på kroner, på KJØNN er mann 0 og kvinne 1, og UTDANNING er målt i talet på år.
Tabell 3: Resultat frå regresjonsanalyse med INNTEKT som avhengig variabel. b Konstant 260000 KJØNN (X1) 49000 UTDANNING (X2) 2900 SAMSPEL 440 N = 165 p) Skriv opp den estimerte regresjonsmodellen (likninga) som gjenspeglar resultata i tabell 3 (3p). q) Bruk så denne regresjonsmodellen til å rekne ut den forventa inntekta til ei kvinne med 4 års utdanning. Vis utrekninga. (3p) Ein medstudent meiner at du må inkludere fleire uavhengige variablar i regresjonsmodellen i tabellen 3 om du skal nytte minste kvadrats metode (OLS). r) Kva kan grunngjevinga for dette vere? (3p) s) Kva slags konsekvensar kan det få for resultata dine om du ikkje følgjer opp rådet frå medstudenten din, men likevel vedtek å bruke OLS? (3p)