Forelesning 18 SOS1002



Like dokumenter
Forelesning 17 Logistisk regresjonsanalyse

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

SKOLEEKSAMEN 29. september 2006 (4 timer)

Forelesning 13 Regresjonsanalyse

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Forelesning 14 REGRESJONSANALYSE II. Regresjonsanalyse. Slik settes modellen opp i SPSS

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

Logistisk regresjon 1

Sensorveiledning til eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

EKSAMEN I SOSIOLOGI SOS KVANTITATIV METODE. ORDINÆR SKOLEEKSAMEN 4. april 2011 (4 timer)

Fra krysstabell til regresjon

Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.

EKSAMEN I SOS4020 KVANTITATIV METODE 20. mars (4 timer)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

regresjonsmodeller multippel logistisk regresjon logistisk regresjon prediksjon vs assosiasjon den logistisk funksjonen (2)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Logistisk regresjon 2

Krysstabellanalyse. SOS1120 Kvantitativ metode. Disposisjon. 1. Beskrivelse av analyseteknikk. Forelesningsnotater 7. forelesning høsten 2005

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

SOS3003 Eksamensoppgåver

Informasjon om eksamen SOS Kvantitativ metode

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

Akademikere logger ikke av

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Høye skårer indikerer høye nivåer av selvkontroll.

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

SENSORVEILEDNING FOR SKOLEEKSAMEN I SOS KVANTITATIV METODE. 11. mars 2015 (4 timer)

Univariate tabeller. Statistisk uavhengighet og statistisk avhengighet. Bivariat tabellanalyse. Hvordan bør vi prosentuere denne tabellen?

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Sensorveiledning til eksamensoppgaven i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

ME Vitenskapsteori og kvantitativ metode

R A P P O R T. 10/90-fordeling. 50/50-fordeling 0 %

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Eksamen er todelt, og har en kvantitativ og en kvalitativ del. Begge skal besvares.

ME Vitenskapsteori og kvantitativ metode

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

SKOLEEKSAMEN 2. november 2007 (4 timer)

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Median: Rangerer fordeling: Antall studenter er oddetall, medianposisjonen er 4, og medianen er 28 timer

Integrert? Vedleggstabeller til boka. Innvandrere og barn av innvandrere i utdanning og arbeidsliv. Abstrakt forlag AS

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

a) Forklar hva som menes med faktorladning, kommunalitet og eigenvalue.

Matteknologisk utdanning

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMENSOPPGAVE FOR SOS3003: ANVENDT STATISTISK DATAANALYSE

Del 1 og Del 2 vektes likt (50/50). Begge delene må være bestått.

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Enkel Keynes-modell for en lukket økonomi uten offentlig sektor

Innbyggerundersøkelse

Datainnsamling. Pasienterfarings-undersøkelse K Har du tillit til behandlernes faglige dyktighet?

NORSK TEKNOLOGI Boligeiere Mai 2011

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2007

EKSAMEN I SOS1120 KVANTITATIV METODE 12. DESEMBER 2011 (4 timer)

Konsekvenser av familiepolitikk 2

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. februar 2016 (4 timer)

Videregående utdanning for voksne. effekter på arbeid og ledighet

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

SOS3003 Eksamensoppgåver

HØGSKOLEN I STAVANGER

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

STV1020 våren 2018 oppgave 31. Se nederst i dokumentet for nynorsk versjon.

Regresjonsmodeller. HEL 8020 Analyse av registerdata i forskning. Tom Wilsgaard

Eksamensoppgave i ST3001

Meningsmåling Holdninger til Forsvaret

Arbeidsnotat nr Per Arne Tufte

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

2. Forklar med egne ord de viktigste forutsetningene for regresjonen og diskuter om forutsetningene er oppfylt i oppgave 1.

1. Drøft styrker og svakheter ved casestudier i samfunnsvitenskapelig forskning.

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 04. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Foreldres holdning til pedagogisk tilbud i barnehagene

Norsk Vann R A P P O R T. Sentio Research Norge AS Verftsgata Trondheim Org.nr MVA. Mottaker

Logistisk regresjon: binomisk, multinomisk og rangert. Håvard Hegre

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Transkript:

Forelesning 8 SOS002 Bruk av regresjonsmodeller til å predikere verdier? Hvordan kan vi predikere timelønn ut fra denne lineære regresjonsmodellen? B SEB Beta t Sig. t Kvinner(kvinne=, mann=0) -4,0 0,96-0,23-4,66 < 0,00 Utdanning (antall år etter grunnskole) 3,66 0,2 0,3 7,37 < 0,00 Alder (antall 0-år) 4,44 0,4 0,8 0,87 < 0,00 Klasse (Dummy-variabler med ufaglærte arbeidere som referansekategori) Øvre serviceklasse 5,59 2,06 0,4 7,55 < 0,00 Nedre serviceklasse 0,47,44 0,6 7,29 < 0,00 Rutinefunksjonærer -,06,29-0,02-0,82 0,4 Faglærte arbeidere -0,2,42-0,00-0,5 0,882 Forfremmet (ja=, nei=0) 7,08 0,88 0, 8,0 < 0,00 Bedriftserfaring (antall 0-år i bedriften),47 0,58 0,04 2,54 0,0 Privat sektor (privat=, offentlig=0) 6,8 0,90 0, 7,60 < 0,00 Konstantledd 57,39 2,05 27,97 < 0,00 N R 2 3680 0,37 2 Hva predikerer den lineære regresjonsmodellen som timelønn for en kvinnelig ufaglærte arbeidere i offentlig sektor med gjennomsnittlig utdanning (2,65), alder (3,94) og yrkeserfaring (0,94), men som ikke har blitt forfremmet? Y kvinne =-4,0 kvinne+3,66 utdanning+4,44 alder +5,59 Kl+0,47 Kl2-,06 Kl3-2 Kl4 +7,08 forfremmet+,47 bedriftserfaring +6,8 privat+57,39 Y kvinne =-4,0 +3,66 2,65+4,44 3,94 +5,59 0+0,47 0-,06 0-2 0 +7,08 0+,47 0,94 +6,8 0+57,39 Y kvinne = 7,86 3

Hva predikerer den lineære regresjonsmodellen som timelønn for en mannlig ufaglærte arbeidere i offentlig sektor med gjennomsnittlig utdanning (2,65), alder (3,94) og yrkeserfaring (0,94), men som ikke har blitt forfremmet? Y mann = -4,0 kvinne+3,66 utdanning+4,44 alder +5,59 Kl+0,47 Kl2-,06 Kl3-2 Kl4 +7,08 forfremmet+,47 bedriftserfaring +6,8 privat+57,39 Y mann = -4,0 0+3,66 2,65+4,44 3,94 +5,59 0+0,47 0-,06 0-2 0 +7,08 0+,47 0,94 +6,8 0+57,39 Y mann = 85,96 4 Hva er differansen mellom de to prediksjonene? Y kvinne = 7,86 Y mann = 85,96 Diff. = - 4,0 Men hvorfor blir differansen mellom kvinnen og mannen akkurat det samme som regresjonskoeffisienten for kvinne? Grunnen er at regresjonskoeffisienten for kvinne viser jo nettopp forskjellen mellom kvinner og menn når de andre variablene holdes like! Men slik blir det IKKE når vi bruker logistisk regresjon! 5 Hvordan forklarer vi denne logistiske regresjonsmodellen? Logistisk regresjonsmodell for sannsynligheten for å tjene 83 kroner eller mer pr time ut fra diverse uavhengige variabler. B SEB Oddratio Sig. Kvinner(kvinne=, mann=0) -,34 0,0 0,26 < 0,00 Utdanning (antall år etter grunnskole) 0,30 0,02,35 < 0,00 Alder (antall 0-år) 0,27 0,04,3 < 0,00 Klasse (Dummy-variabler med ufaglærte arbeidere som ref.) Øvre serviceklasse,76 0,25 5,78 < 0,00 Nedre serviceklasse,09 0,5 2,99 < 0,00 Rutinefunksjonærer -0,09 0,3 0,9 0,497 Faglærte arbeidere 0,22 0,3,25 0,093 Forfremmet (ja=, nei=0) 0,82 0,09 2,27 < 0,00 Bedriftserfaring (antall 0-år i bedriften) 0,23 0,06,26 < 0,00 Privat sektor (privat=, offentlig=0) 0,52 0,0,68 < 0,00 Konstantledd -2,42 (N=) (3680) 6 2

Kan oddratioene gi oss informasjon om sannsynligheter for å tjene 83 kroner eller mer pr time? Oddratio Forskjellene i Sig. prosent (OR-)*00 Kvinner(kvinne=, mann=0) 0,26-74 0,000 Utdanning (antall år etter grunnskole),35 35 0,000 Alder (antall 0-år),3 3 0,000 Klasse (Ufaglærte arbeidere som ref.) -00 Øvre serviceklasse 5,78 478 0,000 Nedre serviceklasse 2,99 99 0,000 Rutinefunksjonærer 0,9-9 0,497 Faglærte arbeidere,25 25 0,093 Forfremmet (ja=, nei=0) 2,27 27 0,000 Bedriftserfaring (antall 0-år i bedriften),26 26 0,000 Privat sektor (privat=, offentlig=0),68 68 0,000 Konstantledd 0,09 (N=) (3680) Oddsen for å tjene mer enn 83 kroner i timen er 74% lavere for kvinner enn for menn For hvert år økning i utdanning, øker oddsen for å komme i denne høyinntektsgruppen med 35% 7 NB! Odds er ikke det samme som sannsynligheter De fleste er mindre fortrolige med begrepene odds og oddratioer enn med prosenter og prosentdifferanser. Høy utdanning 0 Lav utdanning Odds (Høy/Lav) Byer og tettsteder 50 50 00 20 8 NB! Odds er ikke det samme som sannsynligheter De fleste er mindre fortrolige med begrepene odds og oddratioer enn med prosenter og prosentdifferanser. Prosentdifferanse Landsbygda 30 70 00 Byer og Landsbygda tettsteder Oddratio Høy utdanning 50 30 0 Lav utdanning 50 70 Odds (Høy/Lav),00 0,43 2,33 Det vil si at oddsen for å ha høy utdanning er 33% høyere i byene enn på landsbygda ((2,33-)*00=33) Prosentdifferansen mellom by og land er derimot 20 prosentpoeng Og sannsynlighetene for å ha høy utdanning er 0,5 i byene og 0,3 på landsbygda Det vil si at sannsynligheten for å ha høy utdanning er 20 prosentpoeng høyere i byene enn på landsbygda, ikke 33 prosent høyere. 9 3

Omregning til sannsynligheter NB! Dette er en ikke-lineær tolkning Det vil si at effekten i form av sannsynligheter må identifiserer for et gitt sett av verdier på de andre variablene Statistisk P = / (+ e -L ) der e er den naturlige logaritmen 2,78 Fremgangsmåte a) Sett opp hele regresjonsligninga b) Bestem deg for hvilken X-variabel du vil beregne sannsynligheter for c) Sett inn gjennomsnittsverdiene på alle andre kontinuerlige X-variabler og de mest utbredte kombinasjonene på de andre dummykodede X- variablene d) Beregn predikerte logiter (L) for hver verdi på den valgte X- variabelen e) Beregn så sannsynlighetene med formelen: P = + e L 0 Hvor sannsynlig er det at den en kvinnelig ufaglærte arbeidere i offentlig sektor med gjennomsnittlig utdanning (2,65), alder (3,94) og yrkeserfaring (0,94), men som ikke har blitt forfremmet, tjener mer enn 83 kroner i timen? L kvinne =-,338 kvinne+0,300 utdanning+0,269 alder+,755 Kl +,094 Kl2-0,090 Kl3+0,222 Kl4+0,82 forfremmet +0,232 bedriftserfaring+0,57 privat-2,48 L kvinne =-,338 +0,300 2,65+0,269 3,94+,755 0 +,094 0-0,090 0+0,222 0+0,82 0 +0,232 0,94+0,57 0-2,48 L kvinne =-,686 = = = 0,57 (,686) + e + e P kvinne L Hvor sannsynlig er det at den en mannlig ufaglærte arbeidere i offentlig sektor med gjennomsnittlig utdanning (2,65), alder (3,94) og yrkeserfaring (0,94), men som ikke har blitt forfremmet, tjener mer enn 83 kroner i timen? L mann = -,338 kvinne+0,300 utdanning+0,269 alder+,755 Kl +,094 Kl2-0,090 Kl3+0,222 Kl4+0,82 forfremmet +0,232 bedriftserfaring+0,57 privat-2,48 L mann = -,338 0+0,300 2,65+0,269 3,94+,755 0 +,094 0-0,090 0+0,222 0+0,82 0 +0,232 0,94+0,57 0-2,48 L mann = -0,345 = 0, 45 ( 0,345) + e = + e = P mann L 2 4

Hva er differansen mellom de to sannsynlighetene? P kvinner = 0,57 P menn = 0,45 Diff. = - 0,258 Kvinner med de oppsatte kjennetegnene har 26 prosentpoeng lavere sannsynlighet enn menn, med samme kjennetegnene, for å tjene mer enn 83 kroner 3 5