Sensorveiledning - Våren SOS1120

Like dokumenter
SKOLEEKSAMEN I. SOS1120 Kvantitativ metode. 13. desember timer

SKOLEEKSAMEN I. SOS1120 Kvantitativ metode. 2. juni timer

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

UTSATT SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. Mars 2017 (4 timer)

ECON240 VÅR / 2016 BOKMÅL

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Eksamensoppgave i samfunnsfaglig forskningsmetode 16. mai 2003

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

Sensorveiledning til eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

EKSAMEN I SOS1120 KVANTITATIV METODE 30. NOVEMBER 2006 (4 timer)

Forelesning 13 Regresjonsanalyse

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Oppgaver til Studentveiledning I MET 3431 Statistikk

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

Krysstabellanalyse. SOS1120 Kvantitativ metode. Disposisjon. 1. Beskrivelse av analyseteknikk. Forelesningsnotater 7. forelesning høsten 2005

EKSAMEN I SOSIOLOGI SOS KVANTITATIV METODE. ORDINÆR SKOLEEKSAMEN 4. april 2011 (4 timer)

ME Vitenskapsteori og kvantitativ metode

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

1. Hvordan operasjonalisere studenttilfredshet? Vis tre eksempler.

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Skoleeksamen i SOS Kvantitativ metode

3. Multidimensjonale tabeller. SOS1120 Kvantitativ metode. Årsaksmodeller. Forelesningsnotater 8. forelesning høsten 2005

Skoleeksamen i SOS Kvantitativ metode

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

Sensorveiledning SOS1120 høsten 2004

SKOLEEKSAMEN 2. november 2007 (4 timer)

Forelesning 10 Statistiske mål for bivariat tabellanalyse. Korrelasjonsmål etter målenivå. Cramers V

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Sannsynlighetsregning og Statistikk.

Gjør kort rede for seks av de åtte begrepene. Bruk inntil ½ side på hvert begrep.

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

SENSORVEILEDNING FOR SKOLEEKSAMEN I SOS KVANTITATIV METODE. 11. mars 2015 (4 timer)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

EKSAMENSOPPGAVER STAT100 Vår 2011

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Statistikk og dataanalyse

Forelesning 17 Logistisk regresjonsanalyse

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

EKSAMEN I SOS4020 KVANTITATIV METODE 20. mars (4 timer)

Informasjon om eksamen SOS Kvantitativ metode

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2007

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

SPED4010/eksamen i statistikk: Fredag 30.september 2011 kl

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Kapittel 3: Studieopplegg

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

Definisjoner av begreper Eks.: interesse for politikk

SKOLEEKSAMEN 29. september 2006 (4 timer)

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

6.2 Signifikanstester

Løsningsforslag Til Statlab 5

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

INSTITUTT FOR SOSIOLOGI OG SAMFUNNSGEOGRAFI EKSAMEN I SOSIOLOGI (MASTER) SOS KVANTITATIV METODE. SKOLEEKSAMEN 11. mai 2005 (4 timer)

HØGSKOLEN I STAVANGER

84 % er fornøyde med det tilbudet de får

Studier, region og tilfredshet

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

MEVIT2800. Forelesning, 14/09/07 Audun Beyer

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. februar 2016 (4 timer)

Mulige sammenhenger for plassering på samfunnsstigen

Løsningsforslag eksamen sos1001 V14

Høye skårer indikerer høye nivåer av selvkontroll.

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

QED Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

TMA4240 Statistikk Høst 2016

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

Institutt for økonomi og administrasjon

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

Transkript:

Sensorveiledning - Våren 2015. SOS1120 Av Øyvind Wiborg Generelt: Svar utenfor {} er tilstrekkelig for full poengpott. Svar som inkluderer elementer innenfor {} styrker helhetsvurderingen av kandidat. Avrundinger i flere desimaler som leder til avvikene utregninger aksepteres også som full pott. Det skal ikke gis trekk for følgefeil i oppgaver som baseres på gale utregninger i tidligere oppgaver. Skjønnsmessig vurdering gis i slike tilfeller. Bruk skåringsskjema vedlagt i excelformat. Det anbefales at spesielt gode svar fargemarkeres med grønn. Slik at det er lettere å oppsummere helhetsinntrykket om studenten ligger og vipper mellom to karakterer. Nedre grenser for følgende karakterer er: * A: 38 (maksimal poengscore er 42) * B: 34 * C: 25 * D: 20 * E: 13 * F: Under 13 Oppgave 1 a) Hvilke målenivå befinner variablene «degree», «coninc», «region», «hrs1» seg på? (1 poeng) degree = ordinalnivå 0.25 coninc = forholdstallsnivå 0.25 region = nominalnivå 0.25 hrs1 = forholdstallsnivå 0.25 b) Begrunn kort hvorfor du mener «region» befinner seg på det målenivået (1 poeng) Variabelen er på nominalnivå fordi verdikategoriene er gjensidig utelukkende og uttømmende. Verdiene kan derimot ikke rangeres. { Denne kategoriske variabelen har heller ikke faste intervaller eller noe absolutt nullpunkt. } c) Hva ville sentraltendensmålet modus ha fortalt oss om du hadde brukt dette målet på variabelen «region»? (0.5 poeng) Modus ville ha angitt den regionen som forekommer hyppigst. {Alternativt: modus angir her den regionen hvor det bor flest folk} d) Kan vi bruke median på variabelen for region? Ja / Nei (0.5 poeng) 1

NEI {For å bruke median som et mål på sentraltendens kreves det at variabelen er på minst ordinalnivå. Dette betyr at verdiene/verdikategoriene skal kunne rangeres fra høy til lav. «Region» er kun på nominalnivå. Det gir ingen mening å rangere «landsdeler»} Tabell 1: Frekvenstabell av utdanningskategorier. N=26039 rs highest degree Freq. Percent Cum. lt high school 2,687 10.32 10.32 high school 13,820 53.07 63.39 junior college 1,832 7.04 70.43 bachelor 5,084 19.52 89.95 graduate 2,616 10.05 100.00 Total 26,039 100.00 e) Hvilken utdanningskategori er modus i tabell 1? (1 poeng) «High school» (evt. «videregående skole») {Dette er verdien som forekommer hyppigst/oftest i tabellen: 53.07%} f) Tolk medianen i tabell 1(1 poeng) Ifølge medianen er «high school» den mest sentrale verdi i tabellen hvor den midterste verdien er gitt innenfor den kumulative prosenten. {Medianen angir den midterste verdien i rekken av alle de rangerte verdiene. I tabellen finner man medianen ved å kikke på den kumulative prosenten. Medianen angis av kategorien hvor den kumulative prosenten først innholder den miderste prosentilen 50%} g) Hvor stor prosentandel av utvalget har fullført bachelorgrad eller høyere ifølge denne tabellen? (1 poeng) 19,52+10,05 = 29,57% h) Tegn et histogram basert på tabell 1. Marker stolpene med kategorinavn. Bruk antall observasjoner på y-aksen. (1 poeng) 16000 14000 12000 10000 8000 6000 4000 2000 0 2687 lt high school 13820 high school 1832 junior high 5084 2616 bachelor graduate 2

Annual income Institutt for sosiologi og samfunnsgeografi {Det kreves ikke her at man har tallverdien på toppen av stolpene. Mulig uklarhet: oppgaven nevner «histogram» og ikke «stolpediagram» (som er det mest riktige for kategoriske variabler). Jeg har ikke lagt stor substansiell vekt på skillet mellom histogram/stolpediagram i forelesningene. Dersom studenten påpeker dette, teller det bare positivt i helhetsinntrykket. Men det viktigste poenget med oppgaven er at studenten forstår/klarer å fremstille fordelingen av verdikategoriene i tabellen grafisk} Oppgave 2 Anta at figuren (figur 1) nedenfor er representativ for den arbeidsføre delen av USA. Beskriv kort hva linjene i figuren nedenfor forteller oss om inntektsutviklingen avhengig om de har fra foreldre med høy eller lav yrkesposisjon. (2 poeng) FIGUR1: Gjennomsnittlig årlig inntekt (i dollar) for personer med foreldre som har lav og høy yrkesstatus («parents sei»: Par SEI). Personer mellom 30-70 år. 100000 90000 80000 70000 60000 50000 40000 30000 20000 10000 0 1990 1995 2000 2005 2010 gss year for this respondent Par SEI lower than 50 Par SEI higher than 50 Linjene viser at den gjennomsnittlige inntekten er relativt stabil (/svakt økende) i årene 1985 til 2010) for begge sosioøkonomiske grupper {Svar i samme dur aksepteres også: Trenden er (relativt stabil/) svakt økende for begge grupper. Forskjellen mellom de som har foreldre med høy og lav sosial bakgrunn (parsei) ser ikke ut til å avta over tid. } Oppgave 3 Tenk deg at en forsker stiller seg opp foran en kino klokken 13.00, en helt tilfeldig valgt dag. Kinoen har nettopp vist en barnefilm om Snurre Sprett. Folk strømmer ut av kinoen. Han spør de ti tilfeldig første personene som kommer ut av kinoen om de har lyst til å være med i en spørreundersøkelse. Anta at alle sier ja til å være med. 3

Fraction Institutt for sosiologi og samfunnsgeografi a. Er dette er et sannsynlighetsutvalg hvor analyseresultatene kan generaliseres til resten av befolkningen? Ja/nei (1 poeng) NEI b. Begrunn kort svaret ditt i a. (2 poeng) Dette er et utvalg hvor forskeren ikke kjenner sannsynligheten for at individene trekkes fra populasjonen. Et sannsynlighetsutvalg krever at denne sannsynligheten er kjent. {Svar langs liknende resonnementer aksepteres også: Utvalget er basert på slumpmessig trekning, og kan være skjevt og lite representativt for populasjonen. Her er det for eksempel rimelig å tro at de som kommer ut fra kinoen er i hovedsak barn og barneforeldre i en bestemt aldersgruppe.} Oppgave 4 FIGUR 2: Histogram av inntektsfordeling i USA. Personer 30-70 år..4.3.2.1 0 0 100000 200000 300000 400000 respondent income in constant dollars 4.1 Inntektsfordelingen i figuren over er (1 poeng) : a. høyreskjev b. venstreskjev c. normalfordelt d. t-fordelt e. uniform 4.2 Hvis medianen i denne inntektsfordelingen er 35602 $, hva er det mest sannsynlig gjennomsnittet for inntekt av følgende alternativer (1 poeng) : a. 44680 $ b. 35602 $ c. 12101 $ 4

Oppgave 5 Tabell 2: Krysstabell mellom inntekt (incdv) og utdanningsnivå (degreedv). Dette er variabler som er omkodet til to kategorier basert på inntektsvariabelen «coninc» og utdanningsvariabelen «degree».. t a d e g r e e D V i n c D V, r o w V c h i n o f R E C O D E o f d e g r e e ( r s R E C O D E o f r i n c o m e h i g h e s t ( r e s p o n d e n t s i n c o m e ) d e g r e e ) < 2 5 0 0 0 > = 2 5 0 0 0 T o t a l l o w e d u c 7 0. 9 9 2 9. 0 1 1 0 0. 0 0 h i g h e d u c 3 7. 8 1 6 2. 1 9 1 0 0. 0 0 T o t a l 6 2. 3 7 3 7. 6 3 1 0 0. 0 0 P e a r s o n c h i 2 ( 1 ) = 3. 1 e + 0 3 P r = 0. 0 0 0 C r a m é r ' s V = 0. 3 0 0 4 5.1 Anta at utdanning påvirker inntekten. Regn ut prosentdifferansen i forhold hva som er antatt årsak. Vis utregningen.(1 poeng) 62,19%-29.01% = 33.18 %-poeng {evt: 37,81%-70.99% = -33.18 %-poeng} 5.2 Gi en kort tolkning av denne prosentdifferansen (1 poeng) Begge tolkninger aksepteres: Tolkning 1 (%-poeng): Det er 33.18%-poeng flere som er tjener mer eller lik 25000 dollar blant de med høy enn lav utdanning i USA Tolkning 2 (styrkemål): En prosentdifferanse på 33.18% forteller oss at det er en moderat(/noe sterk) sammenheng mellom utdanning og inntekt. {Spesielt godt helhetsinntrykk om studenten har foretatt begge tolkninger. Det aksepteres også at studentene foretar tolkning 1 ut i fra den første kolonnen i tabellen (de som tjener mindre enn 25000 dollar i året} 5.3 Tolk korrelasjonsmålet Cramers V (1 poeng) Korrelasjonsmålet Cramers V(her på 0,30) forteller oss at det er en moderat(/noe sterk) sammenheng mellom utdanning og inntekt. {Selv om standardiserte korrelasjonsmål som Cramers V går fra 0 (ingen korrelasjon) til 1 (perfekt korrelasjon), er det sjeldent at vi korrelasjoner nærmere 1 i samfunnsvitenskap. Dette fordi det ofte er tilfeldig støy (folk gjør tilfeldige ting) / eller at det forekommer målefeil i utvalg/variablene.} 5

5.4 Formuler en nullhypotese og en forskningshypotese for sammenhengen mellom utdanning og inntekt. (1 poeng) H0: Det er ingen sammenheng mellom utdanning og inntekt i den arbeidsføre amerikanske befolkningen (/populasjonen) HA: Det er en sammenheng mellom utdanning og inntekt i den arbeidsføre amerikanske befolkningen (/populasjonen) 5.5 Utfør en moderne kjikvadrattest. La signfikansnivået (alpha) være 0,05. Signifikanssannsynligheten (p-verdien) er oppgitt som «Pr =0,000». (2 poeng) {I en moderne test kan vi sammenlikne den (observerte) signifikanssannsynligheten med det (kritiske) signifikansnivået, for å avgjøre om vi kan forkaste nullhypotesen}. {Vi har allerede formulert forskning og nullhypotese for sammenhengen mellom utdanning og inntekt (i populasjonen). Signifikansnivået er også allerede angitt. } Siden signfikanssannsynligheten (p=0.000) er lavere enn signfikansnivået (a=0,05) kan vi forkaste nullhypotesen med stor grad av sikkerhet. I forhold til det valgte signifikansnivået kan vi konkludere at vi tar feil i færre en 5% tilfeller når det gjelder å feilaktig forkaste en sann nullhypotese. {Dette betyr at vi får (indirekte) støtte for forskningshypotesen om at det er en (statistisk signifikant)sammenheng mellom utdanning og inntekt i den (arbeidsføre) amerikanske befolkningen (/populasjonen).} Oppgave 6 Nedenfor ser du at tabellen oppgir beskrivende statistikk for prestisjeskåre for arbeidstimer per uke. Tabell 3: Deskriptiv statistikk for antall arbeidstimer per uke (hrs1). Mean = gjennomsnitt, SE(mean) = standardfeil, N = antall observasjoner.. tabstat hrs1, stat(mean sem N ) variable mean se(mean) N hrs1 42.57777.1117816 15835 6

a. Finn kritisk t-verdi i vedleggstabellen for et signifikansnivå på 99,9% (alfa= 0.001). Frihetsgrader er gitt ved df = N-1. (1 poeng) {alfa er allerede gitt til 0.001} Df = 15835-1= 15834, Kritisk t-verdi er da : 3.291 {Vi finner kritisk t-verdi i tabellen bak ved å kikke nederst i kolonnen hvor alfa er 0.001}. b. Beregn (estimér) et 99,9% konfidensintervall for gjennomsnittet av arbeidstimer i utvalget basert på formelen (1 poeng): KI 99,9% = mean ± t*se KI_nedre: 42.58-0.11*3.291 = 42.21799 KI_øvre: 42.58 +0.11*3.291 = 42.2942 Konfidensintervallet(KI) = {42.22, 42.94} {Det er tilstrekkelig at de viser utrekningen for KIøvre og nedre} c. Gi en kort tolkning av konfidensintervallet (1 poeng) enten eller Det sanne populasjonssnittet for gjennomsnittlig arbeidstimer per uke (hrs1) vil med 99% sikkerhet befinne seg innenfor 42,22-42,94 timer I 99% av utvalgene i samplingfordelingen vil vi finne det sanne populasjonsnittet for gjennomsnittlig arbeidstimer per uke (hrs1) innen intervallet 42.22-42.94 timer {Svarene må likne på minst et av disse to alternativene} Oppgave 7 Nedenfor ser du en korrelasjonstabell mellom flere av variablene. Alle tallene viser pearsonsr som er korrelasjonsmål for to kontinuerlige variabler av gangen. Tabell 4: korrelasjonstabell. Pearsons-r. corr coninc sei parsei region (obs=24191) coninc sei parsei region coninc 1.0000 sei 0.3915 1.0000 parsei 0.2230 0.2956 1.0000 region -0.0230 0.0169 0.0444 1.0000 7

a. Tolk korrelasjonen mellom barnas sosiale yrkesstatus(sei) og inntekt (coninc). (1 poeng) En Pearsons r på 0.39 viser at det er en (relativt sterk/) moderat positiv sammenheng mellom yrkesstatus og inntekt. {Dette betyr at jo høyere yrkesstatus, desto mer tjener man} b. Hvorfor viser alle korrelasjonene langs diagonalen i tabellen r=1? (1 poeng) Diagonalen viser perfekt korrelasjonen, fordi variablene er her korrelert med seg selv. c. Hvilke(n) av variablene hører ikke hjemme rent statistisk sett i denne korrelasjonstabellen? (2 poeng) Svar: «region» {Region passer ikke inn her fordi den er på nominalnivå. Pearsons r krever kontinuerlige variabler på intervall eller forholdstallsnivå} Oppgave 8 (2 poeng) Noen hevder at meritokrati i moderne samfunn fremmer sosial reproduksjon på tvers av generasjoner i moderne samfunn. Ifølge dette resonnementet overføres talent, utdanningspreferanser og jobbpreferanser, enten sosialt eller genetisk fra foreldregenerasjon til barna. I et «perfekt» meritokrati vil familiebakgrunn dermed ha en fullstendig indirekte effekt på barnas inntekt. Familiebakgrunn vil virke gjennom at barn av foreldre med høy status oftere får høy utdanning og dermed høyere lønn enn barn av foreldre med lav status. Rent statistisk sett betyr dette at etter kontroll for barnas yrkesposisjon og utdanning, vil familiebakgrunn dermed ikke ha noen gjenværende direkte effekt på barnas inntekt. Tegn et årsak-virkningsdiagram som viser hvordan foreldres sosiale posisjon (parsei50) antas å påvirke inntekt (coninc) fullstendig gjennom egen utdanning (educ13) og yrkesprestisje (sei50). Parsei50 educ13 sei50 coninc {Full pott så lenge tidsrekkefølgen her er etablert. Aksepteres også i tillegg; direkte effekter fra: educ13 coninc, eller parsei50 sei50} (Studenten kan også bruke beskrivelser av variablene fremfor variabelnavn) Oppgave 9 Vi ønsker her å undersøke sammenhengen mellom forelderens sosiale posisjon (parsei) og barnas inntekt oppgitt i US-dollars ($$$). Vi inkluderer kontrollvariabler i alle modellene. Modell 1: 8

. r e g c o n i n c p a r s e i 5 0 a g e 3 0, b e t a S o u r c e S S d f M S N u m b e r o f o b s = 2 5 3 3 7 F ( 2, 2 5 3 3 4 ) = 6 8 0. 7 2 M o d e l 1. 9 2 7 0 e + 1 2 2 9. 6 3 5 0 e + 1 1 P r o b > F = 0. 0 0 0 0 R e s i d u a l 3. 5 8 5 8 e + 1 3 2 5 3 3 4 1. 4 1 5 4 e + 0 9 R - s q u a r e d = 0. 0 5 1 0 A d j R - s q u a r e d = 0. 0 5 0 9 T o t a l 3. 7 7 8 5 e + 1 3 2 5 3 3 6 1. 4 9 1 4 e + 0 9 R o o t M S E = 3 7 6 2 2 c o n i n c C o e f. S t d. E r r. t P > t B e t a p a r s e i 5 0 4 5 8. 3 2 6 5 1 2. 5 2 5 8 4 3 6. 5 9 0. 0 0 0. 2 2 7 3 1 6 6 a g e 3 0 2 2. 7 7 1 8 1 1 4. 2 8 6 8 2 1. 5 9 0. 1 1 1. 0 0 9 9 0 2 1 _ c o n s 4 8 3 0 3. 7 4 3 2 1. 8 3 6 4 1 5 0. 0 9 0. 0 0 0. 9.1 Tolk konstantleddet i modell 1 (1 poeng) I USA tjener (arbeidsføre amerikanere/) personer som er 30 år og som har foreldre med 50 seiskåre, i snitt 48303,7 dollar per år. 9.2 Tolk regresjonskoeffisienten for alder (age30) (1 poeng) For hvert år eldre en person er, tjener man i snitt 22,8 dollar mer, kontrollert for (/når vi tar hensyn til/ holder konstant etc) foreldrenes sosiale posisjon (Parsei50). Modell 2 [ *** 0.5 poeng trekkes dersom studenten har glemt å nevne «kontroll for» ***]. r e g c o n i n c p a r s e i 5 0 a g e 3 0 e d u c 1 3 y e a r s s e i 5 0, b e t a S o u r c e S S d f M S N u m b e r o f o b s = 2 4 1 3 3 F ( 4, 2 4 1 2 8 ) = 1 4 4 7. 9 3 M o d e l 6. 9 6 6 3 e + 1 2 4 1. 7 4 1 6 e + 1 2 P r o b > F = 0. 0 0 0 0 R e s i d u a l 2. 9 0 2 1 e + 1 3 2 4 1 2 8 1. 2 0 2 8 e + 0 9 R - s q u a r e d = 0. 1 9 3 6 A d j R - s q u a r e d = 0. 1 9 3 4 T o t a l 3. 5 9 8 7 e + 1 3 2 4 1 3 2 1. 4 9 1 3 e + 0 9 R o o t M S E = 3 4 6 8 1 c o n i n c C o e f. S t d. E r r. t P > t B e t a p a r s e i 5 0 1 4 4. 1 1 0 2 1 2. 7 4 6 5 1 1. 3 1 0. 0 0 0. 0 7 1 4 9 7 3 a g e 3 0 2 6. 8 2 7 4 4 1 3. 9 3 2 3 1. 9 3 0. 0 5 4. 0 1 1 4 5 1 3 e d u c 1 3 y e a r s 2 8 3 9. 3 4 1 9 7. 8 2 5 8 3 2 9. 0 2 0. 0 0 0. 2 1 7 4 3 3 7 s e i 5 0 4 8 3. 5 5 5 3 1 4. 5 3 3 1 5 3 3. 2 7 0. 0 0 0. 2 4 1 5 3 5 6 _ c o n s 4 7 6 7 0. 9 7 3 2 1. 2 1 2 7 1 4 8. 4 1 0. 0 0 0. 9.3 Fortolk den (ujusterte) R 2 i modell2 (1 poeng) Til sammen forklarer alle de uavhengige variablene i modellen 19,36% av variasjonen i inntekt (coninc) 9

{Variabelnavn istedenfor «alle uavhengige variablene» aksepteres også. Alternativ tolkning1: Modellen forklarer/predikerer 19,36% av variasjonen i inntekt. Alternativ tolkning2: Modellen reduserer feilprediksjonen i inntekt med 19,36%} 9.4 Hvilken av variablene i modell 2 ser ut til å være minst viktig for barnas inntekt? (Oppgi tallet du vurderer dette ut i fra) (1 poeng) Alder har minst innvirkning på den avhengige variabelen(/inntekt). Dette kan vi se ut i fra at alder har den laveste standardiserte regresjonskoeffisent/beta (beta=0.011) [0.5 poeng i trekk dersom ikke betakoefisienten med tall ikke er nevnt] {Den standardiserte regresjonskoefisenten lar oss sammenlikne variablenes relative betydning på den avhengige variabelen. Den gjør oss i stand til å sammenlikne betydningen av uavhengige variabler med ulik enhetsformat (e.g. kroner, alder etc, ) og ulike fordelinger.} 9.5 Begrunn kort hvorfor regresjonskoeffisenten til foreledrenes sosiale yrkestatus (parsei50) synker i modell 2 i forhold til modell 1? (2 poeng) Regresjonskoefisenten synker i modell2 når det kontrolleres for barnas egen utdanning og yrkesstatus. (1 poeng). En rimelig grunn til at dette er at betydningen av foreldrenes yrkesposisjon på barnas inntekt virker (delvis) gjennom barnas egen utdanning og sosial yrkesposisjon. (1 poeng) [Full pott om begge poenger er med] {Aksepteres også: «Personer med høy sosial bakgrunn, velger i større grad høyere utdanning, som igjen gjør at de får høy yrkesstatus med høy inntekt»} 9.6 Predikér årlig inntekt for en person med 14 års utdanning, som er 45 år gammel, som har gjennomsnittlig prestisjeskåre (SEI=50), og som har foreldre med prestisjeskåre PARSEI= 51. Vis utregning (2 poeng). Modell 2: Likning (1) Inntekt = 47670.97 + 2839.341*educ13years + 26.82744*age30+ 483.5553*sei50 + 144.1101*parsei50 Vi plugger inn verdiene for prediksjon (likning 2): 10

Inntekt = 47670.97 + (2839.341*1)+ (26.82744*15)+ (483.5553*0) + (144.1102*1) = 51056.8328 dollar [Vi krever ikke her at den første likningen (likning 1) er satt opp. Bare likning 2 med utrekning og predikert svar] [NB: HER ER DET DESSVERRE SNEKET SEG INN EN UKLARHET: Det er ikke angitt hvilken modell 1,2, eller 3] som skal benyttes. Men modell 1 kan ikke brukes siden den ikke inneholder alle variablene. De som bruker modell 2 eller 3 får full pott] Oppgave 10 Modell 3:. reg coninc parsei50 age30 educ13years sei50 year2000 parsei50xyear2000 Source SS df MS Number of obs = 24133 F( 6, 24126) = 981.14 Model 7.0587e+12 6 1.1765e+12 Prob > F = 0.0000 Residual 2.8929e+13 24126 1.1991e+09 R-squared = 0.1961 Adj R-squared = 0.1959 Total 3.5987e+13 24132 1.4913e+09 Root MSE = 34627 coninc Coef. Std. Err. t P> t [95% Conf. Interval] parsei50 63.55626 17.69913 3.59 0.000 28.86487 98.24765 age30 20.9517 13.93013 1.50 0.133-6.352225 48.25562 educ13years 2822.469 97.74828 28.87 0.000 2630.876 3014.061 sei50 481.5806 14.51235 33.18 0.000 453.1355 510.0257 year2000 2917.458 448.6771 6.50 0.000 2038.023 3796.893 parsei50xyear2000 148.1438 23.3335 6.35 0.000 102.4087 193.879 _cons 46245.7 383.8942 120.46 0.000 45493.25 46998.16 I modell 3 kontrolleres det for tid (før og etter 2000). Det er dessuten inkludert et samspillsledd mellom år og foreldrenes yrkesposisjon (parsei50xyear2000). a. Hvor mye mer betyr foreldrenes sosiale yrkes status for barnas inntekt etter år 2000, selv etter vi har kontrollert for barnas utdanning og yrkesstatus? (2 poeng). 148,14 dollar {Dette kan leses direkte av samspillsleddet} b. Ta utgangspunkt i likningen: Inntekt = 46245.7 + 63,6 parsei50 + 2917,5 year2000 + 148 parsei50xyear2000 11

Utled to regresjonslikninger basert på dummyvariabelen for tid (year2000): før og etter år 2000.(3 poeng). Før 2000: Inntekt = 46245.7 + 63.6 parsei50 + 2917.5 0 + 148 parsei50 0 Inntekt = 46245. 7 + 63, 6 parsei50 Etter 2000: Inntekt = 46245.7 + 63.6 parsei50 + 2917.5 1 + 148.1 parsei50 1 Inntekt = (46245.7 + 2917.5) + (148.1 + 63.6) parsei50 Inntekt = 49163. 2 + 211. 7 parsei50 {nb: Selv om tallene er hentet fra modell3, ta hensyn til at det er feilaktig brukt «,» fremfor «.» i den opprinnelige likningen. Dette kan ha skapt forvirring hos studentene} 12