SOS3003 Eksamensoppgåver



Like dokumenter
SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

Litt enkel matematikk for SOS3003

SOS 31 MULTIVARIAT ANALYSE

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS 31 MULTIVARIAT ANALYSE

EKSAMENSOPPGÅVER Sommar 1996 FRAMLEGG TIL LØYSING Erling Berge

Du kan skrive inn data på same måte som i figuren under :

Språk og skrift som er brukt i SOS3003

EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE

HØGSKOLEN I STAVANGER

MØTEPROTOKOLL. Leikanger ungdomsråd SAKLISTE: Møtestad: Gamle kantina Møtedato: Tid: 09:00. Tittel

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS 31 MULTIVARIAT ANALYSE

Løysingsforslag til eksamen i MA1301-Talteori, 30/

HØGSKOLEN I STAVANGER

Årsrapport frå opplæringskontor i Hordaland om opplæring av lærlingar og lærekandidatar (Lærebedriftene skal bruka eit eige skjema.

Eksamensoppgave i SØK2900 Empirisk metode

BRUKARUNDERSØKING MOTTAK AV FLYKTNINGAR MOTTAK AV FLYKTNINGAR

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Valdres vidaregåande skule

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

SERVICESKYSSEN -EIT INKLUDERANDE TILBOD

Matematikk 1, 4MX15-10E1 A

Høring - finansiering av private barnehager

Styresak. Ivar Eriksen Oppfølging av årleg melding frå helseføretaka. Arkivsak 2011/545/ Styresak 051/12 B Styremøte

FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS301/ SOS311 8 DES 1997

Framtidige behov for hjelpemiddel

Dersom summen vert over 400 g må ein trekkje dette frå.

Matematisk samtale og undersøkingslandskap

Eksamen MAT1013 Matematikk 1T. Nynorsk/Bokmål

Reisevanekartlegging i Hordaland fylkeskommune Fylkesbygget og Skyss.

Eksempeloppgåve/ Eksempeloppgave 2009

Saksnr Utval Møtedato Utdanningsutvalet I sak Ud-6/12 om anonym retting av prøver gjorde utdanningsutvalet slikt vedtak;

mlmtoo much medicine in Norwegian general practice

Forelesning 13 Regresjonsanalyse

FAKTA. Likeverdige brökar: BrÖkar som har same verdien: 2 = 2 4 = 3 6 = 4 8 = 5

Eksamen MAT1008 Matematikk 2T. Nynorsk/Bokmål

Eksamen REA3028 Matematikk S2. Nynorsk/Bokmål

Eksamensoppgave i SØK Statistikk for økonomer

Molde Domkirke Konfirmasjonspreike

KONTSTRIKKING. Dersom det skal vere lue, genser, jakke eller skjørt, kan det vere naturleg å starte med ein høveleg kant og halve ruter.

TMA4245 Statistikk Eksamen desember 2016

EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE

BEST. NR. 456-NYN. Ungdom i arbeid

Vi har ikkje behandla bustøttesøknaden fordi det manglar samtykke frå ein eller fleire i husstanden

UNDERSØKING OM MÅLBRUKEN I NYNORSKKOMMUNAR RAPPORT

Forslag frå fylkesrådmannen

LOV FOR IDRETTSLAGET JOTUN

Litt enkel matematikk for SOS3003

Særavtale om veiledarfunksjon for nyutdanna lærarar.

Lammedødelegheit - genetiske parametre

Lærlingundersøking om eit fagskuletilbod innan agrogastronomi på Hjeltnes. AUD-notat nr

Med spent forventning... Sjekkliste for ein god barnehageslutt og ein god skulestart

Reglement for godtgjersler til kommunale folkevalde

Vurdering av allianse og alternativ

Årsmelding Austevoll maritime fagskule 2-årig maritim fagskule : Skipsoffisersutdanning- nautikk

Bachelorgrad med spesialisering i engelsk eller tilsvarande. Seminar: totalt 16 timar.

Strategiplan for Apoteka Vest HF

Møteinnkalling for Administrasjonsutval

mmm...med SMAK på timeplanen

JØLSTER KOMMUNE TILSETJINGSREGLEMENT

I lov 17. juli 1998 nr. 61 om grunnskolen og den vidaregåande opplæringa er det gjort følgende endringer (endringene er markert med kursiv):

STIMULERINGSMIDLAR FOR 2013

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Handlingsprogram 2014, Regional plan for museum

PLAN FOR SPESIALUNDERVISNING I FYRESDAL KOMMUNE

PENSUM SOS Mål for kurset. SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Oversikt over Forelesingsnotat, vår 2003

BRUK AV ALTERNATIVE LØP SOM FØRER FRAM TIL FAGBREV

HORDALANDD. Utarbeidd av

NOKUT-strategiar Strategi for utvikling av NOKUT

Kausalanalyse og seleksjonsproblem

KappAbel 2010/11 Oppgåver 2. runde - Nynorsk

Søknad om godkjenning frå fylkesmannen til å gi gaver eller arveforskot frå midlane til ein person med verje

RETNINGSLINER FOR BEHANDLING AV ANLEGGSBIDRAG OG BOTNFRÅDRAG

Betalingsreduksjon i foreldrebetaling BARNEHAGANE I SVEIO

SAKSFRAMLEGG. 36/15 Næring og miljøutvalet

Korleis kan PPT bruke resultata frå forsking i arbeidet i kommunane?

Er du i mål? Legg til hundre på 347. Hvilket tall får dere da? Hva er halvparten av 62 minus 1? Hvilket multiplikasjonsstykke er dette?

Forbrukerrådets husleiekontrakt

ORGANISATORISK PLATTFORM FOR UNGE VENSTRE

INFORMASJON TIL STØTTEKONTAKT/AVLASTAR.

Uttale vedr. ferjesamband i Hardanger

Transkript:

SOS33 Eksamensoppgåver Gjennomgang våren 24 Erling Berge Vår 24 Gjennomgang av Oppgåve 2 gitt hausten 2 Vår 24 2

Haust 2 OPPGÅVE 2I tabellvedlegget til oppgåve 2 er det estimert 6 modellar av eiga inntekt (E.inntekt). a) Ta utgangspunkt i modell og forklar med ord kva effekten av E.utdanning tyder. Finn så i same modellen eit konfidensintervall for effekten av E.utdanning. Finn ut frå modell 4 forventa inntekt for ei 4 år gammal kvinne med 2 års utdanning og heiltidsarbeid i Kværner Oil&Gas. Test om det er ein lineær eller kurvelineær samanheng mellom alder og inntekt. b) Formuler den modellen som er estimert som Modell 8. Vurder om testane i modell 8 er truverdige. Drøft mogelege forbetringar av modellspesifikasjonen. c) Test om Kjelde til livsopphald gir ei signifikant yting til å forklare variasjonen i inntekt. Finn ved hjelp av modell 2 eit estimat av skilnaden i inntekt mellom menn og kvinner når ein føreset at dei er funksjonærar i heiltidsarbeid, har 5 års utdanning og arbeider i Direktoratet for naturforvaltning. Ta utgangspunkt i modell 6 og skriv ut formelen for eit betinga effekt plott for samanhengen mellom alder og inntekt for personar med heiltidsarbeid, 5 års utdanning og arbeid i offentleg sektor. d) Modell 5 er identisk med modell 8, men er estimert utan dei 2 personane som har størst verknad på estimatet av modell 8. Kva kan seiast om desse personane? Kva konsekvensar har det for regresjonsresultatet at personane vert utelatne? Vår 24 3 Haust 2 Oppgåve 2a Ta utgangspunkt i modell og forklar med ord kva effekten av E.utdanning (E.utd) tyder. Finn så i same modellen eit konfidensintervall for effekten av E.utdanning. Finn ut frå modell 4 forventa inntekt for ei 4 år gammal kvinne med 2 års utdanning og heiltidsarbeid i Kværner Oil&Gas. Test om det er ein lineær eller kurvelineær samanheng mellom alder og inntekt. Vår 24 4

Haust 2 Oppgåve 2a- Modell viser at for kvart år ekstra utdanning ein person får vil inntekta auke med 5,25*kr = kr 5.25 om alt anna er likt Vår 24 5 Haust 2 Oppgåve 2a-2 Dersom vi kan gå ut frå at feilledda er normalfordelte vil eit 95% konfidensintervall (5% signifikansnivå) vere gitt ved b E.utd SE E.utd *t 5% < b E.utd < b E.utd + SE E.utd *t 5% Set vi inn i formelen finn vi at 5,25,43*,96 < b E.utd < 5,25 +,43*,96 5,25,85 < b E.utd < 5,25 +,85 4,398 < b E.utd < 6,2 Vår 24 6

Haust 2 Oppgåve 2a-3 Variabel Variabelverd Multiplisert med Parameter Estimat Gir resultatet i Konstant -87,8692-87,8692 Alder 4 * 4,8479342 93,9737 Alder*Alder 4*4 * -,45279-72,44675 Mann * -7,52876 E,utdanning 2 * 6,933 82,9572 Heiltidsarbeid * 75,33449 75,33449 Offentleg sektor * -6,77633 Alder*Mann 4* * 5,72596 Alder*Alder*Mann 4*4* * -,4956 Forventa verdi av E,inntekt 9,893 Vår 24 7 Haust 2 Oppgåve 2a-4 () I modell er ikkje alder inkludert som variabel, i modell 2 er alder inkludert lineært og i modell 3 er alder inkludert som kurvelinær med eit andregradspolynom. Gir alder inkludert lineært eit signifikant bidrag til modellen? Er alder inkludert kurvelineært signifikant betre enn den lineære modellen? Vår 24 8

Haust 2 Oppgåve 2a-4 (2) F-test av kvadratleddet aleine gir ikkje meir kunnskap enn det t-testen av koeffisienten for kvadratleddet gir Begge aldersparametrane er signifikant ulik null Generelt kan ein seie at dersom begge parametrane i eit alderspolynom er signifikant ulik, vil heile polynomet yte signifikant til forklaringa av variasjonen i den avhengige variabelen. Meir omfattande testing trengst berre dersom ein av parametrane ikkje er signifikant ulik. Vår 24 9 Haust 2 Oppgåve 2b Formuler den modellen som er estimert som Modell 8. Vurder om testane i modell 8 er truverdige. Drøft mogelege forbetringar av modellspesifikasjonen. Vår 24

Haust 2 Oppgåve 2b- () Når vi skal formulere ein modell må vi definere elementa som inngår i modellen (variablar og datamaterialet) definere relasjonane mellom elementa (regresjonslikninga), og presisere kva føresetnader som ein må gjere for å bruke modellen (spesifikasjon av modell, Gauss-Markov krav, normalfordelte feilledd) Vår 24 Haust 2 Oppgåve 2b- (2) definere relasjonane mellom elementa i modellen I populasjonen føreset vi at det er eit lineært eller kurvelineært samband mellom den avhengige variabelen, Y, og dei uavhengige X-variablane. Dette tyder i vårt høve at når vi lar i gå over heile populasjonen vil Y i = β + β X i + β 2 X 2i + β 3 X 3i + β 4 X 4i + β 5 X 5i + β 6 X 6i + β 7 X 7i + β 8 X 8i + β 9 X 9i + β X i + β X i + β 2 X 2i + β 3 X 3i + β 4 X 4i + ε i Vår 24 2

Haust 2 Oppgåve 2b-2 Kva påverkar truverdet av testar? Autokorrelasjon? Heteroskedastisitet? Ikkje-normal feilledd? Autokorrelasjon er lite sannsynleg i ein landsomfattande survey Vår 24 3 Haust 2 Oppgåve 2b-2 (2) Heteroskedastisitet? 3 E.innt Residual 2 - -2 2 3 4 Modell 8 E.innt Predicted Vår 24 4

Haust 2 Oppgåve 2b-2 (3) Normalfordeling av residualen? 3...5..25.5.75.9.95.99.999 2 - -2 Modell 8-3 -2-2 3 4 Normal Quantile Plot Vår 24 5 Haust 2 Oppgåve 2b-2 (4) Konklusjon Samla sett vil ein vel seie at tendensen til heteroskedastisitet saman med avvika frå normalfordelinga (dette kan godt vere to sider av same fenomen) tilseier stor varsemd med å tru på testane i modellen. Vår 24 6

Haust 2 Oppgåve 2b-3 () Betre modell gjennom Fleire variablar eller transformasjon av avhengig variabel? Inspeksjon av ulike modellar tyder på at modell 6, der Y er transformert, er ei forbetring. Fordelinga av residualane er nærmare normalfordelinga Vår 24 7 Haust 2 Oppgåve 2b-3 (2) Kvantil-normal plottet av residualen...5..25.5.75.9.95.99.999 - Modell 6-3 -2-2 3 4 Normal Quantile Plot Vår 24 8

Haust 2 Oppgåve 2b-3 (3) Residual plotta mot predikert y Ln(E.innt) Residual - 4 5 6 Modell 6 Ln(E.innt) Predicted Vår 24 9 Haust 2 Oppgåve 2d Modell 5 er identisk med modell 8, men er estimert utan dei 2 personane som har størst verknad på estimatet av modell 8. Kva kan seiast om desse personane? Kva konsekvensar har det for regresjonsresultatet at personane vert utelatne? Vår 24 2

Haust 2 Oppgåve 2d- 2 personar med påverknad i modell 8 () Variabelnamn Case No 756 83 Kommentar Univ/ høyskole utd = har akademisk tittel Næring 6 2 6 = undervisning, forsking, 2 = varehandel, butikk Ekteskapeleg status 2 = gift, 2 = aldri gift Heiltidsarbeid Offentleg sektor =ja =ja Talet på arbeidstakarar i husst 2 # Barn i hushaldet # Mors utdanning 7 7 I år Fars utdanning E.utdanning 7 7 5 9 I år I år Alder 57 9 I år Vår 24 2 Haust 2 Oppgåve 2d- 2 personar med påverknad i modell 8 (2) Variabelnamn Mann Case No 756 83 Kommentar =ja E.innt 45 45 I kroner HH.inntekt 45 45 I kroner Busadtype 2 = sentrum storby, 2 = forstad storby Kjelde til livsopphald 4 2 4 = funksjonær (ikkje leiande), 2 = arbeidar faglært Residual E.innt Model 8 35.48 33.47 h(i) E.innt Model 8.32.969 Cook's D(i) Influence E.innt Model 8.293.298 Vår 24 22

Haust 2 Oppgåve 2d-2 Konsekvensane av å utelate 2 case () Variabelnamn Modell 8 Estimate Modell 5 Estimate Modell 8 parameter relativt til model 5 Konstant -24.48258-7.437.4469 Alder 3.724 3.58948.3647 Alder*Alder -.3572 -.34789.2679 Mann -73.5377-8.799.96893 E.utdanning 3.26476 2.984876.2252 Heiltidsarbeid -5.2539-5.543.997 Offentleg sektor 7.576729 6.9685.39 Alder*Mann 3.3566592 3.5562293.943882 Vår 24 23 Haust 2 Oppgåve 2d-2 Konsekvensane av å utelate 2 case (2) Variabelnamn Modell 8 Estimate Modell 5 Estimate Modell 8 parameter relativt til model 5 Alder*Alder*Mann -.27637 -.2935.94276 E.utdanning*Mann.54529.8649.8362 Heiltidsarbeid*Mann 23.89824 22.476676.63246 Alder*Heiltidsarbeid 6.653477 7.3364.945856 Alder*Alder*Heiltidsarbeid -.7877 -.8282.9536 E.utdanning*Heiltidsarbeid 5.92793 5.33999.95539 Off sektor*heiltidsarbeid -4.23729-4.44984.9467 Vår 24 24

Haust 2 Oppgåve 2d-2 Konklusjon Den substansielle forskjellen er stor både for Mann og for E.utdanning. Det synest rimeleg å sjå dette i lys av at dei to utelatte casa var ein 9 år gammal mann med låg utdanning og ei 57 år gammal kvinne med høg utdanning. Kombinasjonen av variabelverdiar gjer at dei to casa får relativt stor innverknad på regresjonsresultatet. Fordelinga av residualen og spreiinga til residualen etter verdien av predikert Y har likevel ikkje endra seg påviseleg. Vår 24 25