NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Like dokumenter
EKSAMENSOPPGAVE FOR SOS3003: ANVENDT STATISTISK DATAANALYSE

EKSAMENSOPPGAVE I SOS3003 ANVENDT STATISTISK DATAANALYSE I SAMFUNNSVITENSKAP VÅR 2008.

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMENSOPPGAVE I SOS3003:

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

SOS3003 Eksamensoppgåver

Forelesning 17 Logistisk regresjonsanalyse

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS3003 Eksamensoppgåver

UTSATT SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. Mars 2017 (4 timer)

SKOLEEKSAMEN 2. november 2007 (4 timer)

Forelesning 13 Regresjonsanalyse

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Institutt for økonomi og administrasjon

Eksamensoppgave i ST3001

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Logistisk regresjon 1

SKOLEEKSAMEN 29. september 2006 (4 timer)

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

EKSAMEN I SOSIOLOGI SOS KVANTITATIV METODE. ORDINÆR SKOLEEKSAMEN 4. april 2011 (4 timer)

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Logistisk regresjon 2

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

UNIVERSITETET I OSLO

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMEN I SOS1120 KVANTITATIV METODE 12. DESEMBER 2011 (4 timer)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006

INSTITUTT FOR SOSIOLOGI OG SAMFUNNSGEOGRAFI EKSAMEN I SOSIOLOGI (MASTER) SOS KVANTITATIV METODE. SKOLEEKSAMEN 11. mai 2005 (4 timer)

Høye skårer indikerer høye nivåer av selvkontroll.

EKSAMEN I SOS4020 KVANTITATIV METODE 20. mars (4 timer)

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i PSY3100 Forskningsmetode Kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SENSORVEILEDNING FOR SKOLEEKSAMEN I SOS KVANTITATIV METODE. 11. mars 2015 (4 timer)

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Fra krysstabell til regresjon

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

1. Drøft styrker og svakheter ved casestudier i samfunnsvitenskapelig forskning.

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Informasjon om eksamen SOS Kvantitativ metode

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

Examination paper for SOS3050 EMPIRICAL RESEARCH METHODS

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Skoleeksamen i SOS Kvantitativ metode

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

EKSAMENSOPPGAVE VÅR 2011 I SOS3003 ANVENDT STATISTISK DATAANALYSE I SAMFUNNSVITENSKAP

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMEN I SOS3003

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

EKSAMEN I SOS1120 KVANTITATIV METODE 2. DESEMBER 2010 (4 timer)

Sensorveiledning til eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

SKOLEEKSAMEN 8. januar 2008 (4 timer)

Eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

ME Vitenskapsteori og kvantitativ metode

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Forelesning 18 SOS1002

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. februar 2016 (4 timer)

UNIVERSITETET I OSLO

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

UNIVERSITETET I OSLO

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

UNIVERSITETET I OSLO

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2007

Transkript:

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGAVE SOS3003 Faglig kontakt under eksamen: Albert Andrew Simkus Telefon: 99 53 21 74 Eksamensdato: 02.12.08 Eksamenstid: 6 timer Studiepoeng: 15 Tillatte hjelpemidler: Kalkulator Antall sider bokmål: 12 Sensurdato: 22.12.08 Tillatte hjelpemidler: Lawrence Hamilton (1992): Regression with graphics. Belmont, Duxbury. Paul E. Specter (1992): Summated rating scale construction. Newberry Park, Sage. Structural Equation Modeling using AMOS: An Introduction. Ytterligere lærebøker i statistikk for samfunnsvitenskap. Følgende er forbudt å ta med på eksamen: Kopier av tidligere eksamener i dette kurset, sensorveiledning for disse eksamene eller notater som omhandler disse eksamene eller sensorveiledningene. BOKMÅL Generell instruks: Foran hvert spørsmål er det oppgitt omtrentlig vekt og omtrentlig lengde på et godt svar. Dette angir anbefalt lengde for et godt svar, og skal hjelpe deg så du ikke skriver for kort eller for langt. Kvaliteten på svaret er mye viktigere enn lengden. Karakteren på eksamenen blir basert på den samlede kvaliteten på besvarelsen, og spesielt gode svar på noen av spørsmålene vil kunne veie opp for mindre gode svar på andre. Det blir også tatt hensyn til at enkelte spørsmål med hensikt er laget enkle, mens andre er vanskeligere å besvare. Sluttkarakteren blir gitt på grunnlag av den totale besvarelsen. Hvis du har norsk som morsmål, anbefales det allikevel at du leser den engelskspråklige versjonen i tillegg for å forsikre deg om at du forstår detaljene i spørsmålene korrekt. Den norske versjonen vil allikevel være tilstrekkelig for å kunne besvare eksamen. Du må skrive tydelig! Fremhev hvilket spørsmål du besvarer, og presenter besvarelsen i samme rekkefølge som oppgaveteksten!

SPØRSMÅL DEL I (Den samlede vektleggingen av denne oppgavedelen utgjør omtrent 30 prosent av hele karakteren) Svarene på de fleste av disse spørsmålene burde være veldig korte og presise. Det er mulig at i noen tilfeller så vil svaret være noe lignende som Nei, dette kan ikke stemme (med en kort forklaring på hvorfor). 1. Hvilket mål i OLS angir gjennomsnittlig endring i den avhengige variabelen når vi endrer verdien på den uavhengige variabelen med ett trinn, etter at vi har kontrollert for effekten av alle de andre uavhengige variablene? 2. Hvis du beregner en verdi som ligger 1,96 standardfeil under et punktestimat, og verdien som ligger 1,96 standardfeil over det samme punktestimatet, hvilket mål har du da beregnet? 3. Hvilket mål i logistisk regresjon er det som tilsvarer verdien av t opphøyd i andre? 4. I hvilke tilfeller kan konstantleddet i en multippel OLS-regresjon angi en predikert verdi på den avhengige variabelen? 5. Forestill deg at du ser på et sett med statistiske estimat fra en multippel regresjonsmodell. Du legger merke til at den ustandardiserte regresjonskoeffisienten for variabelen alder er 0,000, men at sannsynlighetene ut fra t-testen indikerer at koeffisienten er statistisk signifikant. Samtidig ser du at koeffisienten for dummyvariabelen kjønn (å være mann) er 0,05 og ikke statistisk signifikant. Er dette mulig, eller er det en opplagt feil? Gi en kort forklaring. 6 10. Følgende fem spørsmål er basert på tabellen nedenfor. Denne tabellen viser resultatet fra en OLS-regresjon der den avhengige variabelen er en holdningsskala om kjønnsroller fra en survey i Polen. Fem av tallene i denne tabellen har blitt endret slik at de har verdier som er umulige ut fra de andre tallene i tabellen. Det er ikke mer enn en feil på hver horisontale linje i tabellen, i alt fem feil. Identifiser feilene, og forklar hvorfor de må være feil. Navngi de fem svara fra 6-10 i den rekkefølgen de ligger i tabellen.

Coefficients a Model 1 Standardized nstandardized Coefficien Coefficients % Confidence Interval for B Std. Error Beta t Sig. Lower BoundUpper Bound (Constant) 18,510,941 19,661,000 16,661 20,359 AGE -,068,501 -,254-6,192,000 -,090 -,047 Female 1,926,379,208 5,082,000 1,926 2,670 Education Level of Edu,237,084,122 2,830,671,073,402 Urban Residence Type,085,112,033,760,047 -,135,304 Religiosity Church atten -,164,181-3,017 -,904,366 -,519,192 a. Dependent Variable: GENSCALE2 SCALE zv33 + zv34 + zv35 + zv37 + zv40 + zv43 11 15. I OLS og logistisk regresjon er det mange mål, begrep og statistikker som ligner (er analoge) hverandre. De er ikke matematisk like, men de bidrar med omtrent samme type informasjon og de brukes til samme formål i tolkningen. Her er det listet opp et antall slike mål. Ordne alle disse målene i en liste med to kolonner med seks linjer. I den første kolonnen lister du opp et mål som brukes i OLS-regresjon, og i den andre kolonnen, på samme linje, lister du opp det tilsvarende målet i logistisk regresjon. For eksempel: OLS-REGRESJON R-square LOGISTISK REGRESJON Pseudo-R-square osv Begrepene som skal ordnes i to parallelle lister er (de står i tilfeldig rekkefølge her): t-test -2 (Log-Likelihood) L. R. Chi-square-test Cook s D F-test sum-of-squares logistisk regresjonskoeffisient Wald statistikk Delta Bj ustandardisert b-koeffisient 16. Er multikollinaritet et potensielt problem i logistisk regresjon? Hvis ja, hva er en enkel måte å se om du har et problem med multikollinaritet i logistisk regresjon, selv om det tilsynelatende strider litt mot reglene (det er lov)? 17. Er heteroskedastisitet et problem i logistisk regresjon? Hvis ja, hvordan må du håndtere det? 18. Er diskriminering et mulig problem i logistisk regresjon? Hvis ja, nevn to måter du kan identifisere problemet. 19. Hvilket spesifikt statistisk mål kan du benytte om du vil finne ut om det finnes uteliggere som kan påvirke regresjonskoeffisienten til en enkelt teoretisk viktig uavhengig variabel? 20. Er BETA-koeffisienten i OLS-regresion og oddsratioene eller de multiplikative koeffisientene i logistisk regresjon like eller ulike i kalkulering og tolkning? Forklar kort hvorfor.

21 24. (Spørsmål om dummyvariabler) 21. Du analyserer effekten av år med formell utdanning (antall fullførte år med utdanning), på en avhengig variabel. Du setter inn denne kontinuerlige variabelen for år med utdanning, og den viser ikke noen verdi som er statistisk signifikant forskjellig fra null. Allikevel, når du fjerner år med formell utdanning og erstatter den med et sett med seks dummyvariabler for nivå av utdanning fullført, så viser disse en signifikant sammenheng basert på F-testen for forbedring av modellen. Hvorfor er det slik? 22. I en annen analyse av en annen avhengig variabel, så finner du en nesten perfekt lineær sammenheng som er signifikant på 0,05-nivå når du bruker den kontinuerlige år med formell utdanning som forklaringsvariabel. Men et sett med fem dummyvariabler for nivå av utdanning fullført bidrar ikke til en signifikant forbedring av modellens forklaringskraft, selv når den kontinuerlige variabelen er utelatt. Hvorfor kan det være at dette skjer? 23. Du må teste inklusjon av dummyvariabler som representerer en enkelt teoretisk variabel i en OLS-regresjon. Er det mest fornuftig å inkludere dem en etter en, på en trinnvis måte, basert på t-tester for hver dummy, eller å inkludere hele settet og enten akseptere eller forkaste alle dummyene basert på en F-test for forbedring av modellen? 24. Om man har akseptert et sett med dummyer for en teoretisk modell i den endelige modellen, er da effektene mellom alle par av dummykategorier signifikant forskjellige fra hverandre? Hvilken statistikk i outputen vil du bruke som en indikasjon på hvorvidt enkelte dummyer er statistisk forskjellige fra resten? Vil det hjelpe og bytte referansekategori? 25. Hva er navnet på et av de mest vanlige målene på skalareliabilitet, og hva er de akseptable eller gode verdier for dette målet? Spørsmål 26 30. Advarsel! Ødelagte tall! De følgende fem spørsmålene er basert på tabellen nedenfor. Denne tabellen viser resultatene fra en logistisk regresjonsmodell hvor den avhengige variabelen er basert på et spørsmål fra 2003-2004 South-East European Social Survey. Spørsmålet var: Do you agree or disagree I support the efforts of the International court to try war criminals from the war in this country, regardless of what side they were on. Svarene strongly agree og agree ble kodet til verdien 1, mens svar som antydet at man ikke var enig, ble kodet til 0. Data fra den originale tabellen kom fra Bosnia & Hercegovina og var et representativt utvalg for hele landet med en utvalgsstørrelse på rundt 3000 for dette spørsmålet. Variablene for kjønn, religiøsitet (høyere verdi indikerer mer religiøs) og antall år utdannelse er innlysende. Det er også en variabel med fire kategorier som angir hvor ruralt respondentens bosted er, hvor den fjerde kategorien er mest rural og den første kategorien er mest urban. Men! En spesialist i data-hacking har vært slem og forandret tabellen, slik at den nå inneholder fem store feil som en våken statistiker vil kunne avdekke hvis han eller hun følger godt med. Disse løper fra innlysende til mindre innlysende feil, og krever litt kalkulering (inntasting av et nummer og en funksjonsknapp) for å avdekke. Det finnes ikke mer enn èn feil på noen av de horisontale linjene i tabellen, og tre av de ni horisontale linjene har ingen feil. Pek på de fem feilene og nevn de etter hvert som du ser dem når du går igjennom tabellen fra topp til bunn. (Ikke bruk for mye tid på dette! Ser du de ikke raskt, gå videre og returner til denne oppgaven senere!)

Variables in the Equation Step 1 a MALE(1),341,080 18,183 1,000 1,406 B S.E. Wald df Sig. Exp(B) FEMALE(2),005,003 3,162 1,075 1,005 RELIGIOSITY -,160,039 17,236 1,000 -,852 URBRUR4 40,288 3,000 URBRUR4(1),537,248 4,698 1,030 1,711 URBRUR4(2) -,427,196 4,769 1,029,501 URBRUR4(3) -,703,316 2,225 1,026,495 EDYEARS -5,019,013 2,106 1,147,981 Constant 1,298,349 13,795 1,000 3,662 a. Variable(s) entered on step 1: MALE, AGE, RELIGIOSITY, URBRUR4, EDYEARS. SPØRSMÅL DEL II OG III I begge eksamensoppgavene benyttes data fra den første intervjurunden av European Social Survey (ESS), som ble utført i 2002. Denne bølgen inkluderte 22 land, og spørsmålene her er basert på data fra bare tre av disse landene: Storbritannia, Norge og Polen. DEL II: OLS REGRESJONSANALYSE (TELLER OMTRENT 35 prosent) Den avhengige variabelen i regresjonsanalysen er en skala for tillit til samfunnsinstitusjoner. Se ellers dokumentasjonen i tabellvedlegget. a) Hvilken av de tre modellene er best? b) Skriv ligningen for predikert verdi, basert på utvalget. c) Er det forskjeller mellom landene når det gjelder tillit til samfunnsinstitusjoner? d) Lag (tegn) et enkelt betinget effektplot (diagram) som illustrerer effekten av utdanning for de tre landene. e) Vurder følgende hypoteser: H1: Alder har en lineær effekt på tillit til samfunnsinstitusjoner. H2: Kvinner har mindre tillit til samfunnsinstitusjoner enn menn. H3: Utdanning har ingen effekt på tillit til samfunnsinstitusjoner i Polen. f) Vurder om forutsetningene til modell 3 er tilfredsstilt.

DEL III: LOGISTISK REGRESJON (TELLER 35 prosent) Den avhengige variabelen i denne logistiske regresjonen er FREEGL, som har verdien 1 hvis respondenten var helt enig i utsagnet Gay men and lesbians should be free to live their own life as they wish. Ellers har variabelen verdien null. a) Skriv ned ligningen for modellen. b) Beskriv sammenhengen mellom alder og holdning til homofile og lesbiske. c) Beskriv sammenhengen mellom ekteskapelig status og holdning til homofile og lesbiske. d) Er det samspill mellom land og kjønn på holdning i modellen? e) Finn oddsratioene for å være helt enig i at homofile og lesbiske bør få leve som de vil mellom kvinner og menn i Storbritannia, Norge og Polen. Hva forteller de tre oddsrationen (kan beskrives i en kort sosiologisk setning)? f) Finn predikert sannsynlighet for å være helt enig i at homofile og lesbiske bør få leve som de vil for en 50 år gammel ugift mann med ti års utdanning, som er bosatt i Norge. Dokumentasjon og tabeller for DEL II: OLS Regresjonsanalyse Avhengig variabel: SYSTRUST en skala som beregner gjennomsnittlig skåre på spørsmål om tillit til fire samfunnsinstitusjoner: Using this card, please tell me on a score of 0-10 how much you personally trust each of the institutions I read out. 0 means you do not trust an institution at all, and 10 means you have complete trust. Firstly the parliament, the legal system, the police, politicians?

Uavhengige variabler: I regresjonsanalysen er land dummykodet med Polen som referansekategori.

Dokumentasjon og tabeller for DEL III: Logistisk regresjonsanalyse