NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGAVE SOS 00 ANVENDT STATISTISK DATAANALYSE I SAMFUNNSVITENSKAP Faglig kontakt under eksamen: Kristen Ringdal Tlf.: 7 59 7 0 Eksamensdato: 8. desember Eksamenstid: 6 timer Studiepoeng: 5 Språkform: bokmål, nynorsk Antall sider vedlegg + forside: 8 Antall sider bokmål: Antall sider nynorsk: Antall sider engelsk: 0 Antall sider i alt: 9 Sensurdato: 9. desember 004 Sensurtelefon: 85 4804 Tillatte hjelpemidler: Kalkulator Norsk-engelsk/ engelsk-norsk ordbok Hamilton, Lawrence C. 99 «Regression with Graphics», Belmont, Duxbury, Hardy, Melissa A. 99 «Regression with Dummy Variables», QASS 9, London, Sage Allison, P.D. 00 «Missing data», QASS, London, Sage Trykte forelesningsnotater fra Ringdals forelesninger.
BOKMÅL I begge eksamensoppgavene benyttes data fra European Social Survey (ESS). Hensikten med ESS er å kartlegge sammenhengen mellom institusjonelle forhold i de europeiske land og borgernes holdninger, verdier og oppfatninger. Den første intervjurunden ble foretatt høsten 00 og data ble frigitt for allmenn bruk høsten 00. I alt har land deltatt. I de to eksamensoppgavene er antall land avgrenset til tre: Storbritannia, Norge og Polen. OPPGAVE Regresjonsanalyse (teller 50%) Den avhengige variabelen i regresjonsanalysen er en skala (indeks) for tillit til samfunnsinstitusjoner. Se ellers dokumentasjonen i tabellvedlegget. a) Hvilken av de tre modellen er best? b) Definer modellen for populasjonen (uten forutsetninger). Ta utgangspunkt i den beste modellen. c) Er det forskjeller mellom landene når det gjelder tillit til samfunnsinstitusjoner? d) Lag et betinget effektdiagram som viser effekten av utdanning for hvert av de tre landene. e) Vurder følgende hypoteser: H: Alder har en lineær effekt på tillit til samfunnsinstitusjoner. H: Kvinner har mindre tillit til samfunnsinstitusjoner enn menn. H: Utdanning har ingen effekt på tillit til samfunnsinstitusjoner i Polen. f) Vurder om forutsetningene til modell er tilfredsstilt. OPPGAVE Logistisk regresjon (teller 50%) Den avhengige variabelen i den logistiske regresjonsanalysen er freegl, som har verdien hvis respondenten var helt enig i utsagnet Gay men and lesbians should be free to live their own life as they wish. Ellers har variabelen verdien null. a) Skriv ut ligningen for modellen (ta med forutsetningene). b) Beskriv sammenhengen mellom alder og holdning til homofile og lesbiske. c) Beskriv sammenhengen mellom ekteskaplig status og holdning til homofile og lesbiske. d) Er det samspill mellom land og kjønn i modellen? e) Finn oddsratioene for å være helt enig at homofile og lesbiske bør få leve som de vil mellom kvinner og menn i Storbritannia, Norge og Polen. Hva forteller de tre oddsratioene? f) Finn predikert sannsynlighet for å være helt enig i at homofile og lesbiske bør få leve som de vil for en 50 år gammel ugift mann bosatt i Norge.
NYNORSK I begge eksamenoppgåvene vert det nytta data frå European Social Survey (ESS). Føremålet med ESS er å kartlegge samanhengen mellom institusjonelle tilhøve i dei europeiske landa og borgarane sine holdningar, verdiar og oppfatningar. Den første intervjurunden vart utført hausten 00 og data var gjevne fri for allmenn bruk hausten 00. I alt har land teke del i undersøkinga. I dei to eksamensoppgåvene er talet på land avgrensa til tre: Storbritannia, Noreg og Polen. OPPGÅVE Regresjonsanalyse (teller 50%) Den avhengige variabelen i regresjonsanalysen er ein skala (indeks) for tillit til samfunnsinstitusjonar. Sjå elles dokumentasjonen i tabellvedlegget. a) Kva for ein av dei tre modellane er den beste? b) Definer modellen for populasjonen (utan føresetnader). Ta utgangspunkt i den beste modellen. c) Er det skilnader mellom landa når det gjeld tillit til samfunnsinstitusjonar? d) Lag eit betinga effektdiagram som viser effekten av utdanning for kvart av dei tre landa. e) Vurder følgjande hypotesar: H: Alder har ein lineær effekt på tillit til samfunnsinstitusjonar. H: Kvinner har mindre tillit til samfunnsinstitusjonar enn menn. H: Utdanning har ingen effekt på tillit til samfunnsinstitusjonar i Polen. f) Vurder om føresetnadene til modell er stetta. OPPGÅVE Logistisk regresjon (teller 50%) Den avhengige variabelen i den logistiske regresjonsanalysen er freegl, som har verdien viss respondenten var heilt samd i utsagnet Gay men and lesbians should be free to live their own life as they wish. Elles har variabelen verdien null. a) Skriv ut likninga for modellen (ta med føresetnadene). b) Beskriv samanhengen mellom alder og holdning til homofile og lesbiske. c) Beskriv samanhengen mellom ekteskaplig status og holdning til homofile og lesbiske. d) Er det samspel mellom land og kjønn i modellen? e) Finn oddsratioane for å være heilt samd i at homofile og lesbiske bør få leve som dei vil mellom kvinner og menn i Storbritannia, Noreg og Polen. Kva fortel dei tre oddsratioane? f) Finn predikert sannsyn for å vere heilt samd i at homofile og lesbiske bør få leve som dei vil for ein 50 år gammal ugift mann busett i Noreg.
9.00 8.00 7.00 6.00 5.00 4.00.00.00.00 0.00 Documentasjon og tabeller for oppgave : Regresjonsanalyse Avhengig variabel: systrust en skala (indeks) er beregnet som gjennomsnittlig skåre på spørsmål om tillit til fire samfunnsinstitusjoner: Using this card, please tell me on a score of 0-0 how much you personally trust each of the institutions I read out. 0 means you do not trust an institution at all, and 0 means you have complete trust. Firstly the parliament, the legal system, the police, politicians? 700 600 500 400 00 00 00 0 Std. Dev =.97 Mean = 4.8 N = 606.00 0.00 Trust in system, mean of b7-b0 Uavhengige variabler: I regresjonsanalysen er land dummykodet med Polen som referansekategori. CNTRY Country Valid GB United Kingdom NO Norway PL Poland Cumulative Frequency Percent Valid Percent Percent 05... 06.8.8 66.0 0 4.0 4.0 00.0 698 00.0 00.0 De resterende uavhengige variablene skulle være selvforklarende, se tabellen enedenfor 4
Beskrivende statistikk for variablene i regresjonsanalysen. Descriptive Statistics SYSTRUST Trust in system, mean of b7-b0 Age squared MARRIED Married (), not married (0) EDUYRS Years of full-time education completed GB Dummy for Great Britain NO Dummy for Norway EDUK ED*GB interaction EDNO ED*no interaction Mean Std. Deviation N 4.884.96807 6066.498.50004 6066 45.6076 8.06870 6066 406.487 768.8560 6066.579.4996 6066.49.55 6066..4744 6066.7.4756 6066 4.9 6.04 6066 4.496 6.5809 6066 Resultater fra regresjonsanalysen Model Model Summary d Adjusted Std. Error of R R Square R Square the Estimate.8 a.047.047.969.475 b.5.5.704.48 c..0.770 a. Predictors: (Constant), EDUYRS Years of full-time education completed, MARRIED Married (), not married (0),, Age squared, b. Predictors: (Constant), EDUYRS Years of full-time education completed, MARRIED Married (), not married (0),, Age squared,, GB Dummy for Great Britain, NO Dummy for Norway c. Predictors: (Constant), EDUYRS Years of full-time education completed, MARRIED Married (), not married (0),, Age squared,, GB Dummy for Great Britain, NO Dummy for Norway, EDUK ED*GB interaction, EDNO ED*no interaction d. Dependent Variable: SYSTRUST Trust in system, mean of b7-b0 5
Model Regression Residual Regression Residual Regression Residual ANOVA d Sum of Squares df Mean Square F Sig..506 5.50 60.5.000 a 79.04 6060.69 49.50 6065 596.746 7 756.678 5.98.000 b 894.774 6058.00 49.50 6065 548.895 9 60. 0.4.000 c 806.65 6056.98 49.50 6065 a. Predictors: (Constant), EDUYRS Years of full-time education completed, MARRIED Married (), not married (0),, Age squared, b. Predictors: (Constant), EDUYRS Years of full-time education completed, MARRIED Married (), not married (0),, Age squared,, GB Dummy for Great Britain, NO Dummy for Norway c. Predictors: (Constant), EDUYRS Years of full-time education completed, MARRIED Married (), not married (0),, Age squared,, GB Dummy for Great Britain, NO Dummy for Norway, EDUK ED*GB interaction, EDNO ED*no interaction d. Dependent Variable: SYSTRUST Trust in system, mean of b7-b0 Model (Constant) Age squared MARRIED Married (), not married (0) EDUYRS Years of full-time education completed (Constant) Age squared MARRIED Married (), not married (0) EDUYRS Years of full-time education completed GB Dummy for Great Britain NO Dummy for Norway (Constant) Age squared MARRIED Married (), not married (0) EDUYRS Years of full-time education completed GB Dummy for Great Britain NO Dummy for Norway EDUK ED*GB interaction EDNO ED*no interaction Unstandardized Coefficients Coefficients a Standardized Coefficients a. Dependent Variable: SYSTRUST Trust in system, mean of b7-b0 Collinearity Statistics t Sig. Tolerance VIF B Std. Error Beta.406.8 8.64.000 -.05.049 -.07 -.0.04.996.004 -.0.008 -.4 -.570.6.00.44.000.000.07.868.004.00.07 -.46.056 -.07 -.6.009.790.66.5.007.5 6.87.000.884..667.65.0.000 -.044.045 -.0 -.99..99.008 -.04.007 -.77-5.7.000.00.880.000.000.98 6.097.000.00.46.05.05.07.069.09.769.0.068.007. 9.97.000.84.99.5.057.69 9.84.000.69.44.7.057.507 7.5.000.69.445 4.46.99..000 -.049.045 -.0 -.07.68.99.008 -.04.007 -.89-5.9.000.09.909.000.000.408 6.74.000.00.64.8.05.00.4.00.767.04.00.0.07.74.08.87.487.75.0.80.75.000.054 8.9.856.0.05 4.69.000.055 8.99.04.06.0.6.0.048 0.84.0.06.40 6.496.000.046.584 6
Case Number 88 804 896 96 948 965 978 0854 Casewise Diagnostics a SYSTRUST Trust in system, mean Predicted Std. Residual of b7-b0 Value Residual -.046.00 5.60-5.60 -.5.75 6.475-5.975 -.0.00 5.7047-5.7047 -.90.00 5.5097-5.5097 -.09.75 5.98-5..80 9.5.5858 5.664.657 0.00.6848 6.5. 9.50.7784 5.76 a. Dependent Variable: SYSTRUST Trust in system, mean of b7-b0 700 600 Histogram Dependent Variable: Trust in system, mean of 500 400 00 Frequency 00 00 0 Std. Dev =.00 Mean = 0.00 N = 6066.00 Regression Standardized Residual Normal P-P Plot of Regression Standardized Residual.75.5.75.5.75.5.75.5 -.5 -.75 -.5 -.75 -.5 -.75 -.5.00 Dependent Variable: Trust in system, mean of b7-b0.75 Expected Cum Prob.50.5 0.00 0.00.5.50.75.00 Observed Cum Prob 7
4 Scatterplot Dependent Variable: Trust in system, mean of Regression Standardized Residual 0 - - - -4 - - 0 4 Regression Standardized Predicted Value Documentasjon og tabeller for oppgave : Logistisk regresjon Variabeldokumentasjon Avhengig variabel: FREEGL Gay and lesbians free to live as they wish Valid Missing.00 Agree,Not agree.00 Agree strongly System Cumulative Frequency Percent Valid Percent Percent 4989 80.5 8. 8. 997 6. 6.7 00.0 5986 96.6 00.0.4 698 00.0 Uavhengige variabler: (NB: interaksjonen mellom land og kjønn mangler her på grunn av at SPSS beregner selv Cntry*Female på kladd) Descriptive Statistics MARRIED Married (), not married (0) CNTRY Valid N (listwise) N Minimum Maximum Mean Std. Deviation 698.00.00.50.50004 68 5.00 98.00 45.789 8.9806 685.00.00.54.49945 698.00.00.0094.8947 674 8
Logistic Regression Unweighted Cases a Selected Cases Unselected Cases Case Processing Summary Included in Analysis Missing Cases N Percent 5967 96..7 698 00.0 0.0 698 00.0 a. If weight is in effect, see classification table for the total number of cases. Dependent Variable Encoding Original Value.00 Agree,Not agree.00 Agree strongly Internal Value 0 Categorical Variables Codings CNTRY.00 Great Britain.00 Norway.00 Polen Parameter coding Frequency () () 0.000.000 04.000.000 90.000.000 Block : Method = Enter Step Model Summary - Log Cox & Snell Nagelkerke likelihood R Square R Square 505.46 a.056.095 a. Estimation terminated at iteration number 5 because parameter estimates changed by less than.00. 9
Step a MARRIED CNTRY CNTRY() CNTRY() CNTRY * CNTRY() by CNTRY() by Constant Variables in the Equation B S.E. Wald df Sig. Exp(B) -.076.58..69.96 -.04.00.660.000.976 -.76.076 5.97.00.88 9.59.000.549.47.987.000.7.74.8 8.948.000.098 6.588.000.60.99 9.0.00.86.778.9 6.9.000.78 -.0.4 80.600.000.0 a. Variable(s) entered on step :,, MARRIED, CNTRY, CNTRY *. 0