1 SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE Eksamensdag: 8 desember 1997 Eksamensstad: Dragvoll, paviljong C, rom 201 Tid til eksamen: 6 timar Vekt: 5 for SOS301 og 4 for SOS31/ SOS311 Talet på sider med nynorsk: 20 Dato for sensur: 5 januar 1998 Hjelpemiddel som kan nyttast: Kalkulator. Norsk-engelsk/ engelsk-norsk ordbok. Hamilton, L.C. 1992 "Regression with Graphics" Ringdal,K. 1987 "Kausalanalyse i samfunnsvitenskap" Kompendium for SOS31/ SOS311 og SOS301: Multivariat analyse Oppgåvene 1, 2, 3a og 3b skal løysast av alle. Oppgåvene 3c og 3d skal løysast berre av dei som skal ha eksamen i SOS31/ SOS311. Oppgåve 4 skal løysast berre av dei som skal ha eksamen i SOS301
2 NB OPPGÅVENE 1, 2, 3A OG 3B SKAL LØYSAST AV ALLE Oppgåve 1(tel 10% i karakteren for alle) A) Forklar kva ein ordningsobservator (som t.d. median) er for noko. B) Forklar ved hjelp av eit diagram korleis vi kan tolke parametrane i den logistiske funksjonen Y i = α / [1+γ*exp{-βx i}] + ε i Oppgåve 2 (tel 50% av karakteren for alle) I vedlagte tabellar er det estimert ein modell av eiga utdanning. A) Finn den forventa utdanninga til ei 44 år gammal ugift kvinne når du får vite at mor hennar hadde 9 års utdanning og far hennar 10 år. Forklar kva effekten av «Kvinne» tyder og finn eit 95% konfidensintervall for den når du ikkje tar omsyn til interaksjonseffektane. B) Drøft på bakgrunn av vedlagte tabellar for modellen av eiga utdanning i kva grad ein kan seie at føresetnadene for å kunne dra valide konklusjonar er oppfyllt. C) Definer modellen som er estimert og skriv ut likninga for eit betinga effekt plott for verknaden av alder på eiga utdanning for kvinner med foreldre som har gjennomsnittleg utdanning. D) Gi ei substansiell tolking av regresjonsresultata med utgangspunkt i betinga effekt plottet som er lagt ved tabellane.
3 Oppgåve 3A og 3B (tel 20% av karakteren for alle) Diagrammet nedanfor illustrerer resultata frå ein rekursiv stimodell med Vassdragsutbygging som siste variabel og med forklaringsvariablane Eiga inntekt, Eiga utdanning, Alder, Kvinne og Offentleg sektor. ζ 2 X 1 =Alder 0,17 Y 2 =Eiga inntekt 0,04-0,04-0,05-0,34 X 3 =Offentleg sektor 0,12 0,21-0,06 ζ 3 Y 3 =Vassdragsutbygging 0,013 X 2 = Kvinne -0,33-0,05 0,34 Y 1 =Eiga utdanning -0,06-0,04 ζ 1 A) Finn ved hjelp av diagrammet den totale kausaleffekten av Eiga Utdanning på Vassdragsutbygging B) Finn ved hjelp av diagrammet eit estimat av korrelasjonen mellom Eiga inntekt og Eiga utdanning. Gjer greie for framgangsmåten.
4 OPPGÅVE 3C OG 3D SKAL LØYSAST BERRE AV DEI SOM SKAL HA EKSAMEN I SOS31/ SOS311 Oppgåve 3C og 3D (tel 20% av karakteren for SOS31/ SOS311) C) Skriv ned likningssystemet som definerer modellen og gjer greie for kva føresetnader som må vere oppfyllt for å kunne dra konklusjonar med kjent grad av tryggleik D) Forklar kva ein felleseffekt er for noko og vis korleis ein kan finne felleseffektane i korrelasjonen mellom Vassdragsutbygging og Eiga utdanning. OPPGÅVE 4 SKAL LØYSAST BERRE AV DEI SOM SKAL HA EKSAMEN I SOS301 Oppgåve 4 (tel 20% av karakteren for SOS301) A) Forklar tankegangen bak den lineære sannsynsmodellen (LPM) og kommenter føresetnadene den kviler på. I vedlagte tabellar er det estimert to logit modellar av sannsynet for å vere ugift betinga av alder og kjønn. B) Definer modellen som er estimert i modell 2. Forklar kva skilnaden er mellom modell 1 og 2 og test om den er signifikant. Finn oddsen for å vere ugift for 30 år gamle kvinner.
5 OPPGÅVE 2 DEFINISJON AV VARIABLAR 7 9 12 14 18 7 9 12 14 18 Frequencies Level Count Probability Cum Prob 7 385 0,14371 0,14371 9 616 0,22994 0,37365 12 1015 0,37887 0,75252 14 345 0,12878 0,88130 18 318 0,11870 1,00000 Total 2679 Kvinne Frequencies Level Count Probability Cum Prob 0 1335 0,49832 0,49832 1 1344 0,50168 1,00000 Total 2679
6 OPPGÅVE 2 DEFINISJON AV VARIABLAR Mors utd år 7 9 12 14 7 9 12 14 Frequencies Level Count Probability Cum Prob 7 1466 0,54722 0,54722 9 621 0,23180 0,77902 12 379 0,14147 0,92049 14 213 0,07951 1,00000 Total 2679 Mean 8,728 Std Dev 2,319 Std Error Mean 0,045 N 2679,000 Fars utd år 7 9 12 14 7 9 12 14 Frequencies Level Count Probability Cum Prob 7 1337 0,49907 0,49907 9 496 0,18514 0,68421 12 484 0,18066 0,86487 14 362 0,13513 1,00000 Total 2679 Mean 9,219 Std Dev 2,637 Std Error Mean 0,051 N 2679
7 OPPGÅVE 2 DEFINISJON AV VARIABLAR Alder 4.999.99.95.90.75.50.25.10.05.01.001 3 2 1 0-1 -2-3 Normal Quantile -4 20 30 40 50 60 70 80 90 Quantiles maximum 100.0% 94,000 quartile 75.0% 50,000 median 50.0% 35,000 quartile 25.0% 25,000 minimum 0.0% 15,000 Moments Mean 39,202 Std Dev 17,415 Std Error Mean 0,336 N 2679,000
8 Dependent variable: RSquare 0,248759 RSquare Adj 0,24679 Root Mean Square Error 2,780187 Mean of dependent variable 11,5614 N 2679 Parameter Estimates Variable Estimate Std Error t Prob> t Beta VIF= 1/toleranse (Constant) 4,0732647 0,548065 7,43 <,0001.. Alder 0,1845434 0,01672 11,04 <,0001 1,003 29,378 Alder**2-0,002313 0,000176-13,14 <,0001-1,166 28,019 Kvinne -1,127005 0,444754-2,53 0,0113-0,176 17,140 Mors utd år 0,1783773 0,044722 3,99 <,0001 0,129 3,726 Fars utd år 0,3402916 0,038447 8,85 <,0001 0,280 3,562 Kvinne*Mors utd 0,1579943 0,061075 2,59 0,0097 0,230 28,223 Kvinne*Fars utd -0,067756 0,053703-1,26 0,2072-0,105 24,727 Corr (Constant) Alder Alder **2 Correlation of Estimates Kvinne Mors utd år Fars utd år Kvinne* Mors utd Kvinne* Fars utd (Constant) 1....... Alder -0,762 1...... Alder**2 0,681-0,978 1..... Kvinne -0,433 0,027-0,016 1.... Mors utd år -0,426 0,145-0,102 0,329 1... Fars utd år -0,261 0,066-0,049 0,235-0,614 1.. Kvinne*Mors utd 0,195 0,002-0,008-0,475-0,695 0,466 1. Kvinne*Fars utd 0,158-0,029 0,027-0,334 0,451-0,711-0,650 1
9 Whole-Model Test 18 17 16 15 14 13 12 11 10 9 8 7 4 5 6 7 8 9 10 11 12 14 15 16 18 Predicted Analysis of Variance Source DF Sum of Squares Mean Square F Ratio Model 7 6836,312 976,616 126,3501 Error 2671 20645,338 7,729 Prob>F C Total 2678 27481,649 <,0001 Residual 11 9 7 5 3 1-1 -3-5 -7 4 5 6 7 8 9 10 11 12 14 15 16 18 Predicted
10 Alder 20 18 16 14 12 10 8 6 4 20 30 40 50 60 70 80 90 Alder Leverage 20 18 16 Effect Test Sum of Squares F Ratio DF Prob>F 941,57745 121,8170 1 <,0001 Alder**2 14 12 10 8 6 4 0 1000 3000 5000 7000 9000 Alder**2 Leverage Effect Test Sum of Squares F Ratio DF Prob>F 1334,2922 172,6247 1 <,0001
11 Kvinne 20 10 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Kvinne Leverage Effect Test Sum of Squares F Ratio DF Prob>F 49,631736 6,4211 1 0,0113 Mors utd år 21 19 17 15 13 11 9 7 5 4 5 6 7 8 9 10 11 12 13 14 15 Mors utd år Leverage Effect Test Sum of Squares F Ratio DF Prob>F 122,96657 15,9089 1 <,0001
12 Fars utd år 20 10 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Fars utd år Leverage Effect Test Sum of Squares F Ratio DF Prob>F 605,52688 78,3403 1 <,0001 Kvinne*Mors utd 20 10 0 1 2 3 4 5 6 7 8 9 10 11 12 14 Kvinne*Mors utd Leverage Effect Test Sum of Squares F Ratio DF Prob>F 51,725162 6,6920 1 0,0097
13 Kvinne*Fars utd 20 10 0 1 2 3 4 5 6 7 8 9 10 11 12 14 Kvinne*Fars utd Leverage Effect Test Sum of Squares F Ratio DF Prob>F 12,304004 1,5918 1 0,2072
14 Residual 4.999.99.95.90.75.50.25.10.05.01.001 3 2 1 0-1 -2-3 Normal Quantile -4-7 -5-3 -1 1 2 3 4 5 6 7 8 9 10 Quantiles maximum 100.0% 10,850 99.5% 7,931 97.5% 6,645 90.0% 3,886 quartile 75.0% 1,294 median 50.0% -0,242 quartile 25.0% -1,956 10.0% -3,290 2.5% -4,325 0.5% -5,332 minimum 0.0% -6,803 Moments Mean -0,000 Std Dev 2,777 Std Error Mean 0,054 Upper 95% Mean 0,105 Lower 95% Mean -0,105 N 2679,000
15 h(i) 4.999.99.95.90.75.50.25.10.05.01.001 3 2 1 0-1 -2-3 Normal Quantile -4 0,00 0,01 0,02 Quantiles maximum 100.0% 0,02058 99.5% 0,01189 97.5% 0,00835 90.0% 0,00534 quartile 75.0% 0,00388 median 50.0% 0,00224 quartile 25.0% 0,00165 10.0% 0,00160 2.5% 0,00102 0.5% 0,00093 minimum 0.0% 0,00092 Moments Mean 0,003 Std Dev 0,002 Std Error Mean 0,000 Upper 95% Mean 0,003 Lower 95% Mean 0,003 N 2679,000
16 Cook s D(i) Influenc.999.99.95.90.75.50.25.10.05.01.001 4 3 2 1 0-1 -2-3 -4 Normal Quantile 0,00 0,01 0,02 Quantiles maximum 100.0% 0,01986 99.5% 0,00478 97.5% 0,00236 90.0% 0,00098 quartile 75.0% 0,00038 median 50.0% 0,00012 quartile 25.0% 0,00003 10.0% 0,00001 2.5% 0,00000 0.5% 0,00000 minimum 0.0% 0,00000 Moments Mean 0,000 Std Dev 0,001 Std Error Mean 0,000 Upper 95% Mean 0,000 Lower 95% Mean 0,000 N 2679,00
17 Case med høg Cook s D(i) E.utd. Cook s D(i) Case nr E.utd år Alder Kvinne E.inntekt i 1000 Mors utd år Fars utd år 0,0050 2318 7 16 0 7 14 0,0051 945 12 86 0 180 7 7 0,0052 1336 18 25 1 250 14 7 0,0061 1335 18 37 0 250 14 7 0,0062 1945 18 71 1 80 7 12 0,0063 1334 18 29 0 60 14 7 0,0065 2268 18 78 0 12 12 0,0071 1317 18 66 0 180 12 7 0,0079 1473 18 79 0 180 7 9 0,0088 1123 18 79 0 115 7 7 0,0101 1124 18 80 0 145 7 7 0,0199 1475 18 86 0 180 7 9 Cook s D(i) Case nr Estimert Residual h(i) 0,0050 2318 12,45-5,45 0,0102 0,0051 945 6,47 5,53 0,0101 0,0052 1336 12,73 5,27 0,0114 0,0061 1335 12,61 5,39 0,0126 0,0062 1945 10,01 7,99 0,006 0,0063 1334 12,36 5,64 0,012 0,0065 2268 10,62 7,38 0,0073 0,0071 1317 10,7 7,3 0,0081 0,0079 1473 8,53 9,47 0,0054 0,0088 1123 7,85 10,15 0,0052 0,0101 1124 7,67 10,33 0,0058 0,0199 1475 7,15 10,85 0,0102
18 Betinga effekt plott av alderen sin verknad på utdanning for menn og kvinner etter foreldra si utdanning 15 14 13 12 11 10 9 8 7 6 5 4 20 30 40 50 60 70 80 90 Alder Bet eff.ald for Kv med H.utd far/m Bet eff.ald for Ma med H.utd far/m Bet eff. ald for Ma med L.utd far/m Bet eff. ald for Kv med L.utd far/m H.utd = 14 år L.utd = 7 år
19 OPPGÅVE 4 DEFINISJON AV VARIABLAR alder er koda med alder i heile år alderi2 er alder kvadrert Variable N Mean Std. Dev. Min Max alder 1890 42.10952 16.06861 16 74 alderi2 1890 2031.276 1458.572 256 5476.119048 0 16 75 alder mann er koda 1 for menn og 0 for kvinner mann Freq. Percent Cum. 0 947 50.11 50.11 1 943 49.89 100.00 Total 1890 100.00
20 OPPGÅVE 4 MODEL 1 Logit regresjon med «ugift» som avhengig variabel 1 Iteration 0: Log Likelihood = -1030.341 Iteration 1: Log Likelihood = -826.25368 Iteration 2: Log Likelihood = -798.12826 Iteration 3: Log Likelihood = -795.96854 Iteration 4: Log Likelihood = -795.94825 Iteration 5: Log Likelihood = -795.94825 Logit Estimates Number of obs = 1890 chi2(2) = 468.79 Prob > chi2 = 0.0000 Log Likelihood = -795.94825 ugift Coef. Std. Err. t P> t mean alder -0.09730 0.0058143-16.735 0.000 42.10952 mann 0.55024 0.1251002 4.398 0.000 0.4989418 _cons 2.07224 0.2028193 10.217 0.000 OPPGÅVE 4 MODEL 2 Logit regresjon med «ugift» som avhengig variabel 1 Iteration 0: Log Likelihood = -1030.341 Iteration 1: Log Likelihood = -696.57014 Iteration 2: Log Likelihood = -674.13324 Iteration 3: Log Likelihood = -673.46616 Iteration 4: Log Likelihood = -673.46473 Logit Estimates Number of obs = 1890 chi2(3) = 713.75 Prob > chi2 = 0.0000 Log Likelihood = -673.46473 ugift Coef. Std. Err. t P> t mean alder -0.49505 0.0288983-17.131 0.000 42.10952 alderi2 0.00474 0.0003133 15.126 0.000 2031.276 mann 0.75210 0.1432123 5.252 0.000 0.4989418 _cons 9.17584 0.5613369 16.346 0.000 1 Kommentar fra Erling Berge januar 2000: Ved ein feil er kodane for «Ugift» og «Ikkje ugift» bytt om. Modellane som er estimert må såleis tolkast ut frå at Y=1 tyder «Ikkje ugift» og Y=0 «Ugift».