Eksamensoppgaver/ Examination questions SOS36 2/5/22 NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS36 REGRESJONSANALYSE Eksamensdag: 22 mai 2 Eksamensstad: Dragvoll Tid til eksamen: 6 timar Vekter: 5 Talet av sider med tekst: 52 Talet av sider bokmål: - Talet av sider nynorsk: 4 Talet av sider engelsk: - Talet av sider vedlegg: 48 Dato for sensur: Hjelpemiddel som kan nyttast: Kalkulator Norsk-engelsk/ engelsk-norsk ordbok Hamilton, Lawrence C 992 «Regression with Graphics», Belmont, Duxbury, Hardy, Melissa A 993 «Regression with Dummy Variables», QASS 93, London, Sage Breen, Richard 996 «Regression Models Censored, Sample Selected, or Truncated Data», QASS, London, Sage
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE (vekt,) a) Forklar kva glatting (smoothing) er b) Korleis kan ein nytte dummyvariablar til å teste for kurvesamanhengar? OPPGÅVE 2 (OLS-regresjon, vekt,45) I tabellvedlegget til oppgåve 2 er det estimert 8 modellar av eiga inntekt (Einntekt) Modellane -6 nyttar estimerte verdiar for manglande inntektsopplysningar, modellane og 8 utelet personane der opplysningar mangla a) Bruk modell for å finne eit konfidensintervall for effekten av å ha heiltidsarbeid Vurder om det er ein lineær eller kurvelineær samanheng mellom alder og inntekt Finn ut frå modell 3 forventa inntekt for ei 4 år gammal kvinne med 2 års utdanning og heiltidsarbeid ved NTNU b) Formuler den modellen som er estimert som Modell 4 Vurder om testane i modell 4 er truverdige Test om bustad gir ei signifikant yting til å forklare variasjonen i inntekt c) Modell 6 er identisk med modell 4 men er estimert utan den personen som har størst innverknad på estimatet av modell 4 Kva kan seiast om denne personen? Kva konsekvensar har det for regresjonsresultatet at personen vert utelaten? d) Manglande opplysningar i variabelen Einntekt m/ est missing er erstatta med eit estimat frå Modell Modell er identisk med modell 3 men er estimert på faktiske observasjonar Drøft generelt problemet med manglande observasjonar på avhengig variabel Vurder konkret og substanisielt skilnadene mellom Modell 3 og i estimerte effektar for Mann og Offentleg sektor
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 (Logistisk regresjon, vekt,45) I tabellvedlegget til oppgåve 3 er det estimert 4 ulike modellar av Besøke lokalt kunstgalleri a) Lag eit konfidensintervall for effekten av Mors utdanning i modell Korleis tolkar ein parameterestimatet for Mors utdanning? b) Formuler den modellen som er estimert i modell 3 Finn ut om Bustadstype gir eit signifikant bidrag til modellen Vurder om føresetnadene for modellen kan seiast å vere stetta c) Bruk modell 4 til å finne forventa verdi av sannsynet for å vitje det lokale kunstgalleriet for ein 5 år gammal mannleg universitetslærar frå Trondheim med 9 års utdanning når du også får vite at mor hans hadde 8 års utdanning Skriv opp formelen for å finne betinga effektplott for samanhengen mellom sannsyn og alder d) Kva er definisjonen av Oddsen for å vitje lokalt kunstgalleri for den persontypen som er definert i pkt c)? Bruk definisjonen og modell 3 til å finne oddsraten for å velje å vitje lokalt kunstgalleri mellom ein mann med 9 års utdanning og ein med 8 års utdanning
Eksamensoppgaver/ Examination questions SOS36 2/5/22
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 Variabeldefinisjonar/ OPPGAVE 2 Variabeldefinisjoner/ QUESTION 2 Definition of variables Einntekt = bruttoinntekt til intervjupersonen i kr, er koda 3, dersom personen seier bruttoinntekta er i intervallet -6 8, dersom personen seier bruttoinntekta er i intervallet 6-5, dersom personen seier bruttoinntekta er i intervallet -3 4, dersom personen seier bruttoinntekta er i intervallet 3-6 8, dersom personen seier bruttoinntekta er i intervallet 6-2 25, dersom personen seier bruttoinntekta er i intervallet 2-3 35, dersom personen seier bruttoinntekta er i intervallet 3-4 45, dersom personen seier bruttoinntekta er i intervallet 4+ 998, dersom personen ikkje vil svare 999, dersom opplysningar manglar kodane 998 og 999 er i somme modellar erstatta med eit regresjonsestimat basert på dei personane som har valide inntektsdata Einntekt = bruttoinntekt til intervjupersonen i kr, er kodet 3, hvis personen sier bruttoinntekta er i intervallet -6 8, hvis personen sier bruttoinntekta er i intervallet 6-5, hvis personen sier bruttoinntekta er i intervallet -3 4, hvis personen sier bruttoinntekta er i intervallet 3-6 8, hvis personen sier bruttoinntekta er i intervallet 6-2 25, hvis personen sier bruttoinntekta er i intervallet 2-3 35, hvis personen sier bruttoinntekta er i intervallet 3-4 45, hvis personen sier bruttoinntekta er i intervallet 4+ 998, hvis personen ikke vil svare 999, hvis opplysninger mangler kodene 998 og 999 er i noen modeller erstattet med et regresjonsestimat basert på de personene son har valide inntektsdata Einntekt (own income) = gross income of interviewee in kr, has been coded 6, if the person says the gross income is in the range of -6 9, if the person says the gross income is in the range of 6-2, if the person says the gross income is in the range of -3 5, if the person says the gross income is in the range of 3-6 8, if the person says the gross income is in the range of 6-2 25, if the person says the gross income is in the range of 2-3 35, if the person says the gross income is in the range of 3-4 45, if the person says the gross income is in the range of 4+ 998, if the person will not answer 999, if data is missing the codes 998 and 999 are in some models replaced by a regression estimate based on the persons with valid income data
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 Variabeldefinisjonar/ OPPGAVE 2 Variabeldefinisjoner/ QUESTION 2 Definition of variables 6 4 2 Count Axis 6 9 2 8 35 998 5 25 45 999 Einntekt Mann Man Frequencies Income level Count Prob 6 63 294 9 396 3433 2 26 8853 5 39 2856 8 435 456 25 399 3535 35 94 389 45 5 934 998= unwilling to answer 9 62 999= missing 35 459 Total 2948 missing utelaten/ utelatt/ excluded Frequencies Income Level Count Prob 6 63 2323 9 396 534 2 26 999 5 39 4389 8 435 655 25 399 548 35 94 3569 45 5 264 Total 2634 Frequencies Level Count Prob 53 5984 = mann (man) 445 496 Total 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 Variabeldefinisjonar/ OPPGAVE 2 Variabeldefinisjoner/ QUESTION 2 Definition of variables Heiltidsarbeid =, ja,arbeider heil dag; = andre svar (deltid, varierer, nei, missing) Heiltidsarbeid =, ja, arbeider hel dag; = andre svar (deltid, varierer, nei, missing) Heiltidsarbeid =, yes, full time employment; =other answers (part time, varying, no, missing) Frequencies Level Count Prob 669 5665 = heiltid (full time) 29 43385 Total 2948 Offentleg sektor =, arbeider i offentleg sektor; = andre svar (privat, andre svar, missing) Offentleg sektor =, arbeider i offentlig sektor; = andre svar (privat, andre svar, missing) Offentleg sektor =, employed by public sector; = other answers (privat, other answers, missing) Frequencies Level Count Prob 23 2286 = ansatt (employed) 8 24 Total 2948 Alder = alder i år Alder = age in years 3 2 Count Axis 2 3 4 5 6 8 9 Quantiles % maximum 94 5% quartile 5 5% median 35 25% quartile 25 % minimum 5 Moments Mean 38885 Std Dev 449 Std Err Mean 3235 upper 95% Mean 3955 lower 95% Mean 382549 N 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 Variabeldefinisjonar/ OPPGAVE 2 Variabeldefinisjoner/ QUESTION 2 Definition of variables Eutdanning = «eiga utdanning i år» er koda dersom personen har utdanning på folkeskolenivå (inntil 8 års skolegang) 9 dersom personen har utdanning på ungdomsskole/ realskolenivå (9- års skolegang) 2 dersom personen har utdanning på videregående skole/ gymnas nivå (-3 års skolegang) 4 dersom personen har utdanning på universitetsnivå (meir enn 2 års skolegang + studiar), men er uten akademisk tittel dersom personen har utdanning på universitetsnivå (meir enn 2 års skolegang + studiar), og har akademisk tittel Eutdanning = «egen utdanning i år» er kodet hvis personen har utdanning på folkeskolenivå (inntil 8 års skolegang) 9 hvis personen har utdanning på ungdomsskole/ realskolenivå (9- års skolegang) 2 hvis personen har utdanning på videregående skole/ gymnas nivå (-3 års skolegang) 4 hvis personen har utdanning på universitetsnivå (mer enn 2 års skolegang + studier), men er uten akademisk tittel hvis personen har utdanning på universitetsnivå (mer enn 2 års skolegang + studier), og har akademisk tittel Eutdanning = «own education in years» has been coded if the person has education at the level of primary school (up to 8 years of education) 9 if the person has education at the level of secondary school (9- years of education) 2 if the person has education at the level of high school (-3 years of education) 4 if the person has education at college level (more than 2 years of education + college studies), but without academic title if the person has education at college level (more than 2 years of education + college studies), and with academic title 5 5 25 Count Axis 9 2 4 Frequencies Years Count Prob 45 63 9 68 2366 2 92 342 4 3 2585 33 94 Total 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 Variabeldefinisjonar/ OPPGAVE 2 Variabeldefinisjoner/ QUESTION 2 Definition of variables Bustadstype = bustadstype er svar på spørsmålet: Kva for ein av dei omtala bustadane liknar mest på den du har i dag? Sentrum av storby, Forstad til storby, Småby, Tettstad i landkommune eller Spredtbygd Bustadstype = bostedstype er svar på spørsmålet: «Hvilke av de beskrevne bostedene ligner mest på det du har i dag? Sentrum av storby, Forstad til storby, Småby, Tettsted i landkommune eller Spredtbygd» Bustadstype = type of home town is the answer to the questionwhich of the described places resembles closest where you live today? Center of city, suburb to city, small town, village, sparsely settled 5 5 25 Count Axis 3 25 2 5 5 Probability Axis 2 3 4 5 6 Frequencies Type Count Prob = sentrum av storby (center of city) 354 28 2 = forstad til storby (suburb of city) 562 964 3 = småby (small town) 5 3 4 = tettstad i landkommune (village) 969 328 5 = spredbygd (sparsely settled) 492 6689 6 = ukjent (unknown) 6 269 Total 2948 Bost type er dummykoda med Bost Sentrum storby = dersom bustaden ligg i sentrum av storby, elles Bost Forst storby = dersom bustaden ligg i forstad til storby, elles Bost Småby = dersom bustaden ligg i småby, elles Bost Tettst = dersom bustaden ligg i tettstad i landkommune, elles Bost Spredtb = dersom bustaden ligg i spredtbygde strok, elles Bost Uoppg = dersom det ikkje er oppgitt kvar bustaden ligg, elles Bost type er dummykodet med Bost Sentrum storby = hvis bostedet ligger i sentrum av storby, ellers Bost Forst storby = hvis bostedet ligger i forsted til storby, ellers Bost Småby = hvis bostedet ligger i småby, ellers Bost Tettst = hvis bostedet ligger i tettsted i landkommune, ellers Bost Spredtb = hvis bostedet ligger i spredtbygd område, ellers Bost Uoppg = hvis det ikke er oppgitt hvor bostadet ligger, ellers Bosttype has been dummy coded with Bost Sentrum storby = if the home town is center of city, otherwise Bost Forst storby = if the home town is suburb of city, otherwise Bost Småby = if the home town is small town, otherwise Bost Tettst = if the home town is village, otherwise Bost Spredt = if the home town is sparsely settled, otherwise Bost Uoppg = if the home town is unknown, otherwis
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 Variabeldefinisjonar/ OPPGAVE 2 Variabeldefinisjoner/ QUESTION 2 Definition of variables Kjelde til livsopphald = kjelde til livsopphald Kjelde til livsopphald = kilde til livsopphold Kjelde til livsopphald = source of livelihood 4 3 2 Count Axis 5 5 Probability Axis 2 3 4 5 6 8 9 2 Frequencies Code Count Prob Arbeidar, ufaglært (Worker, unbskilled) 42 424 2 Arbeidar, faglært (Worker, skilled) 489 6588 3 Funksjonær, leiande, (While collar worker, manager) 264 8955 4 Funksjonær elles (White collar worker otherwise) 32 855 5 Sjølvstendig (Self employed) 58 6 Elev/ student/ lærling (Student) 463 56 For tida arbeidslaus (Currently unemployed) 99 3358 8 Alderspensjonist (Pensioner) 255 865 9 Trygda (Social security) 232 8 Gift utan betalt arbeid (Married without paid work) 9 268 Andre kjelder (Other sources) 363 2 Uoppgitt (No answer) 49 662 Total 2948 Kjelde til livsopphald er dummykoda med Arbeider = dersom personen er faglært eller ufaglært arbeidar (kode og 2), elles Funksjonær = dersom personen er funksjonær (inkl leiande funksjonær) (kode 3 og 4), elles Selvstendig = dersom personen er sjølvstendig (kode 5), elles Elev/ student = dersom personen er elev, student eller lærling (kode 6), elles Pensjon/ trygd = dersom personen er alderspensjonist eller trygda (kode 8 og 9), elles Annet = dersom personen er arbeidslaus, gift uten eige betalt arbeid eller har anna type forsørging (kode, og ), elles Uoppgitt KtL = dersom personen ikkje har svart på spørsmålet, elles
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 Variabeldefinisjonar/ OPPGAVE 2 Variabeldefinisjoner/ QUESTION 2 Definition of variables Kjelde til livsopphald er dummykodet med Arbeider = hvis personen er faglært eller ufaglært arbeider (kode og 2), ellers Funksjonær = hvis personen er funksjonær (inkl ledende funksjonær) (kode 3 og 4), ellers Selvstendig = hvis personen er selvstendig (kode 5), ellers Elev/ student = hvis personen er elev, student eller lærling (kode 6), ellers Pensjon/ trygd = hvis personen er alderspensjonist eller trygdet (kode 8 og 9), ellers Annet = hvis personen er arbeidsløs, gift uten ege tbetalt arbeid eller har annen type forsørging (kode, og ), ellres Uoppgitt KtL = hvis personen ikke har svart på spørsmålet, ellers Kjelde til livsopphald has been dummy coded with Arbeider = if the person is skilled or unskilled worker (code og 2), otherwise Funksjonær = if the person is white collar worker or manager (code 3 og 4), otherwise Selvstendig = if the person is selfemployed (code 5), otherwise Elev/ student = if the person is student (code 6), otherwise Pensjon/ trygd = if the person is pensioner (code 8 og 9), otherwise Annet = if the person is unemployed, married without paid work or has other source of livelihood (code, og ), otherwise Uoppgitt KtL = if the person did not answer the question, otherwise
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2 / OPPGAVE 2 Modell /QUESTION 2 Model Response Einnt m/ est missing Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 53328 RSquare Adj 525 Root Mean Square Error 69234 Mean of Response 45834 Observations (or Sum Wgts) 2948 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 5 89466 238953 626282 Error 2942 29 3833 Prob > F C Total 294 23856 Parameter Estimates Term Estimate Std Error t Ratio Prob> t VIF Intercept -462458 6885-6 < Alder 458 6893 655 < 588 Mann 329589 23943 33 < 984 Eutdanning 593284 46488 85 < 9258 Heiltidsarbeid 98885 2499229 3954 < 99326 Offentleg sektor 25528 25888 94 3458 2888 Residual by Predicted Plot Einnt m/ est missing Residual 3 2 - -2 2 3 4 Einnt m/ est missing Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 2 /QUESTION 2 Model 2 Response Einnt m/ est missing Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 554366 RSquare Adj 55345 Root Mean Square Error 592545 Mean of Response 45834 Observations (or Sum Wgts) 2948 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 6 2845699 2495 69655 Error 294 3265 35 Prob > F C Total 294 23856 Parameter Estimates Term Estimate Std Error t Ratio Prob> t VIF Intercept -444565 8395-36 < Alder 69549 359564 935 < 333548 Mann 35696 23343 522 < 329 Eutdanning 222898 3996 8 < 944399 Heiltidsarbeid 83854 25382 3232 < 366933 Offentleg sektor -626229 2644524-23 9 633 Alder*Alder -6483 394-646 < 339252 Residual by Predicted Plot Einnt m/ est missing Residual 3 2 - -2 2 3 4 Einnt m/ est missing Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 3 /QUESTION 2 Model 3 Response Einnt m/ est missing Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 569 RSquare Adj 5533 Root Mean Square Error 59855 Mean of Response 45834 Observations (or Sum Wgts) 2948 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 3363643 248 3636624 Error 2936 98823 334 Prob > F C Total 294 23856 Parameter Estimates Term Estimate Std Error t Ratio Prob> t Intercept -68 5386-589 < Alder 436386 46325 96 < Mann -5888 66992-655 < Eutdanning 55243 588 94 < Heiltidsarbeid 6689826 3468928 928 < Offentleg sektor 98839 34846 264 84 Alder*Alder -426 525-9 < Alder*Mann 4528342 9 63 < Alder*Alder*Mann -4529 84-55 < Eutdanning*Mann 34969 865 38 Heiltidsarbeid*Mann 293483 54662 5 < Offentleg sektor*mann -399 52596-58 < Residual by Predicted Plot Einnt m/ est missing Residual 3 2 - -2 2 3 4 Einnt m/ est missing Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 3 /QUESTION 2 Model 3 Distributions Residual Einnt(EM) Modell 3 3 525 5 5995 99999 2 - -2 25 5 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 326 995% 2334 95% 58 9% 6544 5% quartile 223 5% median -349 25% quartile -335 % -659 25% -3 5% -424 % minimum -259 Moments Mean 4e-4 Std Dev 56955 Std Err Mean 625298 upper 95% Mean 28343 lower 95% Mean -28343 N 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 3 /QUESTION 2 Model 3 Response Einnt m/ est missing Prediction Profile The change in predicted response as you vary one factor at a time, holding the other factors at their current values Click in the graph to change the current values of the factors Einnt m/ est missing 45 835342 5 4 94 2 Alder Mann Eutdanning Heiltidsarbeid Offentleg sektor Interaction Profiles The change in predicted response by the variable named in the diagonal and for low and high values of the variable named on the right side of the row Einnt(EM) Einnt(EM) Einnt(EM) Einnt(EM) Einnt(EM) 36 24 2 36 24 2 36 24 2 36 24 2 36 24 2 Alder Mann 5 94 Eutdanning 5 94 Heiltidsarbeid 5 94 5 94 Offentleg sektor Alder Mann Eutdanning Heiltidsarbeid Offentleg sektor 4345 869 55 65 55 55 Meir om lesing av plottet er gitt under vedlegg til oppgåve 3 Mer om lesning av plottet er gitt under vedlegg til oppgave 3 More on the reading of the plot is presented in attachements to question 3
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 4 /QUESTION 2 Model 4 Response Einnt m/ est missing Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 6962 RSquare Adj 6669 Root Mean Square Error 55659 Mean of Response 45834 Observations (or Sum Wgts) 2948 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 22 42682 64299 26285 Error 2925 94564 393 Prob > F C Total 294 23856 Parameter Estimates Term Estimate Std Error t Ratio Prob> t VIF Intercept -2556 22589-2 36 Alder 2856639 493533 564 < 6686 Mann -986363 56582-632 < 589644 Eutdanning 4488848 582243 < 288532 Heiltidsarbeid 4896 364584 3 < 322989 Offentleg sektor 6699 3488949 2 446 2324622 Alder*Alder -2659 5383-493 < 99952 Alder*Mann 4638986 693943 668 < 2499549 Alder*Alder*Mann -4225 64-554 < 225836 Eutdanning*Mann 25554 5959 33 26265 Heiltidsarbeid*Mann 2924 54654 55 < 485255 Offentleg sektor*mann -2685 5868-54 < 242424 Sentrum storby 588529 46826 39 < 66963 Forstad storby 2332 3556 563 < 89896 Småby 888665 35622 249 28 342 Tettstad 88343 344 284 46 23635 Uoppg bostad 48355522 583838 64 5238 9953 Funksjonær 3385296 3455 8 < 4938 Sjølvstendig 249939 485864 53 < 229566 Elev/ student -2362938 422299-56 < 22488325 Pensjon/ trygd -53235 4644-5 254 28388 Andre KtL -5544 448-39 2 4656 Uoppgitt KtL -46346 846389-26 39 55398
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 4 /QUESTION 2 Model 4 Residual by Predicted Plot Einnt m/ est missing Residual 3 2 - -2 2 3 4 Einnt m/ est missing Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 4 /QUESTION 2 Model 4 Distributions Residual Einnt(EM) Modell 4 3 525 5 5995 99999 2 - -2 25 5 5 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 3363 995% 246 95% 4599 9% 635 5% quartile 289 5% median -463 25% quartile -36 % -595 25% -924 5% -436 % minimum -28 Moments Mean 89e-4 Std Dev 5542632 Std Err Mean 239 upper 95% Mean 283 lower 95% Mean -28 N 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 4 /QUESTION 2 Model 4 h(i) Einnt(EM) Modell 4 4 525 5 5995 99999 3 2 25 5 25 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 4556 995% 285 95% 2246 9% 3 5% quartile 844 5% median 6 25% quartile 558 % 48 25% 48 5% 329 % minimum 39 Moments Mean 89 Std Dev 463 Std Err Mean 68 upper 95% Mean 9524 lower 95% Mean 654 N 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 4 /QUESTION 2 Model 4 Cook's D(i) Einnt(EM) Modell 4 5 525 5 5995 99999 4 3 2 3 5 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 4995 995% 685 95% 25 9% 8 5% quartile 29 5% median 25% quartile % 25% 5% % minimum Moments Mean 362 Std Dev 32 Std Err Mean 242 upper 95% Mean 44 lower 95% Mean 398 N 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 4 /QUESTION 2 Model 4 Barn i husholdet Mor s utdann ing Far s utdann ing Eutda nning Case information for persons with high Cook s D Sorted by Cood s D in Model 4 Case No i Næring Ekteskapeleg Heiltids- Offentleg sektor Talet på arbeidstakarar i husst status arbeid 856 5 2 9 9 33 5 2 2 5 954 2 2 9 2 2 56 6 2 2 2 329 2 2 4 69 6 2 2 83 2 2 5 9 6 2 2 2 53 3 2 9 2 Næring=3=samferdsel/transport/post/tele; Ekteskapeleg status==gift; barn i husholdet==ja; Case information for persons with high Cook s D Sorted by Cood s D in Model 4 Case No i Alder Mann Einntekt () HH inntekt () Busads-type Kjelde til livsopphald 856 45 35 45 3 5 33 34 45 45 3 954 45 45 25 2 9 56 5 45 45 2 4 2 23 25 25 3 2 329 4 45 45 2 5 69 22 45 45 2 5 83 9 45 45 2 6 39 45 45 6 5 53 42 45 8 5 2 Case information for persons with high Cook s D Sorted by Cood s D in Model 4 Case No i Residual Einnt(EM) Modell 4 h(i) Einnt(EM) Modell 4 Cook's D(i) Einnt(EM) Modell 4 Residual Einnt(EM) Modell 3 856 94384 526944 83332 2386585 33 234533 88822 8393 9429556 954 28684995 9346 58 285966 56 26582868 4662 6253 2992569 2 844558 22865 962 259858 329 24435995 38455 296 284625 69 22258646 596968 4884 2466355 83 324646 9923 24325 369854 6 9884429 234254 365383 2829868 53 336365225 29564 499432 32593
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 4 /QUESTION 2 Model 4 Case information for persons with high Cook s D Sorted by Cood s D Model 4 Case No i Residual Einnt Modell Residual Einnt Modell 8 h(i) Einnt Modell 8 Cook's D(i) Einnt Modell 8 856 22339834 8624926 6544 82883 33 932349 299453 2433 85252 954 282643643 2825693 3839 6235 56 2994583 265592 2483 693 2 656643 44659 438446 5944 329 2545862 24238 392964 6933 69 24439694 2226646 6855 52 83 389235 32656 55 38 6 26498 9565925 294339 564432 53 3664555 3432 52469 5636
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 5 /QUESTION 2 Model 5 Response Einnt m/ est missing Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 6498 RSquare Adj 62626 Root Mean Square Error 55892 Mean of Response 45834 Observations (or Sum Wgts) 2948 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 48 824534 2638934 Error 293 9546 324 Prob > F C Total 294 23856 Parameter Estimates Term Estimate Std Error t Ratio Prob> t VIF Intercept -286695 22-866 Alder 2388868 49524 553 < 42398 Mann -988523 5686-63 < 59962 Eutdanning 496922 5828 86 < 2862 Heiltidsarbeid 4958449 3655 358 < 3884525 Offentleg sektor 65924 352563 6 88 2388352 Alder*Alder -263 54-482 < 68844 Alder*Mann 4663845 6988 669 < 24964236 Alder*Alder*Mann -4295 648-56 < 22439 Eutdanning*Mann 2548938 62984 334 8 25888 Heiltidsarbeid*Mann 26553 55838 546 < 4883456 Offentleg sektor*mann -2546626 554-499 < 2426 Funksjonær 3545994 34839 29 < 485 Sjølvstendig 23823 4868233 488 < 22895 Elev/ student -2299 4233252-524 < 2238453 Pensjon/ trygd -488983 46664-5 2943 2825595 Andre KtL -49393 429228-362 3 44924 Uoppgitt KtL -65558 8539-95 56 433 Residual by Predicted Plot Einnt m/ est missing Residual 3 2 - -2 2 3 4 Einnt m/ est missing Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE/ OPPGAVE 2 Modell 6 /QUESTION 2 Model 6 Response Einnt m/ est missing (case 53 excluded) Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 6369 RSquare Adj 658 Root Mean Square Error 55265 Mean of Response 448 Observations (or Sum Wgts) 294 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 22 4468 6434 25868 Error 2924 892985 354 Prob > F C Total 2946 2363 Parameter Estimates Term Estimate Std Error t Ratio Prob> t Intercept -25622 299-26 399 Alder 2568453 49449 562 < Mann -93559 5596-625 < Eutdanning 4456546 5869 69 < Heiltidsarbeid 454694 362345 32 < Offentleg sektor 6982594 346698 2 44 Alder*Alder -2628 535-49 < Alder*Mann 45356 689923 653 < Alder*Alder*Mann -46 5-53 < Eutdanning*Mann 25464 5486 334 9 Heiltidsarbeid*Mann 34599 5233 6 < Offentleg sektor*mann -222 5494-539 < Sentrum storby 666846 43295 43 < Forstad storby 29522 3554 588 < Småby 9663443 354895 23 64 Tettstad 958324 394525 3 2 Uoppg bostad 546336 5364 2 4688 Funksjonær 33986939 32362 89 < Sjølvstendig 24969538 48282 5 < Elev/ student -238483 49484-569 < Pensjon/ trygd -528288 4653-5 252 Andre KtL -5488 484628-39 2 Uoppgitt KtL -24284 8489929-29 36
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 6 /QUESTION 2 Model 6 Residual by Predicted Plot Einnt m/ est missing Residual 3 2 - -2 2 3 4 Einnt m/ est missing Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 6 /QUESTION 2 Model 6 Distributions Residual Einnt(EM) Modell 6 3 525 5 5995 99999 2 - -2 25 5 5 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 3988 995% 23428 95% 4569 9% 653 5% quartile 29 5% median -4 25% quartile -385 % -5896 25% -96 5% -43 % minimum -26 Moments Mean 2e-4 Std Dev 55535 Std Err Mean 439 upper 95% Mean 9885264 lower 95% Mean -988526 N 294
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE/ OPPGAVE 2 Modell 6 /QUESTION 2 Model 6 h(i) Einnt(EM) Modell 6 525 5 5995 99999 4 3 2 25 5 25 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 4598 995% 2855 95% 2262 9% 3 5% quartile 844 5% median 6 25% quartile 558 % 48 25% 48 5% 329 % minimum 39 Moments Mean 845 Std Dev 49 Std Err Mean upper 95% Mean 9555 lower 95% Mean 6536 N 294
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 6 /QUESTION 2 Model 6 Cook's D(i) Einnt(EM) Modell 6 4 3 2 9 8 6 5 4 3 2 525 5 5995 99999 3 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 38 995% 68 95% 25 9% 8 5% quartile 29 5% median 8 25% quartile % 25% 5% % minimum Moments Mean 3548 Std Dev 959 Std Err Mean upper 95% Mean 3895 lower 95% Mean 322 N 294
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell /QUESTION 2 Model Response Einnt Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 5558 RSquare Adj 548 Root Mean Square Error 5839633 Mean of Response 5935 Observations (or Sum Wgts) 2634 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 95426 995843 292249 Error 2622 894365 34 Prob > F C Total 2633 9895642 Parameter Estimates Term Estimate Std Error t Ratio Prob> t Intercept -694 299689-56 < Alder 485899 532959 95 < Mann -98598 893-548 < Eutdanning 53362693 629424 848 < Heiltidsarbeid 6265666 36366 24 < Offentleg sektor 35888226 36534 98 3258 Alder*Alder -44 59-84 < Alder*Mann 3984485 884 55 < Alder*Alder*Mann -34699 859-44 < Eutdanning*Mann 39996 83338 36 3 Heiltidsarbeid*Mann 32523 54262 55 < Offentleg sektor*mann -223592 542688-43 <
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell /QUESTION 2 Model Residual by Predicted Plot 3 Einnt Residual 2-2 3 4 Einnt Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell /QUESTION 2 Model Distributions Residual Einnt Modell 3 525 5 5995 99999 2-25 5 5 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 389 995% 248 95% 559 9% 68 5% quartile 249 5% median -8 25% quartile -349 % -588 25% -9394 5% -2468 % minimum -245 Moments Mean 43e-5 Std Dev 5824222 Std Err Mean 35455 upper 95% Mean 222653 lower 95% Mean -22265 N 2634
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell /QUESTION 2 Model Response Einnt Prediction Profile 2 The change in predicted response as you vary one factor at a time, holding the other factors at their current values Click in the graph to change the current values of the factors 45 Einnt 82828 5 4 94 2 Alder Mann Eutdanning Heiltidsarbeid Offentleg sektor Interaction Profiles The change in predicted response by the variable named in the diagonal and for low and high values of the variable named on the right side of the row Einnt Einnt Einnt Einnt 36 24 2 36 24 2 36 24 2 36 24 2 24 2 Einnt 36 Alder Mann 5 94 Eutdanning 5 94 Heiltidsarbeid 5 94 5 94 Offentleg sektor Alder Mann Eutdanning Heiltidsarbeid Offentleg sektor 4345 869 55 65 55 55 2 Meir om lesing av plottet er gitt under vedlegg til oppgåve 3 Mer om lesning av plottet er gitt under vedlegg til oppgave 3 More on the reading of the plot is presented in attachements to question 3
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell /QUESTION 2 Model Frekvensfordelingar for 34 personar utan inntektsopplysningar Heiltidsarbeid Level Count Prob 25 858 39 242 Offentleg sektor Level Count Prob 283 92 3 983 Eutdanning År Count Prob 69 295 9 95 3255 2 26 42 4 6 596 8 2548 Alder -Ârsgr År Count Prob -29 4 44586 3-39 56 834 4-49 29 9236 5-59 29 9236 6-69 8 532-9 29 9236 8-89 353 9+ 2 63 HHinntekt () kr Count Prob 6 2 63 9 6 596 2 5 592 5 8 532 8 3 9554 25 2 8599 35 8 532 45 3 44 998=miss 64 52229 999=miss 2 6688
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell /QUESTION 2 Model Frekvensfordelingar for 34 personar utan inntektsopplysningar Busadstype Type Count Prob 544 2 43 3694 3 4 2356 4 5 33439 5 62 945 6 3 44 Kjelde til livsopphald Level Count Prob 3 983 2 25 962 3 2229 4 3 955 5 4 24 6 94 29936 22 6 8 2 8599 9 24 643 4 35 385 2 26 828
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 8 /QUESTION 2 Model 8 Response Einnt Summary of Fit R-square is the portion of variation attributed to the model, between and Root Mean Squared Error "RMSE" estimates the standard deviation of the residual RSquare 58268 RSquare Adj 5839 Root Mean Square Error 56824 Mean of Response 5935 Observations (or Sum Wgts) 2634 Analysis of Variance The test that the whole model fits better than a simple mean, ie testing that all the parameters are zero except the intercept Source DF Sum of Squares Mean Square F Ratio Model 22 68464 5394 688696 Error 26 8258 345 Prob > F C Total 2633 9895642 Parameter Estimates Term Estimate Std Error t Ratio Prob> t Intercept -28853 3622-48 398 Alder 28693 545856 524 < Mann -93226 3536-53 < Eutdanning 432929 6226 693 < Heiltidsarbeid 44625 3656 8 < Offentleg sektor 2964 364858 4435 Alder*Alder -239 599-46 < Alder*Mann 4328629 666 569 < Alder*Alder*Mann -3894 8295-469 < Eutdanning*Mann 2388568 83484 29 3 Heiltidsarbeid*Mann 2849835 532428 54 < Offentleg sektor*mann -99565 526246-38 2 Sentrum storby 4355652 4269 336 8 Forstad storby 22999 38942 53 < Småby 6436 386222 3 26 Tettstad 95568266 334434 285 43 Uoppg bostad 882594 856582 3 354 Funksjonær 3488963 3234 58 < Sjølvstendig 2548498 49923 5 < Elev/ student -268523 453255-592 < Pensjon/ trygd -939354 499899-89 583 Andre KtL -633265 459924-3 693 Uoppgitt KtL 39994 242 89 325
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 8 /QUESTION 2 Model 8 Residual by Predicted Plot 3 Einnt Residual 2-2 3 4 Einnt Predicted
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 8 /QUESTION 2 Model 8 Distributions Residual Einnt Modell 8 3 525 5 5995 99999 2 - -2 2 4 6 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 36 995% 24485 95% 5 9% 6394 5% quartile 2226 5% median -8 25% quartile -32 % -5686 25% -995 5% -258 % minimum -43 Moments Mean Std Dev 5584546 Std Err Mean 8828 upper 95% Mean 2336 lower 95% Mean -233 N 2634
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 8 /QUESTION 2 Model 8 h(i) Einnt Modell 8 525 5 5995 99999 6 5 4 3 2 5 5 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 654 995% 58 95% 29 9% 238 5% quartile 958 5% median 55 25% quartile 62 % 53 25% 443 5% 35 % minimum 34 Moments Mean 954 Std Dev 6386 Std Err Mean 24 upper 95% Mean 9394 lower 95% Mean 89 N 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 2 Modell 8 /QUESTION 2 Model 8 Cook's D(i) Einnt Modell 8 525 5 5995 99999 6 5 4 3 2 3 Count Axis -3-2 - 2 3 4 Normal Quantile Plot Quantiles % maximum 56 995% 8 95% 285 9% 86 5% quartile 3 5% median 9 25% quartile 2 % 25% 5% % minimum Moments Mean 4 Std Dev 86 Std Err Mean 35 upper 95% Mean 4859 lower 95% Mean 3483 N 2634
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 Variabeldefinisjonar/ OPPGAVE 3 Variabeldefinisjoner/ QUESTION 3 Definition of variables Besøke lokalt kunstgalleri = dersom «Val av tidsbruk i bygdenorge» =, elles Val av tidsbruk i bygdenorge er svar på spørsmålet Dersom du var på reise i bygdenorge og måtte vente ein time på ferje, kva for ein av desse stadane ville du helst vitje? Lokalt kusntgalleri, husflidsforretning, staden sitt kjøpsenter, kafe/ restaurant Besøke lokalt kunstgalleri = hvis «Val av tidsbruk i bygdenorge» =, ellers Val av tidsbruk i bygdenorge er svar på spørsmålet «Hvis du var på reise i bygdenorge og måtte vente en time på ferge, hvilke av disse stende ville du da helst besøke? Lokalt kusntgalleri, husflidsforretning, stedets kjøpsenter, kafe/ restaurant» Besøke lokalt kunstgalleri (Visit local art gallery ) = if «Val av tidsbruk i bygdenorge» (choice of spending time in rural Norway) =, otherwise Val av tidsbruk i bygdenorge is the answer to the question If you were travelling in Norway and had to wait an hour for the ferry, which of the following establishments would you rather visit? Local art gallery, arts and crafts shop, local shopping mall, café/ restaurant Frequencies Level Count Prob 393 333 2555 86669 Total 2948 Kvinne Woman Frequencies Level Count Prob 445 496 53 5984 Total 2948 Eutdanning Eutdanning Own education Busadstype Bostedstype Type of home town Alder = alder i år Alder = alder i år Alder (age) = age in years sjå oppgåve 2 variablar se oppgave 2 variabler see question 2 variables sjå oppgåve 2 variablar se oppgave 2 variabler see question 2 variables sjå oppgåve 2 variablar se oppgave 2 variabler see question 2 variables
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 Variabeldefinisjonar/ OPPGAVE 3 Variabeldefinisjoner/ QUESTION 3 Definition of variables Mors utdanning = «mor si utdanning i år» er koda dersom mor har utdanning på folkeskolenivå (inntil 8 års skolegang) 9 dersom mor har utdanning på ungdomsskole/ realskolenivå (9- års skolegang) 2 dersom mor har utdanning på videregående skole/ gymnas nivå (-3 års skolegang) 5 dersom mor har utdanning på universitetsnivå (meir enn 2 års skolegang + studiar), Mors utdanning = «mors utdanning i år» er kodet hvis mor har utdanning på folkeskolenivå (inntil 8 års skolegang) 9 hvis mor har utdanning på ungdomsskole/ realskolenivå (9- års skolegang) 2 hvis mor har utdanning på videregående skole/ gymnas nivå (-3 års skolegang) 5 hvis mor har utdanning på universitetsnivå (mer enn 2 års skolegang + studier), Mors utdanning = «mother s education in years» has been coded if mother has education at the level of primary school (up to 8 years of education) 9 if mother has education at the level of secondary school (9- years of education) 2 if mother has education at the level of high school (-3 years of education) 5 if mother has education at college level (more than 2 years of education + college studies), 5 5 Count Axis 9 2 5 Frequencies Level Count Prob 654 566 9 663 2249 2 42 3636 5 229 68 Total 2948
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3/ OPPGAVE 3 Modell -4 / QUESTION 3 Model -4 Kommentarar til vedleggstabellane for oppgåve 3 Oddsrater Til skilnad frå SPSS vil kolonna med oddsrater her gi høvestalet mellom oddsen for å ha varabelen sin høgaste verdi og oddsen for å ha variabelen sin lågaste verdi 2 Rsquare Rsquare(U) for ein modell er definert som reduksjonen i negativ loglikelihood som følgjer av modellen (kalla Difference, skilnaden mellom Full og Reduced) i høve til den negative loglikelihooden i ein modell som berre har konstant til parameter (kalla Reduced) 3 VIF VIF = variansinflasjonsfaktoren = / toleransen 4 Betinga effekt plott I ei rekkje av betinga effekt plott (eksempel nedanfor) vil kvart einskild plott gi oss samanhengen mellom sannsynet for den gitte avhengige variabelen ( Pr{Y=}) og den uavhengige som er nemnt under det einskilde plottet når dei andre uavhengige variablane er haldne konstante med dei verdiane som står midt under plottet deira Variabelverdiane som står på kvar side gir minste og største observerte variabelverdi for variabelen Det samme gjeld for verdiane som er gitt for sannsynet Eksempel: Samanhengen mellom «Kvinne» og Pr{Y=} er betinga av variabelverdiane EgUtd =, Barn i HH = og Alder = Største mogelege verdi av Pr{Y=}= 58 og lågaste mogelege verdi er 32 For Kvinne = (dvs for ein mann), gitt at dei andre variablane er faste (EgUtd =, Barn i HH = og Alder = ), vil Pr{Y=}= 498, talet som er gitt midt på skalaen 58 Pr[Y=] 498 32 5 94 Kvinne Eutdanning Barn i husholdet Alder
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 2/ OPPGAVE 3 Modell -4 / QUESTION 3 Model -4 Kommentarer til vedleggstabellene for oppgave 3 Oddsrater Ulikt SPSS vil kolonnen med oddsrater her gi forholdstallet mellom oddsen for å ha variabelens høyeste verdi og oddsen for å ha variabelens laveste verdi 2 Rsquare Rsquare(U) for en modell er definert som reduksjonen i negativ loglikelihood som følger av modellen (kalt Difference, forskjellen mellom Full og Reduced) i forhold til den negative loglikelihooden i en modell som bare har konstant til parameter (kalt Reduced) 3 VIF VIF = variansinflasjonsfktoren = / toleransen 4 Betinget effekt plott I en rekke av betinget effekt plott (eksempel nedenfor) vil hvert enkelt plott gi oss sammenhengen mellom sannsynligheten for den gitte avhengige variabelen ( Pr{Y=}) og den uavhengige som er nevnt under det enkelte plottet når de andre uavhengige variablene er holdt konstante med de verdiene som står midt under plottet deres Variabelverdiene som står på hver side gir minste og største observerte variabelverdi for variabelen Det samme gjelder for verdiene som er gitt for sannsynligheten Eksempel: Sammenhengen mellom «Kvinne» og Pr{Y=} er betinget av variabelverdiene EgUtd =, Barn i HH = og Alder = Største mugelige verdi av Pr{Y=}= 58 og laveste mugelige verdi er 32 For Kvinne = (dvs for en mann), gitt at de andre variablene er faste (EgUtd =, Barn i HH = og Alder = ), vil Pr{Y=}= 498, tallet som er gitt midt på skalaen 58 Pr[Y=] 498 32 5 94 Kvinne Eutdanning Barn i husholdet Alder
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3/ OPPGAVE 3 Modell -4 / QUESTION 3 Model -4 Comments to the tables attached to question 3 Odds ratios Different from SPSS the column of odds ratios here gives the ratio of the odds of having the highest value of the variable and the odds of having the lowest value of the variable 2 Rsquare Rsquare(U) for a model is defined as the reduction in i negativ loglikelihood caused by the model (called Difference, the difference between Full and Reduced) in relation to the negative loglikelihood in a model with only a constant as parameter (called Reduced) 3 VIF VIF = Variance inflation factor = / tolerance 4 Conditional effect plots In a row of conditional effect plots (as in the example below) each plot will give us the relationship between the probability of the dependent variable ( Pr{Y=}) and the independent variable listed below each plots with the other independent variables kept konstant at the values given in the middle below their plot The variable values on each side give the lowest and highest observed value on that variable Similarly applies for the values given for the probability Example: the relationship between «Kvinne» and Pr{Y=} is based on the variable values EgUtd =, Barn i HH = and Alder = The highest possible value of Pr{Y=}= 58 and the lowest possible value is 32 For Kvinne = (ie for a man), given that the other variable values are fixed (ie EgUtd =, Barn i HH = og Alder = ), Pr{Y=}= 498, the figure given in the middle of the scale 58 Pr[Y=] 498 32 5 94 Kvinne Eutdanning Barn i husholdet Alder
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 /OPPGAVE 3 /QUESTION 3 Nominal Logistic Fit for Besøke lokalt kunstgalleri (Modell ) Iteration History Iter LogLikelihood Step Delta-Criterion Obj-Criterion -24339888 Initial 333446385 2-39568 Newton 948446 939394 3-8693888 Newton 2239 485935 4-83456556 Newton 5422 24346 5-83444345 Newton 96 2 Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 4352 4 484 < Full 834443 Reduced 5495 RSquare (U) 64 Observations (or Sum Wgts) 2948 Parameter Estimates Term Estimate Std Error ChiSquare Prob > Odds Ratio VIF ChiSq Intercept -58659 36822 2344 < Kvinne 2694685 2693 52 68 392654 42269 Eutdanning 826 9532 8639 < 623466 623 Mors utdanning 4428 225642 25 < 24956 26844 Alder 5324 36382 69 < 33498269 2455366
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 /OPPGAVE 3 /QUESTION 3 Nominal Logistic Fit for Besøke lokalt kunstgalleri (Modell 2) Iteration History Iter LogLikelihood Step Delta-Criterion Obj-Criterion -24339888 Initial 283682339 2-35556 Newton 2552844 9598324 3-84869293 Newton 2429856 484853 4-822399 Newton 362 24333 5-8222524 Newton 5358 8 6-8222524 Newton 4 3e- Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 52543 5 5586 < Full 822252 Reduced 5495 RSquare (U) 65 Observations (or Sum Wgts) 2948 Parameter Estimates Term Estimate Std Error ChiSquare Prob > Odds Ratio VIF ChiSq Intercept -49565 662486 5586 < Kvinne 28536 29955 68 3 328836 52 Eutdanning 435 5296 395 4 284999 846 Mors utdanning 82529 226564 224 < 2554325 2833 Alder -45234 335 2 339 6995286 553543 Eutdanning*Alder 5226 262 242 9 8338 6498692
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 /OPPGAVE 3 /QUESTION 3 Nominal Logistic Fit for Besøke lokalt kunstgalleri (Modell 3) Iteration History Iter LogLikelihood Step Delta-Criterion Obj-Criterion -24339888 Initial 3536 2-3294222 Newton 94422 83635 3-93386 Newton 2645 4966953 4-6599 Newton 63653 23959 5-645 Newton 9596 9 Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 8395 649 < Full 64 Reduced 5495 RSquare (U) 698 Observations (or Sum Wgts) 2948 Parameter Estimates Term Estimate Std Error Chi- Prob > Odds Ratio VIF Square ChiSq Intercept -2263382 64534 99 584 Kvinne 2643493 3383 544 9 325832 62 Eutdanning -2665 3599 23 293 24329 526944 Mors utdanning 3263 23355 344 < 28535994 34854 Alder -325838 269 338 662 2826 4594 Eutdanning*Alder 65243 62 4 54464399 45686846 Alder*Alder 35636 42 334 66 835 4998939 Alder*Alder*Eutdanning -59 646 6 35 2462e-9 35268
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 /OPPGAVE 3 /QUESTION 3 Tabell Count Total % Col % Row % Observed Y= "MostLikely Besøke lokalt kunstgalleri" mot "Besøke lokalt kunstgalleri" (Modell 3) Most likely Y= 4 4 266 2 3 333 43 5 5 389 32 326 9898 2544 863 864 995 2933 9949 393 333 2555 866 2948 Tests Source DF -LogLike RSquare (U) Model 94298 Error 2946 9323295 C Total 294 944254 N 2948 Test ChiSquare Prob>ChiSq Likelihood Ratio 883 Pearson 232 2 Fisher's Exact Test Prob Left 966 Right 286 2-Tail 286 Kappa Std Err 993 893 Kappa measures the degree of agreement
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 /OPPGAVE 3 /QUESTION 3 Betinga effekt plott (Modell 3) The change in predicted response as you vary one factor at a time, holding the other factors at their current values Click in the graph to change the current values of the factors Prob[] Model 3 49 5 5 5 94 Kvinne Eutdanning Mors utdanning Alder Prob[] Model 3 9362 5 5 94 94 Kvinne Eutdanning Mors utdanning Alder Prob[] Model 3 258 5 5 5 5 94 Kvinne Eutdanning Mors utdanning Alder Prob[] Model 3 22649 5 5 5 94 94 Kvinne Eutdanning Mors utdanning Alder
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 /OPPGAVE 3 /QUESTION 3 Betinga effekt plott (Modell 3) The change in predicted response as you vary one factor at a time, holding the other factors at their current values Click in the graph to change the current values of the factors Prob[] Model 3 522 5 5 5 94 Kvinne Eutdanning Mors utdanning Alder Prob[] Model 3 55 5 5 94 94 Kvinne Eutdanning Mors utdanning Alder Prob[] Model 3 323 5 5 5 5 94 Kvinne Eutdanning Mors utdanning Alder Prob[] Model 3 3449 5 5 5 94 94 Kvinne Eutdanning Mors utdanning Alder
Eksamensoppgaver/ Examination questions SOS36 2/5/22 OPPGÅVE 3 /OPPGAVE 3 /QUESTION 3 Nominal Logistic Fit for Besøke lokalt kunstgalleri (Modell 4) Iteration History Iter LogLikelihood Step Delta-Criterion Obj-Criterion -24339888 Initial 2465 2-262 Newton 68383 83648 3-698982 Newton 542842 53969 4-669533 Newton 64699 29259 5-665824 Newton 9365 826 6-665823 Newton 5e-9 Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 93 2 844 < Full 6658 Reduced 5495 RSquare (U) 84 Observations (or Sum Wgts) 2948 Parameter Estimates Term Estimate Std Error Chi- Prob > Odds Ratio VIF Square ChiSq Intercept -2989542 68969 98 Kvinne 263959 42 536 26 32969 Eutdanning -24483 356535 333 68 8433 5294834 Mors utdanning 5656 23684 2464 < 25632668 355 Alder -38898 2835 3 544 8 4584 Eutdanning*Alder 328 62 88 5 66e+ 45666 Alder*Alder 4234 43 356 593 552469 45344 Alder*Alder*Eutdanning -65 64 655 5 68e-9 3532435 Sentrum storby 535453 223962 34 8 2249633 642 Forstad storby 56692945 2865 39 66 6284582 8549 Småby 5232448 246 594 48 6854444 99 Tettstad 3434 236 42 56 48556 2696 Uoppg bostad 832952 469564 5 9694 33