NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGAVE I SOS1002 SAMFUNNSVITENSKAPELIG FORSKNINGSMETODE Eksamensdato: 30. mai 2008 Eksamenstid: 5 timer Studiepoeng: 15 Antall sider bokmål: 2 (Formler: se side 7) Antall sider nynorsk: 2 (Formler: se side 7) Number of pages in English: 2 (Formulas: page 7) Tillatte hjelpemiddel: Kalkulator (alle typer) Sensurdato: Faglig kontakt under eksamen: Karin Dyrstad (73 59 18 37 / 474 18 574) Sensurtelefon 815 48014 BOKMÅL Alle tre oppgavene skal besvares. De tre besvarte oppgavene teller hver en tredjedel av den samlede karakteren. Oppgave 1 Nedenfor ser du en tabell fra den norske delen av European Social Survey 2006. Utvalget skal behandles som et sannsynlighetsutvalg fra populasjonen: alle personer på 15 og, som var bosatte i Norge høsten 2006. Variabelen yrkesaktivitet er konstruert ut fra spørsmålene Se på dette kortet. Hvilke av beskrivelsene passer på det du har gjort de siste 7 dagene? og Og hvilke av disse beskrivelsene passer best på din situasjon (de siste 7 dagene)?, og er kodet med verdien 1 (yrkesaktiv) for de som har krysset av for I lønnet arbeid (eller midlertidig fraværende), (ansatt, selvstendig næringsdrivende eller har arbeid i familiebedrift) og verdien 0 (ikke yrkesaktiv) for alle andre svar. I tillegg har tabellen informasjon om kjønn og alder, der alder er gruppert i tre kategorier. Tabell 1. Yrkesaktivitet fordelt etter alder og kjønn. Frekvenser. Kjønn Menn Kvinner Alder Yrkesaktivitet Ikke yrkesaktiv 105 31 152 133 59 185 Yrkesaktiv 187 297 118 145 245 91 a) Gjør om tabell 1 til en prosenttabell. Beskriv deretter variablene, og forklar kort hva tabellen viser. b) Regn ut korrelasjonene mellom alder og yrkesaktivitet for både menn og kvinner, og sammenlign de to korrelasjonskoeffisientene. 1
c) Tabell 2 viser informasjonen fra tabell 1 i en logistisk regresjonsmodell, der de yrkesaktive har verdien 1 og de som ikke er yrkesaktive har verdien 0. Forklar hva denne modellen viser. Tabell 2. Logistisk regresjonsmodell for yrkesaktivitet, ut fra kjønn og alder. Uavhengige variabler B S.E. P OR Kvinne (menn=0, kvinner=1) -0,491 0,171 0,004 0,612 Alder (dummyer med som referansekategori) 35 54 1,683 0,225 0,000 5,380-0,830 0,173 0,000 0,436 Samspill mellom kvinne og aldersdummyene Kvinne * 35 54-0,345 0,293 0,239 0,708 Kvinne * 0,034 0,246 0,889 1,035 Konstant 0,577 0,122 0,000 1,781 B: logistiske regresjonskoeffisienter, S.E.: regresjonskoeffisientenes standardfeil, P: er signifikanssannsynligheten til B/S.E., OR: oddsratioet er antilogaritmen av B, eller exp(b), eller eb der e er den matematiske konstanten e = 2,718. Oppgave 2 Gjør kort rede for følgende begrep: a) Litteratursøking b) Referanseliste (litteraturliste) c) Måling d) Sentraltendens og spredning e) Formålsforklaringer f) Spuriøs effekt Oppgave 3 Du blir spurt av Studentsamskipnaden i Trondheim (SiT) om å gjøre en kvalitativ undersøkelse av hvordan studenter bor og hva slags erfaring de har med sin bosituasjon. For å svare på forespørselen må du sette opp en plan for prosjektet: Redegjør for følgende aspekter: hva slags datainnsamlingsmetoder du anser som relevante, hva slags data du kan få ved tilnærmingen (det vil si hva dataene sier noe om), om det er spesielle problemer eller utfordringer med ulike deler av prosjektet, hvordan dine empiriske data kan registreres, bearbeides og analyseres. Begrunn dine valg. 2
NYNORSK Du skal svare på alle dei tre oppgåvene. Dei tre oppgåvene tel kvar for seg ein tredjedel av den samla karakteren. Oppgåve 1 Nedanfor ser du ein tabell frå den norske delen av European Social Survey 2006. Utvalet er eit sannsynsutval frå populasjonen: alle personar på 15 og, som var busett i Noreg hausten 2006. Variabelen yrkesaktivitet er konstruert ut i frå spørsmåla Se på dette kortet. Hvilke av beskrivelsene passer på det du har gjort de siste 7 dagene? og Og hvilke av disse beskrivelsene passer best på din situasjon (de siste 7 dagene)?, og er koda med verdien 1 (yrkesaktiv) for dei som har kryssa av for I lønnet arbeid (eller midlertidig fraværende), (ansatt, selvstendig næringsdrivende eller har arbeid i familiebedrift) og verdien 0 (ikkje yrkesaktiv) for alle andre svar. I tillegg har tabellen informasjon om kjønn og alder, der alder er gruppert i tre kategoriar. Tabell 1. Yrkesaktivitet fordelt etter alder og kjønn. Frekvensar. Kjønn Menn Kvinner Alder Yrkesaktivitet Ikkje yrkesaktiv 105 31 152 133 59 185 Yrkesaktiv 187 297 118 145 245 91 a) Gjer om tabell 1 til ein prosenttabell. Skildre deretter variablane, og forklar kort kva tabellen syner. b) Rekn ut korrelasjonen mellom alder og yrkesaktivitet for både menn og kvinner, og samanlikn dei to korrelasjonskoeffisientane. c) Tabell 2 syner informasjonen frå tabell 1 i ein logistisk regresjonsmodell der dei yrkesaktive er koda med verdien 1 og dei som ikkje er yrkesaktive har verdien 0. Forklar kva denne modellen syner. Tabell 2. Logistisk regresjonsmodell for yrkesaktivitet, ut i frå kjønn og alder. Uavhengige variablar B S.E. P OR Kvinne (menn=0, kvinner=1) -0,491 0,171 0,004 0,612 Alder (dummyar med som referansekategori) 35 54 1,683 0,225 0,000 5,380-0,830 0,173 0,000 0,436 Samspel mellom kvinne og dummyane for alder Kvinne * 35 54-0,345 0,293 0,239 0,708 Kvinne * 0,034 0,246 0,889 1,035 Konstant 0,577 0,122 0,000 1,781 B: logistiske regresjonskoeffisientar, S.E.: standardfeil til regresjonskoeffisientane, P: er signifikanssannsyn til B/S.E., OR: oddsratioet er antilogaritmen av B, eller exp(b), eller eb der e er den matematiske konstanten e = 2,718. 3
Oppgåve 2 Gjer kort greie for følgjande omgrep: a) Litteratursøking b) Referanseliste (litteraturliste) c) Måling d) Sentraltendens og spreiing e) Formålsforklaringar f) Spuriøs effekt Oppgåve 3 Studentsamskipnaden i Trondheim (SiT) ber deg om å gjere ei kvalitativ undersøking av korleis studentar bur og kva erfaringar dei har med eigen busituasjon. I samband med oppdraget må du setje opp ein plan for prosjektet. I planen skal du gjere greie for følgjande: Kva metodar du vil nytte ved innsamling av datamateriale. Kva type data du f n du gjer det på denne måten (Det vil seie kva du f vite noko om). Spesielle problem eller utfordringar i høve til dei ulike delane av prosjektet. Korleis du vil registrere, ta hand om og analysere datamaterialet. Grunngi svara dine. 4
ENGLISH Answer all three questions. All three tasks have equal weights. Task 1 Below, you see a table from the Norwegian part of the European Social Survey 2006. The sample should be handled as a random sample from the population: All persons age 15 or older who live in Norway autumn 2006. The variable labour force participation is constructed from the questions: Using this card, which of these descriptions applies to what you have been doing for the last 7 days? and And which of these descriptions best describes your situation (in the last seven days)?, and is coded with value 1 (working) for they who have checked off In paid work (or away temporarily) (employee, self-employed, working for your family business) and the value 0 for all other answers. Additionally, Table 1 shows information about gender and age, where age is grouped into three categories. Table 1. Labour force participation by age and gender. Frequencies. Gender Men Women Age Below 35 Age 55 or older Below 35 Age 55 or older Labour force participation Not working 105 31 152 133 59 185 Working 187 297 118 145 245 91 a) Change Table 1 into percentages. Describe the variables in the table, and explain briefly the main pattern in Table 1. b) Estimate the correlation between age and work among men and women, and compare these two correlation coefficients. c) Table 2 shows information from Table 1 in a logistic regression model where those who participate in the labour force have value 1, and those who do not have value 0. Explain what the model shows. Table 2. Logistic regression model predicting labour force participation, by gender and age. Independent variables B S.E. P OR Woman (men=0, women=1) -0,491 0,171 0,004 0,612 Age (dummies with Below 35 as reference category) Age 35 54 1,683 0,225 0,000 5,380 55 or older -0,830 0,173 0,000 0,436 Interaction (Woman * Age-dummies) Woman * Age 35 54-0,345 0,293 0,239 0,708 Woman * 55 or older 0,034 0,246 0,889 1,035 Intercept 0,577 0,122 0,000 1,781 B: logistic regression coefficients, S.E.: standard errors of regression coefficients, P: significant probability of B/S.E., OR: odd ratios, antilogarithm of B, or exp(b), or eb where e is the natural mathematic constant e = 2,718. 5
Task 2 Explain briefly the following concepts: a) Literature search b) Reference list (author index) c) Measurement d) Central tendency and variability e) Intentional explanations f) Spurious effect Task 3 You are asked by the Student Union (Studentsamskipnaden) in Trondheim to do a qualitative study of how students live and what their housing experiences are. To answer the request you need to develop a plan for the project: Elaborate on the following aspects: what kind of data collection methods you regard as relevant, what kind of data you might get with your approach (i.e. what kind of information is contained in the data), if there are special problems or challenges with the different parts of the project, how your empirical data may be registered, processed and analysed. Make sure you account for the way you reason. 6
Formler som kan komme til nytte: Kjikvadratet ( O E) E 2 der O er observert fordeling, og E er fordeling ved statistisk uavhengighet Cramer V Kjikvadratet Nk ( 1) der k er antall kategorier i variabelen med færrest verdier L U Gamma der L er par ordnet likt, og U er par ordnet ulikt L U Stuarts Tau c 2k( L U ) 2 n ( k 1) også kalt Kendalls tau-c Beregning av predikert sannsynlighet ut fra predikert logit (L): 1 ˆP 1 e ˆL Sannsynlighetstabeller som kan komme til nytte: Andel av normalfordelingen som ligger mer enn Z standardavvik over gjennomsnittet, for noen utvalgte verdier av Z: Prosent av norm alfordelingen som ligger over verdien Z M + Z s 0 5 0 0,5 30,8 1 1 5,9 1,28 10 1,5 6,5 1,65 5,0 1,96 2,5 2 2,3 2,33 1,0 2,5 0,62 2,57 0,5 3 0,1 4 Kritiske verdier for kjikvadratet: Antall Sannsynlighet frihetsgr. 0,99 0,90 0,50 0,20 0,10 0,05 0,02 0,01 0,001 1 0,0002 0,02 0,46 1,64 2,71 3,84 5,41 6,64 10,83 df 2 0,02 0,21 1,39 3,22 4,61 5,99 7,82 9,21 13,82 3 0,12 0,58 2,37 4,64 6,25 7,82 9,84 11,34 16,27 4 0,30 1,06 3,36 5,99 7,78 9,49 11,67 13,28 18,47 5 0,55 1,61 4,35 7,29 9,24 11,07 13,39 15,09 20,52 6 0,87 2,20 5,35 8,56 10,65 12,59 15,03 16,81 22,46 7