NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGAVE I SOS100 SAMFUNNSVITENSKAPELIG FORSKNINGSMETODE Eksamensdato: 30. november 009 Eksamenstid: 5 timer Studiepoeng: 15 Antall sider bokmål: (Formler: se side 7) Antall sider nynorsk: (Formler: se side 7) Number of pages in English: (Formulas: page 7) Tillatte hjelpemiddel: Kalkulator (alle typer) Sensurdato: 1. desember 007 Faglig kontakt under eksamen: Arild Blekesaune (73 59 17 54) Sensurtelefon 815 48014 BOKMÅL Alle oppgavene tre oppgaver skal besvares. De tre besvarte oppgavene teller hver en tredjedel av den samlede karakteren. Oppgave 1. Tabell 1 viser flere regresjonsmodeller basert på data fra det norske, irske og slovakiske utvalget fra ESS006. Den avhengige variabelen i disse regresjonsmodellene er basert på spørsmålet Bruk dette kortet, og vis hvor ofte du bruker internett, World Wide Web eller e- post til privat bruk, enten hjemme eller på jobben?, der de som har svart det høyeste alternativet Hver dag har blitt kodet med verdien 1 mens de som oppgir at de bruker internett sjeldnere enn dette har blitt kodet med verdien 0. I variabelen Irland er alle fra det irske utvalget kodet med verdien 1 mens alle andre er kodet med verdien 0, og i variabelen Slovakia er alle fra det slovakiske utvalget kodet 1 mens alle andre har verdien 0. Norge blir da en referansekategori som de to andre landene sammenlignes med. Kjønn er målt med variabelen Mann, der menn har verdien 1 og kvinner verdien 0. Alder angir informantenes alder i antall år da undersøkelsen ble gjennomført i 006, og utdanning er målt i antall år med fullført utdanning. Forklar hva tabell 1 viser. Tabell 1. Logistiske regresjonsmodeller for daglig internettbruk i Norge (n=1746), Irland (n=164) og Slovakia (n=1674). B S.E. p OR B S.E. p OR B S.E. p OR Konstantledd -0,030 0,048 0,534 0,971-0,856 0,186 0,000 0,45-0,489 0,45 0,046 0,613 Irland -1,143 0,075 0,000 0,319-1,8 0,084 0,000 0,93 -,186 0,371 0,000 0,11 Slovakia -1,454 0,079 0,000 0,34-1,64 0,088 0,000 0,197-1,995 0,38 0,000 0,136 Mann 0,509 0,070 0,000 1,663 0,510 0,070 0,000 1,665 Alder -0,043 0,00 0,000 0,957-0,043 0,00 0,000 0,957 Utdanning 0,185 0,011 0,000 1,03 0,158 0,016 0,000 1,17 Utdanning*Irland 0,069 0,06 0,008 1,07 Utdanning*Slovakia 0,07 0,07 0,34 1,07 - Log likelihood 5815,743 4948,05 4940,840 B = logistiske regresjonskoeffisienter S.E. = regresjonskoeffisientenes standardfeil p = signifikanssannsynligheten OR = oddsratioet er antilogaritmen av B (exp(b)) 1
Oppgave Seks av åtte oppgaver skal besvares. Hver besvarelse skal være på inntil ½ side. a) Type-I og type-ii-feil b) Cronbachs alfa c) Residual d) Frihetsgrader (df) e) Pearsons r f) Kurvelineær sammenheng g) Deltagende observasjon h) Forklar hvorfor variabler på nominalnivå (og ofte ordinalnivå) dummykodes. Forklar så hvordan man tolker et dummysett i en regresjonstabell. Oppgave 3 Du jobber som konsulent i selskapet GRED (en forkortelse for gode råd er dyre ) og får i oppdrag å designe en kvalitativ undersøkelse for Turistforeningen om hva slags forhold hyttebrukere har til foreningens hytter. Arbeidet skal gjøre i løpet av en sommer og du selv skal også gjøre selve datainnsamlingen og analyse. a) Nevn kort hvilke kvalitative datainnsamlingsmetoder man kan benytte i dette tilfellet og punktvis hva som kan være fordeler og ulemper med de ulike. Skisser for de ulike metodene hvordan du konkret ser for deg tilgangen til informanter (hyttebrukere). b) Det viser seg at foreningen er spesielt opptatt av det sosiale miljøet på de selvbetjente hyttene (det vil si hytter uten ansatte). Hvordan kan dette utforskes? c) Skisser ulike observasjonsroller og hvilke praktiske og etiske hensyn som er relevante for dem? d) Redaktøren for Sosiologisk tidsskrift får senere høre om det glimrende arbeidet ditt og inviterer deg til å skrive en vitenskapelig artikkel fra undersøkelsen. Han ber deg spesielt poengtere hvordan undersøkelsen kan generaliseres. Skisser relevante former for generalisering. Er det spesielle etiske hensyn som må ivaretas i forbindelse med presentasjon av empiri i tidsskriftsartikkelen? e) Du poengterer i din rapport til foreningen at ordet datainnsamling som de bruker i oppdraget ikke er helt godt. Hvorfor er det ikke dette ordet presist?
NYNORSK Du skal svare på alle tre oppgåvene. Dei tre oppgåvene tel kvar for seg ein tredjedel av den samla karakteren. Oppgåve 1. Tabell 1 viser fleire regresjonsmodellar basert på data frå det norske, irske og slovakiske utvalet frå ESS006. Den avhengige variabelen i desse regresjonsmodellane er basert på spørsmålet Bruk dette kortet, og vis kor ofte du bruker internett, World Wide Web eller e- post til privat bruk, enten heime eller på jobben?, der dei som har svart det høgste alternativet Kvar dag har blitt koda med verdien 1 mens dei som oppgjer at dei bruker internett sjeldnare enn dette har blitt koda med verdien 0. I variabelen Irland er alle frå det irske utvalet koda med verdien 1 mens alle andre er koda med verdien 0, og i variabelen Slovakia er alle frå det slovakiske utvalet koda 1 mens alle andre har verdien 0. Noreg blir då en referansekategori som dei to andre landa blir samanlikna med. Kjønn er målt med variabelen Mann, der menn har verdien 1 og kvinner verdien 0. Alder angir informantane sin alder i år då granskinga blei gjennomført i 006, og utdanning er målt i år med fullført utdanning. Forklar kva tabell 1 viser. Tabell 1. Logistiske regresjonsmodellar for daglig internettbruk i Noreg (n=1746), Irland (n=164) og Slovakia (n=1674). B S.E. p OR B S.E. p OR B S.E. p OR Konstantledd -0,030 0,048 0,534 0,971-0,856 0,186 0,000 0,45-0,489 0,45 0,046 0,613 Irland -1,143 0,075 0,000 0,319-1,8 0,084 0,000 0,93 -,186 0,371 0,000 0,11 Slovakia -1,454 0,079 0,000 0,34-1,64 0,088 0,000 0,197-1,995 0,38 0,000 0,136 Mann 0,509 0,070 0,000 1,663 0,510 0,070 0,000 1,665 Alder -0,043 0,00 0,000 0,957-0,043 0,00 0,000 0,957 Utdanning 0,185 0,011 0,000 1,03 0,158 0,016 0,000 1,17 Utdanning*Irland 0,069 0,06 0,008 1,07 Utdanning*Slovakia 0,07 0,07 0,34 1,07 - Log likelihood 5815,743 4948,05 4940,840 B = logistiske regresjonskoeffisientar S.E. = standardfeilen til regresjonskoeffisientane p = signifikans OR = oddsrata er antilogaritmen av B (exp(b)) Oppgåve De ska svare på seks av åtte oppgåver. Kvart svar skal vere på inntil ½ side. a) Type-I og type-ii-feil b) Cronbachs alfa c) Residual d) Frihetsgrader (df) e) Pearsons r f) Kurvelineær samanheng g) Deltakande observasjon h) Forklar kvifor variablar på nominalnivå (og ofte ordinalnivå) dummykodast. Forklar så korleis ein tolkar eit dummysett i ein regresjonstabell. 3
Oppgåve 3 Du arbeider som konsulent i selskapet GRED (ei forkorting for gode råd er dyre ) og får i oppdrag å designe ei kvalitativ studie for Turistforeininga om kva slags forhold hyttebrukarar har til foreiningas hytter. Arbeidet skal gjerast i løpet av ein sumar og du sjølv skal og gjere sjølve datainnsamlinga og analyse. a) Nemn kort kva slags kvalitative datainnsamlingsmetodar ein kan nytte i dette høvet og punktvis kva som kan vere fordelar og ulemper med de ulike. Skisser for dei ulike metodane korleis du konkret ser for deg tilgangen til informantar (hyttebrukarar). b) Det viser seg at foreininga er særleg oppteke av det sosiale miljøet på dei sjølvbetjente hyttene (det vil si hytter utan personale). Korleis kan dette utforskes? c) Skisser ulike observasjonsroller og kva for praktiske og etiske omsyn som er relevante for dei? d) Redaktøren for Sosiologisk tidsskrift får seinare høyre om det glimrande arbeidet ditt og inviterer deg til å skrive ein vitskapeleg artikkel frå undersøkinga. Han ber deg spesielt poengtere korleis undersøkinga kan generaliserast. Skisser relevante former for generalisering. Er det spesielle etiske omsyn som må tas i samband med presentasjon av empiri i tidsskriftsartikkelen? e) Du poengterer i din rapport til foreininga at ordet datainnsamling som dei bruker i oppdraget ikkje er heilt godt. Kvifor er det ikkje dette ordet presist? 4
ENGLISH Answer all three tasks. All three tasks have equal weights. Task 1. Table 1 shows several regression models based on data from the Norwegian, Irish, and Slovakian samples from ESS006. The independent variable in those regression models is based on the question Now, using this card, how often do you use the internet, the World Wide Web or e-mail - whether at home or at work - for your personal use?, those who have answered the highest alternative Every day are coded 1 while those who use internet less than that are coded 0. In the variable Ireland are all from the Irish sample coded 1 while all other are coded 0, and in the variable Slovakia are all from the Slovakian sample coded 1 while all other are coded 0. In that way, Norway will be a reference category which these two countries are compared to. Gender is measured by the variable man, where men are coded 1 while women are coded 0. Age measures the informant s age in number of years when the survey was collected in 006, and education measures years of education completed. Explain the pattern in Table 1. Table 1. Logistic regression models predicting daily use of internet in Norway (n=1746), Ireland (n=164), and Slovakia (n=1674). B S.E. p OR B S.E. p OR B S.E. p OR Intercept -0,030 0,048 0,534 0,971-0,856 0,186 0,000 0,45-0,489 0,45 0,046 0,613 Ireland -1,143 0,075 0,000 0,319-1,8 0,084 0,000 0,93 -,186 0,371 0,000 0,11 Slovakia -1,454 0,079 0,000 0,34-1,64 0,088 0,000 0,197-1,995 0,38 0,000 0,136 Man 0,509 0,070 0,000 1,663 0,510 0,070 0,000 1,665 Age -0,043 0,00 0,000 0,957-0,043 0,00 0,000 0,957 Education 0,185 0,011 0,000 1,03 0,158 0,016 0,000 1,17 Education*Ireland 0,069 0,06 0,008 1,07 Education*Slovakia 0,07 0,07 0,34 1,07 - Log likelihood 5815,743 4948,05 4940,840 B = logistic regression coefficients S.E. = standard errors p = significance OR = odd ratios are antilogarithm of B (exp(b)) Task Answer six of eight exercises. Each answer should be up to ½ page. a) Type I and Type II error b) Cronbach s Alpha c) Residual d) Degrees of freedom (df) e) Pearson s r f) Curvilinear connection g) Participant observation h) Explain why nominal (and often ordinal) level variables are coded into dummy variables. Explain how a set of dummy variables in a regression model is interpreted. 5
Task 3 You work as consultant for the company GRED and are asked to design a qualitative study for the Norwegian Tourist Association (NTA) about what relation users of (mountain) cabins have to the association s cabins. The work is supposed to be finished during a summer and you will do both data collection and analysis. a) Describe briefly which qualitative data collection methods you may use in this situation? What are pros and cons for each of them? How do you get access to informants (cabin users) when applying each method? b) You discover that NTA is especially concerned about the communal aspects of the self-serviced cabins (without employed service personnel). How can you study these aspects? c) Describe various observation roles and their relevant practical and ethical considerations? d) The editor of The Journal of Sociology learns about your brilliant work and invites you to write a scientific article to report from the study. He asks you especially to consider generalisation of the study. Describe various forms of generalisation. Is there any special ethical considerations that need to be taken when it comes to presentation of empirical data in the article? e) You emphasise in your report to NTA that the term data collection that they use in the invitation is not too good. Why is the term not precise? 6
Formler som kan komme til nytte: Kjikvadratet: (O E) E χ = der O er observert fordeling, og E er fordeling ved statistisk uavhengighet 1 ˆP = -Lˆ der P sannsynlighet og L er predikert logit (L = β 0 + β 1 X 1 + β X + + β k X k ) 1+ e k ρ Cronbachs alfa: α= der ρ står for Pearsons r, og k er antallet indikatorer 1 + ρ (k 1) (Xi X)(Yi Y) Pearsons r: r =, der s ss(n 1) x y x = (X1 X) n 1 og s y = (Y1 Y) n 1 Sannsynlighetstabeller som kan komme til nytte: Andel av normalfordelingen som ligger mer enn Z standardavvik over gjennomsnittet, for noen utvalgte verdier av Z: Prosent av norm alfordelingen som ligger over verdien Z M + Z s 0 5 0 0,5 30,8 1 1 5,9 1,8 10 1,5 6,5 1,65 5,0 1,96,5,3,33 1,0,5 0,6,57 0,5 3 0,1 4 Kritiske verdier for kjikvadratet: Antall Sannsynlighet frihetsgr. 0,99 0,90 0,50 0,0 0,10 0,05 0,0 0,01 0,001 1 0,000 0,0 0,46 1,64,71 3,84 5,41 6,64 10,83 df 0,0 0,1 1,39 3, 4,61 5,99 7,8 9,1 13,8 3 0,1 0,58,37 4,64 6,5 7,8 9,84 11,34 16,7 4 0,30 1,06 3,36 5,99 7,78 9,49 11,67 13,8 18,47 5 0,55 1,61 4,35 7,9 9,4 11,07 13,39 15,09 0,5 6 0,87,0 5,35 8,56 10,65 1,59 15,03 16,81,46 7