Sensorveiledning SOS1120 vår

Sensorveiledning SOS1120 vår 2003 1 Oppgave 1: a) MÅL: Test av evne til å vurdere samsvaret (validiteten) mellom en operasjonell definisjon og en teoretisk variabel. Spørsmålet måler et sentralt aspekt ved likestilling, nemlig arbeidsdeling. Det er likevel andre aspekter ved likestilling som spørsmålet ikke dekker, og det er betenkelig å bare bruke en indikator som mål på det teoretiske begrepet. I stedet for å spørre om en er for eller mot likestilling, går spørsmålet på arbeidsdelingen mellom menn og kvinner. På den måten unngår en at likestilling framstår som et positivt ladet fyndord i spørsmålsstillingen. En kan nok likevel ikke utelukke politisk korrekte svar. Spørsmålet har en slagside på to måter: påstanden har en retning (mot likestilling) og samtidig blir man spurt om man er enig i påstanden (ikke om man er uenig). Denne måten å spørre på kan ha sin begrunnelse i at man ønsker å redusere politisk korrekte svar. b) Test av studentens ferdigheter i å identifisere variabler i en tredimensjonal krysstabell, og å diskutere hvor mye informasjon det er forsvarlig å trekke ut av verdifordelingen i disse variablene (bestemme målenivå). Variablene i krysstabellen er: Holdning til påstanden om at mannens oppgave er å tjene penger og kvinnens oppgave er å ta seg av hjemmet og familien. Verdiene er: sterkt enig, enig, verken eller, uenig og sterkt uenig. Kjønn med verdiene mann og kvinne Alder med verdiene 25-39 år, 40-59 år og 60 år eller mer Alder og kjønn er uavhengige variabler. Det ses av prosentueringsretningen i krysstabellen. Tabellen er viser fordelingen på holdningsvariabelen for grupper med ulik verdi på kjønns- og aldersvariabelen. Kjønnsvariabelen er på nominalnivå. Aldersvariabelen er på ordinalnivå fordi den er gruppert, har ulike intervaller og en åpen kategori. Substansielt er holdningsvariabelen på ordinalnivå. Det er derfor betenkelig å anvende den som en variabel på høyere målenivå. Ringdal peker imidlertid på at ordinalvariabler med mange verdier (for eksempel fem eller flere) kan presses på høyere målenivå. (En skal heller ikke la substansielle betraktninger om målenivå stå i veien for å la det formelle målenivået styre valget av analyseteknikk. I regresjonsanalysene forklarer vi tross alt 30 % av variasjonen i denne variabelen, hvilket må sies å være bra.) 1 Det har vært knapt med tid til å sjekke innholdet i denne veiledningen. Det tas derfor forbehold om at det i farten kan ha dukket opp feil i sensorveiledningen. Gi meg beskjed hvis dere oppdager noe. 1

c) MÅL: Teste evne til å se hovedmønsteret i en krysstabell og evne til å kommentere et statistisk mål på sammenheng/korrelasjon (Cramers v). Krysstabellen viser at det er en tendens til at kvinner i større grad er uenig i påstanden enn menn. Dette gjelder for alle aldersgrupper, men forskjellen kvinners og menns holdninger er klart størst i den yngste aldersgruppen. I tillegg ser vi at yngre mer uenig i påstanden enn eldre når vi sammenlikner for henholdsvis menn og kvinner. Cramers v er et mål på statistisk sammenheng mellom to variabler. Det varierer mellom 0 og 1 og har verdien 0 hvis det ikke er sammenheng mellom variablene. Cramers v angir ikke retningen på sammenhengen, dvs. om den er positiv eller negativ og egner seg derfor best i krysstabeller hvor minst en av variablene er på nominalnivå (her er kjønn på nominalnivå). Teknisk beregnes Cramers v ved å beregne kjikvadratet for sammenhengen mellom variablene. Kjikvadratet angir forskjellen mellom observerte frekvenser og forventede frekvenser dersom det ikke er sammenheng mellom variablene. Formlene nedenfor viser framgangsmåten: I tabellen er Craners v beregnet for sammenhengen mellom kjønn og holdning til likestilling for hver av de tre aldersgruppene. Vi ser at Cramers v er sterkest for den yngste aldersgruppen. Her er altså sammenhengen mellom de to variablene sterkest. For de to eldste aldersgruppene er det svake sammenhenger mellom variablene. d) MÅL: Teste evne til å sette opp hypoteser og gjennomføre hypoteseprøving for å ta stilling til en substansiell påstand om at det ikke er sammenheng mellom variablene i populasjonen/ befolkningen (dvs. at nullhypotesen er korrekt). Hypoteser: H 0 : H 1 : Ingen sammenheng i populasjonen mellom kjønn og holdning til likestilling i en gitt aldersgruppe Sammenheng i populasjonen mellom kjønn og holdning til likestilling i en gitt aldersgruppe Ringdal presenterer to varianter av hypoteseprøving: 2

Klassisk versjon av kjikvadrattest: Frihetsgrader: (5-1)*(2-1) = 4 Kritisk kjikvadratverdi er 9,488 på 5%-nivået og 13,277 på 1%-nivået. Testobservatoren overskrider kritisk kjikvadratverdi på både 5%-nivå og 1%-nivå i den yngste aldersgruppen, men ikke i de to andre. Moderne versjon av kjikvadrattest: Signifikanssannsynligheten er lavere enn 0,05 og 0,01 for den yngste aldersgruppen, men høyere enn 0,05 i de to andre. Konklusjon: Vi får støtte for at det ikke er forskjell mellom menns og kvinners holdninger til likestilling i de to eldste aldersgruppene. I den yngste aldersgruppen må nullhypotesen forkastes, og vi får støtte for at menns og kvinners holdninger til likestilling er ulike i denne aldersgruppen. e) MÅL: Teste evne til å tolke resultater fra regresjonsanalyse og avgjøre om de kan generaliseres til å gjelde for populasjonen. Konstantleddet angir forventet skåre på holdningsvariabelen når alle de uavhengige variablene har verdien null. I vårt tilfelle vil det si kvinner på 25 år som bor utenfor by. Gjennomsnittlig skåre for denne gruppen er 4,472. Kjønn: Mennene i utvalget skårer i gjennomsnitt 0,24 mindre på skalaen enn kvinner, kontrollert for alder og bosted. De er med andre ord mer enig i påstanden enn kvinner. Sammenhengen er statistisk signifikant både på 5%-nivået og 1%-nivået. Alder: For hver år eldre personene i utvalget er, skårer de 0,035 lavere på holdningsskalaen, kontrollert for kjønn og bosted. De er med andre ord mer enig i påstanden jo eldre de er. Sammenhengen er statistisk signifikant både på 5%-nivået og 1%-nivået. Bosted: De i utvalget som bor i by skårer i gjennomsnitt 0,139 høyere på holdningsskalaen enn de som ikke bor i by, kontrollert for kjønn og alder. De som bor i by er med andre ord mer uenig i påstanden enn de som ikke bor i by. Sammenhengen er statistisk signifikant både på 5%-nivået og 1%-nivået. R 2 viser at regresjonsmodellen forklarer 20,87 prosent av variasjonen i den avhengige variabelen, dvs. holdning til påstanden. Alternativt kan vi si at vi reduserer feilprediksjonen i utvalget med 20,87 prosent ved å bruke regresjonsmodellen til å predikere framfor å bruke gjennomsnittet på den avhengige variabelen. f) MÅL: Teste evne til å se at det er inkludert to nye uavhengige variabler i den nye regresjonsmodellen og evne til å forklare substansielt hvorfor det fører til endringer for de uavhengige variablene som allerede er inkludert i modellen. I tabell 3 er det tatt med to nye variabler, utdanning og inntekt. Disse er tatt med for å få et mer fullstendig bilde av hvilke faktorer som påvirker holdning til likestilling. De er også tatt med for å kontrollere for flere variabler. 3

Det som skjer når vi kontrollerer for inntekt og utdanning er at koeffisienten for kjønnsvariabelen er sterkere og at koeffisienten for bosted er svakere og ikke lenger signifikant på 5%-nivået. Disse endringene skyldes at vi har kontrollert for inntekt og utdanning. Det er imidlertid ikke mulig å avgjøre om det er en eller begge av kontrollvariablene som forårsaker endringene. Det er rimelig å anta at endringen i koeffisienten for kjønn skyldes en indirekte effekt, som kan illustreres slik: Menn Likestilling Utdanning Inntekt En kan si at det er to motstridende tendenser for sammenhengen mellom kjønn og holdning til likestilling. Menn er på den ene siden mindre positive enn kvinner til likestilling (direkte effekt). På den andre siden har menn høyere inntekt og/eller lengre utdanning enn kvinner. Høyere inntekt og utdanning henger sammen med mer positive holdninger til likestilling. Via inntekt og utdanning er det også en tendens til at menn er mer positive til likestilling enn kvinner. I regresjonsanalysen i tabell 2 er disse motstridende tendensene bakt inn i den samme regresjonskoeffisienten. I regresjonsanalysen i tabell 3 får vi skilt disse to effektene fra hverandre. Endringen i koeffisienten for bosted skyldes antakelig også en indirekte sammenheng. Grunnen til at de som bor i by er mer positive til likestilling, er (antakelig) at de som bor i by jevnt over har høyere inntekt og utdanning enn de som ikke bor i byområder. Jo høyere inntekts- og utdanningsnivå jo mer positive holdninger til likestilling. Dette kan illustreres med følgende kausalmodell: By Likestilling Utdanning Inntekt Oppgave 2: Spørsmål 2A: 1. MÅL: Teste kunnskaper om forskjeller mellom to ulike design: eksperiment og tverrsnittsundersøkelser. Kandidaten bør beskrive hovedtrekkene ved henholdsvis tverrsnittsundersøkelse og eksperiment. Hovedpoenget er at tverrsnittsdata er data fra ett tidspunkt. De samles ofte inn ved hjelp av surveyundersøkelser, men kan også samles inn på andre måter. Dersom slike data samles inn på flere tidspunkter har vi gjentatte tverssnittsundersøkelser eller tidsserier. 4

Eksperimentdata kommer derimot fra en konkret setting: Forskeren kontrollerer tidsrekkefølgen mellom årsak og virkning ved å manipulere årsaksvariabelen og måle effekten på den avhengige variabelen. I tillegg sikres kontroll med forstyrrende (konfunderende) tredjevariabler gjennom randomisering, eventuelt matching eller ved å holde andre variabler konstante gjennom utvalget av forsøkspersoner (se Ringdal s. 213). Det er for øvrig dette som er forskjellen mellom virkelige eksperimenter og kvasieksperimenter. Det kan hende noen her går videre og beskriver eksperimentets grunnstruktur mer inngående og skille mellom ulike eksperimentelle opplegg (Ringdal gir en oversikt på s. 217). Det trekker selvfølgelig opp, men punktene ovenfor er tilstrekkelig for å regnes som en god besvarelse. 2. MÅL: Teste kunnskaper om betingelsene for å trekke konklusjoner om årsakssammenhenger. For å kunne trekke slutning om årsakssammenheng, må følgende betingelser være oppfylte: - det må være en sammenheng mellom variablene - årsaken (uavhengig variabel) må komme før virkningen (avhengig variabel) i tid - må ha kontrollert for alle relevante uavhengige variabler - må kunne spesifisere en teoretisk mekanisme som kopler de to variablene 3. MÅL: Teste evne til å bruke kunnskapene i spørsmål 1. og 2. til å drøfte fordeler og ulemper med henholdsvis eksperiment og tverrsnittsundersøkelse i en konkret undersøkelse når hensikten er å teste en årsakshypotese Kandidatene bør se at problemstillingen for undersøkelsen er en årsakshypotese. Eksperiment er strengt tatt den eneste opplegget som under ideelle betingelser gjør det mulig å trekke «sikre» årsaksslutninger, men kan selvfølgelig ikke fjerne statistisk usikkerhet. Forskeren har kontroll med tidsrekkefølgen mellom årsak og virkning (ved at den uavhengige variabelen manipuleres) og har bedre muligheter til å kontrollere for forstyrrende (konfunderende) «tredjevariabler» (ved randomisering, dvs. tilfeldig fordelingen til eksperiment- og kontrollgruppe). Dette gir under ideelle betingelser god intern validitet. Problemet er den ytre validiteten, dvs. generaliserbarheten. Eksperimentsituasjonen kan fort bli unaturlig og urealistisk og følgelig fjernt fra den virkeligheten vi ønsker å si noe om. Dette problemet er noe mindre i felteksperimenteter, men disse gir igjen mindre kontroll med trusler mot den interne validiteten. Et tilleggsproblem er at det ikke sjelden er praktisk vanskelig å gjennomføre eksperimenter. Pluss for dem som peker på de etiske problemene med eksperimentet (og som kanskje henviser til Milgrams forsøk). Ved tverrsnittsundersøkelser måles variablene på ett tidspunkt, ofte ved at informantene svarer på en survey. Dette gjør det vanskelig å avgjøre årsaksretningen mellom variabler. (Pluss til dem som nevner at dette kan tas hensyn til ved å gjennomføre gjentatte tversnittsundersøkelser.) Kontroll for forstyrrende tredjevariabler må i analysene skje ved 5

kontrollvariabelmetoden (jf. regresjonsanalysen i oppgave 1). En kan derfor heller aldri være helt sikker på å ha kontrollert for alle relevante uavhengige variabler. Fordelene med tverrsnittsundersøkelser er den praktiske gjennomførbarheten og at det ofte er etisk mer forsvarlig. Noen kan kanskje finne på å besvare oppgaven rent «teoretisk». De bør få uttelling dersom momentene ovenfor er med, men en god besvarelse bør relatere disse momentene til den konkrete problemstillingen for undersøkelsen. En kan tenke seg et eksperiment der ungdommer tilfeldig fordeles til en eksperimentgruppe og en kontrollgruppe. Eksperimentgruppen blir vist voldelige filmer, mens kontrollgruppen blir vist filmer uten vold. Etterpå måles holdninger til å løse konflikter med vold. Hvis det er signifikant forskjell mellom de to gruppene (dvs. at eksperimentgruppen er mer positivt innstilt til å løse konflikter med vold), gir det støtte til årsakshypotesen. Spørsmålet er om dette opplegget kan forsvares etisk. Det er blant annet avhengig av den oppfølgingen deltakerne i eksperimentet får. Pluss til dem som tar opp dette. En tverrsnittsundersøkelse kunne for eksempel gjennomføres som survey hvor en stilte spørsmål om hvilke typer filmer en liker å se og holdningene til å løse konflikter med vold. Problemet er at en ikke kan være helt sikker på årsaksretningen her (rekkefølgen mellom handlings- og holdningsvariabler er alltid vanskelig å avgjøre). En kan heller ikke være sikker på om en har kontrollert for alle relevante bakgrunnsvariabler, selv om kjønn og sosial bakgrunn er naturlige kandidater. Opplegget er i alle fall i utgangspunktet mindre etisk betenkelig. Spørsmål 2B: 1. MÅL: Teste kunnskaper om forskjeller og likheter mellom to ulike design: kvalitativ og kvantitativ design. Ragin peker på forskjellen mellom de to designene: Kvantitative undersøkelser har mange enheter og få variabler. De går i bredden (ekstensive). Kvalitative undersøkelser har få enheter og mange variabler. De går i dybden (intensive). Jeg har problematisert dette på forelesningen. Det finnes blant annet kvantitative psykologiske tester som er omfattende og som har til hensikt å gå dybden. Det er heller ikke naturgitt at en kvalitativ undersøkelse går i dybden. Ragin peker også på at hovedsiktemålet for kvalitative undersøkelser er å finne likhetstrekk mellom enhetene i undersøkelsene og utvikle teoretiske begreper på bakgrunn av disse. Hovedsiktemålet for kvantitative undersøkelser er å undersøke forskjeller ved å undersøke samvariasjon mellom variabler, dvs. hvordan variasjon i en variabel (eller flere variabler) går parallelt med variasjon i en annen variabel. For eksempel at utdanningsforskjeller henger sammen med forskjeller i yrkeskarriere. Opp mot dette stiller han komparativ metode som ved å ta utgangspunkt i både forskjeller og likheter mellom enhetene blir i stand til å undersøke årsakssammenhenger. Også dette standpunktet er problematisert på forelesningen. Kvalitative undersøkelser kan for eksempel ha som utgangspunkt å undersøke forskjeller mellom ulike typer enheter. Ragin skjema er nyttig som idealtyper, men må brukes forsiktig hvis hensikten er å karakterisere kvalitativ og kvantitativ forskning generelt. 6

Tabellen oppsummerer noen av poengene hos Ragin. Kvalitativ Komparativ Kvantitativ Antall case Få Middels Mange Antall Mange Middels Få variabler Kjennskap til hvert case Inngående Stor Liten Fokus Likheter mellom Mønstre av forskjeller Forskjeller i form av case og likheter mellom variasjon i variabler Orientering Utvikle og klargjøre begreper case Avdekke hvordan kombinasjoner av årsaker påvirker utfall Dybdekunnskap Årsakskonstellasjoner Detaljer, Kontekst nyanser mellom case Korrelasjon (samvariasjon) mellom årsaks- og effektvariabler Generelle mønstre Forenkling, generalisering Grønmos artikkel gir en annen innfallsport til å diskutere forholdet mellom kvalitativ og kvantitativ tilnærming. Hans hovedtanke er at skillet ikke går mellom kvantitativ og kvalitativ metode, men mellom kvalitative og kvantitative data, dvs. data i tallform og data i tekstform. Det betyr at ulike sosiale fenomener kan studeres ved hjelp av både kvalitative og kvantitative data og at ulike datainnsamlingsteknikker kan gi både talldata og tekstdata (dybdeintervjuer kan for eksempel kodes om til kvantitative data og analyseres ved hjelp av innholdsanalyse). Grønmo presenterer mange skillelinjer mellom kvalitative og kvantitative data når det gjelder: typiske undersøkelsesopplegg (kvalitativ: deltakende observasjon, uformell intervjuing og kvalitativ innholdsanalyse; kvantitativ: strukturert observasjon, strukturert utspørring og kvantitativ innholdsanalyse) trekk ved undersøkelsen (kvalitativ: analytisk beskrivelse, fleksibilitet, nærhet og sensitivitet, relevans; kvantitativ: statistisk generalisering, strukturering, avstand og selektivitet, presisjon) hovedtrekk ved datainnsamlingen (kvalitativ: tilgjengelighet til relevante hendelser og handlinger, fullstendighet; kvantitativ: sammenliknbarhet mellom de utvalgte hendelsene og handlingene, nøyaktighet) Tabellen nedenfor oppsummerer Grønmos hovedpunkter i forbindelse med dataanalyse: 7

Det er som vi ser mye studentene kan legge vekt på. En god besvarelse bør vel ha med hovedtrekkene i Ragins idealtyper og Grønmos vekt på at det er dataene som skiller de to tilnærmingene. Men vi bør også belønne studenter som forholder seg fritt i forhold til disse to pensumbidragene. 2. MÅL: Teste kunnskaper om mulighetene for å kombinere kvalitativ og kvantitativ design. Grønmo peker på følgende fire kombinasjonsmuligheter: - kval. und. som forberedelse til kvant. und. - kval. und. som oppfølging til kvant. und. - parallell utnyttelse av kval. og kvant. tilnærminger under både datainnsamling og dataanalyse - innsamling av kval data som kvantifiseres under analysen Kandidaten bør kunne eksemplifisere hver av disse. 3. MÅL: Teste evne til å drøfte fordeler og ulemper med henholdsvis kvalitativ og kvantitativ design i en konkret undersøkelse når hensikten er å teste en årsakshypotese Kandidaten bør se at problemstillingen er en årsakshypotese. Siktemålet ser også ut til å være å si noe generelt om forholdet mellom sosial bakgrunn og utdanning. Dette taler for et ekstensivt opplegg med sikte på å teste en hypotese og generalisere resultatet til populasjonen. Alt dette taler for et kvantitativt opplegg. En kvantitativ tilnærming vil gi muligheter for å undersøke et sannsynlighetsutvalg av befolkningen og følgelig muligheten til å foreta statistisk generalisering. Et kvalitativt opplegg kunne vært mer egnet til å si noe om hvordan sosial bakgrunn fører til utdanningsforskjeller, dvs. avdekke mekanismer mellom disse fenomenene. De som diskuterer hvordan kvalitativ og kvantitativ tilnærming kan kombineres for å avdekke både om det er en sammenheng og hvordan denne sammenhengen ser ut, må belønnes. 8