Metode i medievitenskap MEVIT2800 Kvantitativ metode: observasjon, intervju og analyse Grønmo 2004: Kap 7, 8, 9, 14 og 15 18 mars, 2013 Karoline Andrea Ihlebæk
Kvantitative data fremstår som tall eller andre mengdetermer (Grønmo 2004:33). Generalisering: Å trekke slutninger fra utvalget til universet (Grønmo 2004: 85) Forutsetter bestemte typer utvalg og metoder for utvalg
Et sannsynlighetsutvalg defineres som et utvalg der alle enhetene i universet har en kjent sannsynlighet for å komme med i utvalget, og der denne sannsynligheten er større en null (ingen enhet er utelukket fra utvalget) og mindre enn 1 (ingen enhet er sikret plass i utvalget) (Grønmo 2004:87)
Utvalg 1000 Den norske befolkning per 2013: 5 051 275 Sannsynlighet for å komme med i utvalget: 1000 / 5 051 275= 0,00019796982 Det vil altså si mer en 0 og mindre enn 1
Enkel tilfeldig utvelging (loddtrekning) Systematisk utvelging (hver n te) Stratifisert utvelging (likhet mellom enhetene - proporsjonalt eller disproporsjonalt utvalg Klyngeutvelging (nærhet mellom enhetene) Flertrinns sannsylinghetsutvelging
Kildetype Kvalitativ data Kvantitativ data Aktør Deltakende observasjon Strukturert observasjon Respondent Uformell intervjuing (Samtaler) Strukturert utspørring (Survey) Dokument Kvalitativ innholdsanalyse Kvantitativ innholdsanalyse
Strukturert observasjon Aktørene iakttas mens de utfører den virksomheten som forskeren er interessert i å studere (Grønmo 2004:152)
Forutsetninger: Valg av felt Utforme observasjonsdata Grad av åpenhet Instruksjon av observatørene
Gjennomføre Informere aktørene Posisjon og synsvinkel Observasjon og skjemautfylling
Tre typiske problemer 1. Synsvinkelen begrenset 2. Laboratorieobservasjon kan påvirke aktørene 3. Observasjonen kan variere mellom ulike observatører
Summegruppe Når kan det være aktuelt å bruke strukturert observasjon i en medievitenskapelig studie?
Oppsummering observasjon: Forskeren er ikke deltakende Må forberede skjema og gjennomføring i forkant Feltobservasjon eller laboratorieobservasjon Må avgjøre hvor stor grad av åpenhet Finne riktig synsvinkel
Strukturerte intervjuer Ferdigformulerte spørsmål i en bestemt rekkefølge og med faste svaralternativer for de fleste spørsmålene (Grønmo 2004:165)
Viktig! Skjemaet må brukes på samme måten overfor alle respondentene!
Utspørringsmåten Respondenten fyller ut skjema Korte og enkle Respondentene blir intervjuet Avhengig av tilgjengelighet
Utforme spørreskjemaet Velge spørsmål basert på problemstillingen Hvert spørsmål vil referere til en bestemt variabel eller indikator Variabel er alle de registrerte opplysningene om en enhet Kan igjen deles inn i verdier
ENHET Variabel Verdi Kjønn 1. Mann 2. Kvinne Alder 1. 20-30 2. 31-40 3. 41-50 4. 51-60 Undervisningsemner 1. MEVIT1300 2. MEVIT1400 3. MEVIT1500 4. etc
Åpne spørsmål: ingen faste svaralternativer Hva synes du om dekningen av Paradise Hotel i norske medier? Lukkede spørsmål: faste svaralternativer Hva synes du om dekningen av Paradise Hotel i norske medier? 1. Det er fordummende 2. Det er underholdende 3. Det er altfor mye av det 4. Det er altfor lite av det 5. Annet?
Enkle eller sammensatte spørsmål Enkeltspørsmål fremstår for seg selv i spørreskjemaet Sammensatte spørsmål omfatter en pakke eller batteri av spørsmål som gir mening når de sees i sammenheng Sammensatte spørsmål brukes ofte i forbindelse med indekser Indeks: et sammensatt mål med flere variabler Indikator: en variabel som inngår i en indeks
Eksempel indeks: Vurder følgende utsagn om Paradise Hotel på en skala fra 1-5 hvor 5 er helt enig og 1 er helt uenig: a. Jeg synes Paradise Hotel er underholdende b. Jeg koser meg når jeg ser på Paradise Hotel c. Paradise Hotel burde aldri ha blitt sendt på TV d. De som er med på Paradise Hotel blir utnyttet av TVkanalen e. De som er med på Paradise Hotel blir rike og berømte etter de har deltatt i programmet
Spørsmålenes innhold Respondenten bør ha gode forutsetninger for å svare på spørsmålene Kognitive spørsmål: faktiske forhold Hvor ofte ser du på Paradise Hotel? Evaluative spørsmål: verdier og vurderinger Hva synes du om Paradise Hotel?
Sensitive spørsmål Hvor ofte ser du på porno? 1. Ofte 2. Sjelden 3. Aldri (fare for underrapportering) Hvor ofte ser du på NRKs debattprogram Dagsytt18? 1. Ofte 2. Sjelden 3. Aldri (fare for overrapportering)
Noen viktige huskeregler Lag nøytrale spørsmål På en skala fra 1-5, hvor stor interesse har du av å lese nyheter om Paradise Hotel i norske medier? Unngå ledende spørsmål Synes du underholdningsprogrammet på TV3 Paradise Hotel er et dårlig program? Klare, entydige og presise spørsmål Feil: Hvor mye tjener du? Riktig: Hvor stor var din samlede brutto årsinntekt i fjor, før skattefradrag og skattetrekk?
Svaralternativer Hvert spørsmål er en variabel, mens hvert svar er en verdi Må gjenspeile de operasjonelle definisjonen av variablene og deres verdier som vi gjør før datainnsamlingen
ENHET Variabel Verdi Er du mann eller kvinne? 1. Mann 2. Kvinne Hvor gammel er du? 1. 20-30 2. 31-40 3. 41-50 4. 51-60 Hvilke emner underviser du i? 1. MEVIT1300 2. MEVIT1400 3. MEVIT1500 4. MEVIT2800 5. MEVIT3220
Innbyrdes eksklusive og uttømmende Hvor fornøyd er du med forelesningene på MEVIT2800? Meget fornøyd Fornøyd Både og Misfornøyd Meget misfornøyd
Målenivå Kjennetegn Eksempel Nominalnivå Ulikhet (Mann/Kvinne) Ordinalnivå Rekkefølge mellom verdier. Ordnet i en bestemt rekkefølge. Utelukkende og forskjellige. Verdien er større eller mindre enn den andre. Foreleseren holder: 1) Gode forelesninger 2) Middels forelesninger 3) Dårlige forelesninger Intervallnivå Forhåndstallnivå Avstand mellom verdier. Gir informasjon om avstanden mellom verdiene. Ikke så interessant for samfunnsvitenskapen Samme som intervallnivå, men med et naturlig nullpunkt. Sier noe om forholdet mellom hverandre. En tempraturmåler Alder: 1.20-40 2.41-60 3.61-80
Rekkefølge på spørsmål 1. Enkle spørsmål 2. Mer krevende spørsmål 3. Sensitive og kontroversielle spørsmål 4. Enkle og behagelige spørsmål
Lay-out Filterspørsmål: Ser du nyheter på tv? Nei. Hvor ofte ser du på tv-nyheter? Jeg ser ikke på tvnyheter. Hvilken kanal ser du tv-nyheter på? Jeg sa jo at jeg ikke ser på nyheter på tv, din idiot. Still spørsmål om samme tema i samme bolk
Pre-testing av spørreskjemaet: prøv ut spørreskjemaet på noen utvalgte før selve undersøkelsen begynner, så slipper du sånne dumme feil
Etiske vurderinger Loven om personopplysninger forutsetter at respondentene får visse typer av informasjon: Om hensikten med utspørringen Om konfidensialitet og anonymitet Om retten til å nekte å delta eller å trekke seg underveis
Gjennomføring: Respondenten fyller ut skjema Intervju via telefon, face-to-face, skype Mål å få høy svarprosent
Tre typiske problemer: Respondentens vilje til å svare Respondentens evne til å svare Reposdentens forståelse av spørsmålene
Summegruppe Hvilke styrker og svakheter er det ved å bruke kvantitative intervjuer som metode?
Oppsummering: Strukturert intervju bygger på ferdigformulerte spørreskjemaer som tar utgangspunkt i variabler som er relevant ut i fra problemstillingen Spørsmål stilles i en bestemt rekkefølge (enkle, krevende, kontroversielle, hyggelige) Målenivå på svaralternativer: nominal, ordinal, intervall, forhåndstall
Alle må stilles samme spørsmål Spørsmålene må være nøytrale, endimensjonale og klare og forståelige Mål med høy svarprosent
Pause
Analyse av kvantitativ data ++ ± Grønmo 2004: Kap 14 og 15
I alle kvantitative studier vil datamaterialet foreligge som tall. Gjelder for strukturert observasjon, strukturerte intervjuer og kvantitativ innholdsanalyse Alle metodene kan derfor analyseres likt
Mål: identifisere, beskrive og karakterisere faktiske mønstre i det datamaterialet som analyseres. Nødvendig å: organisere og tilrettelegge datamaterialet for analysen
Datamatrise (N1500=respondenter) Variabler Enheter V1 Kjønn V2 Alder V3 Bosted V4 Utdanning V5 Antall kinobesøk per måned V6 Interesse av å se norsk film på kino E1 1 2 1 3 1 1 E2 1 3 2 3 2 1 Hvorfor er E3 2 2 1 jeg et tall? 3 4 2 E4 2 3 3 3 3 1 E5 1 4 2 2 2 4 E6 1 5 1 1 3 5
Kodebok Variabel nr. Variabelnavn Kode Verdi 1 Kjønn 1 2 2 Alder 1 2 3 3 Type bosted 1 2 3 4 Utdanning 1 2 3 5 Kinobesøk per måned 1 2 3 4 6 Hvor stor interesse har du av å se på norsk film på kino 1 2 3 4 5 Mann Kvinne 20-30 31-40 41-50 By mindre enn 50.000 By mellom 50.000-250.000 By over 250.000 Videregående Høyskole/universitet under 4 Høyskole/universitet under +4 Ingen 1-3 4-6 Mer Svært liten interesse Liten interesse Middels interesse Stor interesse Svært stor interesse
Omkoding av variable Flere verdier for en variabel kan slås sammen Hvor stor interesse har du av å se på norsk film på kino 1. Svært liten interesse 2. Liten interesse 3. Middels interesse 4. Stor interesse 5. Svært stor interesse Slått sammen verdier: 1. Liten interesse 2. Middels interesse 3. Stor interesse
Indekser Slå sammen flere variabler til en ny indeks Variablene kalles da indikatorer
Analyse: beskrive fordelingen av de ulike verdiene Frekvens: antall enheter som er registrert med en bestemt verdi En fordeling på en enkelt variabel eller på en enkel indeks omtales som en univariat fordeling
Datamatrise Variabler Enheter V1 Kjønn V2 Alder V3 Bosted V4 Utdanning V5 Antall kinobesøk per måned V6 Interesse av å se norsk film på kino E1 1 2 1 3 1 1 E2 1 3 2 3 2 1 E3 2 2 1 3 4 2 E4 2 3 3 3 3 1 E5 1 4 2 2 2 4 E6 1 5 1 1 3 5
Eksempel: Variabel 6 fra kodebok Hvor stor interesse har du av å se på norsk film på kino? 1. Svært liten interesse 2. Liten interesse 3. Middels interesse 4. Stor interesse 5. Svært stor interesse
Ulike fremstillinger Absolutt frekvens: faktisk opptelling av enhetene for de ulike verdiene Relativ frekvens: hvor mange prosent enhetene utgjør av alle enhetene Kumulativ frekvens: prosentandelen for en bestemt verdi pluss prosentandelen for alle lave verdier
Interesse av å se på film Absolutt frekvens Relativ frekvens (prosentfordeling) Kumulativ frekvens 1. Svært lite interesse 345 345x100/1500= 23 345x100/1500= 23 2. Liten interesse 330 330x100/1500= 22 330+345x100/150 0= 45 3. Middels interesse 300 300x100/1500= 20 300+330+345x100 /1500= 65 4. Stor interesse 285 285x100/1500= 19 285+300+330+345 x100/1500= 85 5. Svært stor interesse 240 240x100/1500= 16 240+285+300+330 +345x100/1500= 100 Sum 1500 23+22+20+19+16= 100% 100%
Trykk på nederste linje
Statistiske mål Sentraltendens: hvilken verdi på variabelen som er mest sentral i fordelingen av enhetene Spredning av enheter: hva som karakteriserer spredningen av enhetene på de ulike verdiene
Median er et mål på sentraltendens som tar hensyn til verdiens rekkefølge Når verdien er ordnet i stigende rekkefølge, er medianen den verdien der fordelingen deles i like store deler
Interesse av å se på film Absolutt frekvens Relativ frekvens Kumulativ frekvens 1. Svært lite interesse 345 345x100/1500= 23 345x100/1500= 23 2. Liten interesse Median 330 330x100/1500= 22 Det kan vi se 330+345x100/150 0= 45 3. Middels interesse 300 300x100/1500= her 20 300+330+345x100 /1500= 65 4. Stor interesse 285 285x100/1500= 19 285+300+330+345 x100/1500= 85 5. Svært stor interesse 240 240x100/1500= 16 240+285+300+330 +345x100/1500= 100 Sum 1500 23+22+20+19+16= 100% 100%
Spredning Statistiske mål på spredning i en univariat fordeling viser hvilken grad enhetene er spredt på ulike verdier, eller i hvilken grad de er spredt rundt medianen. Flere mulige spredningstyper Vi ser kun på normert modalprosent
Hvis alle enhetene har den samme verdien er modalprosenten på 100 Altså hvis alle enhetene for variabelen kjønn har verdien kvinner, så er modalprosenten på 100 for denne variabelen
Hvis vi skal se på spredningen for variablene (v6) om interesse for norsk film på kino er formelen slik: Normert modalprosent = 23 100/5 x 100 = 3,75 100 100/5 3,75 er svært lav og spredningen er derfor stor (altså, er tallet lavt er spredningen stor)
Interesse av å se på film Absolutt frekvens Relativ frekvens Kumulativ frekvens 1. Svært lite interesse 345 345x100/1500= 23 345x100/1500= 23 2. Liten interesse 330 330x100/1500= 22 330+345x100/150 0= 45 3. Middels interesse 300 300x100/1500= 20 300+330+345x100 /1500= 65 4. Stor interesse 285 285x100/1500= 19 285+300+330+345 x100/1500= 85 5. Svært stor interesse 240 240x100/1500= 16 240+285+300+330 +345x100/1500= 100 Sum 1500 23+22+20+19+16= 100% 100%
Sammenheng mellom variabler En statistisk sammenheng mellom to variabler innebærer en sannsynlighet for at enheter med bestemte verdier på den ene variabelen også har bestemte verdier på den andre variabelen (Grønmo 2004:291)
Bivariate analyser sammenhengen mellom to variabler Multivariate analyser sammenhengen mellom tre eller fire variabler.
Tabellanalyse Brukes når variablene er på nominalnivå eller ordinalnivå Forutsetter variabler med få verdier Avhengighetsforhold mellom to variabler innebærer at den variabelen forutsettes å påvirke den andre
Den variabelen som påvirker kaller vi for den uavhengig variabel Den variabelen som påvirkes kaller vi for avhengig variabel Hvis vi ikke skiller mellom uavhengig og avhengig variabler er forholdet symmetrisk
Hvem er avhengig og hvem er uavhengig variabel? Når vi ser på forholdet mellom to variabler er spørsmålet om vi kan anta at de enkelte enhetenes verdier på den ene variabelen er fastlagt før de fikk sine verdier på den andre variabelen hvis det er mulig å forutsette en slik tidsrekkefølge mellom variablene, kan analysen ta utgangpunkt i et avhengighetsforhold mellom to variabler (Grønmo 2004:294)
Den variabelen som er fastlagt først er UAVHENGIG Den variabelen som ble fastlagt sist er AVHENGIG Og den som er AVHENGIG påvirkes av den UAVHENGIGE
Datamatrise Variabler Enheter V1 Kjønn V2 Alder V3 Bosted Summegruppe: V4 Utdanning V5 Antall kinobesøk per måned V6 Interesse av å se norsk film på kino Hvem er avhengig og hvem er uavhengig av V1 og V3? E1 1 2 1 3 1 1 E2 1 3 2 3 2 1 E3 2 2 1 3 4 2 E4 2 3 3 3 3 1 E5 1 4 2 2 2 4 E6 1 5 1 1 3 5
Svar: Uavhengig variabel er kjønn og avhengig variabel er bosted. Fordi: Kjønn kan ikke påvirkes av bosted, men bosted kan påvirkes av kjønn.
Bivariat sammenheng mellom inntekt og boligstørrelse, absolutte frekvenser Inntekt Boligstørrelse Lav Middels Høy Total Liten 250 100 50 400 Middels 150 400 50 600 Stor 100 200 200 500 Sum 500 700 300 1500
Relative frekvenser (alder og utdanning) vertikal prosentuering Inntekt Boligstørrelse Lav Middels Høy Total Liten 250x100/500 =50 100x100/700 =14 50x100/300 =17 27 Middels 150x100/500 =30 400x100/700 =57 50x100/300 =17 40 Stor 100/100/500 =20 200x100/700 =29 200x100/300 =66 33 Sum 100% 100% 100% 100% N 500 700 300 1500
Relative frekvenser (alder og utdanning) horisontal prosentuering Inntekt Boligstørrelse Lav Middels Høy Sum N Liten 250x100/100 =62 100x100/400 =25 50x100/600 =13 100% 400 Middels 150X100/600 =25 400x100/600 =67 50x100/600 =8 100% 600 Stor 100x100/500 =20 200x100/500 =40 200x100/500 =40 100% 500 Sum 33 47 20 100% 1500
Prosentuering med basis i totalsummen (N1500) Inntekt Boligstørrelse Lav Middels Høy Sum Liten 250x100/1500 =16 100x100/1500 =7 50x100/1500 =4 27 Middels 150x100/1500 =10 400x100/1500 =27 50x100/1500 =3 40 Stor 100x100//1500 =7 200x100/1500 =13 200x100/1500 =13 33 Sum 33 47 20 100% (N=1500)
Sammenheng Hvilken av prosentueringene som bør brukes i en gitt analyse vurderes i forhold til skillet mellom avhengig og uavhengig variabel Hvilken er avhengig og uavhengig variabel her? Inntekt eller størrelse på bolig?
Svar: Inntekt=uavhengig, bolig=avhengig Det vil være rimelig å anta at inntekten er fastlagt før kjøp av bolig
Oppsummering Kvantitative data foreligger som tall Organiser datamaterialet i en datamaterise med utgangpunkt i en kodebok Fordelingen av enhetene på en variable kalles univariat fordeling, som kan analyseres ved hjelp av frekvenser (absolutte, relative og kumulative), grafiske framstillinger og statistiske mål
For å se på sammenhenger mellom variabler kan vi foreta en bivariat tabellanalyse Vi skiller mellom avhengig og uavhengig variabel Kan foreta vertikal, horisontal eller prosentuering med basis i totalsummen for å se sammenhenger
Forvirret? Kom på seminaret på fredag. Der skal vi øve oss