Måling SOS1120 Kvantitativ metode Forelesningsnotater 5. forelesning høsten 2005 Per Arne Tufte Måling er å knytte teoretiske begreper til empiriske indikatorer Operasjonell definisjon Angir hvordan et teoretisk begrep skal måles Definisjoner av begreper Eks.: interesse for politikk Teoretisk definisjon (eks.: fattigdom) Operasjonell definisjon (eks.: under halvparten av median inntekt) Data (eks.: inntektsstatistikk) Validitet Reliabilitet Innholdsvaliditet Kriterievaliditet Begrepsvaliditet Allmenn kildekritikk Målingenes konsistens Test retest Splitt i to Intern konsistens Angi hvor stor eller liten din politiske interesse er på en skala fra 1 til 5, hvor 1 er overhodet ikke interessert og 5 svært interessert. 1 2 3 4 5 Nokså lite Noe Nokså interessert interessert interessert Overhodet ikke interessert Teoretisk begrep Begrepsvaliditet Operasjonell definisjon Svært interessert 1
Enheter norske innbyggere i stemmeberettiget alder (1) Avklare hvilke dimensjoner (aspekter) består begrepet av Norskhet Sjåvinisme Prioritere norsk Betydningen av Født i Norge Norsk statsborgerskap Bo i Norge Protestantisk kristen Helst bo i Norge Alle burde være nordmenn Norge er bedre enn de fleste andre land Man bør støtte sitt land selv om det handler galt Teoretiske variabel: variabler nasjonal indentitet Nasjonal holdning til identitet innvandrere Nasjonal stolthet (2) Avklare hvilke indikatorer (variabler) en skal bruke for å si noe om de aktuelle dimensjonene Begrense import Utlendinger ikke få kjøpe eiendom Prioritere norske filmer og programmer Norge følge egne interesser på tross av mulig konflikt Vitenskap og teknologi Sportsresultater Kunst og kultur Væpnede styrker Historie Velferdsstolthet Demokratiet Velferdssystemet Rettferdig og lik behandling Eksempel: Indikatorer for nasjonal identitet (Knutsen) Variablenes målenivå Hvilken informasjon gir tallene i datamatrisen? Hvilke egenskaper ved kodetallene kan en gjøre bruk av for å gi en meningsfull fortolkning Hvordan kan tallenes behandles/analyseres? Hvilke regneoperasjoner er det meningsfylt å gjøre med kodetallene? De fire målenivåene Nominalnivå Har du studert i utlandet eller planer om å studere ved universiteter utenfor Norge? 1 Ja, har studert i utlandet 2 Ja, har planer om å studere i utlandet 3 Ja, har studert og planer om å studere videre i utlandet 4 Nei angir kun at enhetene har lik/forskjellig verdi på variabelen sier ikke noe om rangering/ordning Enhet og mangfold s. 155 2
Er hjemstedet ditt Ordinalnivå 1 Stor by (Oslo, Bergen, Trondheim eller Stavanger) 2 Mellomstor by (mellom 50 000 og 100 000 innbyggere) 3 Liten by (mellom 15 000 og 50 000 innbyggere) 4 Større tettsted (mellom 5 000 og 15 000 innbyggere) 5 Mindre tettsted 6 Bygd eller grend angir at enhetene har lik/forskjellig verdi på variabelen sier noe om en ordning/en logisk rangering Intervallnivå angir at enhetene har lik/forskjellig verdi på variabelen sier noe om en ordning/en logisk rangering angir hvor stor avstanden er mellom verdiene har ikke absolutt nullpunkt Forholdstallsnivå Omtrent hvor stort var ditt studielån før semesterstart? cccccc kroner angir at enhetene har lik/forskjellig verdi på variabelen sier noe om en ordning/en logisk rangering angir hvor stor avstanden er mellom verdiene har absolutt nullpunkt Målenivåene og regneoperasjoner Skille verdier fra hverandre Ordne verdier etter størrelse Regne avstander mellom verdier Regne forhold mellom verdier Ordinalnivå Nominalnivå Intervallnivå Forholdstallsnivå 3
En datamatrise lagret i SPSS Kvantitativ dataanalyse Enhet og mangfold s. 282 Frafall og manglende data Frafall Bruttoutvalg Nettoutvalg Hvor mange? Manglende data Tilfeldig eller systematisk? Datamatrise Avhengig og uavhengig variabel Hvordan fordelingen på en variabel avhenger av hvilke verdier vi har på en annen variabel Uavhengig variabel (f. eks. kjønn) Avhengig variabel (f. eks. hvor lang tid en bruker på badet) Spesielt aktuelt ved undersøkelse av årsakshypoteser. 4
Analyseteknikker på dette kurset 1. Analyseteknikker Hvordan undersøker vi om det er sammenheng mellom variablene? Kategorivariabler Krysstabellanalyse Kontinuerlig avhengig variabel Test av forskjeller mellom gjennomsnitt Variansanalyse (ANOVA) Ordinær regresjonsanalyse (OLS) Mål på sammenheng mellom variabler (korrelasjonsmål) 2. Korrelasjonsmål Hvor sterk er sammenhengen mellom variablene? Nominalnivå: Phi / Cramers V Ordinalnivå: Gamma/Somers d/kendalls tau b og tau c Intervall /forholdstallsnivå: Pearsons r 5
To former for statistisk generalisering 3. Statistisk generalisering Kan resultatene fra utvalget gjøres gjeldende for populasjonen? Estimering Anslår en populasjonsstørrelse på bakgrunn av resultatene i utvalget Feilmarginer Hypotesetesting Tester hvilken statistisk hypotese som er mest sannsynlig 1. Hvilken test skal brukes? Gangen i hypotesetesting Kjikvadrattest (krysstabellanalyse) T test (testing av forskjeller mellom gjennomsnitt, regresjonskoeffisienter) F test (variansanalyse, regresjonsmodell) 6
2. Formulerer hypoteser Nullhypotese: H0: Ingen sammenheng mellom variablene Alternativ hypotese: H1: Sammenheng mellom variablene Det er alltid nullhypotesen vi tester, aldri alternativhypotesen! 3. Valg av signifikansnivå Akseptabel sannsynlighet for å forkaste nullhypotesen når den er sann Nullhypotesen er: Beslutning: Sann Gal Beholder H 0 Korrekt beslutning Feil av type II β Forkaster H 0 Feil av type I α Korrekt beslutning 4. Finne testobservator (eller dens p verdi) Avhengig av type test: Kjikvadrat T verdi F verdi Samme grunnprinsipp for alle testene: Hvor stor er forskjellen mellom utvalgsresultat og det resultatet vi skulle ha fått dersom nullhypotesen er riktig. 5. Konklusjon Hvis testobservator er høyere enn kritisk verdi (evt. p verdi lavere enn signifikansnivå), forkast H0. Utvalgsresultatet avviker så mye fra nullhypotesen at det er liten fare for å forkaste en riktig nullhypotese (feil av type I). 7