Univariate tabeller. Bivariat tabellanalyse. Forelesning 8 Tabellanalyse. Formålet med bivariat analyse:



Like dokumenter
Univariate tabeller. Statistisk uavhengighet og statistisk avhengighet. Bivariat tabellanalyse. Hvordan bør vi prosentuere denne tabellen?

Forelesning 10 Kjikvadrattesten

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

Eksamensoppgave i ST3001

Forelesning 9 Statistiske mål for bivariat tabellanalyse

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Forelesning 13 Regresjonsanalyse

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Krysstabellanalyse. SOS1120 Kvantitativ metode. Disposisjon. 1. Beskrivelse av analyseteknikk. Forelesningsnotater 7. forelesning høsten 2005

3. Multidimensjonale tabeller. SOS1120 Kvantitativ metode. Årsaksmodeller. Forelesningsnotater 8. forelesning høsten 2005

Statistisk generalisering

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Forelesning 10 Statistiske mål for bivariat tabellanalyse. Korrelasjonsmål etter målenivå. Cramers V

Kort innføring i SPSS

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

Case Processing Summary

Metode i medievitenskap MEVIT2800 Kvantitativ metode: observasjon, intervju og analyse Grønmo 2004: Kap 7, 8, 9, 14 og mars, 2013 Karoline

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Logistisk regresjon 2

Løsningsforslag eksamen sos1001 V14

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Statistikk er begripelig

Eksamensoppgave i samfunnsfaglig forskningsmetode 16. mai 2003

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

Tyngdekraft og luftmotstand

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Logistisk regresjon 1

Semesteroppgave 1 i SOS1002 Samfunnsvitenskapelig forskningsmetode

Forelesning 17 Logistisk regresjonsanalyse

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2007

Korrelasjon og lineær regresjon, litt om resultatpresentasjon

UTSATT EKSAMEN I SOS1120 KVANTITATIV METODE 8. JANUAR 2007 (4 timer)

Value added-indikatoren: Et nyttig verktøy i kvalitetsvurdering av skolen?

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

Bergen kommune Seksjon informasjon

Arbeidstid. Medlemsundersøkelse mai Oppdragsgiver: Utdanningsforbundet

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

Eksamensoppgave i SØK3514 / SØK8614 Anvendt økonometri

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SPED4010/eksamen i statistikk: Fredag 30.september 2011 kl

ST0202 Statistikk for samfunnsvitere

ME Metode og statistikk Candidate 2511

Testobservator for kjikvadrattester

Utarbeidelse av forskningsprotokoll

SPSS Statistics-kurs 2013

Analyse av nasjonale prøver i lesing, regning og engelsk pa ungdomstrinnet 2015 for Telemark

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

NyGIV Regning som grunnleggende ferdighet

Det lille kvantitative metodeheftet

Forelesning 9 mandag den 15. september

Omtaler av grunnlagsrapporten. I dette dokumentet finnes det tre uttalelser om grunnlagsrapporten til elevundersøkelsen 2007.

FRITT SYKEHUSVALG KONKURRANSE OG BEDRE KVALITET?

ME Vitenskapsteori og kvantitativ metode

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Actis R A P P O R T. Sentio Research Norge AS Verftsgata Trondheim Org.nr MVA. Mottaker

Gjør kort rede for seks av de åtte begrepene. Bruk inntil ½ side på hvert begrep.

Vedrørende rundskriv for vurdering av par ved assistert befruktning

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Semesteroppgave i SVSOS107 Samfunnsvitenskapelig forskningsmetode

SKOLEEKSAMEN 2. november 2007 (4 timer)

Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.

Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå

Reglement for Studenttinget NTNU

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

UNGDATA. Presentasjon Østfold

Mendelsk Genetikk (kollokvium )

Ørl an d kom m u n e R A P P O R T. Sentio Research Norge AS Verftsgata Trondheim Org.nr MVA. Mottaker. Dato:

Under noen av oppgavene har jeg lagt inn et hint til hvordan dere kan går frem for å løse dem! Send meg en mail om dere finner noen feil!

Repeterbarhetskrav vs antall Trails

MU Totalrapport. Antall besvarelser: 113. Norsk Kulturråd. Svarprosent: 87% Totalrapport

Personvernundersøkelsen 2008

Oppgave 1: Kvantitaitv metode: a)

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

Sensurveiledning SOS1002, vår 2013

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

EKSAMEN I SOSIOLOGI SOS KVANTITATIV METODE. ORDINÆR SKOLEEKSAMEN 4. april 2011 (4 timer)

Kunnskapssenterets årskonferanse 2006 Jon Helgeland. Måling av 30 dagers overlevelse ved hjerneslag, hjerteinfarkt og hoftebrudd

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Klasseledelse, fag og danning hva med klassesamtalen i matematikk?

Spørreundersøkelse om holdninger til organdonasjon 2015

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Repeterbarhetskrav vs antall Trails

NHO R A P P O R T. Sentio Research Norge AS Verftsgata Trondheim Org.nr MVA. Mottaker. Deres ref:

PRIMTALL FRA A TIL Å

R A P P O R T. Vår ref: Marie Rande Arve Østgaard INNLEDNING

Positiv og virkningsfull barneoppdragelse

Transkript:

Forelesning 8 Tabellanalyse Tabellanalyse er en godt egnet presentasjonsform hvis: variablene har et fåtall naturlige kategorier For eksempel kjønn, Eu-syn variablene er delt inn i kategorier For eksempel alder inndelt i Yngre og Eldre Tabellanalysen kan være: univariat (en variabel) bivariat (to variabler) multivariat (tre eller flere variabler) 1 Univariate tabeller cq2 WHAT DID YOU VOTE? Valid Missing Cumulative Frequency Percent Valid Percent Percent 1 VOTED YES 1315 39,2 46,4 46,4 2 VOTED NO 1517 45,2 53,6 100,0 2832 84,4 100,0 3 VOTED BLANK 3,1 8 DONT KNOW/REFUSES 15,4 TO ANSWER System 507 15,1 525 15,6 3357 100,0 Hvordan bør vi sette opp denne tabellen i en rapport? Tabell 1. Stemmegivning ved folkeavstemningen om EU i 1994. Stemmegivning: Prosent Ja 46 Nei 54 Sum 100 (N=) (2832) 2 Bivariat tabellanalyse Formålet med bivariat analyse: Avgjøre hvorvidt enhetenes verdi på en variabel har en tendens til å gå sammen med en bestemt verdi på en annen variabel Det vil si å avgjøre om det er statistisk avhengighet eller statistisk uavhengighet mellom de to variablene 3 1

Statistisk uavhengighet og statistisk avhengighet Statistisk uavhengighet mellom variablene To variabler er statistisk uavhengige når de relative betingede fordelingene er like. Dette innebærer at de relative betingede fordelingene er lik marginalfordelingen. Statistisk avhengighet mellom variablene Når de relative betingede fordelingene er forskjellige har vi statistisk avhengighet mellom variabelen. Jo sterkere statistisk avhengighet, jo lettere kan vi forutsi enhetenes verdi på en variabel ut fra hvilken verdi de har på den andre variabelen. Vi kan undersøke om det er statistisk avhengighet ved å: sammenligne ulike prosentfordelinger (de relativt betingede fordelingene) måle styrken på den statistiske avhengigheten ved hjelp av statistiske mål 4 Hvordan bør vi prosentuere denne tabellen? cq2 WHAT DID YOU VOTE? * sex sex Crosstabulation cq2 WHAT DID YOU VOTE? 1 VOTED YES 2 VOTED NO Den bivariate fordelingen sex sex 1 MALE 2 FEMALE 796 519 1315 750 767 1517 1546 1286 2832 Horisontal marginal Vertikal marginal 5 Tre måter å prosentuere på Prosentuering med basis i det totale antall enheter Prosentuering med basis i de vertikale marginalene (Horisontal prosentuering) Prosentuering med basis i de horisontale marginalene (Vertikal prosentuering) 6 2

Prosentuering med basis i det totale antallet enheter cq2 WHAT DID YOU VOTE? * sex sex Crosstabulation cq2 WHAT DID YOU VOTE? 1 VOTED YES 2 VOTED NO % of % of % of sex sex 1 MALE 2 FEMALE 796 519 1315 28,1% 18,3% 46,4% 750 767 1517 26,5% 27,1% 53,6% 1546 1286 2832 54,6% 45,4% 100,0% 28,1 prosent av utvalget består av menn som stemte ja til EU 7 Prosentuering med basis i den vertikale marginalen cq2 WHAT DID YOU VOTE? * sex sex Crosstabulation cq2 WHAT DID YOU VOTE? 1 VOTED YES % within cq2 WHAT DID YOU VOTE? 2 VOTED NO % within cq2 WHAT DID YOU VOTE? % within cq2 WHAT DID YOU VOTE? sex sex MALE 2 FEMALE 1 796 519 1315 60,5% 39,5% 100,0% 750 767 1517 49,4% 50,6% 100,0% 1546 1286 2832 54,6% 45,4% 100,0% Det er 11,1 prosentpoeng flere ja-stemmer enn nei-stemmer blant menn (Vil det si at ja-stemming øker sannsynligheten for å bli en mann?) 8 Prosentuering med basis i den horisontale marginalen cq2 WHAT DID YOU VOTE? * sex sex Crosstabulation cq2 WHAT DID YOU VOTE? 1 VOTED YES % within sex sex 2 VOTED NO % within sex sex % within sex sex sex sex 1 MALE 2 FEMALE 796 519 1315 51,5% 40,4% 46,4% 750 767 1517 48,5% 59,6% 53,6% 1546 1286 2832 100,0% 100,0% 100,0% Det er 11,1 prosentpoeng flere kvinner som stemte nei enn menn! Aha! Her har vi et funn!!!!! Hva avgjør så prosentueringsretningen? Kausaliteten! 9 3

Ulike måter å forklare sammenhengen mellom to variabler Kausal sammenheng Forklarer den statistiske sammenhengen mellom variablene ved at en uavhengig variabel påvirker verdien på en avhengig variabel. Eksempel: Sammenhengen mellom foreldre og barns utdanningsnivå. Ikke kausal sammenheng Måling av statistisk sammenheng uten at den ene variabelen betraktes som årsak til den andre. Eksempel: Sammenhengen mellom ektefelles utdanningsnivå. 10 Uavhengige og avhengige variabler Når vi ønsker å studere hvordan fordelingen på en variabel er betinget av hvilken verdi enhetene har på en annen variabel, kaller vi den første for avhengig variabel og den andre for uavhengig variabel. Kjønn Stemmegivning ved EU-valget Uavhengig variabel Avhengig variabel 11 Hvordan bestemmer vi hvilken variabel som er uavhengig? Årsaken (X) må komme før effekten (Y) Modellens årsakshierarki må spesifiseres ut fra teori eller sunn fornuft Det må være statistisk sammenheng (samvariasjon) mellom X og Y Styrken for den statistiske sammenhengen mellom X og Y i utvalget kan beregnes med ulike statistiske mål Sammenhengen mellom X og Y må ikke være spuriøs Vi må kontrollere for andre mulig årsaksvariabler 12 4

To enkle regler ved prosentuering Vi prosentuerer alltid med basis i den eller de uavhengige variablene. Vi kommenterer alltid tabellen på tvers av prosentueringsretningene. 13 Hva er uavhengig og avhengig variabel i denne tabellen, og hvordan tolker vi tabellen? Tabell 2. Stemmegivning ved folkeavstemningen om EU i 1994 etter kjønn. Prosenter. Menn Kvinner Ja 52 40 Nei 49 60 Sum 101 100 (n=) (1546) (1286) 14 Hva er statistisk avhengighet i et utvalg? Er det statistisk avhengighet mellom kjønn og EU-syn i dette utvalget på 1000 enheter? Kjønn: Menn Kvinner Ja 250 250 Nei 250 250 Kjønn: Menn Kvinner t Ja 50 50 50 Nei 50 50 50 Sum 100 100 100 (n=) (500) (500) (1000) Nei det er ingen statistisk avhengighet fordi de relativt betingede fordelingene (fordelingen for menn og kvinner) er lik marginalfordelingen (totalfordelingen)! 15 5

Er det statistisk avhengighet mellom kjønn og EU-syn i dette utvalget? Kjønn: Menn Kvinner Ja 200 200 Nei 300 300 Kjønn: Menn Kvinner t Ja 40 40 40 Nei 60 60 60 Sum 100 100 100 (n=) (500) (500) (1000) Nei det er fortsatt ingen statistisk avhengighet fordi de relativt betingede fordelingene (fordelingen for menn og kvinner) er lik marginalfordelingen (totalfordelingen)! 16 Er det statistisk avhengighet her? Kjønn: Menn Kvinner Ja 240 160 Nei 360 240 Kjønn: Menn Kvinner t Ja 40 40 40 Nei 60 60 60 Sum 100 100 100 (n=) (600) (400) (1000) Nei det er fortsatt ingen statistisk avhengighet! 17 Er det statistisk avhengighet mellom kjønn og EU-syn i dette utvalget? Kjønn: Menn Kvinner Ja 300 200 Nei 200 300 Kjønn: Menn Kvinner t Ja 60 40 50 Nei 40 60 50 Sum 100 100 100 (n=) (500) (500) (1000) Ja her er de prosentuerte betingede fordelingene ulike, og de er ikke lik marginalfordelingen! Det vil si: I dette utvalget på 1000 enheter er det statistisk avhengighet mellom kjønn og EU-syn 18 6

kategorier Hvor stor må den statistiske avhengigheten i utvalget være for at vi også kan hevde at den gjelder i den populasjonen som utvalget er trukket fra? 19 Valg av metode for statistisk generalisering er avhengig av hva slags variabler vi har Avhengig variabel Uavhengig variabel kontinuerlig kategorivariabel Kjikvadrattest Logistisk regresjonsanalyse kontinuerlig variabel Lineær regresjonsanalyse med dummyer Lineær regresjonsanalyse 20 Kjikvadrattesten Den mest benyttede metoden for å utføre statistiske generaliseringer fra bivariate tabeller. Brukes til å teste nullhypotesen om at det ikke er sammenheng mellom to variabler i populasjonen ved hjelp av data fra et sannsynlighetsutvalg. 21 7

Y EU-syn Hvis menn og kvinner stemmer likt er det mest sannsynlig at vi får denne fordelingen i utvalget Y EU-syn * X Kjønn Crosstabulation 1 Ja 2 Nei X Kjønn 1 Menn 2 Kvinner 500 500 1000 500 500 1000 1000 1000 2000 Kjikvadratet viser at det er ingen forskjell mellom de frekvensene i vårt utvalg og frekvensene slik vi må forvente at de vil være hvis det ikke er noen forskjell i populasjonen som utvalget er trukket fra. Asymp. Sig. Exact Sig. Exact Sig. Value df (2-sided) (2-sided) (1-sided) Pearson Chi-Square.000 b 1 1.000 Continuity Correction a.000 1 1.000.000 1 1.000 1.000.518.000 1 1.000 2000 500.00. 22 Kan vi avkrefte lik stemmegivning i populasjonen hvis vi får dette utvalgsresultatet? Y EU-syn Y EU-syn * X Kjønn Crosstabulation 1 Ja 2 Nei X Kjønn 1 Menn 2 Kvinner 510 490 1000 490 510 1000 1000 1000 2000 Det er 37,1% sannsynlighet for at kvinner og menn i populasjonen stemmer likt i populasjonen Asymp. Sig. Exact Sig. Exact Sig. Value df (2-sided) (2-sided) (1-sided) Pearson Chi-Square.800 b 1.371 Continuity Correction a.722 1.395.800 1.371.395.198.800 1.371 2000 500.00. 23 Kan vi avkrefte hypotesen om at kvinner og menn stemmer likt ut fra dette utvalgsresultatet? Y EU-syn Y EU-syn * X Kjønn Crosstabulation X Kjønn 1 Menn 2 Kvinner 1 Ja 520 480 1000 2 Nei 480 520 1000 1000 1000 2000 Det er fortsatt 7,4% sannsynlighet for at menn og kvinner i populasjonen kan stemme likt Asymp. Sig. Exact Sig. Exact Sig. Value df (2-sided) (2-sided) (1-sided) Pearson Chi-Square 3.200 b 1.074 Continuity Correction a 3.042 1.081 3.201 1.074.074.041 3.198 1.074 2000 500.00. 24 8

Her kan vi avkrefte hypotesen om lik stemmegivning Y EU-syn Y EU-syn * X Kjønn Crosstabulation X Kjønn 1 Menn 2 Kvinner 1 Ja 525 475 1000 2 Nei 475 525 1000 1000 1000 2000 Det er 2,5% sannsynlighet for at kvinner og menn i populasjonen stemmer likt Asymp. Sig. Exact Sig. Exact Sig. Value df (2-sided) (2-sided) (1-sided) Pearson Chi-Square 5.000 b 1.025 Continuity Correction a 4.802 1.028 5.002 1.025.025.014 4.998 1.025 2000 500.00. 25 Her ser vi en krysstabell fra en reell utvalgsundersøkelse STEMME Stemmegivning Pearson Chi-Square STEMME Stemmegivning * KJONN Kjønn Crosstabulation 1 Sosialistisk 2 Borgerlig 3 Vet ikke KJONN Kjønn 1 Menn 2 Kvinner 456 382 838 485 460 945 96 138 234 1037 980 2017 Asymp. Sig. Value df (2-sided) 13.134 a 2.001 13.173 2.001 10.986 1.001 2017 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 113.69. χ 2 = 13,134 Signifikanssannsynligheten for χ 2 = 13,134 ved 2 frihetsgraderer er på 0,1% 26 Hva skjer hvis vi kutter ut de som ikke stemte? STEMME Stemmegivning Pearson Chi-Square Continuity Correction a STEMME Stemmegivning * KJONN Kjønn Crosstabulation Value 1 Sosialistisk 2 Borgerlig df Asymp. Sig. (2-sided) 1.704 b 1.192 1.582 1.208 1.705 1.192 1.703 1.192 1783 KJONN Kjønn 1 Menn 2 Kvinner 456 382 838 485 460 945 941 842 1783 Exact Sig. (2-sided) Exact Sig. (1-sided).200.104 395.74. χ 2 blir vesentlig lavere Er det fortsatt signifikante forskjeller? 27 9