SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006



Like dokumenter
SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 VÅREN 2008

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

Forelesning 10 Statistiske mål for bivariat tabellanalyse. Korrelasjonsmål etter målenivå. Cramers V

Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2007

Eksamensoppgave i samfunnsfaglig forskningsmetode 16. mai 2003

Forelesning 9 Statistiske mål for bivariat tabellanalyse

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Krysstabellanalyse. SOS1120 Kvantitativ metode. Disposisjon. 1. Beskrivelse av analyseteknikk. Forelesningsnotater 7. forelesning høsten 2005

Univariate tabeller. Statistisk uavhengighet og statistisk avhengighet. Bivariat tabellanalyse. Hvordan bør vi prosentuere denne tabellen?

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

3. Multidimensjonale tabeller. SOS1120 Kvantitativ metode. Årsaksmodeller. Forelesningsnotater 8. forelesning høsten 2005

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Forelesning 17 Logistisk regresjonsanalyse

SKOLEEKSAMEN 2. november 2007 (4 timer)

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Oppgave 1. Besvarelse av oppgave 1c) Mål på statistisk sammenheng mellom variabler i krysstabeller

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

ME Vitenskapsteori og kvantitativ metode

SKOLEEKSAMEN 29. september 2006 (4 timer)

Forelesning 18 SOS1002

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Sensorveiledning SOS1120 vår

Definisjoner av begreper Eks.: interesse for politikk

1. Hvordan operasjonalisere studenttilfredshet? Vis tre eksempler.

Logistisk regresjon 1

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Del 1 og Del 2 vektes likt (50/50). Begge delene må være bestått.

UTSATT EKSAMEN I SOS1120 KVANTITATIV METODE 8. JANUAR 2007 (4 timer)

SENSORVEILEDNING I SOS1002 SAMFUNNSVITENSKAPELIG FORSKNINGSMETODE

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Sensorveiledning SOS1120 høsten 2004

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

Gjør kort rede for seks av de åtte begrepene. Bruk inntil ½ side på hvert begrep.

84 % er fornøyde med det tilbudet de får

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Univariate tabeller. Bivariat tabellanalyse. Forelesning 8 Tabellanalyse. Formålet med bivariat analyse:

Eksamensoppgave i ST3001

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

SPED4010/eksamen i statistikk: Fredag 30.september 2011 kl

SKOLEEKSAMEN I. SOS1120 Kvantitativ metode. 13. desember timer

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

INSTITUTT FOR SOSIOLOGI OG SAMFUNNSGEOGRAFI EKSAMEN I SOSIOLOGI (MASTER) SOS KVANTITATIV METODE. SKOLEEKSAMEN 11. mai 2005 (4 timer)

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

EKSAMEN I SOSIOLOGI SOS KVANTITATIV METODE. ORDINÆR SKOLEEKSAMEN 4. april 2011 (4 timer)

SKOLEEKSAMEN 8. januar 2008 (4 timer)

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Statistikk er begripelig

Skoleeksamen i SOS Kvantitativ metode

STV1020 våren 2018 oppgave 31. Se nederst i dokumentet for nynorsk versjon.

EKSAMEN I SOS1120 KVANTITATIV METODE 27. NOVEMBER 2003 (6 timer)

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 16. april 2015 kl

Forelesning 10 Kjikvadrattesten

EKSAMEN I SOS1120 KVANTITATIV METODE 12. DESEMBER 2011 (4 timer)

Kort innføring i SPSS

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Studier, region og tilfredshet

EKSAMEN I SOS1120 KVANTITATIV METODE 30. NOVEMBER 2006 (4 timer)

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

2. Forklar med egne ord de viktigste forutsetningene for regresjonen og diskuter om forutsetningene er oppfylt i oppgave 1.

Eksamensoppgave i PSY3100 Forskningsmetode Kvantitativ

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

EKSAMEN I SOS1120 KVANTITATIV METODE 2. DESEMBER 2010 (4 timer)

EKSAMEN I SOS4020 KVANTITATIV METODE 20. mars (4 timer)

Løsningsforslag eksamen sos1001 V14

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

MEVIT2800. Forelesning, 14/09/07 Audun Beyer

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Oppsummering & spørsmål 20. april Frode Svartdal

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

Transkript:

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006 Oppgave 1 Nedenfor ser du en forenklet tabell basert på informasjon fra den norske delen av European Social Survey 2004. Utvalget skal behandles som et sannsynlighetsutvalg fra populasjonen: alle personer 17 år og eldre som var bosatte i Norge høsten 2004. Variabelen nettbruk måler svarene på spørsmålet: Hvor ofte bruker du internett, World Wide Web eller e-post til privat bruk, enten hjemme eller på jobben?. De opprinnelige svarkategoriene er: 0 Har ikke nettilgang, verken hjemme eller på jobben, 1 Bruker aldri, 2 Mindre enn en gang i måneden, 3 En gang i måneden, 4 Flere ganger i måneden, 5 En gang i uken og 6 Flere ganger i uken er slått sammen i den nye kategorien Ikke daglig, mens svarkategorien 7 Hver dag utgjør den nye kategorien Daglig. I tillegg har tabellen informasjon om kjønn og alder, der alder er gruppert i tre kategorier. Tabell 1. Internettbruk fordelt etter alder og kjønn. Frekvenser. Menn Kvinner Internettbruk 17-29 år 30-59 år Over 60 år 17-29 år 30-59 år Over 60 år Ikke daglig 60 200 160 120 280 160 Daglig 140 200 40 80 120 40 Totalt 200 400 200 200 400 200 a) Gjør om tabell 1 til en prosenttabell. Beskriv deretter variablene, og fortell kort hva tabellen viser. MÅL: Test av studentens ferdigheter i å sette opp tabeller, identifisere variabler, gi grunnlag for å vurdere deres evne til å drøfte hvor mye informasjon de mener det er forsvarlig å trekke ut av verdifordelingen i disse variablene (bestemme målenivå), og å teste studentenes evner til å fortolke innholdet i en krysstabell. Uavhengige variabler: Kjønn Alder Avhengige variabler: Internettbruk Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå Alder: Variabelen kan rangeres, og det er derfor mest naturlig å plassere den på ordinalnivå. Internettbruk: Denne variabelen kan også rangeres, og bør plasseres på ordinalnivå. Den prosentuerte tabellen bør se omtrent slik ut: 1

Tabell 1. Internettbruk fordelt etter alder og kjønn. Prosenter. Menn Kvinner Internettbruk 17-29 år 30-59 år Over 60 år 17-29 år 30-59 år Over 60 år Ikke daglig 30 50 80 60 70 80 Daglig 70 50 20 40 30 20 Totalt 100 100 100 100 100 100 (Antall) (200) (400) (200) (200) (400) (200) I forklaringen av hva tabellen viser ønsker vi kun en beskrivelse av mønsteret inne i tabellen, og ikke tekniske beskrivelser av hvordan tabellen er satt opp. Alle bør se at unge bruker internett oftere enn eldre. Videre bør alle se at det er flere menn enn kvinner som bruker internett daglig, men at denne kjønnsforskjellen blir mindre jo eldre aldersgrupper som sammenlignes. b) Beregn korrelasjonen mellom alder og internettbruk for menn, og korrelasjonen mellom alder og internettbruk for kvinner. Forklar hva de to korrelasjonene viser. MÅL: Teste studentenes forståelse av statistiske mål for bivariate sammenhenger, og hvordan valget av mål for samvariasjon mellom to variabler avhenger av variablenes målenivå. Her skal alle kunne se at de må regne ut en korrelasjonskoeffisient mellom alder og internettbruk for menn, og en korrelasjonskoeffisient mellom alder og internettbruk for kvinner. Her bør vi tillate mange ulike valg av mål, og heller se på argumentasjonen bak valgene. De fleste vil forhåpentligvis argumentere med at de to variablene alder og internettbruk bør plasseres på ordinalnivå, og ut fra dette enten velge gamma eller Kendalls tau-c. Vi bør gi noe ekstra for de som argumenterer godt for å bruke korrelasjonsmålet Kendalls tau-c i stedet for gamma. De studentene som regner korrelasjonene direkte fra de prosentuerte tabellene har så store problemer med tallbehandling at det bør trekkes mye. Utgangspunkt for å beregne korrelasjonene mellom alder og internettbruk for menn: 17-29 år 30-59 år Over 60 år Ikke daglig 60 200 160 Daglig 140 200 40 Etter som Gamma er et korrelasjonsmål som utnytter informasjonen om rangering, bør det gies et pluss for de studentene som tar hensyn til retningen på rangeringene når de regner forholdet mellom par ordnet likt og par ordnet ulikt. For å få riktig fortegn på korrelasjonsmålet har alle blitt anbefalt å starte beregningen av par ordnet likt (L) i ruten med de laveste verdiene på begge variablene. Fortegnet blir også riktig hvis de starter med de høyeste verdiene på begge variablene, men dette er kanskje ikke så logisk godt startpunkt. Her blir det dermed mest naturlig å starte beregningen av par ordnet likt (L) i den ruta som har 60 enheter (kombinasjonen lav/lav). Beregningen av par ordnet ulikt (U) bør da enten starte med kombinasjonen lav/høy (n=140) eller høy/lav (n=160). Nedenfor viser jeg en detaljert løsning basert på det første startpunktet. 2

Par ordnet likt (starter øverst til venstre): L= 60 (200+40) + 200 (40) = 22400 Par ordnet ulike (start nederst til venstre): U= 140 (200+160) + 200 (160) = 82400 Gamma for menn blir da: Gamma Menn 22400 82400 = = 0,573 0,57 22400 + 82400 Den tilsvarende løsningen for kvinner blir: Par ordnet likt (starter øverst til venstre): L= 120 (120+40) + 280 (40) = 30400 Par ordnet ulike (start nederst til venstre): U= 80 (280+160) + 120 (160) = 54400 Gamma for kvinner blir da: Gamma Kvinner 30400 54400 = = 0,283 0,28 30400 + 54400 Løsninger med andre mål for samvariasjon, blir: kvinne.00 Nominal by Nominal Ordinal by Ordinal Phi Symmetric Measures Value Asymp. Std. Error(a) Approx. T(b) Approx. Sig..358.000 Cramer's V.358.000 Kendall's tau-b -.336.029-11.180.000 Kendall's tau-c -.375.034-11.180.000 Gamma -.573.045-11.180.000 N of Valid Cases 800 1.00 Nominal Phi by.154.000 Nominal Cramer's V.154.000 Ordinal by Kendall's tau-b Ordinal -.146.033-4.447.000 Kendall's tau-c -.150.034-4.447.000 Gamma -.283.061-4.447.000 N of Valid Cases 800 3

Tolkning: Det er en enda sterkere negativ korrelasjon mellom alder og internettbruk for menn enn for kvinner. Dette viser at det er større forskjeller i internettbruk mellom unge og eldre menn enn mellom unge og eldre kvinner. De som i tillegg klarer å trekke ut noe substansielt samfunnsvitenskapelig om at kjønnsforskjellen er størst i den yngste aldersgruppen mens det er ingen kjønnsforskjell i den eldste aldersgruppen bør belønnes for dette. c) Tabell 2 viser informasjonen fra tabell 1 i en logistisk regresjonsmodell der de som bruker internett daglig er kodet med verdien 1 og de som ikke bruker internett daglig er kodet med verdien 0. Forklar hva denne modellen viser. Tabell 2. Logistisk regresjonsmodell for internettbruk. Variabler B S.E. P OR Mann (kvinne=0, mann=1) 1,373 0,187 < 0,001 3,946 Alder (17-29=0, 30-59=1, over 60=2) -0,485 0,112 < 0,001 0,615 Samspill (mann * alder) -0,616 0,161 < 0,001 0,540 Konstant -0,385 0,128 < 0,001 0,680 MÅL: Teste studentenes forståelse av logistisk regresjon og generell tolkning av samspilleffekt. Her skal alle kunne klare å se sammenhengen mellom tabell 1 og tabell 2. Videre bør de beste kunne se at samspillet påvirker fortolkningen av de to enkelteffektene, slik at effekten av mann måler kjønnsforskjellen for den yngste aldersgruppen (alder=0), og at effekten av alder alene er alderseffekten for kvinner (mann=0). Fortegnene på disse to enkelteffektene viser at det er flere menn enn kvinner som bruker internett daglig, og at andelen som bruker internett daglig er lavere i de eldste enn i de yngste aldersgruppene. Hvis det er noen som argumenterer for at den kategoriserte aldersvariabelen burde ha vært dummykodet, så bør de få uttelling for det. Den negative samspillseffekten viser at kjønnsforskjellen blir mindre jo eldre man blir. Dette poenget kommer godt fram i dette effektplottet. 4

Noen vil sannsynligvis også fortolke oddsratioene i tabell 2, og da blir den naturlige tolkningen at menn i den yngste aldersgruppen har nesten tre ganger (100*(3,946-1)=294,6) så høy odds for å bruke internett daglig enn kvinner, og at oddsen for at en kvinne (mann=0) skal bruke internett daglig minsker med 39 prosent (100*(0,615-1)=-38,5) for hver økte aldersgruppe. Oddsratioen for samspillet kan da tolkes som at den høye oddsratioen for kjønnsforskjellen i den yngste aldersgruppen blir svekket ved at oddsen for menn i forhold til kvinner blir 46 prosent (100*(0,540-1)=-46) lavere for hver aldersgruppe. Studentene har ikke blitt oppfordret til å kjøpe avanserte kalkulatorer med logaritmer, og vi bør derfor fokusere mer forståelsen av logistisk regresjon enn på avanserte utregninger av predikerte sannsynligheter og lignende. 5

Oppgave 2 Nedenfor ser du en forenklet tabell basert på informasjon fra surveyen Ungdom og fysisk aktivitet i Møre- og Romsdal 2004. Utvalget skal behandles som et sannsynlighetsutvalg fra populasjonen: alle 8., 9. og 10.-klassinger i Møre og Romsdal i 2004. Variabelen fotball måler svarene på spørsmålet om fotball under hovedspørsmålet: Kryss av for om du aldri har drevet, har sluttet eller om du deltar i disse idrettene.. De opprinnelige svarkategoriene 1 Har aldri drevet og 2 Har sluttet er slått sammen i den nye kategorien Ikke aktiv, mens svarkategorien 3 Deltar i idrettslag utgjør den nye kategorien Aktiv. I tillegg har tabellen informasjon om kjønn og klassetrinn.. Tabell 3. Deltakelse i organisert fortball fordelt etter klassetrinn og kjønn. Frekvenser. Jenter Gutter Fotball 8. klasse 9. klasse 10. klasse 8. klasse 9. klasse 10. klasse Ikke aktiv 195 210 225 105 150 195 Aktiv 105 90 75 195 150 105 Totalt 300 300 300 300 300 300 a) Gjør om tabell 3 til en prosenttabell. Beskriv deretter variablene, og fortell kort hva tabellen viser. MÅL: Test av studentens ferdigheter i å sette opp tabeller, identifisere variabler, gi grunnlag for å vurdere deres evne til å drøfte hvor mye informasjon de mener det er forsvarlig å trekke ut av verdifordelingen i disse variablene (bestemme målenivå), og å teste studentenes evner til å fortolke innholdet i en krysstabell. Uavhengige variabler: Kjønn Klassetrinn Avhengige variabler: Aktiv i organisert fotball Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå Klassetrinnr: Variabelen kan rangeres, og det er derfor mest naturlig å plassere den på ordinalnivå. Fotball: Denne variabelen kan også rangeres, og bør plasseres på ordinalnivå. Den prosentuerte tabellen bør se omtrent slik ut: Tabell 1. Aktivitet i organisert fotball fordelt etter klassetrinn og kjønn. Prosenter. Jenter Gutter Fotball 8. klasse 9. klasse 10. klasse 8. klasse 9. klasse 10. klasse Ikke aktiv 65 70 75 35 50 65 Aktiv 35 30 25 65 50 30 Totalt 100 100 100 100 100 100 (Antall) (300) (300) (300) (300) (300) (300) 6

I forklaringen av hva tabellen viser ønsker vi kun en beskrivelse av mønsteret inne i tabellen, og ikke tekniske beskrivelser av hvordan tabellen er satt opp. Alle bør se at det er en større andel av guttene som er aktive i organisert fortball enn andelen blant jentene. Videre bør alle se at det er stort frafall fra fotball både blant jenter og gutter, men at frafallet er størst blant guttene. b) Beregn korrelasjonen mellom klassetrinn og forball for jenter, og korrelasjonen mellom klassetrinn og forball for gutter. Forklar hva de to korrelasjonene viser. MÅL: Teste studentenes forståelse av statistiske mål for bivariate sammenhenger, og hvordan valget av mål for samvariasjon mellom to variabler avhenger av variablenes målenivå. Her skal alle kunne se at de må regne ut en korrelasjonskoeffisient mellom klassetrinn og fotball for jenter, og en korrelasjonskoeffisient mellom klassetrinn og fotball for gutter. Her bør vi tillate mange ulike valg av mål, og heller se på argumentasjonen bak valgene. De fleste vil forhåpentligvis argumentere med at de to variablene klassetrinn og aktivitet i fotball bør plasseres på ordinalnivå, og ut fra dette enten velge gamma eller Kendalls tau-c. Vi bør gi noe ekstra for de som argumenterer godt for å bruke korrelasjonsmålet Kendalls tau-c i stedet for gamma. De studentene som regner korrelasjonene direkte fra de prosentuerte tabellene har så store problemer med tallbehandling at det bør trekkes mye. Utgangspunkt for å beregne korrelasjonene mellom klassetrinn og aktivitet i fotball for jenter: 8. klasse 9. klasse 10. klasse Ikke aktiv 195 210 225 Aktiv 105 90 75 Etter som Gamma er et korrelasjonsmål som utnytter informasjonen om rangering, bør det gies et pluss for de studentene som tar hensyn til retningen på rangeringene når de regner forholdet mellom par ordnet likt og par ordnet ulikt. For å få riktig fortegn på korrelasjonsmålet har alle blitt anbefalt å starte beregningen av par ordnet likt (L) i ruten med de laveste verdiene på begge variablene. Her blir det naturlig å starte beregningen av par ordnet likt (L) i den ruta som har 195 enheter (kombinasjonen lav/lav). Beregningen av par ordnet ulikt (U) bør da enten starte med kombinasjonen lav/høy (n=105) eller høy/lav (n=225). Nedenfor viser jeg en detaljert løsning basert på det første startpunktet. Par ordnet likt (starter øverst til venstre): L= 195 (90+75) + 210 (75) = 47925 Par ordnet ulike (start nederst til venstre): U= 105 (210+225) + 90 (225) = 65925 Gamma for jenter blir da: Gamma Jenter 47925 65925 = = 0,158 0,15 47925 + 65925 7

Den tilsvarende løsningen for gutter blir: Par ordnet likt (starter øverst til venstre): L= 105 (150+105) + 150 (105) = 42525 Par ordnet ulike (start nederst til venstre): U= 195 (150+195) + 150 (195) =96525 Gamma for gutter blir da: Gamma Gutter 42525 96525 = = 0,388 0,39 42525 + 96525 Løsninger med andre mål for samvariasjon, blir: Symmetric Measures Symmetric Measures mann.00 Nominal by Nominal Ordinal by Ordinal Phi Value Asymp. Std. Error(a) Approx. T(b) Approx. Sig..089.028 Cramer's V.089.028 Kendall's tau-b -.084.031-2.687.007 Gamma -.158.058-2.687.007 N of Valid Cases 900 1.00 Nominal by Phi Nominal.245.000 Cramer's V.245.000 Ordinal by Kendall's tau-b Ordinal -.231.030-7.672.000 Gamma -.388.048-7.672.000 N of Valid Cases 900 c) Tabell 4 viser informasjonen fra tabell 3 i en logistisk regresjonsmodell der de som er aktive i organisert fotball er kodet med verdien 1 og de som ikke er aktive i organisert fotball er kodet med verdien 0. Forklar hva denne modellen viser. Tabell 4. Logistisk regresjonsmodell for deltakelse i organisert fotball. Variabler B S.E. P OR Gutt (gutt=1, jente=0) 1,235 0,156 < 0,001 5,437 Klassetrinn (8.=0, 9.=1, 10.=2) -0,239 0,090 0,008 0,787 Samspill (gutt * klassetrinn) -0,380 0,124 0,002 0,684 Konstant -0,616 0,111 < 0,001 0,540 8

MÅL: Teste studentenes forståelse av logistisk regresjon og generell tolkning av samspilleffekt. Her skal alle kunne klare å se sammenhengen mellom tabell 1 og tabell 2. Videre bør de beste kunne se at samspillet påvirker fortolkningen av de to enkelteffektene slik at effekten av gutt måler kjønnsforskjellen for det laveste klassetrinnet (8. klasse=0), og at effekten av klassetrinn alene er klassetrinneffekten for jenter (gutt=0). Fortegnene på disse to enkelteffektene viser at det er flere gutter enn jenter som driver med aktiv fotball, og at andelen som driver med fotball er lavere i de høyeste klassetrinnene enn i de yngste klassetrinnene. Den negative samspillseffekten viser at kjønnsforskjellen blir mindre utover i ungdomsskolen. Dette poenget kommer godt fra dette effektplottet. Noen vil sannsynligvis også fortolke oddsratioene i tabell 2, og da blir den naturlige tolkningen at gutter i på det laveste klassetrinnet har mer enn fire ganger (100*(5,437-1)=443,7) så høy odds for å være aktive i organisert fotball enn jenter, og at oddsen for at en jente (gutt=0) skal være med i fotball minsker med 21 prosent (100*(0,787-1)=-21,3) for hvert økte klassetrinn. Oddsratioen for samspillet kan da tolkes som at den høye oddsratioen for kjønnsforskjellen i det laveste klassetrinnet blir svekket ved at oddsen for gutter i forhold til jenter blir 32 prosent (100*(0,684-1)=-31,6) lavere for hvert klassetrinn. Studentene har ikke blitt oppfordret til å kjøpe avanserte kalkulatorer med logaritmer, og vi bør derfor fokusere mer forståelsen av logistisk regresjon enn på avanserte utregninger av predikerte sannsynligheter og lignende. 9

Oppgave 3 MÅL: Teste studentenes kjennskap til mer og mindre sentrale begrep i pensum. Gi en kort beskrivelse av følgende begrep: a) Årsaksforklaringer Her er vi ut etter de som vi kan kalle ikke-deterministiske årsaksforklaringer, der det legges vekt på tidsrekkefølge, korrelasjon, kontroll for andre variabler og klargjøring av årsaksmekanismene. Hvis noen i tillegg klarer å skille mellom variabler som kun kan være x- variabler (eksogene variabler), de som kan være både x- og y-variabler, og de som bare kan være y-variabler (endogene), bør bli belønnet for dette (se Ringdal 2001: 391). b) Validitet Her bør alle vite at validitet går på gyldigheten av det vi maler. Eller er det presentert en god del ulike validitetsbegrep både i Enhet og mangfold og på forelesningene. Her bør alle drøfte begrepet validitet i forhold til begrepet reliabilitet. c) Kjikvadrattest Her er vi ute etter om studentene forstår at dette knytter seg til statistisk testing av hypoteser om statistisk sammenheng mellom to variabler i populasjonen. d) Samplingfordeling for utvalgsgjennomsnitt De som har forstått dette, og forklarer hvordan samplingfordelingen deles inn i standardfeil og ikke standardavvik, har kommet langt i modningsprosessen og bør belønnes rikelig. Trondheim 22.11.2006 Arild Blekesaune 10