Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

Like dokumenter
Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.

Repeated Measures Anova.

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

a) Forklar hva som menes med faktorladning, kommunalitet og eigenvalue.

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Verdens statistikk-dag.

Effektstørrelse. Tabell 1. Kritiske verdier for Pearson s produkt-moment-korrelasjon med 5% og 1% signifikansnivå. N 5% 1% N 5% 1%

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

PSY Forskningsmetode II: Eksperimentell design og statistisk analyse, høst 2015.

6.2 Signifikanstester

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

EKSAMEN I SOS1120 KVANTITATIV METODE 30. NOVEMBER 2006 (4 timer)

SENSORVEILEDNING FOR SKOLEEKSAMEN I SOS KVANTITATIV METODE. 11. mars 2015 (4 timer)

Til bruk i metodeundervisningen ved Høyskolen i Oslo

EKSAMEN I SOS4020 KVANTITATIV METODE 20. mars (4 timer)

1. De fleste blir mer vennlige av å drikke alkohol Mange blir mer aggressive av å drikke alkohol

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

EKSAMEN I SOSIOLOGI SOS KVANTITATIV METODE. ORDINÆR SKOLEEKSAMEN 4. april 2011 (4 timer)

Kan vi stole på resultater fra «liten N»?

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

ME Metode og statistikk Candidate 2511

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Prøveeksamen i STK3100/4100 høsten 2011.

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

UNIVERSITETET I OSLO

Eksamensoppgave i (emnekode) (emnenavn)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

ME Vitenskapsteori og kvantitativ metode

Variansanalyse. Uke Variansanalyse. ANOVA=ANalysis Of Variance

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

Forelesning 13 Regresjonsanalyse

Eksamen PSYC3101 Kvantitativ metode II Høsten 2013

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

Generelle lineære modeller i praksis

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

ME Vitenskapsteori og kvantitativ metode

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

Informasjon om eksamen SOS Kvantitativ metode

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

2. Forklar med egne ord de viktigste forutsetningene for regresjonen og diskuter om forutsetningene er oppfylt i oppgave 1.

Eksperimentelle design

Forskningsmetoder i menneske-maskin interaksjon

MASTEROPPGAVE I ARBEIDS- OG ORGANISASJONSPSYKOLOGI

Høsten Skriftlig skoleeksamen, 23. Oktober, kl. 09:00 (3 timer). Sensur etter tre uker.

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

vekt. vol bruk

Eksamen PSYC3101 Kvantitativ metode II Vår 2015

Kapittel 3: Studieopplegg

UNIVERSITETET I OSLO

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Noen momenter ved vurdering av eksamen PSY1010 PSYC1100 våren 2019.

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

UNIVERSITETET I OSLO

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

UNIVERSITETET I OSLO

Innhold. Multisample inference - del 2 (Rosner, ) Data Effect of Lead Exposure (Eks. i Rosner Kap mm)

Effekt av PALS på trakassering/mobbing i skolen? Forsker Mari-Anne Sørlie Notat

Kort overblikk over kurset sålangt

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Løsningsforslag eksamen 25. november 2003

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

Kausalanalyse og seleksjonsproblem

UNIVERSITETET I OSLO

10.1 Enkel lineær regresjon Multippel regresjon

Lineær regresjon: introduksjon

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

TMA4245 Statistikk Eksamen desember 2016

regresjonsmodeller multippel logistisk regresjon logistisk regresjon prediksjon vs assosiasjon den logistisk funksjonen (2)

SKOLEEKSAMEN 2. november 2007 (4 timer)

SKOLEEKSAMEN 29. september 2006 (4 timer)

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

EKSAMEN I SOS1120 KVANTITATIV METODE 2. DESEMBER 2010 (4 timer)

PSY Anvendt kvantitativ forskningsmetode

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. februar 2016 (4 timer)

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

Skoleeksamen i SOS Kvantitativ metode

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Eksamensoppgave i ST3001

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Høye skårer indikerer høye nivåer av selvkontroll.

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

Vektorligninger. Kapittel 3. Vektorregning

Transkript:

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

Analyse av endringsskårer (change scores).

Vi så forrige gang på analyser av design med en innen-person faktor (within, repeated) og en mellom-person faktor (between). Her er et nytt eksempel med veldig enkel data. Vi har 100 personer som er målt før og etter en intervensjon (treatment), men de ble delt i to grupper og bare den ene gruppen ble utsatt for intervensjonen: pre-post med kontrollgruppe. Resultatene ble slik: Og de kan fremstilles grafisk slik: 12.50 12.00 11.50 11.00 0 Kontroll 1 Eksperiment 10.50 10.00 pre post Som vi har snakket om tidligere ser vi at dersom vi hadde undersøkt effekten av intervensjonen ved et vanlig post-test only design, så ville vi overestimert effekten siden gruppene var forskjellige allerede ved pretesten. Det må vi kontrollere for og det kan vi her siden vi har data fra pre-testen.

Dette kan vi formulere på to måter. Vi kan studere forskjellen mellom gruppene post etter at vi har trukket fra forskjellen pre: (11.98 10.77) (10.90 10.40) =.71 Eller vi kan undersøke om endringen fra pre til post var forskjellig i de to gruppene (ofte en mer nyttig måte å formulere problemet på men resultatet blir det samme): (11.98 10.90) (10.77 10.40) =.71 Og den mest generelle måten å analysere dette på ville være å benytte repeated measures Anova :

Og resultatet fra denne analysen blir slik: I et slikt design kan vi alltid estimere hovedeffekter av Tid og Gruppe. Disse er imidlertid helt uinteressante her det eneste vi er interesserte i er om hovedeffekten av tid er forskjellig i de to gruppene og det er nettopp det Tid*Gruppe interaksjonen forteller oss. I det enkle tilfellet her med bare to repeterte målinger, kunne vi gjort dette på en enklere måte. Vi kunne fjernet hele hovedeffekten av tid ved å konstruere en endringsskåre (change score) for hver person, og analysert denne direkte. I SPSS gjør vi det slik: COMPUTE Endring = Post Pre. Bruk gjerne menyen Transform, Compute i SPSS:

Vi kan nå studere denne endringsvariabelen på samme måte som enhver annen avhengig variabel. Dere har på 3. semester brukt lineær regresjonsanalyse og har sett at dersom en forklaringsvariabel er dikotom, så kan den behandles som en kvantitativ variabel. Det er jo gruppevariabelen her så vi kunne brukt regresjonsmodellen: Endring i = α + β*gruppe + ε i og β ville da gi oss effekten av å øke Gruppe med 1.. Test gjerne dette med regresjonsprogrammet (husk å skru på Part and partial correlations under Statistics): Og vi får nøyaktig samme resultat som i forrige analyse. Vi kan til og med kvadrere den såkalte partielle korrelasjonen (.214 2 =.046) og finne partial eta squared. Og t 2 (2.166 2 = 4.69) gir sannelig samme F-verdi som i forrige analyse. Dette er åpenbart samme analyse gjort på to forskjellig måter. Og vi kunne selvsagt også brukt programmet GLM, Univariate med Endring som avhengig variabel (skru på Estimates of effect size under Options) og fått akkurat samme resultater:

En slik analyse av endringsskårer har en rekke fordeler: Endringsskåren gir oss et enkelt tolkbart mål på individuell endring over tid. Analysen kan generaliseres til simultan analyse av endring over flere tidspunkter ved repeated measures Anova. Det er enkelt å konstruere modeller hvor man kontrollerer for flere kovariater i tillegg til intervensjonsvariabelen(e). Men debatten rundt det med endring over tid er komplisert og har vedvart gjennom 50-60 år nå, og flere har argumentert mot bruk av slike skårer. Noen har til og med frarådet dette Denne debatten rekker vi på ingen måte nå og er ikke eksamensrelevant men noen av dere vil etter hvert kunne støte på reviewere og kanskje til og med veiledere og sensorer - som kjenner disse innvendingene. Så for de helt spesielt interesserte finnes det en god (synes jeg) oppsummering her: En oppsummering av debatten angående "change scores". Kritikerne av analyser av endringsskårer har selvsagt foreslått alternativer. Vi ser på det vanligste.

Kovariansanalyse (analysis of covariance - Ancova).

Vi så at vi ville hatt problemer med det enkle post-test only designet siden gruppene allerede var forskjellige på pre-testen. Det måtte vi korrigere for. Og i de forrige analysene formulerte vi spørsmålet slik: er det forskjeller mellom gruppene (eksperiment og kontroll) med hensyn til gjennomsnittlig endring fra pre til post? Vi kunne også formulert spørsmålet slik: ville det vært forskjeller mellom gruppene på post-testen dersom de hadde vært like på pre-testen og dersom det viser seg å være det, så kan det tilskrives intervensjonen. Dere kjenner sikkert fra 3. semester en nyttig tolkning av regresjonskoeffisientene i en multippel regresjonsanalyse: effekten av variabel x for personer med samme verdier på variablene z, t,osv. Vi holder altså andre forklaringsvariabler konstante i en slik analyse. Det skulle bety at vi her kunne analysere regresjonsmodellen: Post i = α + β 1 *Gruppe + β 2 *Pre i + ε i og det er det som er Ancova modellen Og analysen kan her gjøres med det vanlige regresjonsprogrammet i SPSS: Og dere ser at i dette eksemplet får vi nøyaktig samme resultat som vi fikk fra de andre analysene!

Og vi kunne selvsagt gjort akkurat samme analysen med GLM, Univariate. Det ville vært veldig arbeidsbesparende dersom vi hadde hatt mer enn to grupper!

I dette eksemplet ga altså analyse av endringsskårer og Ancova samme resultat. Slik vil det imidlertid ikke alltid være. Her hadde vi to grupper som tilfeldigvis var forskjellige på pre-testen. Det kan sammenlignes med at vi har brukt et eksperimentelt design med randomisert tilordning til grupper, men vi har vært litt uheldige med randomiseringen, slik at gruppene fortsatt var litt forskjellige på pre-testen. Om vi da kontrollerer for dette ved å bruke endringsskårer eller Ancova spiller liten rolle. Men hva skjer dersom vi har et design med to grupper som er systematisk forskjellige på pre-testen? Vi har samme type data som i forrige eksempel: 100 personer og et pre-post med kontroll gruppe design. Resultatene ble nå slik: 13.00 12.50 12.00 11.50 11.00 10.50 10.00 9.50 9.00 8.50 8.00 pre post 0 Kontroll 1 Eksperiment Større forskjeller mellom gruppene generelt men ikke så ulike resultatene i forrige eksempel

Forsker 1 velger å analysere endringsskårene og starter med å konstruere en slik.

Deretter gjennomfører han en regresjonsanalyse med endring fra pre til post avhengig av Gruppe og dette vil i det enkle tilfellet her være ekvivalent med en repeated measures Anova: Og finner bare en svak (partial eta 2 =.154 2 =.02) og ikke statistisk signifikant effekt av gruppe, og tvinges til å konkludere med at det ikke her er mulig å dokumentere at disse gruppene har endret seg forskjellig fra pre til post. Forsker 2 velger Ancova med postskårer avhengig av Gruppe når man har kontrollert for pre-test nivå: Og finner en sterkere (partial eta 2 =.232 2 =.05) og statistisk signifikant effekt av gruppe, og konkluderer med at det her ser ut til at gruppene har endret seg forskjellig fra pre til post og kanskje også med at dette er i samsvar med at intervensjonen har hatt en effekt. Så hvem skal vi stole på: forsker 1 eller forsker 2?

Eller vi kan illustrere dette problemet ved reelle data hentet fra en datafil i Fronter som vi har brukt tidligere: likelonn.sav Problemstillingen er egentlig akkurat den samme. Vi har 474 personer hvor vi har data både for begynnerlønn (Salbeg) og nåværende lønn (Salnow). Alle vil ha hatt en økning i lønn, men det vi er interessert i her er om lønnsutviklingen har vært forskjellig for kvinner og menn (Sex). Vi starter med å konstruere en endringsskåre:

Forsker 1 analyserer dette ved hjelp av endringsskåren og gjør en regresjonsanalyse med endring avhengig av kjønn (Sex): Han finner en soleklar statistisk effekt av kjønn på endringen, og effekten er særdeles sterk. Partial eta 2 er -.378 2 =.14 og konkluderer med at det er betydelige forskjeller m.h.t. lønnsutvikling. Forsker 2 velger Ancova modellen og gjør en regresjonsanalyse med nåværende lønn (Salnow) avhengig av kjønn (Sex) når man kontrollerer for begynnerlønn (Salbeg): Han finner en marginalt statistisk effekt av kjønn på endringen (p<.05), men effekten er så svak at den sannsynligvis vil være helt uten praktisk interesse. Partial eta 2 er -.114 2 =.01 Så igjen: hvem skal vi stole på: forsker 1 eller forsker 2?

Hadde jeg nå hatt et enkelt svar på spørsmålet om hvem av disse forskerne man burde stole på i hvert tilfelle, så skulle jeg ikke holdt det for meg selv, det kan jeg garantere! Men det finnes nok ikke. Vi kunne diskutert det litt mer i detalj, men det ville kreve mer tid enn vi har til rådighet. De interesserte kan more seg med å google Lord s paradox, og se på de forslagene til løsning av det som har versert de siste 50-60 årene. Det som er helt sikkert, er at dersom man skal sammenligne løsninger av et problem, så må man først formulere problemet likt. Og disse forskerne verken formulerer problemet likt, eller kontrollerer for initiale forskjeller på samme måte og da blir jo ofte løsninger forskjellige. Uten annen informasjon om prosessen som har generert data enn pre- og postskårer og gruppetilhørighet, så vil det ikke være mulig å si noe sikkert om hvem som trekker riktig konklusjon. En av dem kan ha rett eller dersom de har lagt ulike forutsetninger til grunn og dermed undersøkt ulike ting så kan det faktisk hende at begge har rett.. Husk bare foreløpig på at når vi er interesserte i forskjeller i endring over tid i ikke-eksperimentelle design hvor vi kan anta at grupper er systematisk forskjellige initialt så er ikke disse metodene ekvivalente!