Repeated Measures Anova.

Like dokumenter
Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

RELIABILITET : Pålitelighet? Troverdighet? Reproduserbarhet? Stabilitet? Konsistens?

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Klassisk ANOVA/ lineær modell

Oppsummering & spørsmål 20. april Frode Svartdal

Generelle lineære modeller i praksis

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Lineære modeller i praksis

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Effektstørrelse. Tabell 1. Kritiske verdier for Pearson s produkt-moment-korrelasjon med 5% og 1% signifikansnivå. N 5% 1% N 5% 1%

Noen momenter ved vurdering av eksamen PSY1010 PSYC1100 høsten 2018.

UNIVERSITETET I OSLO

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Verdens statistikk-dag.

Løsningsforslag eksamen 25. november 2003

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

6.2 Signifikanstester

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Eksamen PSY2011 Forskningsmetode II: Eksperimentell design og statistisk analyse Høsten 2013

Noen momenter ved vurdering av eksamen PSY1010 PSYC1100 våren 2019.

Kan vi stole på resultater fra «liten N»?

Oppgave 1. Kilde SS df M S F Legering Feil Total

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Kort overblikk over kurset sålangt

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

PSY Forskningsmetode II: Eksperimentell design og statistisk analyse, høst 2015.

Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

Løsningsforslag eksamen 27. februar 2004

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Innhold. Del 1 Grunnleggende begreper og prinsipper... 39

Kapittel 1 Vitenskap: grunnleggende antakelser

Løsningsforslag: STK2120-v15.

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

PSY Forskningsmetode II: Eksperimentell design og statistisk analyse, høst 2014.

Eksperimentelle design

Oppgave 14.1 (14.4:1)

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

PSY Kvantitativ metode

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

10.1 Enkel lineær regresjon Multippel regresjon

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Til bruk i metodeundervisningen ved Høyskolen i Oslo

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT april 2016

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

Regional forskingskonferanse for Psykiatri og rusfeltet Vår Olav M. Linaker PH, St. Olavs Hospital/INM, NTNU

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kausalanalyse og seleksjonsproblem

UNIVERSITETET I OSLO

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Pålitelighetskontroll av RTK. Geodesidagene 2016 Pål Herman Sund, Even Brøste, Narve Schipper Kjørsvik

Inferens i regresjon

Logistisk regresjon 2

Eksamensoppgave i TMA4255 Anvendt statistikk

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Oppgave N(0, 1) under H 0. S t n 3

Eksamen PSYC2104 Kvantitativ metode A Vår 2019

LØSNING: Oppgavesett nr. 1

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.

Kapittel 4.4: Forventning og varians til stokastiske variable

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4240 Statistikk

i x i

Oppgavesett nr. 5. MAT110 Statistikk 1, Et transportfirma har et varemottak for lastebiler med spesialgods, se figur 1.

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

Eksamen PSYC2104 Kvantitativ metode A Høst 2018

AVLSDATA FRA FØLLFESTIVALEN DEL 1 av Unn Reierstad, cand.scient (NLH/UMB), veterinær (NVH) / RR Reierstad Ridehest

Løsningsforslag eksamen STAT100 Høst 2010

Helserelatert livskvalitet hos deltagere i et kommunalt livss3lsendrings3ltak; Stor og Sterk

Oppgave 13.1 (13.4:1)

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

Transkript:

Repeated Measures Anova.

Vi bruker oppgave-5 som eksempel. I en evalueringsstudie av en terapeutisk intervensjon valgte man et pre-post med kontrollgruppe design. Alle personer ble undersøkt tre ganger - før terapi (pre), umiddelbart etter terapi (post), og tre måneder senere (oppfølging). Tolv pasienter ble tilfeldig tilordnet to grupper: en kontrollgruppe (her kodet "0"), og en intervensjonsgruppe (her kodet "1"). Resultatene for et av symptommålene som ble anvendt så slik ut: I første omgang er vi her bare interesserte i hovedeffekten av Tid.

Vi kan tenke på dette designet som et variansanalyse-design med to uavhengige variabler (Person og Tid) og med bare en observasjon i hver celle. Da vil det være tre forhold som kan skape variasjon i de observerte skårene: forskjeller mellom tidspunkter (hovedeffekt av Tid), forskjeller mellom personer (hovedeffekt av Person), og at forskjeller mellom tidspunkter varierer fra person til person (en Tid*Person interaksjon). Forklart varians for de to hovedeffektene beregnes som tidligere.

Vi kan nå estimere alle verdier ut fra de to hovedeffektene: yˆ ijk y ( y j y) ( y k y) og vi ser at vi får en tabell helt uten Person*Tid interaksjon!

Forskjellen mellom de observerte verdiene og verdiene estimert fra de to hovedeffektene skyldes at effekten av Tid ikke er den samme for alle personene. Vi har altså en Person*Tid interaksjon. Hvor mye denne bidrar til variasjonen kan vi finne ved å beregne forskjellen mellom observerte og estimerte verdier:

I denne tabellen med bare en observasjon i hver celle, er det tre mulig kilder til variasjon: forskjeller mellom personer (hovedeffekt av person), forskjeller mellom tidspunkter (hovedeffekt av tid), og en tidspunkt*person interaksjon (tid*person). Vi er her primært interesserte i hovedeffekten av Tid, og feil i forhold til denne er at den kan variere fra person til person (tid*person interaksjonen). Generelle gjennomsnittsforskjeller mellom personer er helt irrelevante for denne effekten, og vi lager en signifikanstest hvor vi tester hovedeffekten av Tid mot Person*Tid interaksjonen. og fra SPSS: Skal dere få denne analysen riktig med SPSS, må dere bruke: Analyse, General Linear Model, Repeated Measures

Sett fra et rent statistisk synspunkt er det stort sett alltid fordelaktig å benytte et repeated measures design. Dette gjør det mulig å se bort fra en kilde til variasjon som vi ikke er interesserte i her: effekten av person, og vi får dermed høyere statistisk styrke. I mange tilfeller er det imidlertid ikke mulig å benytte et slikt design og i andre tilfeller er det ikke særlig smart fordi det vil gi oss tolkningsproblemer dvs. problemer knyttet til indre validitet.

Nå var jo dette designet litt mer komplisert: vi har egentlig et to-veis design med en mellom-person variabel (Gruppe) og en innen-person variabel (Tid). Da blir beregningene mer kompliserte, og vi lar foreløpig SPSS ta seg av det

Multiple Comparisons.

Eksemplet fra tidligere med tilfeldige, ukorrelerte tall: A B B-A 1 53.54 65.31 11.76 2 39.15 69.53 30.38 3 67.33 63.98-3.36 4 46.81 58.63 11.82 5 54.10 61.09 6.99 6 48.33 60.75 12.43 7 62.21 57.86-4.35 8 38.63 64.73 26.10 9 50.85 58.42 7.56 10 57.84 51.46-6.39 11 56.16 64.95 8.79 12 42.28 54.41 12.12 13 50.43 62.06 11.63 14 35.09 54.75 19.67 15 52.30 55.90 3.59 16 43.98 59.39 15.41 17 40.16 35.97-4.19........ 99999 50.73 60.03 9.30 100000 52.41 76.57 24.16 Mean: 49.97 59.98 10.00 Sd: 10.03 10.04 14.18 Varians: 100.64 100.78 200.96 Trekker 100000 tilfeldige tall fra to fordelinger. Den ene (A) har gjennomsnitt 50 og varians=100. Den andre (B) har gjennomsnitt=60 og varians=100. Tallene A og B er trukket helt uavhengige av hverandre, og korrelasjonen (kovariansen) mellom dem er dermed 0. Beregner differansen mellom A og B. Vi så at: var(a-b) = var(a) + var(b) 2*Kov(A,B) Men siden tallene var ukorrelerte var kovariansen 0, og det hele forenklet seg til: var(a-b) = var(a) + var(b)

Samme eksempel, men med tilfeldige, korrelerte tall: A B B-A 1 68.78 74.83 6.05 2 59.48 71.93 12.46 3 36.52 57.05 20.53 4 29.48 42.97 13.49 5 50.27 66.84 16.57 6 50.46 46.48-3.98 7 42.78 74.93 32.16 8 36.98 56.11 19.13 9 60.23 71.02 10.79 10 30.12 60.32 30.20 11 44.10 56.62 12.53 12 25.61 37.70 12.09 13 51.55 53.95 2.40 14 50.64 66.38 15.74 15 49.04 44.30-4.74 16 58.82 51.15-7.67 17 34.14 44.61 10.47........ 99999 48.03 55.36 7.33 100000 60.12 59.90-0.22 Mean: 50.00 59.97 9.97 Sd: 10.02 10.00 10.02 Varians: 100.36 100.08 100.44 Kovarians: 49.99 Korrelasjon: 0.50 Trekker 100000 tilfeldige tall fra to fordelinger. Den ene (A) har gjennomsnitt 50 og varians=100. Den andre (B) har gjennomsnitt=60 og varians=100. Tallene A og B er trukket slik at kovariansen mellom dem er 50. Beregner differansen mellom A og B. var(a-b) = var(a) + var(b) 2*Kov(A,B) Som skulle bli: var(a-b) = 100 + 100 2*50 = 100 At variasjonen til en differanse avhenger av kovariansen (korrelasjonen), kan vi dra nytte av i et design med repeterte målinger!

Eksempel på enveis repetert design. 8 personer er målt to ganger (under to ulike betingelser). Treatment Treatment Person A B B-A Kov(A,B) Person A B B-A Kov(A,B) 1 5 7 2 1 1 5 7 2 1 2 4 6 2 0 2 4 6 2 0 3 6 8 2 4 3 6 5-1 -2 4 3 5 2 1 4 3 5 2 1 5 4 6 2 0 5 4 6 2 0 6 5 7 2 1 6 5 7 2 1 7 3 5 2 1 7 3 8 5-2 8 2 4 2 4 8 2 4 2 4 Mean 4.00 6.00 Mean 4.00 6.00 Sd 1.31 1.31 0.00 Sd 1.31 1.31 1.60 Varians 1.71 1.71 0.00 Varians 1.71 1.71 2.57 Kovarians 1.71 Kovarians 0.43 Variansen til B-A: 0.00 Variansen til B-A: 2.57 Vi ser at variansen til differansen avhenger av kovariansen mellom A og B!

Her kunne vi testet differansen mellom de to gjennomsnittene ved en enkel t-test for differansen mellom korrelerte gjennomsnitt (paired samples t-test i Spss): Det vil imidlertid bare fungere dersom vi som her har bare to repeterte målinger og en uavhengig variabel. Vi kunne hatt flere målinger og/eller flere uavhengige variabler. Da må vi finne en mer generell fremgangsmåte!

Vi går tilbake til eksemplet vi startet med. Der fikk vi følgende resultat:

Effect-size.

For differanser mellom gjennomsnitt («kontraster») kan vi bruke: Cohen s d = X 1 X 2 σ X 1 X 2 Sd = X 1 X 2 Mean(Var) = X 1 X 2 2.51 Cohen's Standard d r r 2 2.00 0.71 0.50 1.90 0.69 0.47 1.80 0.67 0.45 1.70 0.65 0.42 1.60 0.63 0.39 1.50 0.60 0.36 1.40 0.57 0.33 1.30 0.55 0.30 1.20 0.51 0.27 1.10 0.48 0.23 1.00 0.45 0.20 0.90 0.41 0.17 LARGE 0.80 0.37 0.14 0.70 0.33 0.11 0.60 0.29 0.08 MEDIUM 0.50 0.24 0.06 0.40 0.20 0.04 0.30 0.15 0.02 SMALL 0.20 0.10 0.01 0.10 0.05 0.00 0.00 0.00 0.00