Noen Statistiske utfordringer ved analyse av PROM Kyrre Breivik Uni Research Helse, RKBU-Vest RKBU-Vest
Pasientrapporterte data Flere statistiske utfordringer ved analyse av PROM (f.eks. missing, validitet, kausalitet etc) I denne presentasjonen vil jeg fokusere på utfordringer knyttet til dimensjonalitet og skjeve variabler
Dimensjonalitet Unidimensjonalitet av måleinstrument er ofte ansett som et ideal. Måleinstrumentet har som oftest til hensikt å måle et fenomen. Thurstone (1931) f.eks. argumenterer for viktigheten av at alle måleinstrument skal måle et konstrukt Implisitt i både klassisk test teori og (tradisjonell) item response teori Summeskåre blir ofte benyttet for å representere konstruktet Høy Cronbach s Alpha (f.eks. Alpha >.70) har ofte feilaktig blir benyttet som støtte for unidimensjonalitet Men PROM instrument er sjelden helt unidimensjonale
Eksempler på påvirkning av uønskete dimensjoner Responsstil Dif effekt Depresjon Responsstil Depresjon Griner ofte Vise følelser Kjønn
Faktoranalyse blir ofte benyttet for å undersøke om en kan benytte en totalskåre eller om en bør benytte to eller flere subskalaer
Eksempel: Roland-Morris Disability Questionnaire er som oftest skåret som en summeskåre Vi fant tre faktorer (Magnussen, L. H., Lygren, H., Strand, L. I., Hagen, E. M., & Breivik, K., 2015) : Symptomer (f.eks. Jeg har vondt i ryggen nesten hele tiden) Begrensinger i daglige aktiviteter (f.eks. På grunn av ryggsmertene har jeg vanskeligheter med å ta på meg strømpene) Unngåelse av aktiviteter og deltakelse (Jeg holder meg for det meste hjemme på grunn av ryggen, På grunn av ryggen forsøker jeg å få andre til å gjøre ting for meg) Disse faktorene var bare moderat korrelert med hverandre (.34-.40) Symptomer predikerte andre mål på subjektive helseplager Unngåelse av aktiviteter predikerte emosjonsbasert mestring, bevegelsesfrykt eller unngåelsesadferd for både arbeid og fysisk aktivitet samt lite aktiv instrumentell mestring Støtter bruken av separate skaler. Selv om dette studiet ikke støtter at totalskåren reflekter en sterk faktor kan den fremdeles være viktig som prediktor (f.eks. Apgar-skåre)
Eksempel 2: Tidligere studier har gitt støtte til at ADHD er multidimensjonal Diskusjon hvorvidt den består av 2 eller 3 relativt høyt korrelerte dimensjoner (.70 -.85) Samtidig er det mange som oppfatter ADHD som et fenomen Er det ok bruke en summeskåre eller bør en bruke subskalaene eller kanskje begge deler? Bifaktoranalyse er en potensiell velegnet analyse for å besvare dette spørsmålet
Bifaktormodell kan forsvare bruken av en totalskåre ved multidimensjonalitet Ullebø, A. K., Breivik, K., Gillberg, C., Lundervold, A. J., & Posserud, M. B. (2012). Bifaktoranalysen gir støtte til bruk av totalskåre (omega alpha.77). Subskalaene har lite reliabilitet (omega alpha: hyper = 0, inattent =.43, impuls=.38)
Utfordring ved at Helsevariabler ofte er skjevfordelte Skaler som måler pasientrapporterte utfallsmål er ofte relativt skjevfordelte og kan også inneholde relativt mange nullverdier noe som ofte kan være statistisk utfordrende Lundervold et. al., 2013 Amtmann et. al., 2010
Noen løsningsforslag Transformasjon av utfallsvariablene (f.eks. logistisk transformasjon) Benytte robuste analysemetoder (f.eks. MLR) Men kan ha begrenset effekt om det er mange som har 0 verdi Dikotomisering av utfallsvariabel og bruke logistisk regresjon mister ofte mye informasjon Benytte ordinal regresjon (maks antall kategorier i f.eks. Mplus = 11) Poisson regresjon Benyttes på tellevariabler Tobit regresjon og anta at 0 verdier er sensurert Men hva om 0 verdiene er reelle? Two part (semikontinuerlig) modellering: Part 1: Null vs. Ikke null Part 2: kontinuerlig (e.l.) for ikke null verdiene Muthen & Muthen (2009) Mplus short courses.topic 2
Modellere skjeve skalaer via cat-sem eller IRT Cat- SEM og IRT modellering benytter dikotome eller ordinale spørreledd for å måle en underliggende latent variabel Begge metodene tar hensyn til at slike item ikke er normalfordelte og gir veldig like resultater Beslektede metoder hvor en kan transformere Cat- Sem parametre til IRT parametre og omvendt
Noen fordeler ved å benytte cat-sem og IRT Korrigert for feilvarians (latent variabel) Gir mer varians Kan forhindrer spuriøse interaksjonseffekter (også longitudinelt) Gir et mer realistisk mål på presisjonen av måleinstrumentet
Realibility (Chronbach alpha=0.78) 14 Test Information and Measurement Error Test information and measurement error 1.05 12 0.84 10 Information Information 8 6 4 0.63 0.42 Standard Error Standard error 0.21 2 0-3 -2-1 0 1 2 3 Scale Score Scale score 0
Realibility (Chronbach alpha=0.78) 14 Test Information and Measurement Error Test information and measurement error Cronbach alpha =0.90 1.05 12 0.84 10 Information Information 8 6 4 0.63 0.42 Standard Error Standard error 0.21 2 0-3 -2-1 0 1 2 3 Scale Score Scale score 0 Reliability = 1-(1/Information), Reeve & Fayers, 2005
Mulig problem: Den latente variabelen er som regel antatt å være normalfordelt Er dette en rimelig antakelse? Om den latente variabelen i realiteten ikke er normalfordelt kan dette føre til bias (Woods, 2014) Reise (2009) argumenterer for at mange fenomen en ønsker å måle ved hjelp av pasient rapporterte data (depresjon, stoffmisbruk, kroniske smerter etc) er såkalte kvasitrekk eller unipolare - dvs at de er bare relevant for en del av populasjonen
Mulige løsninger Konstruere nye mål på PROM hvor en inkluderer spørreledd som kan diskriminere (så mye som mulig) på tvers av trekket (f.eks. PROMIS) Modellering av fordelingen av den latente variabelen (f.eks. Woods, 2014) Two part mixture modelling En klasse som har null verdi En klasse som har normal fordeling på utfallsvariabelen
Konklusjon Statistiske analyser av PROM kan være utfordrende bl.a. fordi de relativt ofte er: Multidimensjonale Skjevfordelte Stort fokus i den metodiske forskningslitteraturen for å finne de mest hensiktsmessige løsningene på disse utfordringene