Anvendt medisinsk statistikk, vår 008: - Varianskomponenter - Sammensatt lineær modell med faste og tilfeldige effekter - Evt. faktoriell design Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald Johnsen) 1 Klassisk ANOVA/ lineær modell Utgangspunkt: grupperte observasjoner av kontinuerlig, tilfeldig variabel Problemstilling: er gruppenes forventningsverdi lik? H 0 testes med F-test Hvilke grupper skiller seg ut? Post-hoc tester avhengig av problemstilling (onferroni, Tukey, Sidak m.fl.) Målet er å generalisere fra en fast effekt/faktor til populasjonen. 1
Varianskomponenter Utgangspunkt: gjentatte observasjoner av kontinuerlig, tilfeldig variabel Nøkkelbegreper: Repeterbarhet (eng. repeatability ) Samme analyse under så like forhold som overhodet mulig. Uttrykker den grunnleggende, usystematiske feil. Reproduserbarhet (eng. reproducibility ) Samme analyse under skiftende forhold, for eksempel dag/natt, type utstyr, operatør. Uttrykker den realistiske feil fra mange kilder 3 Varianskomponenter Eks. Reproduserbarhet av plasma østradiol (Rosner table 1.0), analysert på log-skala Plott Problemstilling: er variasjonen mellom pasientene større enn variasjonen av gjentatte analyser av samme pasient? Ingen egentlig interesse av den enkelte pasient sitt nivå! vanlig ANOVA uinteressant Variansen til den enkelte måling oppfattes som er sum av to uavhengige komponenter: etween subjects Within subjects 4
Varianskomponenter Generell modell: y = μ+ b + e b N(0, σ ), e N(0, σ ), uavh av b. ij i ij i ij i Altså er y N( μσ, + σ ) ij i = 1,..., k (gruppe, klasse el. individ) j = 1,,..., n (observasjoner innen hver gruppe el. klasse) i N! α i i Rosner Eq. 1.9 kalles b i her. 5 Variasjonskoeffsient CV Eks. I σ CV (målt i %) = 100i μ Estimeres fra ANOVA som 100i SD( y) eller 100i y MSE y Ekspl. Rosner 6.ed, tabell 1.0 (obs log-skala, han anbefaler en annen metode ift. originalskala!!) 0.030 ˆ σ = MSE = 0.030, ˆ σ = 0.317, y =.57, gir CV = 100i = 6.74%.57 Ekspl. Rosner 6.ed, tabell.17 0.051 ˆ σ = MSE = 0.051, ˆ σ = 0.309, y =.95, gir CV = 100i = 7.66%.95 6 3
Intra-klasse korrelasjon ICC Eks. I ICC [0,1] Et mål på reproduserbarhet: I hvor stor grad er gruppene likere seg selv enn andre σ ICC = σ + σ Eks. Rosner tabell 1.0 (log østradiol) ˆ σ 0.317 ICC = = = 0.91 ˆ σ ˆ 0.317+0.03 + σ Ekspl. Rosner 6.ed, tabell.17 ˆ σ 0.309 ICC = = = 0.86 ˆ σ ˆ 0.309+0.051 + σ 7 Lineær, sammensatt modell Eng: linear mixed effects model åde faste ( fixed ) og tilfeldige ( random ) faktorer/ effekter Utgangspunkt: grupperte observasjoner av kontinuerlig, tilfeldig variabel Gruppene er likere seg selv enn andre : avhangighet (korrelasjon) mellom observasjoner fra samme gruppe Gruppene er trukket tilfeldig fra populasjonen av tilsvarende grupper Målet er å generalisere til denne populasjonen Eksempler: Gjentatte observasjoner på samme individ Observasjoner fra forskjellige skoler, sykehus, byer, land 8 4
Lineær, sammensatt modell Problemstilling: bidrar gruppene til økt varians? Hvor mye? Ingen egentlig interesse av å estimere den enkelte gruppe sitt nivå! vanlig ANOVA uinteressant Målet er å estimere bidrag til variansen fra gruppestrukturen. Eksplisitt modellering av avhengighet (korrelasjon) i datamaterialet. 9 Lineær, sammensatt modell y = β + β x + β x +... + b + e b N(0, σ ), e N(0, σ ), uavh av b. ij 0 1 1 i ij i ij i Altså er E( Y) = β + β x + β x +... 0 1 1 i = 1,..., k (gruppe, klasse el. individ) j = 1,,..., n (observasjoner innen hver gruppe el. klasse) i 10 5
Eksempel II: intramural ph vs. P a CO obs id ph pco 1 1 6.68 3.97 1 6.53 4.1 3 1 6.43 4.09 4 1 6.33 3.97 5 6.85 5.7 6 7.06 5.37 7 7.13 5.41 8 7.17 5.44 9 3 7.40 5.67 10 3 7.4 3.64 11 3 7.41 4.3 1 3 7.37 4.73 13 3 7.34 4.96 14 3 7.35 5.04 15 3 7.8 5. 16 3 7.30 4.8 17 3 7.34 5.07 obs id ph pco 18 4 7.36 5.67 19 4 7.33 5.10 0 4 7.9 5.53 1 4 7.30 4.75 4 7.35 5.51 3 5 7.35 4.8 4 5 7.30 4.44 5 5 7.30 4.3 6 5 7.37 3.3 7 5 7.7 4.46 8 5 7.8 4.7 9 5 7.3 4.75 30 5 7.3 4.99 31 6 7.38 4.78 3 6 7.30 4.73 33 6 7.9 5.1 34 6 7.33 4.93 35 6 7.31 5.03 36 6 7.33 4.93 obs id ph pco 37 7 6.86 6.85 38 7 6.94 6.44 39 7 6.9 6.5 40 8 7.19 5.8 41 8 7.9 4.56 4 8 7.1 4.34 43 8 7.5 4.3 44 8 7.0 4.41 45 8 7.19 3.69 46 8 6.77 6.09 47 8 6.8 5.58 11 ph 6.4 6.6 6.8 7.0 7. 7.4 r = -0.065, p = 0.66 4 5 6 pco 1 6
Eksempel II: intramural ph vs. P a CO y = β + β x + b + e b N(0, σ ), e N(0, σ ), uavh av b. ij 0 1 1 i ij i ij i Altså er E( Y) = β + β x 0 1 1 i = 1,,...,15 (individ, id) j = 1,,..., n (observasjoner innen hver gruppe) i ph = β + β ipco + b + e ij 0 1 i ij Altså er E( ph ) = β + β PCO 0 1 i = 1,,...,15 (individ, id) j = 1,,..., n (observasjoner innen hver gruppe) i 13 Eksempel II: intramural ph vs. P a CO SPSS: Analyze Mixed models Linear Parameter Intercept pco Estimates of Fixed Effects a 95% Confidence Interval Estimate Std. Error df t Sig. Lower ound Upper ound 7,631356,184785 31,901 41,99,000 7,54915 8,007797 -,10371,09354 40,565-3,518,001 -,1657 -,043971 a. Dependent Variable: ph. Estimates of Covariance Parameters a Parameter Residual Intercept [subject = id] Variance a. Dependent Variable: ph. Estimate Std. Error,008785,00016,097099,053187 ˆ β = 7.63 ˆ β = 0.10 0 1 ˆ σ =0.009 ˆ σ =0.097 ˆ σ 0.097 σ + σ ICC = = = 0.9 ˆ ˆ 0.097+0.009 14 7
Estimert stigningskoeffisient (β) fra enkel lineær regresjon for hvert individ ph 6.4 6.6 6.8 7.0 7. 7.4 ph = 7.63-0.10*pCO, p < 0.01 3 4 5 6 7 PCO 15 Eksempel III: mobilisering etter hjertekirurgi Observasjonsstudie ved St. Elisabeth landet venøs oksygenmetning målt på samme pasient ved tidspunktene T1-T6: Hvilende, i seng T1 Sittende i stol T Stå/gå ved senga T3 Sittende i stol T4 Stå/gå ved senga T5 Hvilende, i seng T6 16 8
Gjentatte observasjoner på samme individ: S v O % 80 Day 1 Day 60 40 0 Median S v O : 0 56 47 37 47 36 54 57 49 37 47 35 58 T1 T T3 T4 T5 T6 T1 T T3 T4 T5 T6 Time points during mobilization on postoperative day 1 and 17 Eksempel III: mobilisering etter hjertekirurgi. y = β + b + e b N(0, σ ), e N(0, σ ), uavh av b. ij j i ij i ij i Altså er E( Y ) = β j i = 1,,...,15 (individ, id) j = 1,,...,6 (fast ["fixed"] faktor; tidspunkt for mobilisering, kun en observasjon for hver situasjon) 18 9
Eksempel III: mobilisering etter hjertekirurgi. SPSS: Analyze Mixed models Linear Parameter [Index1=1] [Index1=] [Index1=3] [Index1=4] [Index1=5] [Index1=6] Estimates of Fixed Effects a 95% Confidence Interval Estimate Std. Error df t Sig. Lower ound Upper ound 58,533333,0048 4,517 8,948,000 54,364685 6,70198 47,866667,0048 4,517 3,67,000 43,698018 5,035315 35,933333,0048 4,517 17,771,000 31,764685 40,10198 48,000000,0048 4,517 3,738,000 43,83135 5,168648 35,533333,0048 4,517 17,573,000 31,364685 39,70198 57,400000,0048 4,517 8,387,000 53,3135 61,568648 a. Dependent Variable: SVO Day 1 premob, oxymetri. Estimates of Covariance Parameters a Parameter Residual Intercept [subject = id] Variance Estimate Std. Error 18,60854 3,145369 4,71905 17,37504 a. Dependent Variable: SVO Day 1 premob, oxymetri. ˆ β = 58.5, 47.8,...,57.4 1..6 ˆ σ =18.6 ˆ σ =4.7 ˆ σ 4.7 σ + σ ICC = = = 0.70 ˆ ˆ 4.7+18.6 19 10