Levetid (varighet av en tilstand) Levetidsanalyse (survival analysis) Rosner.8-. av Stian Lydersen Forlesning 6 april 8 Eksempler: Tid til personen dør (målt fra fødsel, fra diagnose, fra behandling) Tid til en diagnose Tid fra start av behandling til erklært frisk Levetider er Alltid større enn Ofte sensurert S(t) = Sannsynligheten for å overleve t Sensurerte data Sensurerte data Individ nr hendelse (f.eks død) Sensurtidspunkt Individ nr Emigrert Potensielle ikke-observerte hendelser Potensielle ikke-observerte hendelser Studieslutt Kalendertid Individ-tid 5 6 Levetidsanalyse - mest brukte metoder Aktuarberegning (grov beregning innenfor tidsintervall) Kaplan-Meier plott (empirisk overlevelsessannsynlighet) Log-rank test: Ikke-parametrisk test for forskjell mellom grupper Regresjonsanalyse: Semi-parametrisk (Cox regresjon = Proporsjonal hazard regresjon) Parametrisk (Antar bestemt form på fordelingen, f.eks Weibull-fordeling) ISI-søk mars 9 COX DR REGRESSION MODELS AND LIFE-TABLES JOURNAL OF THE ROYAL STATISTICAL SOCIETY SERIES B-STATISTICAL METHODOLOGY (): 87& 97 Times Cited: 8 Title: NONPARAMETRIC-ESTIMATION FROM INCOMPLETE OBSERVATIONS Author(s): KAPLAN EL, MEIER P Source: JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION 5 (8): 57-8 958 Times Cited: 68
7 8 Metodene for levetidsanalyse forutsetter ikkeinformativ sensurering,9 Norge. Basert på dødelighetstall fra www.ssb.no For hvert individ finnes en potensiell levetid T og et sensurtidspunkt C. Observerer kun min(t, C) og D hvor D= hvis sensurert D= hvis hendelse (f.eks død) Metodene for levetidsanalyse forutsetter at T, D er uavhengige Umulig å sjekke uavhengighet fra data Overlevelse,8,7,6,5,,,, menn kvinner 5 6 7 8 9 år 9 Kaplan-Meier (produkt-grense) estimatoren for overlevelsessannsynligheten Data om overlevelse for 5 pasienter med melanom (fra Aalen, 998) Kaplan-Meier plott (empirisk overlevesessannsynlighet) Antall i live og under observasjon Status (=sensurert, =død) Observasjonstid i år Overlevelsessannsynlighet (Kaplan-Meier) 5,6,9,97,8,86,5,79,65,78,69,66 9,59,57 8,,5 7,6 6,6,9 5,9 5, 5,76 6,8,9 6,8 CumSurvival Survival Function,,8,6,,, 5 Tid i år 6 7 Survival Function Censored Sammenlikning mellom to grupper Kleinbaum & Klein (5) s 7 Remisjonstider for leukemi-pasienter (Freireich & al, Blood, 96) H : mot Ingen gruppeeffekt S (t) = S (t) for alle t H : Levetidene tenderer til å være lengre (evt kortere) i gruppe S (t) S (t) for alle t med > for noen t (evt og <) Ikke-parametrisk test for komplette eller sensurerte data: Lograng-test. Tilnærmet samme resultat: Test om β= i Cox modell med x som indikator på gruppe. (Eksakt samme resultat hvis ingen sammenfallende observasjoner OG bruk av LR p-verdi i Cox modell.) uker hend. grp uker hend. grp uker hend. grp 8 6 8 7 8 7 8 9 9 5 5 6 5 6 6 6 7 5 5 Hendelse = sensur = remisjon Grp = Behandling =placebo
Lograng-test: Eksempel fra Kleinbaum & Klein (5) Tid. hendelser.. rest. (uke) gr h h gr r r 9 7 6 5 6 7 7* 8 6 5 8 8 6 5 6 7 7 6 Sum 9 * Sensurerte tider kommer ikke frem, kursiv antyder uker med sensur. Log-rang testen Likner på en kjikvadrat goodness of fit test Del opp i korte tidsintervall (bare ett tidspunkt med hendelse i hvert intervall) Forventet antall hendelser i intervall nr j: Expected = andel i risikomengden antall hendelser totalt r j ej = ( hj + h j), rj r + j r j e j = ( hj + h j) rj r + j 5 Tid. hendelser.. rest.. expected. (uke) gr h h gr r r gr e e Gr** Obs-Exp / * / *. 9 / * 9/ *.5 7 /8 * 7/8 *.55 6 /7 * 6/7 *. 5 /5 * /5 *. 6 / * / * -.9 7 7* 7/9 * /9 * -. 8 6 6/8 * /8 *.9 5 8 5/ * 8/ * -.5 8 / * 8/ *. 6 /8 * 6/8 *. /6 * /6 * -.5 5 /5 * /5 *.7 6 / * / * -. 7 / * / *.77 7 7/9 * /9 *.56 6 6/7 * /7 *.7 Sum 9 9.6.7. sensurerte kommer ikke frem, kursiv antyder uker med sensur *Observert-expected for gruppe = -(Observert-expected) for gruppe 6 Log-rank test log-rank observator: (Σ failure times obs-forv) /var (Σ obs-forv) r r( h + h) ( r+ r h h) var (Σ obs-forv)= = 6. ( r+ r) ( r+ r ) Når to grupper blir sammenliknet brukes kun resultater for en gruppe; (obs-forv) for gruppe = - (obs-forv) for gruppe For gruppe : (Σ failure times obs-forv) = (.) = 6.9 log-rank: chi = 6.8, df = gir p-verdi <. Mer komplisert hvis det er mer enn grupper som sammenliknes 7 8 Overlevelsessannsynlighet (survival probability, survival function): S(t) = P(T > t) Hazard rate, dødelighet (force of mortality): h(t) Sannsynligheten for at individet av alder t dør i løpet av neste tidsintervall av varighet Δt: P(T t + Δt T > t) h(t) Δt dødelighet, pr person-år menn kvinner Dødelighet Norge 5 5 6 7 8 9 alder, år
9 Formell definisjon av hazardraten: PT ( t+δ t T> t) zt ( ) = lim Δ t Δt som vi ser blir lik P(( T t+δt) ( T > t)) P( t< T t+δt) zt ( ) = lim = lim Δ t Δ t P( T > t) Δ t Δ t P( T > t) Ft ( +Δt) Ft ( ) f( t) = lim = Δ t Δ t P( T > t) S( t) og også: d zt ( ) = (ln( St ( ))) dt Sammenheng mellom S(t) og h(t): t St () h( u) du e H ( t) e hvor H ( t) = = = t h( u) du kalles kumulativ hazard. Det er lettere å plotte H(t) enn h(t). Hazardraten h(t) = H (t) er stigningstallet til H(t). Cox Proporsjonal Hazard (PH) modell h(t; x) = h (t) exp(β x) h(t; x,, x p ) = h (t) exp(β x + + β p x p ) = h (t) exp(β x ) exp(β p x p ) ekvivalent: exp(β x) S(t; x) = S (t) hvor h (t), S (t) kalles base line hazard rate, base line overlevelsessannsynlighet En fortolkning av β Hvis to individer (eller grupper) har hhv x = og x = og ellers like forklaringsvariable: Forholdet mellom hazardratene for gruppene er lik exp(β ), uansett alder t. Størrelsen exp(β ) kalles hazard ratio (HR). Relevant bare hvis forklaringsvariabelen ikke inngår i interaksjonsledd! h (t) er ukjent og helt uspesifisert β,, β p er ukjente parametre Cox, D. R. (97): Metode for estimering av β,, β p og ikke-parametrisk estimering av S (t) (Kaplan- Meier type estimering) for komplette og sensurerte datasett Tidsavhengige β i (t) er mulig (Alternativt: Parametrisk modell, f.eks lognormal eller Weibullfordeling for S(t).) Partiell likelihood (Cox): m h ( t)exp( x( ) ) m i β exp( x( i) β) l p ( β ) = = h ( t)exp( x β) exp( x β) i= j i= j R( t() i ) j R( t() i ) hvor t () t ()... t ( m ) ( j) < < < er de m distinkte (usensurerte) levetidene. Rt ( ) er risikomengden ved t (j) dvs individer i live og usensurert ved t (j) x (j) er kovariatene til individet med levetid t (j). j
5 6 Den partielle likelihood er ikke avhengig av h () t! Estimater for β samt estimatorenes varianser og kovarianser finnes ved å behandle l ( β ) som en vanlig likelihood. p Ved sammenfallende observasjoner brukes en mer generell lp( β ). Alternativer: - eksakt (meget tidkrevende) - Breslow (97) - Efron (977) (Nesten identiske resultater som eksakt). SPSS: Bare Breslow er tilgjengelig. Stata: Alle tilgjengelig. Breslow er default. Angi option Efron ved sammenfallende observasjoner 7 8 Sjekking av PH-antakelsen: Log - log plott Vi har Stx (, ) = S() t så exp( x' β) log( log( Stx (, ))) = x ' β + log( log( S( t))) Software for Cox PH regresjon SPSS - har endel MINITAB har endel STATA - har det meste S-plus eller R- har det meste SAS - har det meste Plott for forskjellige x bør være parallelle under PH antakelsen. Vanskelig å vurdere parallellitet når det er få observasjoner. 9 BMJ ;6:8 Parametric survival models may be more accurate than Kaplan-Meier estimates EDITOR---Lundin et al use Kaplan-Meier estimates of survival probabilities in their system for survival estimation in breast cancer They claim that researchers can obtain survival estimates based on actual data, rather than inferential estimates generated by a regression formula. However, any regression formula is based on actual data. More importantly, survival estimates from a regression model may be substantially more precise than Kaplan-Meier estimates when there are few patients in particular strata. May, M. et al. BMJ ;6:8 Kaplan-Meier versus Weibull distribution Copyright BMJ Publishing Group Ltd. 5
Referanser Hosmer, D. W., Lemeshow, D. W., May, S.: Applied Survival Analysis. Regression Modeling of Time to Event Data. nd Ed. Wiley, 8. Omfattende og velskrevet bok. Kleinbaum, D. G., and Klein, M.: Survival Analysis: A Self-Learning Text. nd ed. Springer, 5. Lettlest innføringsbok 6