Levetid (varighet av en tilstand)

Like dokumenter
Lifetime (duration of a state)

Levetid (varighet av en tilstand)

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

Eksamensoppgave i TMA4275 Levetidsanalyse

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

i=1 t i +80t 0 i=1 t i = 9816.

Logistisk regresjon 2

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

Eksamensoppgave i TMA4275 Levetidsanalyse

Eksamen ST2303 Medisinsk statistikk Onsdag 3 juni 2009 kl

Logistisk regresjon 1

UNIVERSITETET I OSLO

10.1 Enkel lineær regresjon Multippel regresjon

Forelesning 12. Levetider. STK november Eksempel: Klinisk forsøk. Fra studiens start ved tid

En empirisk studie av kumulative insidensfunksjoner estimert ved Cox regresjon og Fine-Gray metoden

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

Eksamensoppgave i TMA4275 Levetidsanalyse

Forelesning 11. STK november Eksempel: Klinisk forsøk. Fra studiens start ved tid t = 0

SAMMENHENGEN MELLOM LENGDEN AV UTDANNELSE OG DØDELIGHET I NORGE MED FOKUS PÅ SØSKENAVHENGIGHET

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Lese og presentere statistikk i medisinske forskningsartikler

UNIVERSITETET I OSLO

Prøveeksamen i STK3100/4100 høsten 2011.

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

EKSAMEN I: DOF 610 STATISTISKE METODER I MEDISINSK FORSKNING 2

UNIVERSITETET I OSLO

Poissonprosesser og levetidsfordelinger

Forelesning 9 STK3100/4100

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Weibullfordelingen. Kjetil L. Nielsen. Innhold. 1 Teori. 1.1 Tetthetsfunksjon og fordelingsfunksjon

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

STK juni 2016

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

UNIVERSITETET I OSLO

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

Forelesning 9 STK3100/4100

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Kapittel 3: Studieopplegg

Ekstraoppgaver for STK2120

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

Kort overblikk over kurset sålangt

UNIVERSITETET I OSLO

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

Detaljerte forklaringer av begreper og metoder.

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Eksamensoppgave i TMA4255 Anvendt statistikk

Regresjonsmodeller. HEL 8020 Analyse av registerdata i forskning. Tom Wilsgaard

Eksamensoppgave i TMA4255 Anvendt statistikk

Forelesning 7 STK3100/4100

Forelesning 8 STK3100/4100

Eksamensoppgave i TMA4295 Statistisk inferens

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Medisinsk statistikk Del I høsten 2009:

Inferens i regresjon

UNIVERSITETET I OSLO

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Tilleggsoppgaver for STK1110 Høst 2015

Forelesning 7 STK3100

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Sammenligning av dødelighetsrater for mennesker født før, under og etter den 2. verdenskrig i de nordiske land

Forelesning 7 STK3100/4100

UNIVERSITETET I OSLO Matematisk Institutt

Forelesning 6 STK3100/4100

Overlevelsesanalyse med tidsavhengige forklaringsvariabler med bruk av Cox proporsjonal hasard regresjonsmodell.

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Forelesning 7 STK3100

TMA4240 Statistikk H2010

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Eksamensoppgåve i TMA4255 Anvendt statistikk

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk 2014

Transkript:

Levetid (varighet av en tilstand) Levetidsanalyse (survival analysis) Rosner.8-. av Stian Lydersen Forlesning 6 april 8 Eksempler: Tid til personen dør (målt fra fødsel, fra diagnose, fra behandling) Tid til en diagnose Tid fra start av behandling til erklært frisk Levetider er Alltid større enn Ofte sensurert S(t) = Sannsynligheten for å overleve t Sensurerte data Sensurerte data Individ nr hendelse (f.eks død) Sensurtidspunkt Individ nr Emigrert Potensielle ikke-observerte hendelser Potensielle ikke-observerte hendelser Studieslutt Kalendertid Individ-tid 5 6 Levetidsanalyse - mest brukte metoder Aktuarberegning (grov beregning innenfor tidsintervall) Kaplan-Meier plott (empirisk overlevelsessannsynlighet) Log-rank test: Ikke-parametrisk test for forskjell mellom grupper Regresjonsanalyse: Semi-parametrisk (Cox regresjon = Proporsjonal hazard regresjon) Parametrisk (Antar bestemt form på fordelingen, f.eks Weibull-fordeling) ISI-søk mars 9 COX DR REGRESSION MODELS AND LIFE-TABLES JOURNAL OF THE ROYAL STATISTICAL SOCIETY SERIES B-STATISTICAL METHODOLOGY (): 87& 97 Times Cited: 8 Title: NONPARAMETRIC-ESTIMATION FROM INCOMPLETE OBSERVATIONS Author(s): KAPLAN EL, MEIER P Source: JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION 5 (8): 57-8 958 Times Cited: 68

7 8 Metodene for levetidsanalyse forutsetter ikkeinformativ sensurering,9 Norge. Basert på dødelighetstall fra www.ssb.no For hvert individ finnes en potensiell levetid T og et sensurtidspunkt C. Observerer kun min(t, C) og D hvor D= hvis sensurert D= hvis hendelse (f.eks død) Metodene for levetidsanalyse forutsetter at T, D er uavhengige Umulig å sjekke uavhengighet fra data Overlevelse,8,7,6,5,,,, menn kvinner 5 6 7 8 9 år 9 Kaplan-Meier (produkt-grense) estimatoren for overlevelsessannsynligheten Data om overlevelse for 5 pasienter med melanom (fra Aalen, 998) Kaplan-Meier plott (empirisk overlevesessannsynlighet) Antall i live og under observasjon Status (=sensurert, =død) Observasjonstid i år Overlevelsessannsynlighet (Kaplan-Meier) 5,6,9,97,8,86,5,79,65,78,69,66 9,59,57 8,,5 7,6 6,6,9 5,9 5, 5,76 6,8,9 6,8 CumSurvival Survival Function,,8,6,,, 5 Tid i år 6 7 Survival Function Censored Sammenlikning mellom to grupper Kleinbaum & Klein (5) s 7 Remisjonstider for leukemi-pasienter (Freireich & al, Blood, 96) H : mot Ingen gruppeeffekt S (t) = S (t) for alle t H : Levetidene tenderer til å være lengre (evt kortere) i gruppe S (t) S (t) for alle t med > for noen t (evt og <) Ikke-parametrisk test for komplette eller sensurerte data: Lograng-test. Tilnærmet samme resultat: Test om β= i Cox modell med x som indikator på gruppe. (Eksakt samme resultat hvis ingen sammenfallende observasjoner OG bruk av LR p-verdi i Cox modell.) uker hend. grp uker hend. grp uker hend. grp 8 6 8 7 8 7 8 9 9 5 5 6 5 6 6 6 7 5 5 Hendelse = sensur = remisjon Grp = Behandling =placebo

Lograng-test: Eksempel fra Kleinbaum & Klein (5) Tid. hendelser.. rest. (uke) gr h h gr r r 9 7 6 5 6 7 7* 8 6 5 8 8 6 5 6 7 7 6 Sum 9 * Sensurerte tider kommer ikke frem, kursiv antyder uker med sensur. Log-rang testen Likner på en kjikvadrat goodness of fit test Del opp i korte tidsintervall (bare ett tidspunkt med hendelse i hvert intervall) Forventet antall hendelser i intervall nr j: Expected = andel i risikomengden antall hendelser totalt r j ej = ( hj + h j), rj r + j r j e j = ( hj + h j) rj r + j 5 Tid. hendelser.. rest.. expected. (uke) gr h h gr r r gr e e Gr** Obs-Exp / * / *. 9 / * 9/ *.5 7 /8 * 7/8 *.55 6 /7 * 6/7 *. 5 /5 * /5 *. 6 / * / * -.9 7 7* 7/9 * /9 * -. 8 6 6/8 * /8 *.9 5 8 5/ * 8/ * -.5 8 / * 8/ *. 6 /8 * 6/8 *. /6 * /6 * -.5 5 /5 * /5 *.7 6 / * / * -. 7 / * / *.77 7 7/9 * /9 *.56 6 6/7 * /7 *.7 Sum 9 9.6.7. sensurerte kommer ikke frem, kursiv antyder uker med sensur *Observert-expected for gruppe = -(Observert-expected) for gruppe 6 Log-rank test log-rank observator: (Σ failure times obs-forv) /var (Σ obs-forv) r r( h + h) ( r+ r h h) var (Σ obs-forv)= = 6. ( r+ r) ( r+ r ) Når to grupper blir sammenliknet brukes kun resultater for en gruppe; (obs-forv) for gruppe = - (obs-forv) for gruppe For gruppe : (Σ failure times obs-forv) = (.) = 6.9 log-rank: chi = 6.8, df = gir p-verdi <. Mer komplisert hvis det er mer enn grupper som sammenliknes 7 8 Overlevelsessannsynlighet (survival probability, survival function): S(t) = P(T > t) Hazard rate, dødelighet (force of mortality): h(t) Sannsynligheten for at individet av alder t dør i løpet av neste tidsintervall av varighet Δt: P(T t + Δt T > t) h(t) Δt dødelighet, pr person-år menn kvinner Dødelighet Norge 5 5 6 7 8 9 alder, år

9 Formell definisjon av hazardraten: PT ( t+δ t T> t) zt ( ) = lim Δ t Δt som vi ser blir lik P(( T t+δt) ( T > t)) P( t< T t+δt) zt ( ) = lim = lim Δ t Δ t P( T > t) Δ t Δ t P( T > t) Ft ( +Δt) Ft ( ) f( t) = lim = Δ t Δ t P( T > t) S( t) og også: d zt ( ) = (ln( St ( ))) dt Sammenheng mellom S(t) og h(t): t St () h( u) du e H ( t) e hvor H ( t) = = = t h( u) du kalles kumulativ hazard. Det er lettere å plotte H(t) enn h(t). Hazardraten h(t) = H (t) er stigningstallet til H(t). Cox Proporsjonal Hazard (PH) modell h(t; x) = h (t) exp(β x) h(t; x,, x p ) = h (t) exp(β x + + β p x p ) = h (t) exp(β x ) exp(β p x p ) ekvivalent: exp(β x) S(t; x) = S (t) hvor h (t), S (t) kalles base line hazard rate, base line overlevelsessannsynlighet En fortolkning av β Hvis to individer (eller grupper) har hhv x = og x = og ellers like forklaringsvariable: Forholdet mellom hazardratene for gruppene er lik exp(β ), uansett alder t. Størrelsen exp(β ) kalles hazard ratio (HR). Relevant bare hvis forklaringsvariabelen ikke inngår i interaksjonsledd! h (t) er ukjent og helt uspesifisert β,, β p er ukjente parametre Cox, D. R. (97): Metode for estimering av β,, β p og ikke-parametrisk estimering av S (t) (Kaplan- Meier type estimering) for komplette og sensurerte datasett Tidsavhengige β i (t) er mulig (Alternativt: Parametrisk modell, f.eks lognormal eller Weibullfordeling for S(t).) Partiell likelihood (Cox): m h ( t)exp( x( ) ) m i β exp( x( i) β) l p ( β ) = = h ( t)exp( x β) exp( x β) i= j i= j R( t() i ) j R( t() i ) hvor t () t ()... t ( m ) ( j) < < < er de m distinkte (usensurerte) levetidene. Rt ( ) er risikomengden ved t (j) dvs individer i live og usensurert ved t (j) x (j) er kovariatene til individet med levetid t (j). j

5 6 Den partielle likelihood er ikke avhengig av h () t! Estimater for β samt estimatorenes varianser og kovarianser finnes ved å behandle l ( β ) som en vanlig likelihood. p Ved sammenfallende observasjoner brukes en mer generell lp( β ). Alternativer: - eksakt (meget tidkrevende) - Breslow (97) - Efron (977) (Nesten identiske resultater som eksakt). SPSS: Bare Breslow er tilgjengelig. Stata: Alle tilgjengelig. Breslow er default. Angi option Efron ved sammenfallende observasjoner 7 8 Sjekking av PH-antakelsen: Log - log plott Vi har Stx (, ) = S() t så exp( x' β) log( log( Stx (, ))) = x ' β + log( log( S( t))) Software for Cox PH regresjon SPSS - har endel MINITAB har endel STATA - har det meste S-plus eller R- har det meste SAS - har det meste Plott for forskjellige x bør være parallelle under PH antakelsen. Vanskelig å vurdere parallellitet når det er få observasjoner. 9 BMJ ;6:8 Parametric survival models may be more accurate than Kaplan-Meier estimates EDITOR---Lundin et al use Kaplan-Meier estimates of survival probabilities in their system for survival estimation in breast cancer They claim that researchers can obtain survival estimates based on actual data, rather than inferential estimates generated by a regression formula. However, any regression formula is based on actual data. More importantly, survival estimates from a regression model may be substantially more precise than Kaplan-Meier estimates when there are few patients in particular strata. May, M. et al. BMJ ;6:8 Kaplan-Meier versus Weibull distribution Copyright BMJ Publishing Group Ltd. 5

Referanser Hosmer, D. W., Lemeshow, D. W., May, S.: Applied Survival Analysis. Regression Modeling of Time to Event Data. nd Ed. Wiley, 8. Omfattende og velskrevet bok. Kleinbaum, D. G., and Klein, M.: Survival Analysis: A Self-Learning Text. nd ed. Springer, 5. Lettlest innføringsbok 6