Epidemiologi. Læringsmål. Hva brukes epidemiologi til? The study of the occurrence of illness. Læren om sykdommers utbredelse og årsaker

Epidemiologi The study of the occurrence of illness Læren om sykdommers utbredelse og årsaker Johan Håkon Bjørngaard Professor, Institutt for samfunnsmedisin, NTNU Læringsmål Insidensrater og insidensandel Relative og absolutte risikomål Statistisk slutning - P-verdi versus konfidensintervall Hva brukes epidemiologi til? finne årsaker til sykdom miljø (forebygging) genetikk samspill mellom faktorer mekanismer (mål for behandling) vurdere effekt av intervensjoner i befolkning (kosthold, trening, vaksiner, screening) vurdere effekt av behandling (klinisk epidemiologi) studere naturlige forløp av sykdom (forløp etter diagnose og behandling) generell helsestatistikk-helsetjenesteplanlegging 1

Hvorfor lære epidemiologi? Evidence Based Medicine : kritisere og vurdere kunnskap som den medisinske praksis bygger på Lese faglitteratur kritisk Behandling: ta i bruk ny kunnskap i klinikken Kommunikasjon: forståelse av risikobegreper Forskning: planlegge og gjennomføre pasient- eller populasjonsbaserte studier 2

Mål på forekomst av sykdom Mål på forekomst av sykdom Prevalens antall med sykdom i en spesifikk populasjon på et gitt tidspunkt- uttrykker status Insidens antall nye tilfeller av sykdom i en spesifikk populasjon i løpet av et gitt tidsrom - uttrykker endring Prevalens - måler sykdomsstatus Andel av en populasjon som har en sykdom på et gitt tidspunkt eksempel: dersom 30 har sykdommen diabetes i en befolkning på 1000 personer er prevalensen 3% et viktig sykdomsmål i helseplanlegging- ressursbehov ikke så velegnet for å finne årsaker til sykdom varighet av sykdom gitt av recovery og dødelighet påvirker prevalensen faktorer en studerer kan påvirke insidens, recovery eller dødelighet tidsrelasjonene mellom årsak og effekt uklar 3

Insidens av sykdom = nye tilfeller av sykdom Insidens uttrykkes på to ulike måter: 1. Insidensandel («kumulativ insidens») er sannsynligheten for å få sykdom i løpet av en viss tid, også kalt risiko 2. Insidensraten, sier noe om hvor hyppig en sykdom oppstår -måler endring fra ikke syk til syk per tidsenhet -Mål på hastigheten sykdom opptrer i befolkningen Insidensandel (risiko) Sannsynligheten for at et individ blir syk i løpet av et gitt tidsintervall = Antall individer som blir syke over et gitt tidsintervall Antall individer i populasjonen ved starttidspunktet dersom man følger 10 000 kvinner i 10 år og 30 av disse får diagnosen livmorkreft er insidensandelen: (30/10 000) = 0.3 % Men, noen av disse er ikke under risiko for å få diagnosen gjennom hele oppfølgingsperioden på 10 år. Noen får kreft, dør, fjerner livmora, eller emigrerer. Hvilket mål på forekomst? Hvorfor har tallet gått opp? Er dette et godt eller dårlig tegn? 14 12 10 8 Prosent som svarer ja på spm: Har du hatt hjerteinfarkt? 7,89 11,48 11,34 6 4 2 0 1984-86 1995-97 2006-08 4

Competing risk og persontid Competing risk: Individer forsvinner ut av studien pga. andre faktorer enn utfallet og er ikke lenger under risiko i studien. Insidensandel tar ikke hensyn til dynamikken i en populasjon og dermed antall personer som til enhver tid er under risiko for utfallet. For å ta hensyn til competing risk bruker en persontid i stedet for antall personer i befolkningen ved studiestart. Insidensrater og persontid under risiko Insidensrater (gullstandarden) antall nye tilfeller av en sykdom Insidensrate = sum av persontid under risiko Vi må beregne bidraget av persontid fra hver person i studien for å estimere insidensrater Persontid: summere tid under risiko Start oppfølging Person 1 2 3 4 død hjerteinfarkt Studieslutt Personår hjerteinfarkt 7 år 10 år 6 år 2 år 5 emigrert 5 år 0 1 2 3 4 5 6 7 8 9 10 År I løpet av 30 personår: 2 fikk hjerteinfarkt, 1 døde, 1 emigrerte, og 1 ble fulgt uten hendelser. Insidensraten for hjerteinfarkt er 2 per 30 personår = 0,0667 per personår = 6,67 per 100 personår eller 667 per 10 000 personår 5

Hvilke mål på forekomst? Hva sier dette oss? 25,00 20,00 15,00 10,00 5,00 Selvmord per 100 000 per år blant menn og kvinner født i 1970 20,30 5,74 Menn Kvinner 0,60 0,50 0,40 0,30 0,20 0,10 Prosent selvmord i perioden 1982-2008 blant menn og kvinner født i 1970 0,53 0,20 Menn Kvinner 0,00 Født 1970 0,00 Født 1970 Insidens Sammenligning av sykdomsforekomst Trenger mål på sammenheng, effekt, forskjell Absolutte effektmål Relative effektmål 6

Absolutte effektmål Differanse mellom to absolutte sykdomsmål risikodifferanse ratedifferanse Numbers needed to treat (NNT) Antall som må behandles for å forebygge ett sykdomstilfelle/død Risikodifferanse Eksempel: Risiko for hjerteinfarkt i løpet av 10 år Statinbrukere: 6% risiko for hjerteinfarkt Placebogruppe: 12% risiko for hjerteinfarkt Risikodifferanse i løpet av 10 år = 0,12-0,06 = 0,06 (6 av 100, 6%, 6%-poeng) Numbers needed to treat: 1/ risikodifferanse NNT=1/0,06 = 17 Ratedifferanse Triglyseridnivå Hjerteinfarkt Personår Insidensrate Høyt 150 790 150 / 790 = 190 per 1000 p.år Lavt 80 880 80 / 880 = 91 per 1000 p.år Ratedifferanse: raten blant eksponerte minus raten blant ikke-eksponerte Ratedifferanse = (190-91) per 1000 p.år = 99 per 1000 p.år Blant individer med høyt triglyseridnivå oppstår det 99 flere tilfeller av hjerteinfarkt per 1000 p.år enn blant individer med lavt triglyseridnivå 7

Relative effektmål Vi beregner en ratio et forholdstall Relativ risiko = ratio mellom to absolutte risikomål risikoratio insidensrateratio Odds ratio ratio mellom to odds (indirekte mål på relativ risiko i case-control-studier) Ratedifferanse Triglyseridnivå Hjerteinfarkt Personår Insidensrate Høyt 150 790 150 / 790 = 190 per 1000 p.år Lavt 80 880 80 / 880 = 91 per 1000 p.år Insidensrateratio (IRR) - insidensraten blant eksponerte dividert med insidensraten blant ikke-eksponerte 150/790 190 IRR = = = 2,1 80/880 91 Dvs. individer med høyt triglyseridnivå har ca. 2 ganger så høy risiko for å få hjerteinfarkt som individer med lavt triglyseridnivå Absolutt versus relativ risiko Samme studie som forrige bilde vises her, men nå uttrykkes absolutt risiko i stedet for relativ risiko Kilde: Skolbekken og Forsmo (NTNU) Tidsskriftet, 2003 8

Hvordan bruke statistikk for å fremme et budskap? Osteoporose som eksempel Samme studie som forrige bilde vises her, men nå uttrykkes absolutt risiko i stedet for relativ risiko Kilde: Skolbekken og Forsmo (NTNU) Tidsskriftet, 2003 Hvilke mål på sykdomsforekomst? Hvordan tolker dere sammenhengene? Per 1,000 per yrs 9

Statistisk slutning (inference) Statistisk slutning dreier seg om å trekke valide konklusjoner basert på informasjon fra et utvalg Eksempel: Vi søker en sann forskjell i dødelighet eller en sann forskjell i blodtrykk mellom to grupper, men vi har ikke målinger for hele populasjonen (vi må basere oss på et utvalg) Hvor sikre kan vi være på at observasjonene vi gjør i utvalget korresponderer med resultatet vi ville fått om vi hadde målinger for hele populasjonen? Vi må alltid vurdere usikkerheten i estimatene våre. Hvis du kaster mynt og kron 5 ganger og får kron 4 ganger, kan du konkludere med at mynten lander på kron i 80% av tilfellene? Det stemmer for vårt utvalg på 5 kast, men hva ville skje hvis vi kastet 1000 ganger? 10

Sudden infant death syndrome (krybbedød). 2607 barn fulgt fram til 1 års alder. Leie SIDS Ikke SIDS Sum Mage 9 837 846 Rygg 6 1755 1761 Sum 15 2592 2607 Andel med SIDS blant barn i mageleie: 9 / 846 = 0,011 = 1,1% Andel med SIDS blant barn i ryggleie: 6 / 1761 = 0,003 = 0,3% Vi estimerer en risikodifferanse: 0,011 0,003 = 0,008 NNT = 1 / 0,008 = 125 Andelen døde er helt klart meningsfullt forskjellig, men ville forskjellen vært den samme for alle tilsvarende hendelser/studier? Sudden infant death syndrome (krybbedød). 2607 barn fulgt fram til 1 års alder. Leie SIDS Ikke SIDS Sum Mage 9 837 846 Rygg 6 1755 1761 Sum 15 2592 2607 Andel med SIDS blant barn i mageleie: 9 / 846 = 0,011 = 1,1% Andel med SIDS blant barn i ryggleie: 6 / 1761 = 0,003 = 0,3% Vi estimerer en risikodifferanse: 0,011 0,003 = 0,008 NNT = 1 / 0,008 = 125 Er forskjellen statistisk signifikant? hypotesetesting (p-verdi) Hvor presise er estimatene? intervallestimering (konfidensintervall) Statistisk slutning (inference) Statistisk inferens baseres på enten: hypotesetesting intervallestimering Ved hypotesetesting prøver vi å forkaste en nullhypotese Ved intervallestimering beregner vi et konfidensintervall, som med for eksempel 95% konfidens, inneholder den sanne parameterverdien Hypotesetesting viser hvor sjelden eller usannsynlig forskjellen er gitt at det egentlig ikke er noen forskjell, mens konfidensintervall viser hvilke forskjeller som er forenlige med observasjonene våre 11

Hypotesetesting P-verdier estimeres ut i fra en spesifikk hypotese Vanligst 0-hypotesen (betegnes ofte H 0 ) H 0 : Ingen sammenheng, ingen forskjell Alternativhypotesen betegnes ofte H 1 H 1: Det er en forskjell/sammenheng H 0 og H 1 er gjensidig utelukkende Uskyldig inntil det motsatte er bevist The concept of innocent until proven guilty To-sidig test 0-hypotesen (H o ) hevder vanligvis at det ikke er forskjell Alternativ til dette er at det en forskjell (alternativhypotese, H 1 ) Siden verken H o eller H 1 spesifiserer retning på forskjellen, gir dette grunnlag for en tosidig test (forskjellen kan gå begge veier) Tosidige tester bør brukes såfremt en ikke har veldig gode grunner for å foreta en ensidig test p-verdi P-verdien representerer sannsynligheten, gitt at 0-hypotesen er sann, for at testobservatoren i studien er like langt eller lengre fra 0-hypotesen enn det som ble observert Eks: Anta at en studie gir et estimat på forskjell i blodtrykk mellom to grupper = 10 mmhg P-verdien (tosidig) representerer da sannsynligheten, gitt sann forskjell=0 (H 0 ), for at en slik studie vil gi: en positiv forskjell lik 10mmHg eller høyere eller en negativ forskjell lik 10mmHg eller lavere 12

I en randomisert studie ble Medikament A sammenliknet med Medikament B. 57% av pasientene i gruppen som tok medikament A ble friske. 39% av pasientene som tok medikament B ble friske. Forskjellen mellom gruppene ble testet. P-verdi = 0,17. Diskuter følgende utsagn: I. Man blir oftere frisk med medikament A enn med medikament B. II. Man blir sjeldnere frisk med medikament A enn med medikament B. III. Man blir like ofte frisk med medikament A som med medikament B. IV. Vi kan ikke slå fast om man blir oftere/sjeldnere/like ofte frisk med medikament A som med medikament B. I en randomisert studie ble medikament A sammenliknet med medikament B. 57% av pasientene i gruppen som tok medikament A ble friske. 39% av pasientene som tok medikament B ble friske. Forskjellen mellom gruppene ble testet. P-verdi = 0,17. Sykdommen er dødelig. Det finnes ingen annen behandling enn medikament A og medikament B. De to medikamentene kan ikke brukes samtidig. Hvis din mor fikk sykdommen, hvilket medikament ville du valgt? I. Medikament A II. Medikament B III.Hipp som happ, da det ikke var signifikante forskjeller Common guidelines for manuscripts submitted to biomedical journals - ICMJE Statistics When possible, quantify findings and present them with appropriate indicators of measurement error or uncertainty (such as confidence intervals) Avoid relying solely on statistical hypothesis testing, such as the use of P values, which fails to convey important quantitative information Ref: International Committee of Medical Journal Editors. Uniform requirements for manuscripts submitted to biomedical journals. N Engl J Med 1997; 336: 309 15. 13

In the IJE (International Journal of Epidemiology) we actively discourage the use of the term "statistically significant" or just "significant" and such statements in method sections as "findings at p<0.05 were considered significant". Where used, we ask authors to provide effect estimates with confidence intervals and exact P values, and to refrain from the use of the term "significant" in either the results or discussion section of their papers. Konfidensintervall (KI)- Presisjon Hvis vi gjentar studien mange ganger og beregner et 95% KI for hver studie, vil 95% av KI inneholde den sanne parameterverdien ( det sanne effektestimatet ) Kan si at vi er 95% sikre (confident) på at intervallet inneholder den sanne parameterverdien (verdien vi forsøker å estimere) eller at intervallet inneholder verdier som er forenlige med våre observasjoner- dvs et mål på presisjon Konfidensintervall versus p-verdi Konfidensintervall gir uttrykk for: Størrelse på effekt Retning Presisjon P-verdier uttrykker: En blanding av presisjon og effektstørrelse 14