Epidemiologi The study of the occurrence of illness Hva brukes epidemiologi til? finne årsaker til sykdom Miljø (forbygging) genetikk samspill mellom faktorer mekanismer (mål for behandling) vurdere effekt av intervensjoner i befolkning (kosthold, trening, vaksiner, screening) vurdere effekt av behandling (klinisk epidemiologi) Studier av sykdommers fremtreden Pål Romundstad studere naturlige forløp av sykdom (forløp etter diagnose og behandling) generell helsestatistikk-helsetjenesteplanlegging Hvorfor lære epidemiologi? Mål på forekomst av sykdom Evidence Based Medicine : kritisere og vurdere kunnskap som den medisinske praksis bygger på Lese faglitteratur kritisk Behandling: ta i bruk ny kunnskap i klinikken Kommunikasjon: forståelse av risikobegreper Forskning: planlegge og gjennomføre pasient- eller populasjonsbaserte studier 1
Mål på forekomst av sykdom Prevalens - måler sykdomsstatus Prevalens antall med sykdom i en spesifikk populasjon på et gitt tidspunkt- uttrykker status Insidens antall nye tilfeller av sykdom i en spesifikk populasjon i løpet av et gitt tidsrom - uttrykker endring Andel av en populasjon som har en sykdom på et gitt tidspunkt eksempel: dersom 30 har sykdommen diabetes i en befolkning på 1000 personer er prevalensen på 3% et viktig sykdomsmål i helseplanlegging- ressursbehov ikke så velegnet for å finne årsaker til sykdom varighet av sykdom gitt av recovery og dødelighet påvirker prevalensen faktorer en studerer kan påvirke insidens, recovery eller dødelighet tidsrelasjonene mellom årsak og effekt uklar Insidens av sykdom = nye tilfeller av sykdom Insidens uttrykkes på to ulike måter: Insidensandel (risk) Sannsynligheten for at et individ blir syk i løpet av et gitt tidsintervall 1. Insidens andel («kumulativ insidens») er sannsynligheten for å få sykdom i løpet av en viss tid, også kalt risiko 2. Insidens raten, sier noe om hvor hyppig en sykdom oppstår -måler endring fra ikke syk til syk per tidsenhet = Antall individer som blir syke over et gitt tidsintervall Antall individer i populasjonen ved starttidspunktet -Mål på hastigheten sykdom opptrer i befolkningen dersom man følger 10 000 kvinner i 10 år og 30 av disse får diagnosen livmorkreft er den kumulative insidensen: (30/10 000) = 0.3 % Men, noen av disse er ikke under risiko for å få diagnosen gjennom hele oppfølgingsperioden på 10 år. Noen får kreft, dør, fjerner livmora, eller emigrerer Competing risk og Persontid Competing risk: Individer forsvinner ut av studien pga andre faktorer enn utfallet og er ikke lenger under risiko i studien Insidensrater og persontid under risiko Insidensrater (gullstandarden) Insidensandel tar ikke hensyn til dynamikken i en populasjon og dermed antall personer som til enhver tid er under risiko for utfallet For å ta hensyn til competing risk bruker en persontid i stedet for antall personer i befolkningen ved studiestart antall nye tilfeller av en sykdom Insidensrate = sum av persontid under risiko Vi må beregne bidraget av persontid fra hver person i studien for å estimere insidensrater 2
Persontid = summere tid under risiko Insidens Start oppfølging Person 1 2 HI Studieslutt Personår 7 år 10 år 3 HI 6 år 4 død 2 år 5 emigrert 5 år 0 1 2 3 4 5 6 7 8 9 10 År I løpet av 30 personår; 2 fikk HI (hjerteinfarkt), 1 døde, 1 emigrerte, og 1 ble fulgt uten hendelser. Insidensraten for HI er 2 per 30 personår (p.år) = 6.67 per 100 p.år eller 667 per 10 000 p.år Sammenligning av sykdomsforekomst Absolutte effektmål Trenger mål på sammenheng, effekt, forskjell Absolutte effektmål Relative effektmål Differanse mellom to absolutte sykdomsmål (RD) risiko differanse (insidensandel differanse) rate differanse Numbers needed to treat (NNT) Antall som må behandles for å forebygge ett sykdomstilfelle/død Risiko differanse i klinikken Rate differanse Eks: Risiko for hjerteinfarkt i løpet av 10 år Statinbrukere = 6% risiko for H.infarkt Placebogruppe = 12% risiko for H.infarkt Triglyserid+ Triglyserid - H.Infarkt personår 150 790 80 880 Insidens rate 150 / 790 = 190 per 1000 p.år 80 / 880 = 91 per 1000 p.år Absolutt risikodifferanse i løpet av 10 år: RD=12 % 6 % = 6% Numbers needed to treat: 1/ RD NNT=1/0.06 = 17 Rate differanse(rd): raten for eksponerte minus raten for ikke eksponerte Rate differanse = (190-91) per 1000 p.år = 99 per 1000 p.år Blant individer med høyt triglyseridnivå oppstår det 99 flere tilfeller av hjerte infarkt per 1000 p.år enn blant individer med lavt 3
Relative effektmål Insidens rate ratio (relativ risiko) # H.Infarkt # personår Insidens rate Relativ risiko = ratio mellom to absolutte risikomål risk ratio (insidensandel ratio) insidensrate ratio Triglyserid + Triglyserid - 150 790 80 880 150 / 790 = 190 per 1000 p.år 80 / 880 = 91 per 1000 p.år Odds ratio ratio mellom to odds (indirekte mål på relativ risiko) Insidens rate ratio (IRR) - insidens raten blant eksponerte dividert med insidens raten blant ikke-eksponerte 150/790 190 IRR = = = 2.1 80/880 91 Dvs. individer med høyt triglyseridnivå har ca 2 ganger så høy risiko for å få HI som individer med lavt Føflekk-kreft i Norge 1995-99 Relativ risiko etter fylke Absolutt versus relativ risiko Samme studie som forrige bilde vises her, men nå uttrykkes absolutt risiko i stedet for relativ risiko Kilde: Kreftregisteret, Institute of Population-based Cancer Research, sept 2002 Kilde: Skolbekken og Forsmo (NTNU) Tidsskriftet, 2003 Hvordan bruke statistikk for å fremme et budskap? Osteoporose som eksempel Samme studie som forrige bilde vises her, men nå uttrykkes absolutt risiko i stedet for relativ risiko Kilde: Skolbekken og Forsmo (NTNU) Tidsskriftet, 2003 4
Statistisk slutning (inference) En Ulykke: Statistisk slutning dreier seg om å trekke valide konklusjoner basert på informasjon fra et utvalg Eksempel: Vi søker en sann forskjell i dødelighet eller en sann forskjell i blodtrykk mellom to grupper, men vi har ikke målinger for hele populasjonen (vi må basere oss på et utvalg) Hvor sikre kan vi være på at observasjonene vi gjør i utvalget korresponderer med resultatet vi ville fått om vi hadde målinger for hele populasjonen? Valg av effektmål (effektestimat) Statistisk slutning Estimerer forskjell mellom kjønnene i andel døde : Vårt effektmål: 0.797 0.256 = 0.541 (54.1%) Vårt effektestimat: 0.797 0.256 = 0.541 (54.1%) Andelen døde er helt klart meningsfullt forskjellige, men ville de vært forskjellig for alle tilsvarende hendelser Uncertainty-chance Uncertainty of the estimate is an important consideration If you flipped a coin 5 times and it came up "heads" 4 times, would you be correct to say that the coin will land on heads 80% of the time? Statistisk slutning It did for your sample of 5 flips. But what would happen if you flipped the coin 100 times or 1000 times? Vårt effektestimat: 0.797 0.256 = 0.541 (54.1%) Er forskjellen statistisk signifikant? Hypotestesting (p-verdi) 5
Statistisk slutning Statistisk slutning (inference) Statistisk inferens baseres på enten: hypotesetesting intervall estimering Ved hypotesetesting prøver vi å forkaste en nullhypotese Vårt effektestimat: 0.797 0.256 = 0.541 (54.1%) Er forskjellene statistisk signifikante? Hypotestesting (p-verdi) Hvor presise er estimatene? Intervall estimering-konfidensintervall) Ved intervall estimering beregner vi et konfidensintervall, som med for eksempel 95% konfidens, inneholder den sanne parameterverdien Hypotesetesting sjekker hvor sjeldne eller usannsynlig observasjonen er gitt at det egentlig ikke er noen forskjell, mens konfidensintervall viser resultater forenlige med observasjonene våre 0-hypotesen (H 0 ) P-verdier estimeres ut i fra en spesifikk hypotese Vanligst 0-hypotesen (betegnes ofte H 0 ) H 0 : Ingen sammenheng, ingen forskjell Alternativ hypotese Betegnes ofte H 1 Det er en forskjell/sammenheng Gjensidig utelukkende i forhold til 0-hypotesen Uskyldig inntil det motsatte er bevist The concept of innocent until proven guilty To-sidig test 0-hypotesen (H o ) hevder vanligvis at det ikke er forskjell Alternativ til dette er at det en forskjell (alternativ hypotese, H 1 ) Siden verken H o eller H 1 spesifiserer retning på forskjellen, gir dette grunnlag for en tosidig test (forskjellen kan gå begge veier) Tosidige tester bør brukes såfremt en ikke har veldig gode grunner for å foreta en ensidig test p-verdi P-verdien representerer sannsynligheten, betinget at 0-hypotesen er sann, for at test observatoren i studien er like langt eller lengre fra 0-hypotesen enn det som ble observert Eks: Anta at en studie gir et estimat på forskjell i blodtrykk mellom to grupper = 10 mmhg P-verdien (tosidig) representerer da tilnærmelsesvis sannsynligheten, gitt sann forskjell=0 (Ho), for at en studie vil gi: en positiv forskjell lik 10mmHg eller høyere eller i en negativ forskjell lik 10mmHg eller lavere 6
I en randomisert studie ble Medikament A sammenliknet med Medikament B. 57% av pasientene i gruppen som tok medikament A ble friske. 39% av pasientene som tok mediament B ble friske. Forskjellen mellom gruppene ble testet å ga en p-verdi = 0.175. Forutsatt at ingen tidligere studier har blitt foretatt, hvilke utsagn anser du som mest korrekt: I. It is more likely to recover from the disease if given Drug A than if given Drug B. II. It is less likely to recover from the disease if given Drug A than if given Drug B. III. It is equally likely to recover from the disease if given Drug A or if given Drug B. I en randomisert studie ble medikament A sammenliknet med medikament B. 57% av pasientene i gruppen som tok medikament A ble friske. 39% av pasientene som tok mediament B ble friske. Forskjellen mellom gruppene ble testet å ga en p-verdi = 0.175. Hvis du skulle behandle pasienter av samme type som i studien, hvilke medikament ville du valgt (under ellers like forhold)? I. Drug A II. Drug B III. Hipp som happ, da det ikke var signifikante forskjeller IV. It cannot be determined whether a person is more/less/equally likely to recover from the disease if given Drug A or if given Drug B. Common guidelines for manuscripts submitted to biomedical journals - ICMJE Statistics When possible, quantify findings and present them with appropriate indicators of measurement error or uncertainty (such as confidence intervals) Avoid relying solely on statistical hypothesis testing, such as the use of P values, which fails to convey important quantitative information ICMJE in 1996 were: the Annals of Internal Medicine, the British Medical Journal, the Canadian Medical Association Journal, the Journal of the American Medical Association, the Lancet, the Medical Journal of Australia, the New England Journal of Medicine, the New Zealand Medical Journal, the Tidsskrift for den Norske Laegeforening, the Western Journal of Medicine, and the Index Medicus In the IJE (International Journal of Epidemiology) we actively discourage the use of the term "statistically significant" or just "significant" and such statements in method sections as "findings at p<0.05 were considered significant". Where used, we ask authors to provide effect estimates with confidence intervals and exact P values, and to refrain from the use of the term "significant" in either the results or discussion section of their papers. Ref: International Committee of Medical Journal Editors. Uniform requirements for manuscripts submitted to biomedical journals. N Engl J Med 1997; 336: 309 15. Konfidensintervall (KI)- Presisjon Konfidensintervall versus p-verdi Hvis vi gjentar studien mange ganger, vil 95% av KI inneholde den sanne parameterverdien ( det sanne effektestimatet ) Kan si at vi er 95% sikre (confident) på at intervallet inneholder den sanne parameterverdien (verdien vi forsøker å estimere) eller at intervallet inneholder verdier som er forenlige med våre observasjoner- dvs et mål på presisjon Konfidensintervall gir utrykk for: Størrelse på effekt Retning Presisjon P-verdier uttrykker: En mix av presisjon og effektstørrelse 7