På ramme alvor? Introduksjon Her i Norge liker vi å tenke at vi er et land som ligger i front, så også på prioriteringsfeltet med blant annet Lønning I fra 1987 som et tydelig bevis på at Norge var tidlig ute med å være eksplisitte på at vi trenger prioritering i helsevesenet. Mange liker kanskje også å tro at vår diskusjon om alvorlighet og nå forslaget om vekting av kostnadseffektivitet etter alvorlighet er enda et prov på at vi er i front. Det stemmer også; få (om noen) andre land vekter kostnadseffektivitet etter alvorlighet. Årsaken til at andre land ikke går i denne retningen er imidlertid ikke fordi vi er i front på en vei som fører noe sted, problemet med å være først på dette feltet er at vi er i front inn på en sidevei. En sidevei som ikke fører noe sted, noe som neppe er hensikten. For å forklare hvorfor det er en sidevei må man bli litt teknisk, men hovedpoenget er at man i praksis justerer noe som ikke gir mening å justere når man justerer kostnadseffektivitet etter alvorlighet. Man justerer en gjennomsnittsverdi som for enkelte stiliserte eksempler kan se ut som alvorlighet, men som i praksis bare er rotete. Om alvorlighetsvekting av grenseverdi I vanlig helseøkonomisk evaluering evalueres vanligvis tiltak for overordna beslutninger. I disse kan man, litt forenklet, si at det vi trenger er 3 tall; (1) forskjell i forventet gjenstående (kvalitetsjustert) levetid med ny behandling sammenlignet med eksisterende behandling, (2) forskjell i forventet livsløpskostnad relatert til behandlingsalternativene (ny og eksisterende) og (3) en grense for kostnadseffektivitet (heretter kalt Gv). I det etterfølgende vil jeg i hovedsak konsentrere meg om førstnevnte; forskjell i forventet gjenstående kvalitetsjustert levetid med ny behandling sammenlignet med eksisterende behandling (heretter omtalt som Øe; økt effekt). I de fleste helseøkonomiske evalueringer estimeres Øe gjennom modellering av hva som skjer med pasientene. I slik modellering vil man separat estimere hva som er gjenstående kvalitetsjustert levetid med eksisterende behandling, og med ny behandling. Den gjenstående kvalitetsjusterte levetiden med eksisterende behandling er det sentrale tallet man bruker i de fleste forslag til estimering av alvorlighet. I «På ramme alvor» (heretter kun; «PRA») brukes begrepet «Prognose (A3)», og jeg vil derfor bruke «A3» i det følgende når jeg henviser til gjenstående kvalitetsjusterte levetid med eksisterende behandling 1. Konklusjonen i PRA er at man bør vekte kostnadseffektivitet etter «absolutt prognosetap» (omtalt som B2 i PRA), som i praksis er gjenstående kvalitetsjustert levetid for gjennomsnittsbefolkningen fratrukket A3. Altså skal dette angi hvor mye «dårligere» den behandlede populasjonen er sammenlignet med den generelle befolkning. Hvis man ikke har jobbet med helseøkonomiske evalueringer utfra et livstidsperspektiv, kan det synes logisk å justere kostnadseffektivitet etter alvorlighet, og argumentasjonen i PRA er god når det gjelder at absolutt prognosetap kan være det beste alternativet. Problemet er bare at dette ikke er noe argument sammenlignet med å ikke vekte for alvorlighet. 1 Merk for øvrig at Øe typisk vil være diskontert med en faktor på 0.04 per år, mens B2 ikke vil være diskontert.
Estimatene for A3 fra analyser av kostnadseffektivitet er, som antydet over, gjennomsnitt (fordi gjennomsnitt ofte brukes til å estimere forventning). Gjennomsnittet brukes altså for hele gruppen som er aktuell for behandling. I PRA er man eksplisitte på at nye tiltak vurderes for hele grupper av aktuelle pasienter samlet. For de fleste behandlinger er det da hensiktsmessig å holde seg til gjennomsnitt for kostnadseffektivitet. I praksis vil dette bety at tiltaket egentlig kan være kostnadseffektivt for noen av de som får behandling og ikke for andre. Eksempelvis kan det hende at én pasient dør kort tid etter en hjerteoperasjon og en annen lever i mange år. Hvis vi på forhånd ikke vet hvem som dør kort tid etter operasjon og hvem som lever lenge, vil det være naturlig å regne på gjennomsnittet av disse. Dette gjennomsnittet er da et gjennomsnitt av de resterende kvalitetsjusterte leveårene for disse pasientene. Her vil hvert leveår få den samme verdien basert på diskontering som definert av direktoratet for økonomistyring og kvaliteten på leveårene vil bli basert på studier av helserelatert livskvalitet. Men hva skjer når vi vekter kostnadseffektivitet etter alvorlighet? Hvis vi holder oss til Øe (altså ser bort fra kostnadene), vil det tilsvare å justere Øe ved å multiplisere den med en «vekt» som er en funksjon av B2 (i praksis foreslått 1+B2/10 i PRA, basert på nedre grense av prognosetapsintervallene i PRAs Tabell 3). En justering av kostnadseffektivitet etter alvorlighet kan altså sees på som en justering av økningen i gjenstående kvalitetsjustert levetid (Øe). Med tanke på at vekten alltid vil være et tall høyere enn 1, betyr dette at levetid og/eller kvalitetsjustering alltid skal vektes opp og aldri ned. Samtidig er det en klar sammenheng mellom B2 og Øe, siden Øe tross alt er en funksjon av blant annet B2. For å se nærmere på hva vektingen egentlig gjør, kan man tenke seg å dele opp vektingen i vekting av levetiden og kvalitetsjusteringen separat. Hvis man kun vekter levetid opp, vil dette tilsvare å redusere diskonteringsraten. Hvis man kun vekter kvalitetsjusteringen, tilsvarer dette andre måter å finne livskvalitet på enn de som brukes. Alvorlighet er imidlertid ment å være en kombinasjon av livslengde og kvalitet, altså vil alvorlighetsvekting av Gv i praksis være en kombinasjon av å vekte livslengde og livskvalitet. De som tar til orde for å vekte for alvorlighet mener altså at Norges fastsatte diskonteringsrate er for høy, og at vi bør bruke andre vekter for livskvalitet enn det vi gjør. Jeg mener at hvis tilhengerne mener dette er tilfelle, så må de stå for det og holde seg til å argumentere for nettopp en lavere diskonteringsrate og andre livskvalitetsinstrumenter enn de som finnes, eller alternativt, slutte å argumentere for vekting av Gv. Et lite eksempel for å illustrere det sistnevnte: I en nylig publisert artikkel regna jeg på kostnadseffektivitet av (blant annet) ticagrelor og clopidogrel (i samarbeid med Dan Atar). I denne analysen fant vi B2=13.9 og Øe=0.58 (henholdsvis udiskontert og diskonterte QALYs, ref fotnote 1). Alvorlighetsjustert Øe blir da 0.58*(1+13.9/10)=1.38. Hvis jeg skal finne hvilken diskonteringsrate som skulle vært brukt i den analysen for å kunne tilsvare foreslått vekting av Gv, vil dette bli en negativ diskonteringsrate på -0.7% (mot +4% vanligvis), noe som åpenbart ikke gir mening. Tilsvarende vil også vekting av livskvalitet bli uten særlig mening. Hvis vi derimot kombinerer disse to, kommer vi til at kostandseffektivitetsanalyse uten diskontering av effekt, samt om lag en halvering av alle livskvalitetsdekrementer gir Øe=1.38. Med tanke på at EQ-5D-3L verdier er brukt i vår analyse, samt at det er kjent at EQ-5D-3L ofte gir større fall i livskvalitet enn andre instrumenter, kan man konkludere med at forslaget i praksis sammenfaller med å ikke diskontere helseeffekter, samt at man ikke bør bruke EQ-5D-3L. I PRA refererer man blant annet til Lønning II, som om alvorlighet fra den NOU-en skulle være noe argument for den foreslåtte justeringen (eksempelvis de to siste avsnittene i 4.8). Det man imidlertid argumenterer for i Lønning II er mer i retning av det som har vært styrende siden den
rapporten kom ut i 1997, nettopp at alvorlighet har vært et inklusjons-/eksklusjonskriterium; hvis tilstanden ikke kan regnes som alvorlig, skal ikke det offentlige dekke behandlingen. I diskusjonen av rotavirusvaksine brukte Nasjonalt råd for kvalitet og prioritering i helse- og omsorgstjenesten denne typen argumentasjon i sin argumentasjon for at vi ikke skulle ha rotavirusvaksine i det norske barnevaksinasjonsprogrammet, selv om vaksinen kunne regnes som kostnadseffektiv i et samfunnsperspektiv (http://www.kvalitetogprioritering.no/nyheter/rotavirus-gir-ikke-alvorlig-sykdom-i-norge). Denne typen argumentasjon er i tråd med Lønning II, i motsetning til den som føres i PRA og av Norheimutvalget. Om alternativkostnad I likhet med Norheimutvalget har man også i PRA kun justert Gv oppover og ikke både opp og ned. I praksis betyr dette at utvalget mener levetid og livskvalitet hos de som blir tilbudt nye tiltak er mer verdt enn de som får eksisterende tiltak som ikke er oppe til vurdering. Hvorfor begge disse to utvalgene gjør dette mangler det god begrunnelse av. Om forebyggende tiltak Både Norheimutvalget og PRA konkluderer med at alvorlighet ved forebyggingstiltak skal skje «på det tidspunkt hvor gevinsten inntreffer» (sitat PRA). I likhet med vektingen som sådan, er dette en skrivebordsidé som vanskelig kan gjennomføres på en hensiktsmessig måte. De to hovedproblemene her er at forebygging og behandling ikke er to uavhengige størrelser og at utregningen ikke vil gi noe meningsfullt svar. Angående det første; om tiltak er forebygging eller behandling er ikke klart definert, det er glidende overganger som i tilfelle måtte bestemmes i hvert enkelt tilfelle, noe som gjør arbeidet uforutsigbart. Skal eksempelvis blodtrykksmedisin vurderes som forebygging hvis man ikke har hatt en hendelse (hjerteinfarkt, angina, slag el.l.), men vurderes som behandling hvis man har hatt en hendelse? Da vil man i tilfelle kunne ende opp med at alvorlighetsvekten blir større for de som ikke har hatt hendelse enn for de som har hatt hendelse. I praksis mener altså utvalgene at livskvaliteten og levetiden til de som er friske skal vektes høyere enn de som er syke. Hovedproblemet med dette er at det i praksis går stikk imot anbefalingen om å vekte etter alvorlighet. Dette punktet er altså en selvmotsigelse. I tillegg til den åpenbare selvmotsigelsen, kommer problemet med hvordan dette skal regnes ut. Hvis man lager modell over forløpet til pasienter med en Markovmodell (mest vanlig), er det vanlig å bruke flere enn én hendelse og to forskjellige tilstander (hvis ikke er det bare en enkel overlevelsesanalyse). Hvis alvorlighet skal regnes ut «på det tidspunkt hvor gevinsten inntreffer», må den altså regnes ut for hver mulige hendelse (eller en definert delmengde av mulige hendelser). Om man da skal ta et gjennomsnitt av disse (vektet eller ikke), eller velge den laveste/høyeste alvorligheten oppgis ikke. Man trenger altså enda en utredning for å finne ytterligere ut av dette hvis man vil gå videre med dette forslaget. Oppsummering Man velger å vekte livslengde og livskvalitet basert på gjennomsnittet i populasjonen som analyseres. Men hvordan dette gjennomsnittet er framkommet sier mer om alvorlighet enn gjennomsnittet selv. For tiltak som screening og vaksiner vil få typisk ha stor effekt, mens mange
vil ha liten eller ingen effekt. For operasjoner vil de fleste ha en effekt som er relativt stor (i hvert fall sammenlignet med ingen operasjon). Helseøkonomiske modeller tar hensyn til at tilstander er alvorlige ved at livskvalitetsjustering er med. Helseøkonomiske modeller tar også hensyn til at tilstander er alvorlige ved at livslengde er med. Hvorfor man skal legge inn en ekstra vekting av alvorlighet når dette i praksis er inne allerede mangler begrunnelse. Det er oppsiktsvekkende at myndighetene har valgt å inkludere denne justeringen i prioriteringsforskriften (f.o.m 1.nov 2015) uten å ha noen gode argumenter for hvorfor det skal være sånn og heller ingen hensiktsmessig måte å regne dette ut på. Konklusjon Min konklusjon 2 er altså at justering av kostnadseffektivitet for alvorlighet med metodene foreslått i PRA ikke vil gi noen justering av alvorlighet slik som ønsket, men kun er et sidespor. Småting: Å hevde at «Alder som eget kriterium har ingen tradisjon i norsk helsetjeneste» er i beste fall upresist. Tre eksempler på at alder eksplisitt blir brukt; hvem som skal få transplantasjon, hvem som skal inviteres til mammografiscreening, hvem som skal få blodtrykks- og kolesterolmedisiner. Selv om man kan si at de andre kriteriene egentlig ligger til grunn, brukes allikevel alder eksplisitt i prioriteringen av disse tiltakene. Utvalget skal ha ros for at de klart definerte at eksplisitte utregninger primært er hensiktsmessig på gruppenivå. Dette gjør framtidige diskusjoner rundt temaet mer ryddige. Jeg har konsekvent tolket vektingen som kontinuerlig selv om både PRA og Norheimutvalget brukte grupper (henholdsvis 6 og 3). Jeg forstår at det ser enklest ut med grupper, men dette har flere åpenbare svakheter og jeg har derfor regnet om til kontinuerlig skala. PRA svarer relativt godt på oppdraget som ble gitt, og konklusjonen om at absolutt prognosetap er best av de foreslåtte måtene å estimere alvorlighet på er godt underbygget. Hovedproblemet med PRA er egentlig ikke innholdet, men oppdraget; utvalget fikk kun i oppdrag å vurdere forskjellige alternativer, ikke om det var på sin plass med en vekting eller ikke. Altså har man ikke gått inn på det som var hovedproblemet i Norheimrapporten; at man skal vekte kostnadseffektivitet etter alvorlighet (der omtalt som helsetap). Referanser NOU 1987: 23. Retningslinjer for prioriteringer innen norsk helsetjeneste. NOU 1997: 18. Prioritering på ny gjennomgang av retningslinjer for prioriteringer innen norsk helsetjeneste. 2 Uavhengig av definisjonen av alvorlighet, er konklusjonen den samme. Eneste forskjell er vektingen.
NOU 2014: 12. Åpent og rettferdig prioriteringer i helsetjenesten. På ramme alvor alvorlighet og prioritering. Oktober 2015 Samdal K, Hagen G, Flem E, Klemp M. Kostnadseffektivitet av å inkludere vaksinasjon mot rotavirus i det norske barnevaksinasjonsprogrammet. Rapport fra Kunnskapssenteret nr. 31 2009. ISBN 978-82-8121-316-6 ISSN 1890-1298. Wisløff T, Atar D. Cost-effectiveness of antiplatelet drugs after percutaneous coronary intervention. Eur Heart J Qual Care Clin Outcomes. Published online: 14 October 2015.