ANALYSE, EKSTRAHERING OG STRUKTURERING AV INFROMASJON KNYTTET TIL DIAGNOSTISERING AV PROSTATAKREFT.
HVEM ER JEG?
HVORDAN HAVNET JEG HER?
ET SAMARBEIDS PROSJEKT
HVEM ER KUNDEN?
KREFTREGISTERET OG ORGANISASJON
HVA SKJER EGENTLIG UNDER PANSERET? Mottar årlig 180 000 krefttilfeller Patologiremisser Korte, ustrukturerte tekst dokumenter Majoriteten kommer som papiruskrift Må preprosesseres før registrering
HVORDAN SER EN PATOLOGIREMISS UT?
HVA HANDLET PROSJEKTET OM? Ønsket om et verktøy som bistår de medisinske koderne i deres arbeid Dreier seg om analyse av patologiremisser, samt tilhørende etterbehandling Utgangspunkt i SAS Insitute sin teknologi og programvare Utvikle en prototype Vurdere potensialet for forenkling og forbedring
FORUTSETNINGER? Hvilken type kreft skulle prosjektet fokusere på Krav og spesifikasjoner Tilgang til vernet informasjon Utlevering av 25 fritekst dokumenter
ET STANDPUNKT Skal ikke erstatte de medisinske koderne Et verktøy som bistår dem i deres arbeid Løsning utviklet spesifikt for datagrunnlaget vi mottok (eg; Prostatakreft) Nå Ikke anvendbar for andre områder, dvs. andre krefttyper Vise at det er mulig - et «Proof of concept»
VÅR TEKNISKE LØSNING PORGRAMVARE BRUKT Løsningen utvikles med utgangspunkt i to forskjellige typer programvare som er utviklet og levert av SAS Institute. Konfigurere disse med vår egen kode og regler for ønsket funksjon og utrekk.
VÅR TEKNISKE LØSNING SAS CONTENT CATEGORIZATION
VÅR TEKNISKE LØSNING SAS CONTENT CATEGORIZATION Eksempel på regel i Content Categorization
VÅR TEKNISKE LØSNING SAS CONTENT CATEGORIZATION Eksempel på uttrekk i Content Categorization
VÅR TEKNISKE LØSNING SAS ENTERPRISE GUIDE
VÅR TEKNISKE LØSNING SAS ENTERPRISE GUIDE Eksempel på kode produsert i prosjektperioden
VÅR TEKNISKE LØSNING PROSESSEN
VÅR TEKNISKE LØSNING RESULTATET
VÅR TEKNISKE LØSNING TEKNISK TEST Kreftregisteret mottok i 2012, 8 719 patologiremisser knyttet til prostatakreft (Kreftregisteret, 2014) Gir derfor grunnlag for å teste vår løsning med tilsvarende lik mengde dokumenter
VÅR TEKNISKE LØSNING TREFFPROSENT Treffprosent på 80 % eller mer ønskelig En viktig faktor for nytteverdien av løsningen Manuell koding med svært høy treffprosent
UTFORDRINGER Ingen spesielle krav til mal eller struktur Noen konsepter har et vanskeligere utgangspunkt Eksempel: En lege kan velge å definere antall biopsier i tall fra 1 10, bokstaver fra A J og romertall fra I X. Mangelen på tid Mer tid + mer utvikling = bedre løsning
KONKLUSJON HVA KOM VI FREM TIL? Løsningen som er utviklet verifiserer at er mulig å ta i bruk SAS Institute sin programvare for håndtering av ustrukturert helse relatert informasjon. Vi har vist at BI teknikker og verktøy kan brukes for å ekstrahere og strukturere informasjon fra fritekst dokumenter. Løsningen som en prototype beviser at teknologien fungerer, og legger et godt fundament for videre utvikling.
VIDERE UTVIKLING Så, hva om vi hadde hatt mer tid til rådighet, hva ville vi gjort da? Høyere treffprosent Flere krefttyper Flere sykehus
TAKK FOR DERES OPPMERKSOMHET!