Trash in, trash out Hvorfor er kvaliteten viktig? 18. okt 2018 // Silje Emilienne Aanderud-Larsen
På full fart inn i framtiden?
Data + kontekst = informasjon Informasjon er data satt i kontekst eller entydig sammenheng, og denne sammenhengen kan beskrives ved hjelp av metadata.
Rettslige føringer i GDPR Personopplysninger må være relevante, korrekte og fullstendige ut fra formål de skal benyttes til. Dette innebærer at opplysninger som behandles skal være oppdaterte og nøyaktige, og ikke inneholde irrelevant informasjon.
Hva kan egentlig gå galt? Person Navn Adresse Telefonnummer Arbeidsgiverorganisasjoner Navn Adresse Telefonnummer Per Pettersen 0553 Oslo Kløverengen 3 00047 21213454 Pettersens konsulenter AS Kløverengen 3 0553 Oslo 12345678 Kjell Nilsen Pettersens vei 22 0776 Oslo Kari Pettersen Kløverengen 3 0553 Lørenskog Vera Olsen Pettersens veg 23 0776 Oslo 89899801 2121345 90909090 Rema 1000 c/o NAV Forvaltning Storgata 10 0978 Oslo NAV Forvaltning Storgata 8 0977 Oslo L?kkebakken!nskereiser 12234390 90909090
Trash in trash out Feilutbetalinger Forsinkelser i saksbehandling Stopp av automatiserte prosesser Feil i statistikk og analyse Feil i dataprofileringsgrunnlag Feil i oppfølging av bruker Kost både penger og omdømme Feil og mangler i datagrunnlag for maskinlæring og prediksjonsarbeid
Kvalitetsdimensjoner Navn: Ingdri Berit Lasren Fødselsdato: 11.10.1885 Dødsdato: 14.11.2017 (reg. 20.10.2018) Statsborgerskap: - Reg. Institusjon: Bredtveit fengsel Nøyaktighet Validitet - gyldighet Oppdaterthet - tidsriktighet Kompletthet Konsistens + Unikhet identifiserte data som skal forekomme kun én gang
Hvordan jobber vi med datakvalitet?
1. Definere krav og forretningsregler Krav: Kvalitetsscoren må være 99 % Validitet Lengde på enkeltopphold må være mellom 0 og 21 år Kompletthet Alle opphold må ha en lengde og antatt løslatelsesdato Unikhet Kun ett institusjonsopphold til enhver tid
2. Funn og årsaker Enkeltsoninger over 21 år. Flere opphold til samme tid på samme person. Funn Dersom dette gjelder 3 av 10 elementer for det første, og 1 av 10 for det siste funnet så er kvalitetsscoren henholdsvis 70% og 90%. Årsak Ingen varsel ved lange opphold. Ingen input-logikk som forhindrer at parallelle opphold kan legges inn i basen.
3. Fiks Skaffe data fra Kriminalomsorgen for å kvittere ut de som egentlig er løslatt Dersom det er flere data - finne ut hvilke som er riktig Legge inn forretningsregler og skranker i basen, slik at registreringene blir korrekte Varsle saksbehandler etter en gitt periode?
4. Monitorering, mål og rapportering 4 Målekort KPIer Årshjul eller andre jevnlige kjøringer Overvåkning av triggere 80 1 60 40 20 0 2 Mai Juni Mål 6000 5000 4000 3000 2000 1000 Oversikt TPS (TPS001) i % Mai Juni Mål Tomme felter 70 60 10 Ugyldige verdier 50 40 10 Selvmotsigende informasjon 10 5 2 Unormal distribusjon 5 2 2 Antall tomme felt i institusjonsnavn (I001) Måned Antall Kommentar Jan 558 Feb 5636 Batch innlesning fra krimoms. Mar 15 Vaskejobb kjørt Apr 15 Mai 122 Jun 0 Jul 1 Aug 2 Sep 2 Okt 23 Nov 2 Des 3 Jan 4 3 0 Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Des Jan
Resultatet av god datakvalitet Saksbehandler Trenger korrekte data tilgjengelig. Må kunne være trygg på at det er riktig data for ytelsen og at hun/han ikke må tolke de eller ikke vet om kilden er til å stole på eller ikke at de 3 uker eventuelt må sjekke flere steder. Rekvirering av D-nummer tar saksbehandler 3 sekunder Bruker Vil få svar på det de lurer på, eller løse Bruker trenger bare å fylle inn oppgaven raskt og riktig helst på nettet. Forventer fødselsnummeret, at de ikke må oppgi så hentes data de forventer resten at NAV av informasjonen har. Mister tillitt når de finner feil. automatisk Analyse Trenger å forstå hva data betyr faglig og Viktig at NAV kan være en hvilke som er relevante og kan brukes i en gitt kunnskapsrik analyse. Historikk samfunnsaktør og endringer i lovverk som kan ha endret betydning, kvalitet og lignende som foretar grundige analyser av bl a arbeidsmarkedet Kontroll Ha tilgang til ulike kilder for å få et helhetlig bilde. Være sikre på at data og koblinger er gyldige på tvers av jus. Raske avklaringer som viser betydning av de forskjellige begrepene og lovverkene IT Sikkerhet for at applikasjoner har tilgang (kun) til relevant data. Kunne levere gode tekniske Alt løsninger går til riktig på bakgrunn enhet av i juridiske og faglige systemene avklaringer slik at disse er stabile og feilfrie. Samhandler Maskinene i Frankrike og Norge bruker 3 minutter istedenfor 3 Tilgang til relevant data av høy kvalitet. Elektronisk samhandling hvor prosessering på en eller begge sider skjer full automatisk. måneder på å bli enige om medlemskap og lovvalg
Veien videre? Maskinlæring på datakvalitet Egen datakvalitetsplattform? Økt grad av forretningsregler for å unngå feilregistreringer Klare KPIer slik at kvaliteten og måloppnåelsen er målbar Harmonisering av informasjos Kartlegging av informasjonen det offentlige har Maskinlæring og KI for å analysere effektiviseringspotensialet i dokumentasjonsforvaltningen vår
Takk for meg (igjen)! Silje Emilienne Aanderud-Larsen Teamleder Innovasjon og analyse 92886401 silje.emilienne.aanderud-larsen@nav.no