Kunstig intelligens i Lånekassen Difi, «Innovasjon i eget hus», 18. oktober 2018 Severin B. Hanssen Leder forretningsutvikling Liv Bergliot Simonsen Fagdirektør kvalitet og kontroll i saksbehandlingen
Kunstig intelligens i Lånekassen en introduksjon 1 Hvorfor Lånekassen er opptatt av kunstig intelligens 2 3 Ett konkret case fra et praktisk ståsted Ett konkret case fra et juridisk ståsted
Lånekassens kontekst er i kraftig endring - suksess avhenger av endringsdyktighet Kundebehov Politiske rammer og føringer Økt fleksibilitet Teknologiske muligheter
Et paradigmeskifte der kunstig intelligens kombinert med skyløsninger og stordata vil være den neste store endringskraften
Automatisering versus Kunstig intelligens
Kunstig intelligens i Lånekassen en introduksjon 1 Hvorfor Lånekassen er opptatt av kunstig intelligens 2 3 Ett konkret case fra et praktisk ståsted Ett konkret case fra et juridisk ståsted
CASE Bruk av maskinlæring for å effektivisere årlig bokontroll av studenter
Maskinlæring 101 noen viktige begreper Modell (hjernen) Spiser informasjon Spytter ut en spådom. F.eks. estimerer boligpris basert på antall rom, kvm, lokasjon etc. Modellen må læres opp (trenes) før bruk Kverne på mye data som er markert med en fasitspådom Krever ofte mye prosesseringskraft og tid
Uten data ingen kunstig intelligens Features er egenskaper og kunnskap som modellen skal bruke for å komme med en spådom. ID Fornavn Etternavn Alder Kjøn n Illustrasjon Features Kommune Sivilstatus Inntekt Antall barn Målvariabel Tatt i kontroll 1523 Per Olsen 21 M 1467 1 0 Ukjent 0 2101 Kari Hansen 19 K 1325 1 150 Ukjent 0 6521 Ola Jensen 21 M 1654 0 21 2 1 2215 Anne Persen 23 K 1658 2 0 1 0 2874 Hans Andersen 25 M 1732 1 350 0 1 Målvariabelen er det modellen skal spå - altså «fasiten». Den er tilgjengelig ved trening.
56 features og 68.413 rader ble benyttet i vårt eksperiment *Fra Proof of concept
Modellen vi benyttet Gradient Boosting baserer seg på beslutningstrær Kjønn = Mann Ja Nei Bostatus = Borte Inntekt = 0 kr Ja Nei Ja Nei Formue < 10 kr P=30% Antall søsken > 3 P=12% Ja Nei Ja Nei P=70% P=10% Alder < 23 år P=34% Ja Nei P=78% (osv...)
Modellen setter sammen mange beslutningstrær der disse gir sin stemme til spådommen 400+ stk for vårt eksperiment Trening: 1. Forsøker et nytt tilfeldig beslutningstre. 2. Kverner all data og måler hvor godt man treffer. 3. Nytt beslutningstre blir en fast del av modellen hvis modellen da treffer bedre.
Resultat*: Vi kan kontrollere 25% av kundene og fortsatt finne 7 av 10 «svindlere» 100% Antallsvindlere tatt 50% Modellen vår Tilfeldig utvalg 0% 0% 25% 50% 100% Antall kunder kontrollert *Fra Proof of concept
Kunstig intelligens avdekker mønster som mennesker i praksis ikke vil være i stand til å se
Kunstig intelligens i Lånekassen en introduksjon 1 Hvorfor Lånekassen er opptatt av kunstig intelligens 2 3 Ett konkret case fra et praktisk ståsted Ett konkret case fra et juridisk ståsted
Tildeling videregående høyere utdanning Tilbakebetaling Innkreving Tilbakebetalingsplan og betalingsstatus Betalingsutsettelse Rentefritak Ettergivelse Oppsigelse av lånet Frivillig innkreving Tvungen innkreving Data Data Data Manuell kontroll av bostatus Uttrekk til bokontroll Bostatus Utdanning Borteboer Utdanningsstipend Støtterett Støttehistorikk Bestått eksamen Inntekt og formue Søknad og vedtak om omgjøringslån til høyere utdanning Kontroll av vilkår for utdanningsstipend Maskinell saksbehandling og vedtak om utdanningsstipend
Er Modellen for uttrekk automatisert behandling/profilering? Den registrerte har rett til ikke å være gjenstand for automatisert behandling, herunder profilering dersom en slik avgjørelse har rettsvirkning for eller på tilsvarende måte i betydelig grad påvirker vedkommende Lånekassens vurdering: Bokontrollen kan få rettsvirkninger bl.a tap av rettigheter jf. utdannningsstøtteloven 15 Bokontrollen er ikke automatisert (art. 22 nr 1) Modellen for utplukk er automatisert, men har i seg selv ikke rettsvirkninger eller i betydelig grad påvirker den registrerte
Er bruk av Modellen en ny behandling? Er tildeling av omgjøringslån, omgjøring til utdanningsstipend og kontroll av vilkår for omgjøring til stipend (bruk av Modellen) en eller flere behandlinger? «behandling» art. 4 nr 2 Konklusjon: flere behandlinger indre sammenheng, men ulike fordi Modellen er viderebehandling av personopplysninger som bl.a er hentet inn til andre formål
Personvernprinsippene, særlig om formålsbestemthetsprinsippet To overordnede komponenter: Personopplysninger skal samles inn for spesifikke, uttrykkelig angitte og berettigede formål. De innsamlede opplysningene skal ikke senere brukes på en måte som er uforenlig med de opprinnelige formålene med innsamlingen (Art. 5 nr 1 b)) To problemstillinger: Er bruk av personopplysninger i modellen for uttrekk til bokontroll et annet formål enn det opprinnelige formålet med innhenting av opplysningene? Gitt at bruken av personopplysningene er et annet formål, er da det nye formålet forenelig eller uforenelig med det opprinnelige formålet?
Personvernprinsippene særlig om dataminimering Er effektivisering av bokontrollen med bruk av «Modellen» nødvendig for å forvalte ordningen med utdanningsstipend? - hva som er nødvendig må avgjøres i hvert enkelt tilfelle Konklusjon: Lånekassen mener ja fordi - kontrollen blir mindre ressurskrevende - utplukket blir mer presist - færre kunder må gjennom kontrollen
Behandlingsgrunnlag for «Modellen»- lovgrunnlag? Art. 6 nr 1 c) rettslig forpliktelse eller e) allmennhetens interesse eller utøve offentlig myndighet «bokontrollen» en del av forvaltningsansvaret utdanningsstøtteloven 15 og 16 jf forskrift om tildeling for 2016-17 tredje del Foreligger det et supplerende rettsgrunnlag for «Modellen? Nei bruk av «Modellen» er ikke uttrykkelig regulert i utdanningsstøtteloven med forskrifter Konklusjon: Har ikke lovgrunnlag for bruk av «Modellen» Om det er adgang til lovendring må vurderes i forhold til art. 23 jf. art. 6
Tildeling videregående høyere utdanning? Tilbakebetaling Innkreving Tilbakebetalingsplan og betalingsstatus Betalingsutsettelse Rentefritak Ettergivelse Oppsigelse av lånet Frivillig innkreving Tvungen innkreving Data Data Data Manuell kontroll av bostatus Hva nå kan vi ikke bruke Modellen? Uttrekk til bokontroll Bostatus Utdanning Borteboer Støtterett Støttehistorikk Bestått eksamen Utdanningsstipend Viderebehandling av personopplysninger for nye, Inntekt forenlige og formål er tillatt uten et formue eget rettsgrunnlag for viderebehandlingen jf art. 6 nr 4 Søknad og vedtak om omgjøringslån til høyere utdanning Kontroll av vilkår for utdanningsstipend Maskinell saksbehandling og vedtak om utdanningsstipend
Momenter formålenes forenlighet art 6 nr 4 Enhver forbindelse mellom formålene opprinnelige og til viderebehandling I hvilken sammenheng personopplysningene er blitt samlet inn, særlig med hensyn til forholdet mellom de registrerte og Lånekassen Arten av personopplysninger, særlige kategorier eller straffbare forhold De mulige konsekvensene av viderebehandlingen for den registrerte Om det foreligger nødvendige garantier, som kan omfatte kryptering eller pseudonymisering
Tildeling videregående høyere utdanning Tilbakebetaling Tilbakebetalingsplan og betalingsstatus Betalingsutsettelse Rentefritak Ettergivelse Data Data Innkreving Oppsigelse av lånet Frivillig innkreving Tvungen innkreving Data Uttrekk til bokontroll Konkret vurdering av hver enkelt opplysning: Forenelig: Bostatus Utdanning Generelle opplysninger om alle kunder og opplysninger innhentet Støttehistorikk Støtterett etter tildelingsforskriften første del Søknad og vedtak om omgjøringslån til høyere utdanning Opplysninger om tidligere bokontroll Usikkert om forenelig: Borteboer Opplysninger etter tildeling høyere utdanning (forskriftens Bestått tredje Inntekt del), og eksamen formue særlig dersom opplysningene gjelder andre enn kunden selv og Kontroll av vilkår for utdanningsstipend lengre tilbake i tid Opplysninger om tilbakebetaling Uforenelig: Opplysninger innhentet Utdanningsstipend etter tildeling videregående (forskriften annen del) Maskinell saksbehandling og vedtak om utdanningsstipend
Mange flere problemstillinger det får bli en annen gang J Lånekassens plikter Kundenes rettigheter Informasjonssikkerhet og risikoreduserende tiltak.. Utvikling av modellen Bruk av modellen Forvaltning av brukt modell Revisjon av modellen utilsiktede konsekvenser herunder diskriminering mv ++++
Kunstig intelligens i Lånekassen Difi, «Innovasjon i eget hus», 18. oktober 2018 Severin B. Hanssen Leder forretningsutvikling Liv Bergliot Simonsen Fagdirektør kvalitet og kontroll i saksbehandlingen