Effektiv testing med rike anonymiserte testdata

Like dokumenter
Automatisert test som leveransekrav

Automatisert Robusthetstesting. Erik Arisholm Testify AS

Testing i en smidig verden med hyppige leveranser og litt om Asberger

Gårsdagens testroller takler ikke dagens utfordringer. Magnus Halvorsen og Erik Rogstad

EVRY Maskering. Agenda 9/26/2013. Testdagen ODIN 25. September EVRY Maskering. Petter Størseth og Kristian Berg

Test i smidig. Laila Sandbæk Testrådgiver og testleder Sogeti

Modernisering av IKT i NAV

Ansvarlig: Faglig ansvarlig for innhold og revisjon, Testseksjonen TestiT, Avd. for Tjenesteproduksjon HN IKT

Tverretatlig samarbeid om test, og syntetiske testdata i modernisering av folkeregisteret

Kostnadseffektivt eller bortkastet tid? Øyvind Woll Seniorkonsulent, Vivento AS

Testbilag til IT kontrakter

Digitalisering to dager til ende 8-9. november Jean-Philippe Caquet Rådgiver Trondheim Kommune

Retningslinjer for akseptansetest

Finansportalen Historiske bankdata

Retningslinjer for akseptansetest

Datakvalitet og Noark

Livsløpstesting av IT-systemer

Bruk av produksjonsdata til testing

LEVER OFTERE TEST SMARTERE

SERES og Tjenesteutvikling i Altinn. Geir Jevne Semantiske dager 7.juni 2011

Public. earkiv 360. Integrasjonsmuligheter og nye metoder for import Stian Gregory

Innføring av elektronisk skattekort. Presentasjon fra Skatteetaten til opplæring av Altinn brukerstøtte

Høringssvar til forslaget til regler om at Skatteetaten og Tolletaten kan bruke personopplysninger til å utvikle og teste it - system.

Dårlige tider gir gode verktøy - visualisering av komplekse feilsituasjoner -

SvarUt. Astrid Øksenvåg, prosjektleder KS SvarUt Steinar Carlsen, Bergen kommune

Testdekning og automatisering - Er 100% testdekning et mål?

BRUKERVEILEDNING MELDINGSVALIDATOR FULLVALIDERING DATO VERSJON BESKRIVELSE Klar til publisering

Modernisering av Folkeregisteret

KS SvarUt Brukermanual for å konfigurere, bruke og administrere tjenesten

ISTQB Foundation Level Prøveeksamen

KAR. Bankenes felles konto- og adresseregister Jorun Juuhl, Competence Manager, Marketing

Feltbeskrivelser SaldoRente doc

Mindre skjemavelde, sikrere tall

Kontrakter og test i smidige prosjekter. Fagmøte Dataforeningen i Trondheim 12.Mars 2012

«Nå kommer kommunene» -Fra innovasjonsprogram til praktisk realitet. Lisbet Nederberg og Håvard Wiik, Skedsmo kommune Altinndagen, 3.

Innberetning av ligningsoppgaver i aksje- og kombinasjonsfond Inntektsåret 2014

Plan som obligatorisk datasett i Norge digitalt. Kåre Kyrkjeeide

PRESENTASJON NORDIG OKTOBER Alle skal kunne teste alt - overalt

Testdata har ingen verdi..

Dataforvaltning og digitalisering. Stein Ivar Rødland IT-sjef Stavanger kommune

<Digitale_arkiver>fra A til #??A_#%,&</Digitale_arkiver> Digitale arkiver fra A til Å

Hva er SvarUt? Forsendelsene adresseres på vanlig måte. I tillegg påføres fødselsnummer eller organisasjonsnummer for å oppnå digital forsendelse.

Test i Praksis. NTNU Februar Copyright 2014 Accenture All Rights Reserved.

Det var en gang.. Kristin Meisingset Hallgren, testleder i SpareBank 1 Gruppen

Smidig metodikk, erfaringer fra NAV Fagportal

Bruk av markedsdialog i prosjektstrategiarbeidet. Øyvind Roseth - Prosjektleder Morten Aune Johannessen - Seniorrådgiver

Akseptansetest av Elektronisk rekvisisjon Klinisk kjemi

SØKNADSSKJEMA TESTSENTER NORSK TEST/BÅTFØRERPRØVEN

Brukerreiser som metodikk for samhandling Enhetlig tverrsektoriell tilnærming og felles datakatalog

Hva jeg skal snakke om

Innrapportering via Altinn: RF-1183 Innskudd, utlån og renter likningsoppgaver

HYPPIGE LEVERANSER HVORDAN KOMMER SPK DIT? Ved Mette Gjertsen Statens pensjonskasse

Digital grunnmur. Oddgeir Albertsen, Stabssjef. Våre verdier Respekt Åpenhet Mot Anerkjennelse Tillit

Erfaring med funksjonell testing i en integrert ALM prosess

Introduksjon Omfang Testmiljø Testdata Forberedelser i Edielportalen Gjennomføring Lenker til Elhub-dokumentasjon Tester for Query (QRY)

Skatteetaten. Skatt nord Gerd Lockertsen

Personvernerklæring for Fredrikstad kemnerkontor

Masterdata SMART DATA AJOURHOLD FRA EVRY MARIT HOLSÆTER

Altinns grensesnitt mot sluttbrukersystemer - Status og nyheter , Morten Græsby, Altinn

Presentasjon Test. Møte med Systemleverandører 5.desember 2014

Dagens Folkeregister. Modernisering av Folkeregisteret Folkeregisteret som felleskomponent

Ny forvaltningsløsning for primærdata. - Strategi, planer og organisering

Brukermøte i e-tinglysingsprosjektet, 19. januar 2016

Difis felleskomponenter. Nokios

Versjon 2.0 Dato Kompetansebehov

Hvorfor bør det etableres en felles systemarkitektur for helseforetakene? Helse IT 2007 Per Olav Skjesol Avdelingsleder Anvendelse Hemit

Bilag 4 Prosjekt- og fremdriftsplan for migrering til ny plattform

Forbedret kundeopplevelse og reduserte driftskostnader ved bruk av maskinlæring i nettskyen. Heidi Brunborg IT-direktør i Lånekassen

ProReport PROMARK WORKFORCE MANAGEMENT PROREPORT FAKTABASERTE BESLUTNINGER

Verdien av god leverandørtesting i konstruksjonsfasen i smidige prosjekter

MRS Medisinsk registreringssystem Drift av kvalitetsregistre.

NOARK 4. Versjon 1, 2 og 3 av NOARK-standarden beskrev krav til elektronisk journalføring. NOARK 4 beskrev i tillegg. Ulemper

Brukermøte i tinglysingen 24. mars Status og veien videre

Tjenesteorientert arkitektur hvordan statistikkproduksjonen støttes og forbedres av en tilpasset IT arkitektur

KS SvarUt. Hvordan konfigurere, bruke og administrere tjenesten

Overordnet Testplan. MUSIT Ny IT-arkitektur, Pilot og Hovedprosjekt. Page 1 of 11

Spørsmål og svar til Konkurransegrunnlag

Prosjektets mål. Dekanmøtet 4. mars 2015

INFORMASJONSSIKKERHET & GDPR. Kundeforum 18.oktober

GJENNOMGANG UKESOPPGAVER 9 TESTING

SØKNADSSKJEMA TESTSENTER NORSK TEST/BÅTFØRERPRØVEN

Smidig innføring og endringsledelse

Innrapportering av Innskudd, utlån og renter via Altinn

Ikke glem hvorfor! Et kundeforedrag om veien til god tjenesteovervåking

Integrasjon - fra strategi til vellykket implementering. Integrasjonsdagene Halden, august 2013 Ståle Hustad, TrønderEnergi Nett AS

Akseptansetest av mottak Rekvirering av medisinske tjenester Medisinsk biokjemi

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

System integration testing. Forelesning Systems Testing UiB Høst 2011, Ina M. Espås,

Felles studieadministrativt tjenestesenter FSAT. Strategi

BEHANDLING AV KUNDEDATA Oversikt over Norids behandling av data om domeneabonnenter. Innhold. Norids behandling av kundedata. Dato:

Transkript:

Effektiv testing med rike anonymiserte testdata 20. september 2016 Helene Aune Skatteetaten Erik Rogstad

21. september 2016 Skatteetatens IT- og Servicepartner Skatteetatens leverandør av IT- og administrative tjenester Utvikler, drifter og forvalter Skatteetatens IT-systemer Systemutvikling Prosjektledelse Infrastruktur Sikkerhet Ca. 900 ansatte fordelt på kontorer i Oslo, Grimstad og Lillehammer

Testsenteret TESTSENTER 21. september 2016 Metode og verktøy Ressurser i prosjekt og linje Ressurser i Testsenteret Testinfrastruktur Testledere Testutvikling (Testklient) Testdata Testansvarlige Testmiljø Testere

Innhold Anonymiserte data Hvorfor? Til hva? Eksempler på bruk Hvordan vi har anonymisert våre data Anonymiseringsnivå Sentrale elementer Erfaringer 4

Begrepsavklaring Anonymiserte testdata Produksjonsdata som er anonymisert for å brukes til test Syntetiske testdata Data som er konstruert uten rot i virkelige data 5

Domene Innskudd, lån og renter Aksjer og fond Skattedata BSU Skattemanntall Barnepass Selvangivelse Skatteoppgjør Skattekort Parter 6

Hva er målet? Målet er å teste med mest mulig produksjonslike data for å avdekke realistiske feil Funksjonelle feil - eksempelvis sære men realistiske funksjonelle feil som man kun finner i testdatasett med god spredning Ikke-funksjonelle feil relatert til ytelse og robusthet som best avdekkes ved produksjonslike data og volum Komplementært til andre former for testing med syntetiske data 7

Alternativ 1: Syntetiske testdata Modell av inputdomenet 8

Alternativ 2: Skarpe produksjonsdata Det billigste og enkleste alternativet? (eller kanskje ikke?) Men NEI Juridisk utfordrende Og uansett jus, så ønsker ikke testere innsyn i sensitive data. De ønsker bare å teste med realistiske data. 9

Alternativ 3: Anonymiserte produksjonsdata Potensielt svært produksjonslike Representerer variasjon og særtilfeller fra produksjon Er anonyme, men bør behandles med noe mer forsiktighet enn helt syntetiske testdata 10

Hva får man med anonymiserte data? Rikt soneuavhengig testdatasett Kan teste de samme aspektene uavhengig av sikkerhetssone Bedre forutsetninger for å lykkes med å flytte primæransvaret for test ned i utviklingsteamene Mer effektiv manuell test testdata med komplette sammenhenger som testere kan kjenne seg igjen i Muliggjør kontinuerlig regresjonstest av komponenter i akseptansetest-tilstand på ferske produksjonsdata. 11

Hvilke data til hvilke type testing? Syntetiske data Velegnet til automatiserte tester Nødvendig der hvor det ikke allerede finnes reelle data Test mot eksterne Anonymiserte data Velegnet til utforskende funksjonell test på alle testnivåer Velegnet til tester som krever volum og variasjon Regresjonstester på siste testnivå før produksjonssetting Bør primært brukes til test internt 12

Modernisert systemportefølje Silo-systemer Modernisert systemarkitektur med felleskomponenter Eksterne grensesnitt Eksterne grensesnitt Eksterne grensesnitt Parter / Manntall Parter / Manntall Parter / Manntall Eksterne grensesnitt Ekstern Kommunikasjon Skatteinfo (Felles Datalager XML-dokumenter) Fagsystem 1 Fagsystem 2 Fagsystem 3 Fagsystem 1 Fagsystem 2 Fagsystem 3 Datalager Datalager Datalager Partsregister 13

Anonymiserer-komponent Eksterne grensesnitt Ekstern Kommunikasjon Skatteinfo (Felles Datalager XML-dokumenter) Anonymiserer Fagsystem 1 Fagsystem 2 Fagsystem 3 Partsregister 14

Brukscenario 1: Kontinuering strøm av anonymiserte produksjonsdata Produksjon Ekstern Kommunikasjon Anonymiserer Test Eksterne grensesnitt Ekstern Kommunikasjon Skatteinfo (Anonymiserte XML-dokumenter) Fagsystem 1 Fagsystem 2 Fagsystem 3 Anonymisert Partsregister 15

Brukscenario 2: Ad hoc-testing med anonymiserte testdata Produksjon Eksternt Kommunikasjon Anonymiserer Test Miljø 1 Ekstern Kommunikasjon Arkiv med anonymiserte filer Miljø 2 Ekstern Kommunikasjon 16

Brukscenario 3: Integrasjonstest mot skarpt miljø Sone med begrenset tilgang Intern testsone Anonymiserer Filmottak Skatteinfo (Anonymiserte XML-dokumenter) Anonymiserte filer Filmottak Fagsystem Skarpe filer Eksternt testmiljø Kvittering Anonymisert Partsregister 17

Hvordan har vi anonymisert data?

Konsistente anonymiserte data Formål: Anonymisere data på en slik måte at de er konsistente på tvers av komponenter og systemer og følgelig kan benyttes til test av integrasjoner og verdikjeder. Ekstern Kommunikasjon Skatteinfo (Anonymiserte XML-dokumenter) Anonymiserer Partsregister 19

Anonymiseringsnivå Overordnet: Anonymiserer all identifiserende informasjon på hver enkelt part, som fnr, dnr, orgnr, navn, adresse, fødselsdato, kontaktinformasjon, etc. Relasjonene i dataene beholdes Personer med hemmelig adresse osv. fjernes fra datagrunnlaget For utenom partsinformasjon må øvrige identifiserende informasjonselementer anonymiseres, som f. eks. kontonummer i Saldo/Rente-oppgaver fra bankene 20

Anonymisering av fnr/orgnr Anonymisering av fødselsnummer (og dnr): Anonymiserte fødselsnumre skal være gyldige fødselsnumre (validere) Anonymiserte fødselsnumre kan være i bruk av reelle parter Ivaretar fødselsår og kjønnsopplysning Anonymisering av organisasjonsnummer: Validerer med tanke på kontrollsiffer Ellers ingen logikk i organisasjonsnumre 21

Anonymisering av andre data Anonymisering av adresser: Anonymiserer alle felter, inkludert kommunenummer og postnummer Forsøker å opprettholde kvalitet og distribusjon av verdier, slik at det i størst mulig grad gjenspeiler produksjon Regler: Forhåndsdefinerte relasjoner Deterministisk Tilfeldig 22

Tips Prøv å finne det punktet her Produksjonslik datakvalitet Grad av anonymisering 23

Kostnad Utvikling av løsning: Fire ressurser i 15 måneder. To interne og to eksterne Drift og vedlikehold: Halv ressurs årlig Videreutvikling Skjer i takt med moderniseringen og bekostes av prosjektene 24

Skatteetaten

Søkbarhet For å effektivt nyttiggjøre seg av anonymiserte testdata trenger man gode søkemuligheter i dataene Vi jobber nå med en løsning rundt dette Tenker også på å lage modeller over inputdomene: Brukes til å søke etter testtilfeller som tilfredsstiller en gitt test suite Brukes til å generere syntetiske testdata for det som ikke er dekket av anonymiserte data 26