Operasjonalisering av AI - "Risikobasert tilnærming" Presentasjon "AI / data science i offentlig sektor" 26.11.2018 Rune Hammerstad, Skatteetaten SITS
Skatteetaten er i endring Fra nasjonal til global Fra etat til stat Fra motstrøms til medstrøms Fra skjema til tema Fra ettertid til sanntid Fra tro til viten
Hendelsesdrevne Satsvise
«Modell» «Modell» kan i denne sammenheng være: Prediktive modeller Ekspertmodeller manuelt definerte Sett av regler Programmerte, statistiske rutiner Nettverksanalyser Mønstergjenkjenning mm Gjerne en kombinasjon av dette
Veiledning Etterlevelse Videre analyse Meldingskontroll Etterretning «Nudge» Bokettersyn.. Fastsetting Innkreving Folkeregistrering
Scoringskomponent Scoringskomponent Informasjon Utføre scoring Velge betjeningsstrategi Gjennomføre tiltak Evaluere Lære Hendelse
Scoringskomponent Forhåndslager Regler Informasjonsplattform Partsreg. Skatteinfo Andre kilder preparering Ekspertmodeller Prediktive modeller Programmert kode Orkestrering Logging Logg Tidligere hendelser Tjenestelag Kall Respons Avvikende løp Forretningsprosess Utføre risikovurdering Behandle risiko Grønt løp
Scoringskomponent Forretningsprosess Avklare risiko Behandle risiko Utvikling og forvaltning av modeller Felleskomponent Scoring og regler Produksjonssetting Informasjonsplattform Andre kilder Tilrettelegging av data til forhåndslager Forhåndslager
Målarkitektur logisk datavarehus, analyse og scoring Produksjonssystemer GUI Saksbehandlerstøtte «(360º)» Konsumenter/ verktøy Mål- og resultatstyring Rapportering Analyse Avansert analyse Nettverksanalyse Søk (klient) Modellbygging Regeladmin Felleskomponent Scoring og regler tilgang Delt datatilgang, metadata og publisering Graf Søk OLAP prosesseringstjenester Mining Tekstanalyse Distribuert Prosessering Administrasjon, monitorering Sikkerhet, tilgang Interne datakilder Preparerte analysedata Sandkasser Forhåndslager av variable Informasjon Eksterne datakilder Skatteinfo Partsregister Saksmappe ++ integrasjon Rådata Strukturert info (repository) Grafdatabase torg torg Søk kilder (Strukturerte/ustrukturerte) lagre (Strukturerte/ustrukturerte)
Hortonworks Platform with Big SQL Open source based Hadoop platform (formerly IBM Open Platform for Apache Hadoop). InfoSphere Click Self-service data integration so that any business or technical user can integrate data. Fluid Query (part of Big SQL) Hide the complexity of data access by offering a single interface into what could be multiple data sources. Work in Progress BigIntegrate Industry leading data integration environment with ability to also run natively in Hadoop. Apache Kafka Real-time ingestion capability included as part of Hortonworks Platform (formerly IBM Open Platform for Apache Hadoop). InfoSphere Replication * Used to capture changes, typically in transactional data and then transport that data to a new target system. BigQuality quality rule design, quality assessment and monitoring for source systems and analytical repositories. BigQuality Quality analysis during ETL job execution, typically called from BigIntegrate, using rules designed in Information Analyzer Sources New sources Machine & Sensor Image & Video Enterprise Content Social Internet Sets Weather Commercial Sets Traditional sources Third-Party Transactional Application System of Record Lifecycle Management acquisition & application access Ingestion & Integration Batch Ingestion Real-Time ingestion Change Capture Document Interpretation & Classification Quality In-Memory Processing Landing Zone Archive Historical Deep Analytics Repository Analytical Lake Storage Exploratory Analytics Repositories Sand Boxes Warehouses & Marts Analytics In-Motion Streaming Analytics Complex Event Processing Enrichment Analytics Operating System Access Self-Service Virtualization Federation APIs Discovery & Exploration Science Actionable Insight Visualization & Storyboarding Reporting, Analysis & Content Analytics Decision Management Predictive Analytics & Modeling Insight as a Service Cognitive Analytics Consistent Analytics Engine Enhanced Applications Customer Experience New Business Models Financial performance Risk Fraud & Operations IT Economics Simple Programming Paradigm Master & Entity Reference Information Management & Governance Catalog Models Quality Masking & Redaction Encryption Security Protection Security Intelligence On-Premise Cloud Platform Hybrid Search Watson Explorer Includes content analytics capabilities that utilizes Watson Natural Language Processing. Science Experience An environment that brings together everything that a Scientist needs. It includes the most popular Open Source tools and IBM unique value-add function. Cognos Analytics Integrated solution for managed reporting and business user self service to create personalized dashboards and reports, featuring smart contextual search. SPSS (Statistics / Modeler) Provides a range of advanced analytics including text analytics, entity analytics, social network analysis, statistics automated modeling and data preparation to build predictive models and uncover hidden patterns. Information Governance Catalog Metadata catalog allowing you to keep a glossary of business attributes while advertising valuable data to the enterprise.