Anvendt Maskinlæring. MainTech Konferansen Anton Eskov, Data Scientist, Inmeta.

Like dokumenter
Praktisk bruk av maskinlæring i vedlikehold

Risikobasert tilsyn. Maskinlæringsverktøy til valg av tilsynsobjekter. Øyvind Dahl, SINTEF. Marius Søberg, Direktoratet for Arbeidstilsynet

Informasjonsmøte for potensielle partnere. 8. Januar 2015

Neural Network. Sensors Sorter

Kurskategori 2: Læring og undervisning i et IKT-miljø. vår

Kostnadskalkyler og usikkerhetsanalyser i store industriprosjekt. Olav Torp Førsteamanuensis NTNU, Institutt for bygg, anlegg og transport

SAMBA Smartere anleggsforvaltning med Big Data

Forbedret kundeopplevelse og reduserte driftskostnader ved bruk av maskinlæring i nettskyen. Heidi Brunborg IT-direktør i Lånekassen

Barbara Wasson, Director. NIFU Workshop on Learning Analytics 25 May 2016

Vedlikeholdsstyring i et digitalt perspektiv Eli Sivertsen Maintech konferansen 2018

Brukers Arbeidsflate. Tjeneste Katalog. Hva vi leverer... Presentasjon Administrasjon Automatisering

Hvordan ser pasientene oss?

Hvordan komme i kontakt med de store

Praktiske løsninger med Microsoft Power BI. CIO Forum Analytics Paul Andreas Osuldsen

Robotene kommer - Introduksjon om RPA og AI

RACE ROLE ACCESS ENHANCEMENT I STATKRAFT

SVM and Complementary Slackness

Modellering av Customer Lifetime Value og hvordan bruke det Øystein Sørensen Data Scientist

Bruk av robot i Helse Vest sitt administrasjonsarbeid

New steps in the municipal health and care staircase: Educating for new roles and innovative models for treatment and care of frail elders.

Oppgraderinger i SAP. Planlegge, organisere og gjennomføre en oppgradering til ECC 5.0/ECC 6.0. Sveinung Gehrken

Emneevaluering GEOV272 V17

Skanska: BIM prosjektering til FDV. Rupert Hanna BIM Knowledge Manager, Skanska 07.mai 2014

Klimatesting av massivtreelementer

Hybrid Cloud and Datacenter Monitoring with Operations Management Suite (OMS)

Hva er kunstig intelligens og maskinlæring? Cathrine Pihl Lyngstad 18. Oktober 2018

Informasjonsmøte for potensielle partnere. 8. Januar 2015

ARCT STAKEHOLDER MAPPING TOOL SAMFUNN = MILJØ = NÆRINGSLIV = LOVVERK

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Midler til innovativ utdanning

Kommende Trender Innenfor Test

Veien til ISO sertifisering

Skanska BIM prosjektering til FDV. Rupert Hanna BIM Knowledge Manager, Skanska 07.Januar 2014

Capgemini Bergen. og vi snakker om... Simply. Business Cloud. Rolf Wangsholm regiondirektør

Gir vi de resterende 2 oppgavene til én prosess vil alle sitte å vente på de to potensielt tidskrevende prosessene.

TEK5020/TEK Mønstergjenkjenning

INNOVASJONSPROSJEKT PÅ AVLØPSPUMPER. Jon Røstum

Øystein Haugen, Professor, Computer Science MASTER THESES Professor Øystein Haugen, room D

Støtter din digitale reise

Muligheter etter studiene

FORRETNINGSsystemer & HR

Kunstig intelligens i biblioteket Cogito, ergo sum

Cloud Computing. Monaco Dette bør være forsiden på din presentasjon. Et lybilde med program etc. Kan komme før Ola prater.

Workshop 2 - Endringer i regelverket for droner - Hva? Når? Hvordan?

Vedlegg 1 Gjennomføring av oppdraget. Kvalitetssikring (KS1) av tilpasset KVU for Ocean Space Centre

«IDEFASE HELGELANDSSYKEHUSET 2025»

WORKSHOP: HOW TO CONNECT STUDENTS TEACHING PRACTICE AND RESEARCH MIKAEL ALEXANDERSSON, KAREN HAMMERNESS, KIRSTI ENGELIEN, & INGA STAAL JENSET

Digital Grid: Powering the future of utilities

Rendering - Lage 3D-bilde av prosjektet

COLLECTION FAB KATALOG S PRODUKTBLAD FAB CIRCULAR S Enjoy! embaccolighting

Digitalisering i BIR - overblikk. Andre Tangen -

Er kunstig intelligens vår venn?

Organizational Project Management Maturity Model (OPM3)

Samferdselsdepartementet. Kunstig intelligens. Anders Martin Fon. April Samferdselsdepartementet

HONSEL process monitoring

Produktkalkyler i SAS Cost and Profitability Management hos Avinor

Nasjonalt kvalifikasjonsrammeverk og læringsmål i forskerutdanningen

Bestille trykk av doktoravhandling Ordering printing of PhD Thesis

Brukerkrav og use case diagrammer og -tekst 19. januar Agenda. Brukerkrav og use case. Diagrammer Tekst.

PATIENCE TÅLMODIGHET. Is the ability to wait for something. Det trenger vi når vi må vente på noe

Prosjektering av tiltak for Renere havn i Trondheim

MPN Brief. Onsdag 14. november Trond Renshusløkken Sales Director Comperio Gold Search competency

Innføring i millit. Av: Halvor Wergeland Rino Nilsen H05M01. HIØ avd. ing. Realfag

Hvilke tilpasninger gjør Fjordkraft mht. MiFID? 5. juni 2007 Trude Frydenberg

Bli en bedre bestiller Telemark Online 2017

Emnedesign for læring: Et systemperspektiv

Vi rigger oss for fremtiden 60 nye år i Mosjøen. Mosjøen september 2018

Presentasjon for Verdal Formannskap

Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen

RPA. Roar Følling

Baltic Sea Region CCS Forum. Nordic energy cooperation perspectives

PLATON EXECUTIVE BRIEFINGS

Maskinlæring og kunstig intelligens for beslutningsstøtte ved innovativ analyse av elektroniske pasientjournaler

Les s Les s Les s Les s Les s Gjør oppgave s

«Best practice» ved bruk av makt og tvang. Pål-Erik Ruud / NAFO Dato:

Konsept. Samle et fragmentert BI-konferansemarked til én omfattende konferanse Faglig på guru-nivå Teknologi- og leverandøruavhengig

Eksamensoppgaver til SOSANT1101. Regional etnografi: jordens folk og kulturelt mangfold. Utsatt skoleeksamen 15. desember 2011 kl.

IN2010: Algoritmer og Datastrukturer Series 2

EN INNFØRING I BPM

The CRM Accelerator. USUS February 2017

Kritisk lesning og skriving To sider av samme sak? Geir Jacobsen. Institutt for samfunnsmedisin. Kritisk lesning. Med en glidende overgang vil denne

Stordata og kunstig intelligens forandrer medisinen. Erik Fosse Intervensjonssenteret Oslo Universitetssykehus

Forbruk & Finansiering

«Denne roboten er helt unik!» Kilde: Donald Duck nr

Stordata i offentlig sektor OSDF 7.12

Digital Strategi i en E- handelskontekst. Dynamics User Group Norge - September 2017

En verktøykasse for innovasjonsarbeid

Bra og enkelt et dilemma i usikkerhetsanalyser? Olav Torp Førsteamanuensis NTNU, Institutt for bygg, anlegg og transport

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Fra bø'eko' +l teknologisk høyborg CIO Forum Datasenter 26. November 2015

Hva må til for utviklingen av arketyper med klinisk god kvalitet?

Multiconsults kjernevirksomhet er rådgivning og prosjektering

DESDIFORs virkeområde

EN Skriving for kommunikasjon og tenkning

5E-modellen og utforskende undervisning

What's in IT for me? Sted CAMPUS HELGELAND, MO I RANA Tid

Climate change and adaptation: Linking. stakeholder engagement- a case study from

Spillbasert læring Spill som verktøy for dialogisk undervisning. Skolelederdagen 2019 Kenneth Silseth

Dybdelæring i læreplanfornyelsen

KUNDENS KRAVSPESIFIKASJON

Transkript:

Anvendt Maskinlæring MainTech Konferansen - 2017 Anton Eskov, Data Scientist, Inmeta www.inmeta.no

130 Ansatte Oslo & Trondheim Solid og lønnsomt selskap Del av Crayon Group med over 1000 ansatte Portal og samhandling Systemutvikling og integrasjon Big Data / Advanced Analytics / BI E-handel Forretningsrådgivning www.inmeta.no

Maskinlæring kunder 3

Agenda Hva er maskinlæring Kundecaser Arbeidstilsynet DNV-GL Tradesolution www.inmeta.no

www.inmeta.no Hva er Maskinlæring?

Maskinlæring "Field of study that gives computers the ability to learn without being explicitly programmed. (Arthur Samuel, 1959) Er en datadrevet prosess Machine Learning DS Domene kunnskap www.inmeta.no

Typer av Maskinlæringsløsninger

Typer av Maskinlæringsløsninger

Eksplorativ ML Proof of Concept Oppstartsfase Forberedelser Prosjektfase Presentasjon: Hva er ML og hvordan komme i gang! Identifisering av ML Case 2 4 uker Inmeta bistår i workshops ved behov. Innhenting av data 3 6 uker Inmeta kan bistå, men ofte gjør kunden dette selv. Oppstartsmøte 3 timer Prosjektfase Ukentlig statusmøte 1-2 timer Overlevering 3 timer Hypothesis Test the Hypothesis Generate Features Train Model Choose Algorithm Inmeta sitt pådrag: 20% - 40% etter behov Inmeta sitt pådrag i denne perioden er 100%

Arbeidsmodell Hypothesis Test the Hypothesis Generate Features Train Model Choose Algorithm

Kundecase Arbeidstilsynet Prediksjon av risiko www.inmeta.no

Arbeidstilsynet En statlig etat, underlagt Arbeids- og sosialdepartementet. Etatens hovedoppgave er å føre tilsyn med at virksomhetene følger arbeidsmiljølovens krav Kontroll og veiledning om arbeidsmiljø http://www.arbeidstilsynet.no 12

Grunnlag Antall organisasjoner i Brønnøysund register ~ 1,3 mill Potensielle tilsynsobjekter ~ 250 000 Antall tilsyn gjennomført pr. år ~ 17 000 13

Oppdraget Produsere en prioritert liste over sannsynlige virksomheter det bør føres tilsyn på fremover. Gi forklaring til prioriteringer Verifiser om ML-metoder kan brukes for å danne slik liste, og hvilke metodene fungerer best Finn ut hvilke data skal legges til grunn til ML-modell(er) www.inmeta.no

Analyse i fire trinn Logistisk regresjonsanalyse for å identifisere egenskaper ved virksomheter som bør prioriteres fremfor andre Benytte resultatene til å fordele virksomhetene videre inn i fire risikogrupper Sammenligne og teste resultater mellom de fire risikogruppene Ekstrapolere resultatene fra analysematerialet til å omfatte alle registrerte virksomheter i Arbeidstilsynets ansvarsområde

Virksomhetene fordeles i grupper basert på beregnet sannsynlighet for å finne avvik Tilhører gruppen av virksomheter med lavest sannsynlighet for alvorlige avvik Tilhører gruppen av virksomheter lav sannsynlighet for alvorlige avvik Tilhører gruppen av virksomheter høy sannsynlighet for alvorlige avvik Tilhører gruppen av virksomheter høyest sannsynlighet for alvorlige avvik

Foreløpig funn: Det er sannsynlig at Arbeidstilsynet over tid vil rette opp i flere arbeidsmiljøproblemer dersom det gjennomføres tilsyn med virksomheter i de høyeste risikogruppene

Kundecase DNV-GL Maritime e-post kategorisering www.inmeta.no

Problemstilling for tekstklassifiseringspilot DNV-GL har en e-postbasert supportfunksjon som en tjeneste som skal gi kunder og ansatte tilgang til flere hundre domeneeksperter Forespørsler blir klassifisert manuelt av technical helpdesk Hypotese: vi kan bruke maskinlæring til å lære hvilken kategori innkommende forespørsler tilhører basert på innhold i e- post-tekst www.inmeta.no

Hierarki av kategorier Antall e-poster: 175 000 Inneholder forespørsler som er klassifisert feil eller mangler klassifisering Hierarki av kategorier, totalt ca 3000 stier www.inmeta.no

Example Confusion Matrix communicates ML results Confusion matrix is a tool for understanding how well a trained MLmodel performs www.inmeta.no

Kundecase Tradesolution Bildeklassifisering www.inmeta.no

26

Problemstilling TS ønsker å se på automatisk kvalitetssikring av bilder Typiske problemer er 1. Uskarphet 2. Uklare kanter 3. Høy glans 4. Ujevn lyssetting 5. Støv 6. Datostempling 7. Skeive bilder

Uskarphet Sharp Picture No blur Blur part

Skarphet: Features eksempel Sharp image HOG Blur image HOG 29

30 Treningsmetode or? Evaluate results Test Data

31 Uklare kanter: bildeforberedelse discontinued Clear edge Continious Unclear edge

32 Høy glans: eksempler Good picture 1 large area Bad picture Several small area s

Automatisk QA med manuell etterkontroll Fokus? el. Rene kanter Høyglans? Lyssetting Manuell etterkontroll Støv Datostempling Skeive bilder Passert automatiske tester

Takk for meg! For mer info, ta kontakt med bjorn.rosvoll@inmeta.no tlf 99 55 44 19 www.inmeta.no