Mønstergjenkjenning innen forretningsanalyse

Størrelse: px
Begynne med side:

Download "Mønstergjenkjenning innen forretningsanalyse"

Transkript

1 WHITE PAPER Mønstergjenkjenning innen forretningsanalyse Implementering med SAS Systemet

2 Innhold Sammendrag...6 Bakgrunn...6 Forretningsbehovene og utfordringene...6 Mønstergjenkjenning og forretningsanalyse...7 Hva er mønstergjenkjenning?...7 Definisjoner...7 Det kognitive paradigmet...7 Relevans risikojustert beslutning...8 Virksomhetsområder hvor mønstergjenkjenning med hell er benyttet Metode Analyse modeller Assosiasjoner - koblinger i mønstre Visualisering av regler og sensitivitet Hvitlister og scenarioer Scoring Utvalgte eksempler på bruksområder Lusking i pasientjournaler - misbruk av hjemler Kredittkortsvindel Analyse av åpne kilder, sosiale nettverk, blogger Automatisk markedsanalyser innen telekom og media (ICT) Varsling av forutsigbart hendelsesforløp Løsningsplattform og hovedkomponenter... 21

3 Figurliste Figur 1 Fastsetting av aktivitetsnivå og oppførsel i gruppe og for individ...8 Figur 2 Identifisering av mulige mønstre...9 Figur 3 Monitorering av relevans for å fastlegge mulige avvik ved hjelp av scoring...9 Figur 4 Mønstergjenkjenningsprosessen...13 Figur 5 Hvor sterke er assosiasjonene, dvs. båndene mellom individ eller hendelser?...14 Figur 6 Mønstergjenkjenningsprosessen fra metode og arbeidshypoteser til analyser og deteksjon...16 Figur 7 Oppslag i helseinformasjon, mulige brudd på hjemler...17 Figur 8 Beregning av score for kortsvindel...18 Figur 9 Analyse av pengestrømmen i nettverk på tvers av hub er...19 Figur 10 Analyse av diskrete hendelser for å forhindre uønsket situasjon...20 Figur 11 Løsningsplattform for mønstergjenkjenning...21 Figur 12 Flyt i prosessene mønstergjenkjenning...22 Tabelliste Tabell 1, Eksempler på applikasjonsområder hvor mønstergjenkjenning har vært benyttet...10 Tabell 2, to alternative strategier for mønsteranalyse...11 Tabell 3, Hovedelementene ved mønstergjenkjenning...12 Tabell 4, Hvitlister og scenarioer

4 Denne white paper er skrevet av Inge Krogstad, Direktør strategi og forretningsutvikling, SAS Institute Norge. Oslo april

5 Sammendrag I takt med den teknologiske utiklingen hvor regne- og lagringsmuligheter i IT systemene nå ikke lengre setter nevneverdige begrensninger på regnekapasitet og estimeringsmuligheter, har analyser som benytter mønstergjenkjenning økt i anvendelse og erobrer stadig nye bruksområder. Analysebaserte IT løsninger som benytter mønstergjenkjenning ufordrer i dag mange av de klassiske fremgangsmåtene for å finne mønstre i store datamengder og i data med varierende eller manglende struktur. Mønstergjenkjenning som metode har her en fordel siden den ikke trenger å forholde seg til hva som er normalt eller unormalt, gyldig eller ugyldig, men kun til begrepet relevans. Metoden utnytter også på en god måte kombinasjonen av data- og text mining. Praktisk utprøving har videre vist at treffprosenten i beregningene kan økes ytterligere ved å benytte klassifisering og bygge profiler på inngangsdata. Mønstergjenkjenning som disiplin er faglig krevende ettersom den stiller store krav til kombinasjon av metodiske og bransjespesifikke kunnskaper. Mønstergjenkjenning som disiplin er faglig krevende ettersom den stiller store krav til kombinasjon av metodiske og bransjespesifikke kunnskaper. SAS Institute har benyttet mønstergjenkjenning innen en rekke løsningsområder, og vi ser at metoden har mange fordeler knyttet til å behandle store transaksjonsvolumer der kunden mangler treningsdata, informasjon er ustrukturert slik som for eksempel sosiale nett og blogger eller at arbeidshypotesene ikke er veldefinerte. Denne rapporten forsøker å gi innsikt i SAS Institutes anvendelse av mønstergjenkjenning, hvordan vi setter opp en mønstergjenkjenningsprosess, videre hvordan vi beregner avvik og risiko score og integrerer resultatene i kundens prosesser og systemer. Til slutt har vi gått gjennom noen utvalgte eksempler på bruksområder innen helsevesenet, kortsvindel, sosiale nettverk, automatisering av markedskampanjer og varsling av forutsigbare hendelser innen prosessindustri / offshore. 5

6 Bakgrunn Forretningsbehovene og utfordringene I virksomhetskritiske forretningsprosesser vil det være nødvendig å overvåke transaksjonsprosessene, finne ut hvor belastningen og risiko er størst for produksjonsstans og ha oversikt over hvordan brukere faktisk benytter systemet. Informasjon på avveier fra denne typen systemer kan bety alt fra omdømme tap, økonomiske vanskeligheter eller tap av kunder, kunden stoler ikke lengre på deg. Mange brukere er ikke klar over at systemene kan eksponere markeds- eller konkurranseinformasjon mer eller mindre skjult i data, eller at systemet egentlig burde underlegges vesentlig strengere bruksregulering både når det gjelder når systemet kan brukes, hva det er tiltenkt og hvilke brukere som faktisk bør ha tilgang. Eksempler på førstnevnte er kundens preferanser segmentert på brukssted eller f.eks. medlemskort. Mens ansattes nysgjerrighet på medlemsregistre, intern dokumentasjon eller naboens track record i offentlig register kan være eksempler på sistnevnte. Ved å dra kundekort når du handler, avleies det geografisk linkbar informasjon som kan knyttes mot så vel reiseruter som preferanser. La oss ta en nærmere kikk på et par eksempler; Eksempel 1, relevante konsumentmønstre Ved å dra kundekort når du handler, avleies det geografisk linkbar informasjon som kan knyttes mot så vel reiseruter som preferanser. M.a.o. det bygges opp potensiell informasjon om din atferd-, rytme- og konsumentvaner. I en konsulent tilbyder sammenheng er det imidlertid mye mer interessant å kikke fremover, dvs. hvordan kan denne informasjonen benyttes til å forsøke å forutse ditt konsum mønster for eksempel på lørdag formiddag og kunne skreddersy tilbud for å utnytte on the spot targeted information. Tilbyder må i en slik sammenheng kunne besvare Hva er de relevante mønstrene som faktisk kan benyttes for å skreddersy slike kundekampanjer?. Eksempel 2, personlig profil og identitet Stadig mer informasjon, både om privatpersoner og virksomheter, er tilgjengelig på nettet og i ulike offentlige og private databaser som helt eller indirekte er koblet til Internett. Ved hjelp av intelligent søketeknologi er det i dag fult mulig å sette opp søk som går igjennom disse enorme datamengdene bestående av databaser, blogger, sosiale nettverk og offentlig tilgjengelige kilder på jakt etter gitte mønstre. Avansert analyse setter deretter sammen og utfører synteser på dette materialet og skaper mer eller mindre det komplette bildet innen bl.a. preferanse, helsetilstand, kriminalitet, personlige forhold og konkurranse. Tester SAS Institute har gjennomført viser at selv kun ved å analysere åpne sosiale nettverk kan individers vaner (og uvaner) identifiseres og settes i system. Hvem vil være interessert i denne typen informasjon? Fellesnevneren i de to eksemplene over er at de benytter mønstergjenkjenning for å gi svarene gjennom at analyseresultatene knyttes sammen med annen informasjon. 6

7 Mønstergjenkjenning og forretningsanalyse Hva er mønstergjenkjenning? Mønstergjenkjenning er ingen ny vitenskap, men et vidtspennende forskningsfelt i akselererende vekst. I parallell med utvikling av datakapasiteten skjer det stadig nyvinning på metodesiden og tilnærmingen benyttes i dag på problemstillinger der datamengden er stor, har fravær på struktur, det mangler tilstrekkelig med treningsdata eller oppgavene er diffuse og vanskelige å gripe fatt i. Definisjoner Mønstergjenkjenning er et fag innen informatikk. Det innebærer at man skal lete gjennom en ofte stor datamengde, etter visse mønstre, og rapportere funn. Selve letingen innebærer at man aktiverer en algoritme på det aktuelle materiale, og med spesiell instruks om hvilke mønster som er av interesse. Funnrapporten vil vise hva som er funnet, hvor det opptrådte, og i hvilken grad funnet er relevant til det som var av interesse. Tidligere skjedde dette manuelt, men i dag vil datamaskiner være sentrale. Kilde: Wikipedia Det kognitive paradigmet Mange har beskrevet og utdypet teoriene rundt mønstergjenkjenning, ulike retninger og anbefalinger på tilnærminger. Bruk av klassifisering, mulighetsrommet som knyttes opp mot metoden samt de domene utfordringene, dvs. hva er egentlig det hensiktsmessig metodevalget, bør det benyttes en tilnærming basert på ledet eller ikke ledet læring? Flere har uttrykt at Dreyfus (Se Dreyfus og Dreyfus 1986) treffer på en forbilledlig og enkel måte der mønstergjenkjenning blir holdt opp mot det kognitive paradigmet eller det Dreyfus beskriver som ubevist informasjonsbehandling gjennom vår evne til raskt og effektivt å identifisere hva som er viktig og riktig. Det kognitive paradigmet - Ubevist informasjonsbehandling evnen til raskt og effektivt å identifisere hva som er viktig og riktig Dreyfus og Dreyfus 1986 Med dette i minnet er det lettere å forstå nøkkelbegrepet relevans og hvordan vi benytter dette i våre analytiske løsninger for mønstergjenkjenning. 7

8 Relevans risikojustert beslutning Vi skal nå se på begrepet relevans og hvordan vi benytter dette i kombinasjon med teorien rundt mønstergjenkjenning for å analysere problemstillingene. Problemstillingene har vi nedfelt i et sett med arbeidshypoteser relatert til mønsterinstruksen som vi ønsker å arbeide ut fra. Etterfølgende eksempel identifiserer en gruppe. Gruppen har på et valgt tidspunkt et aktivitetsnivå og alle medlemmene i gruppene har entydige og tilstrekkelig like attributter som identifiserer tilhørigheten og gruppe egenskapene. M.a.o. på et valgt tidspunkt er vi i stand til å identifisere verdiene av de parametere som på en entydig måte beskriver gruppen. Ole tilhører denne gruppen, men gjennom monitorering finner vi ut at på et gitt tidspunkt har imidlertid Ole et annet aktivitetsnivå og oppførsel enn sin gruppe. For å kunne fastlegge om dette er tilfeldig eller om vi her har identifisert et mønster benytter vi analyseteknikker basert på såkalt ikke-ledet metode (se senere beskrivelse). Metoden trenger m.a.o. ikke forholde seg til hva som er normalt eller unormalt, men kun til relevant aktivitetsnivå. Hvor gode prediksjoner vi oppnår er ofte styrt av hvordan vi klarer å benytte klassifisering og bygge profilene for å fastsette de antatt beste og entydige grupperingsparameterne. Figur 1 Fastsetting av aktivitetsnivå og oppførsel i gruppe og for individ 8

9 Figur 2 Identifisering av mulige mønstre Figur 3 Monitorering av relevans for å fastlegge mulige avvik ved hjelp av scoring Metoden krever at vi, for et valgt sett med faktorer, kan fastlegge hva som er relevante avvik og for hver av disse måle Ole opp mot gruppen. 9

10 Virksomhetsområder hvor mønstergjenkjenning med hell er benyttet I tabellen under er det listet eksempler på applikasjonsområder hvor mønstergjenkjenning med hell har vært benyttet både innenfor privat og offentlig virksomhet. Tabell 1, Eksempler på applikasjonsområder hvor mønstergjenkjenning har vært benyttet Identifisere individ eller hendelser blant mange Diagnostisere helsetilstand og sykdomsforløp Kvalitetskontroll i produksjon varer og tjenester Finne skjult tekst, tallkoder eller symboler Identifisere kundens handle- reaksjonsmønstre Ressursovervåkning og kapasitetsanalyser Avsløre svik, heleri, unndragelse eller annen økonomisk kriminalitet Kjennetegn på situasjoner hvor mønstergjenkjenning har fordeler i forhold til alternative metoder: Store transaksjonsvolumer Mønstrene er ikke kjente Utydelige og overlappende profiler på roller, objekter eller hendelser Små, usikre eller ingen treningsdata Omfattende eller usikker tuning for å luke falske positiver 10

11 Metode SAS Institute har prøvd ut et bredt sett med metoder for å angripe tematikken mønstergjenkjenning og har bl.a. høstet gode erfaringer ved å benytte modeller basert på metoden Ikke ledet læring og hvitlister for å identifisere mulige mønstre. Metoden har bl.a. vist seg å være effektiv innen bekjempelse av økonomisk kriminalitet, bl.a. på grunn av at den ikke forutsetter treningsdata, filtre eller forhåndsdefinerte regler. Resultatene fra kontrollerbar praktisk utprøving har vist at metoden er egnet og har robuste egenskaper for å identifisere både knytninger (bånd) og avvik (relevans) i datamaterialet samt å peke ut kandidater til skjulte mønstre. Etter å ha satt sammen data slik at vi kan se relasjonene mellom individer og hendelser benyttes spesialiserte analyseteknikker slik som assosiasjonsanalyse og clustering for å bygge dynamiske datastyrte regler. Disse reglene blir deretter benyttet for å vaske original data og dermed finne skjulte mønstre og driverne bak disse. Disse driverne er viktig og bør studeres for å forstå og analysere resultatene videre. I de tilfeller mønsteranalysene blir benyttet til å avsløre avvikene atferd (for eksempel kortsvindel eller lusking i persondata), kan overtredelser av regler risikoscores og rangeres for videre undersøkelser. En risikoscore vil i en slik sammenheng kunne si noe om alvorsgrad og sannsynligheten for faktisk misbruk av for eksempel tillit eller signaturrett. Tabell 2, to alternative strategier for mønsteranalyse Basert på ekspert beslutning (ledet læring) Beslutningen er representert i treningsdata Benytter historikk knyttet til oppførsel og mønstre Analysene bygger på både parameteriserte og ikke-parameteriserte metoder Metoden favner et stort utbud av modell alternativer inkl. glm, neurale nett, trealyser og logistisk regresjon Uten ekspert beslutning (ikke ledet læring) Beslutningen er ikke representert i treningsdata eller på annen måte ikke kjent Undersøker oppførsel for å finne uteliggere eller anormal oppførsel som avviker fra andre Benytter både univariate og multivariate teknikker for å finne avvik Metoden benyttet bl.a. clustering, prinsipalkomponenter, peer groups, s.o.m., assosiasjonsanalyse og trendanalyser 11

12 Tabell 3, Hovedelementene ved mønstergjenkjenning Mønstre og bånd Forutsetter ikke kjennskap til normal eller unormal beskrivelse Metoden plukker ut mulige mønstre og grad av knytning Mønstrene bobler opp fra data Hvitlister og scenarioer Assosiasjonsregler og clustering kan benyttes for å bygge hvitlister Hvitlistene vasker ut avvik Scenarioene scorer originaldata Triggere og scoring Risikovektingen gir informasjon om sannsynlighetsgrad på avvik Scoringsregler kan bestå av et sett med triggere med eller uten avhengigheter Analysemodeller Med metoden ikke ledet læring forsøker vi å finne ut hvordan data er organisert og hvilke egenskaper som kjennetegner data. Teorien bygger på mye av samme tenkningen som ligger bak tetthetsfunksjoner som beregner hvor sannsynlige ulike resultater er i forhold til hverandre. Til å gjennomføre dette benytter SAS analysemodeller som grupperer data og identifiserer mulige knytninger ut fra tilhørighet og fellestrekk. Her benytter vi bl.a. hybride analyseteknikker som kombinerer assosiasjonsanalyse - clustering med spesielle visualiseringsteknikker. På denne måten prøver vi å fastlegge hvor sterke bånd det faktisk er mellom individer, objekter eller hendelser. Ved å studere båndene vil vi kunne se avtrykk av mulige skjulte mønstre i datamaterialet. Det er denne prosessen som danner grunnlaget for å skape de endelige assosiasjonsreglene. For å visualisere og identifisere potensielle regler, benyttet vi forskjellige støtteteknikker som link analyse og multidimensjonale plott. Dette gir en god oversikt over relevante relasjoner mellom individ, roller og hendelser samtidig som vi får dannet oss bilde over sensitiviteten, dvs. innsikt i styrken i relasjonene? 12

13 Assosiasjoner - koblinger i mønstre Mønstergjenkjenningsprosessen må starte med at det besluttes en deteksjonsstrategi og en mønsterinstruks, dvs. hva skal systemet lete etter? Ut fra dette vurderes metodiske valg, alternative algoritmer og organisering av data. Figur 4 Mønstergjenkjenningsprosessen Assosiasjonsreglene danner basis for å fastlegge dynamiske hvitlister, dvs., de samhandlinger som i et risikojustert perspektiv ansees som normale mellom individ og hendelse. Hvitlistene utgjør stammen i det vi benevner scenarioer. Scenarioene er parameterbaserte definisjoner av hendelser som benyttes for å måle og beskrive mulige avvik. Hvert scenario kan bestå av en eller flere parametere. De enkelte parametere i scenarioet vil i den etterfølgende scoringsprosessen kunne risikovektes (baysiansk vekting og apriorisansynligheter). 13

14 Visualisering av regler og sensitivitet I figuren under er det vist linkanalyse som bl.a. benyttes for å videreføre resultatene fra assosiasjons-analysen eller clustering. Dette har vist seg å være en svært hensiktsmessig fremgangsmåte for å finne mulige assosiasjonsregler som kan bekrefte eller avkrefte listen av arbeidshypoteser. Et sentralt spørsmål i denne typen analyser vil være å fastlegge grad av relevans, dvs. hvor sterke er egentlig relasjonene (båndene). For å nærme oss slike problemstillinger benytter vi bl.a. sensitivitetsanalyser. Eksemplet under viser hvordan vi kan visualisere resultatene fra sensitivitetsanalysene. Denne typen analyser foretas ofte på normerte data, alternativt kan dette gjøres på fraksjoner, for eksempel 1. kvartil, median osv. Figur 5 Hvor sterke er assosiasjonene, dvs. båndene mellom individ eller hendelser? 14

15 Hvitlister og scenarioer Tabell 4, Hvitlister og scenarioer Hvitlister Valide assosiasjonsregler Danner stammen for parametersetting i scoringsprosess Scenarioer Parameterbaserte definisjoner av hendelser som beskriver mulige avvik Vasker originaldata Assosiasjonsreglene danner grunnlaget for å kunne fastlegge hvitlistene. Etter analysene vil hvitlistene gi en oversikt over av hva som kan være relevante knytninger mellom individ, objekter og hendelser og om det på et slikt grunnlag fremkommer mulige mønstre. Vi kan videre endre granuleringen i disse bildene ytterligere gjennom å bryte informasjonen ned på attributtene som bygger opp dimensjonene bak modellene, dvs. vi utnytter informasjonen som ligger i profilene som systemet har generert. Hvitlistene er videre basis for å sette opp scenarioene og de parametrene som bør benyttes. Scoring Når vi har besluttet hvilke scenarioer vi ønsker å benytte og fastlagt parametere, kan scenarioene benyttes i en scoringsprosess. En slik bearbeiding vil evaluere alle transaksjonene og beregne mulig avvik. En slik scoring som på mange måter kan betraktes som sluttproduktet av fra mønstergjenkjennings-prosessen vil for eksempel kunne si noe om: Hvilken rolle i virksomheten rammer produksjonen mest ved sykdom? Hvor finner vi de 3 viktigste sekvensielle enkelt hendelse som indikerer produksjonsstans i løpet av kommende 5 timer? Hva er de 2 viktigste indikasjonene på feilbehandling? I det store bilde i mønstergjenkjenningsprosessen utgjør scoringen m.a.o. endepunktet av analysene. Analysene satte opp reglene ved hjelp av hvitlister / scenarioene og scoringen systematiserte og vektet hvilke triggere som ble aktivisert for transaksjonene. 15

16 Mønstergjenkjenning Figur 6 Mønstergjenkjenningsprosessen fra metode og arbeidshypoteser til analyser og deteksjon 16

17 Utvalgte eksempler på bruksområder Lusking i pasientjournaler - misbruk av hjemler Det er flere utfordringer knyttet til personvern og elektronisk lagret informasjon, bl.a. misbruk av rettigheter og hjemler for oppslag i pasientjournaler (misbruk av tekniske tilganger utenfor hjemmel og oppslag gjennom normal tilgang såkalt aktualisering). Gjennom aktualisering (som er en rettighet) vil leger, sykepleiere, psykologer, fysioterapeuter, ergoterapeuter, sosionomer, logopeder, ernæringsfysiologer, yrkeshygienikere, pedagoger, vernepleiere og sekretærer ha tilgang til pasientjournalene for nåværende og tidligere innlagte pasienter i helseforetaket. Utfordringene ligger dermed i å gi tilgang til de som skal ha tilgang og samtidig detektere ulovlige tilganger. SAS har utviklet løsninger basert på avansert analyse og mønstergjenkjenning som kan brukes for å avsløre mulig misbruk av utvidede tekniske tilganger og samtidig unngå usikkerheter knyttet til om helseforetaket på forhånd i tilstrekkelig grad har lykkes i å definere hva som er unormalt eller ulovlig. Figur 7 Oppslag i helseinformasjon, mulige brudd på hjemler 17

18 Kredittkortsvindel Tyveri av kredittkort og sikkerhetskode er et økende problem. Med stjålet kredittkort forsøker tyven å bruke kortet på normal måte. Hva er så normal bruk av et gitt kredittkort? Det er nærliggende å koble dette til eieren og kombinasjonen av historikk, grenseverdier og aktivitetsnivå og lagre denne informasjonen spesifikt på kunden. Når tyven benytter kortet på flybussen og kjøper billett til kr 50 på en onsdag, vil denne bruken ikke matche mønsteret som er registrert på kunden både m.h.t. ukedag, brukersted og beløp. Vårt system kan initiere sperring av bruk og varsler servicesenteret som begrenser tapet. SAS benytter analysebaserte løsninger med rutiner for kontobelastning som bl.a. benytter neurale nettverks rutiner. For hver kombinasjon av kort eier vedlikeholder systemet dynamisk kundens bruksmønster. Forsøk på debitering screenes og scores i sanntid m.h.t. relevans og aktivitetsnivå. For kombinasjonen av alle korteiere og kort bygges profiler som ut fra et uendelig rom av dimensjoner beskriver relevant aktivitetsnivå og sekvenser. Således vil tyven med stor sannsynlighet bli stoppet dersom han ikke kjenner og har detaljkunnskap om brukerens vaner. Figur 8 Beregning av score for kortsvindel 18

19 Analyse av åpne kilder, sosiale nettverk, blogger SAS har lagt frem interessante resultater på bl.a. mistanke om skatteunndragelse, narkotika omsetning og innside handel kun basert på analyser av åpne kilder, dvs. blogger og sosiale nettverk. Det som gjør denne typen analyse utfordrende er at det meste av data kun finnes som ustrukturert tekst. Når vi gjennomfører mønstergjenkjenning på slike datakilder, må derfor informasjonen omformes fra tekst til tall. Til dette benyttes text mining, ontologi og automatisk innholdsklassifisering. Resultatene fra analysene gir bl.a. brukerne nettverks- og stjernediagrammer som viser relasjoner og samhandling mellom aktørene. Metoden benyttes bl.a. for å kartlegge mulige kriminelle nettverk, priskarteller eller hvordan penger flyttes mellom konti på tvers av finansielle institusjoner. Figur 9 Analyse av pengestrømmen i nettverk på tvers av hub er Automatisk markedsanalyser innen telekom og media (ICT) Alle telefonsamtaler har en ringer som forsøker å nå minst en mottaker via en eller flere noder i nettverket. Teleselskapene benytter i dag denne informasjonen bl.a. for å modellere signalering, mediastrøm og markedsklynger. M.a.o. i trafikkdata ligger mange av nøkkelene til produktutvikling. Ved hjelp av analysemodeller kan kundesentrisk modeller defineres hvor man fastlegger ringemønster og finner potensielle klynger. Nodene kan knytte disse resultatene bl.a. til geografisk informasjon. Klyngene danner basis for forretningsutvikling og identifisere fremtidige produkter som styrker båndene til leverandør på tjenestesiden og som strømlinjeutformes mot respondenten vha kampanjer. SAS har utviklet analysebaserte løsninger som bl.a. benytter link- og nettverksanalyse for å identifisere potensielle klynger m.a.o. ut fra ringemønster, og på basis av dette, legger opp de beste kundekampanjene. Datastrømmene styrer til enhver tid hvordan kampanjen rettes inn mot brukergruppene gjennom å dreie mot segmenter med best score, dvs. med størst inntjeningsmulighet for tjenesteleverandøren. 19

20 Varsling av forutsigbart hendelsesforløp Mange hendelser kan forutses hvis man har tilgang til kvalitative datastrømmer som kan modellere et fenomen eller fremskrive når en trend mest sannsynlig vil bevege seg utenfor vedtatte grenseverdier (toleranser). Slike modeller grupperes ofte i såkalte avviksbaserte, trendbaserte og hendelsesbaserte modeller. I en avviksbasert modell forsøker vi å tilpasse en teoretisk modell til empiriske resultater, dvs. data fra observerte prosesser. I en trendbasert modell studerer vi tendenser og trender i et kortere eller lengre tidsperspektiv. Utfordringene med slike modeller er ofte å fastlegge riktig oppløsning på tidslinjen. Hendelsesbaserte modeller analyserer diskrete hendelser og deres betydning for prosessen. SAS har analysebaserte løsninger som dekker alle disse gruppene. Figuren under viser et eksempel fra hendelsesbasert modellering. Loggedata er her hentet fra tidsserie ved boring offshore. Hendelsene A1, A2 og A3 eksemplifiserer diskrete hendelser som ble benyttet til å forutsi stans i boringen T. SAS har gjennomført flere prosjekter som har prøvd ut operasjonaliseringen av slike varslingsmodeller. Forretningsfokus er ofte rettet mot det tidsvinduet analysen gir operatøren slik at han proaktivt kan gripe inn i prosessene og forhindre stans eller havari i boreutstyret. Figur 10 Analyse av diskrete hendelser for å forhindre uønsket situasjon 20

21 Løsningsplattform og hovedkomponenter Løsningen for mønstergjenkjenning består av 3 hovedkomponenter som integreres mot brukers produksjon, fagsystemer og databaser. Løsningen analyserer transaksjoner og leverer resultatene tilbake i kundens infrastruktur ved hjelp av SAS plattformen og standardiserte grensesnitt. Figur 11 Løsningsplattform for mønstergjenkjenning Flyten i mønstergjenkjenningsprosessen styres på overordnet nivå gjennom 3 delprosesser. Disse er bygget opp av en rekke tjenester som også kan knyttes sammen i en spesifikk valgt tjenesteorientering hvis brukeren har preferanser på egen SOA/Web Service plattform. Plattformen støtter alle vanlige midleware, databaser og integrasjonsbusser. 21

22 Dataintegrasjon Knytter sammen systemer, databaser og datakilder, vasker data og gjennomfører transformasjoner. Del prosessen klargjør analysegrunnlaget, dvs. operasjonalisering av metodevalgene og analyseoppsett samt generering av metadata for videre prosesstøtte. Analyse Består av en rekke tjenester. Transaksjonene kjøres gjennom scenarioer. Hver forekomst risikoscores mht. at det kan være et avvik fra arbeidshypotesene. Analyseprosessen ivaretar videre opparbeiding av hvitlister og administrerer og drifter scenarioene. Oppfølging Analysetjenestene inneholder modellene, hvitliste sammenstillingene, scoring, vekting og konsolidering av resultater hvor det genseres rapporter, benchmarks og auditing data. Disse benyttes bl.a. som underlag for videre oppfølging og med grensesnitt mot kundens interne systemer. Figur 12 Flyt i prosessene mønstergjenkjenning 22

23 SAS Institute Inc. World Headquarters To contact your local SAS office, please visit: SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. indicates USA registration. Other brand and product names are trademarks of their respective companies. Copyright 2008, SAS Institute Inc. All rights reserved _

Big data bidrar til utvikling i norsk næringsliv

Big data bidrar til utvikling i norsk næringsliv DENNE TEMAAVISEN ER EN ANNONSE FRA MEDIAPLANET Det handler om hvor god du har lyst til å bli LES MER PÅ NETT! WWW.BEDRIFTSØKONOMINORGE.NO Nr 10 DESEMBER 2014 BUSINESS INTELLIGENCE FOTO: TOM EGIL JENSEN

Detaljer

NUMMER 2 2014 NORGES MARKEDSANALYSEFORENING TEMA: Marketing analytics BRANSJENYTT FAGLIG TEKNOLOGI NYTT FRA NMF JOBB&KARRIERE

NUMMER 2 2014 NORGES MARKEDSANALYSEFORENING TEMA: Marketing analytics BRANSJENYTT FAGLIG TEKNOLOGI NYTT FRA NMF JOBB&KARRIERE NUMMER 2 2014 NORGES MARKEDSANALYSEFORENING TEMA: Marketing analytics BRANSJENYTT FAGLIG TEKNOLOGI NYTT FRA NMF JOBB&KARRIERE Fire veier til vekst # 4 Ekspandere i nye markeder Med tilstedeværelse i 88

Detaljer

Servicekvalitet og påvirkning av. Kundens lojalitet. Bachelor 2012

Servicekvalitet og påvirkning av. Kundens lojalitet. Bachelor 2012 2012 Bachelor 2012 Servicekvalitet og påvirkning av Kundens lojalitet Bacheloroppgave 2012 3.år Hotell og relasjonsledelse ved Markedshøyskolen Denne bacheloroppgaven ble utarbeidet av: 979525 979532 Denne

Detaljer

Hvilke muligheter har regnskapsbyråer til å bli rådgivere i SMB-sektoren?

Hvilke muligheter har regnskapsbyråer til å bli rådgivere i SMB-sektoren? Hvilke muligheter har regnskapsbyråer til å bli rådgivere i SMB-sektoren? av Anita E. Tobiassen Paul N. Gooderham SNF-prosjekt nr. 6300: Økt verdiskapning i SMB-sektoren: styrking av påvirkningen fra autoriserte

Detaljer

God praksis for å hindre. eksterne misligheter

God praksis for å hindre. eksterne misligheter Fédération des Experts Comptables Européens God praksis for å hindre eksterne misligheter November 2005 Et notat fra FEEs Public Sector Committee (FEEs komité for offentlig sektor) Oversatt til norsk i

Detaljer

Hvordan anvender ledere i ulike organisasjoner ulik ledelsesatferd på bakgrunn av organisasjonens kontekst?

Hvordan anvender ledere i ulike organisasjoner ulik ledelsesatferd på bakgrunn av organisasjonens kontekst? Institutt for sosiologi, statsvitenskap og samfunnsplanlegging Fakultet for humaniora, samfunnsvitenskap og lærerutdanning Hvordan anvender ledere i ulike organisasjoner ulik ledelsesatferd på bakgrunn

Detaljer

Innovasjon i Møre og Romsdal R-02

Innovasjon i Møre og Romsdal R-02 Innovasjon i Møre og Romsdal R-02 2000 http://www.step.no/ Redaktør for seriene: Editor for the series: Dr. Philos. Finn Ørstavik (1998-2000) Stiftelsen STEP 2000 Henvendelser om tillatelse til oversettelse,

Detaljer

En veiledning. Sikkerhets- og beredskapstiltak mot terrorhandlinger

En veiledning. Sikkerhets- og beredskapstiltak mot terrorhandlinger En veiledning Sikkerhets- og beredskapstiltak mot terrorhandlinger Utgitt av Nasjonal sikkerhetsmyndighet, Politidirektoratet og Politiets sikkerhetstjeneste Sikkerhetsråd 01 Gjennomfør en risikovurdering

Detaljer

BEHOVSDREVET INNOVASJON

BEHOVSDREVET INNOVASJON BEHOVSDREVET INNOVASJON 10 steg til innovasjon i helsesektoren Innhold 3 Introduksjon... 4 Hvem er dette ment for? 6 Hvorfor behovsdrevet innovasjon? 7 Dimensjoner innen behovsdrevet innovasjon 8 Ulike

Detaljer

Utforsking av potensielle tiltak og tariffer for å redusere effekttopper i strømnettet ved innføring av AMS

Utforsking av potensielle tiltak og tariffer for å redusere effekttopper i strømnettet ved innføring av AMS Utforsking av potensielle tiltak og tariffer for å redusere effekttopper i strømnettet ved innføring av AMS Landsby 7, gruppe 2 30. april 2014 Prosjektrapport TET4850 - Eksperterter i Team NTNU Sammendrag

Detaljer

Mørketallsundersøkelsen - Informasjonssikkerhet og datakriminalitet

Mørketallsundersøkelsen - Informasjonssikkerhet og datakriminalitet 2012 Mørketallsundersøkelsen - Informasjonssikkerhet og datakriminalitet Innhold 1 Innledning 3 2 Trusselen 4 2.1 Vurdering fra Norman 4 2.2 Vurdering fra Statoil 6 2.3 Vurdering fra NSM 6 3 Hovedfunn

Detaljer

Tittel: Entreprenørskap - Hva er hovedutfordringene ved oppstart av bedrift og hvordan har suksessfulle entreprenører løst dem?

Tittel: Entreprenørskap - Hva er hovedutfordringene ved oppstart av bedrift og hvordan har suksessfulle entreprenører løst dem? Tittel: Entreprenørskap - Hva er hovedutfordringene ved oppstart av bedrift og hvordan har suksessfulle entreprenører løst dem? Skrevet av: Thomas Konradsen Emnekode: BE320E. MBA HHB Tromsø. Innholdsfortegnelse...

Detaljer

En vanlig dag på jobb

En vanlig dag på jobb En vanlig dag på jobb Arbeidshverdagens elektroniske spor Oktober 2012 Hva registreres om deg i løpet av en vanlig arbeidsdag? Kan hele arbeidsdagen rekonstrueres ned til minste detalj og minutt for minutt?

Detaljer

Medieinvesteringens effekt

Medieinvesteringens effekt Medieinvesteringens effekt Er det en klar positiv sammenheng mellom bedrifters medieinvesteringer og deres inntrykk i befolkningen? Ragnhild S. T. Kræmer Masteroppgave i Ledelse og Organisasjonsvitenskap

Detaljer

Organisasjonstenkning i rapporten fra 22. juli-kommisjonen

Organisasjonstenkning i rapporten fra 22. juli-kommisjonen Organisasjonstenkning i rapporten fra 22. juli-kommisjonen Siri Flesjø Masteroppgave ved Institutt for statsvitenskap, Det samfunnsvitenskapelige fakultet UNIVERSITETET I OSLO Antall ord: 28 836 Mai 2013

Detaljer

Entreprenørskap i et evolusjonært perspektiv

Entreprenørskap i et evolusjonært perspektiv ARBEIDSNOTAT 19/2005 Olav R. Spilling Entreprenørskap i et evolusjonært perspektiv NIFU STEP Norsk institutt for studier av forskning og utdanning / Senter for innovasjonsforskning Hegdehaugsveien 31,

Detaljer

O R G A N F O R N O R S K A R K I V R Å D

O R G A N F O R N O R S K A R K I V R Å D A RKIVRÅD O R G A N F O R N O R S K A R K I V R Å D 1 / 1 4 Funksjonsbasert klassifikasjon Arkivering fra sosiale medier Arkivar og nyutdannet Standardisert arkivdanning gir forretningsverdi Beredskap

Detaljer

Å anskaffe en CRM-løsning

Å anskaffe en CRM-løsning Evaluering av IT-systemer 2009 Å anskaffe en CRM-løsning av Kåre Sorteberg August 2009 1 Innhold Innledning... 3 Kort om CRM... 3 Hva er CRM?... 3 Både kunde og leverandør må oppnå fordeler.... 3 Utfordringene

Detaljer

Ulik avviksrapportering et lederspørsmål?

Ulik avviksrapportering et lederspørsmål? Ulik avviksrapportering et lederspørsmål? Masteroppgave i Endringsledelse Samfunnsvitenskapelig fakultet Universitetet i Stavanger Høsten 2014 Gunn Laila Dahlseng Hope 1 UNIVERSITETET I STAVANGER MASTERGRADSSTUDIUM

Detaljer

Veileder. Håndbok for samfunnsøkonomiske analyser

Veileder. Håndbok for samfunnsøkonomiske analyser Veileder Håndbok for samfunnsøkonomiske analyser 2 SSØ 10/2010, 1. opplag 1500 eks. Forord Det er viktig at statlige tiltak er velbegrunnede og gjennomtenkte. Samfunnsøkonomisk analyse er en metode for

Detaljer

Evaluering av handlingsplaner for Holdninger, Etikk og Ledelse (HEL) i forsvarssektoren. EY Oslo, 01.04.2014

Evaluering av handlingsplaner for Holdninger, Etikk og Ledelse (HEL) i forsvarssektoren. EY Oslo, 01.04.2014 Evaluering av handlingsplaner for Holdninger, Etikk og Ledelse (HEL) i forsvarssektoren EY Oslo, 01.04.2014 Ordsky på forsiden er laget basert på tekstsvar fra spørreundersøkelse utsendt til utvalgte respondenter

Detaljer

Hvordan lykkes med utviklingen av digital kompetanse i videregående skole? Oppsummering av ITUs inspirasjonsseminar for skoleledere

Hvordan lykkes med utviklingen av digital kompetanse i videregående skole? Oppsummering av ITUs inspirasjonsseminar for skoleledere Hvordan lykkes med utviklingen av digital kompetanse i videregående skole? Oppsummering av ITUs inspirasjonsseminar for skoleledere 1 Forord ITU gjennomførte høsten 2008 en serie inspirasjonsseminarer

Detaljer

Temautredning Kunnskap og innovasjon

Temautredning Kunnskap og innovasjon Petter Westnes Temautredning Kunnskap og innovasjon Arbeidsnotat IRIS - 2008/019 Prosjektnummer: 7252196 Prosjektets tittel: Oppdragsgiver(e): Kampen om arbeidskraften: Arbeidsmarkeds- og kompetansescenarier

Detaljer

Skal jeg bli eller skal jeg gå?

Skal jeg bli eller skal jeg gå? Skal jeg bli eller skal jeg gå? Hva motiverer arbeidstakere til å ville slutte i jobben sin, og hva baserer de den endelige avgjørelsen på? En studie av kjerneområdene i StatoilHydros forretningsområde

Detaljer

En kvalitativ studie av utvalgte bedrifters forhold til sosiale medier

En kvalitativ studie av utvalgte bedrifters forhold til sosiale medier Carin Pettersson Kristin Svendsen Prosjektoppgave ved Handelshøyskolen BI En kvalitativ studie av utvalgte bedrifters forhold til sosiale medier Eksamenskode og navn: MAN 29281 Flermedial ledelse Utleveringsdato:

Detaljer

KONSEKVENSER FOR FORVALTNINGEN AV PETROLEUMSFONDET DERSOM SPESIELLE MILJØHENSYN BLIR LAGT TIL GRUNN VED VALG AV INVESTERINGSSTRATEGI

KONSEKVENSER FOR FORVALTNINGEN AV PETROLEUMSFONDET DERSOM SPESIELLE MILJØHENSYN BLIR LAGT TIL GRUNN VED VALG AV INVESTERINGSSTRATEGI KONSEKVENSER FOR FORVALTNINGEN AV PETROLEUMSFONDET DERSOM SPESIELLE MILJØHENSYN BLIR LAGT TIL GRUNN VED VALG AV INVESTERINGSSTRATEGI Brev fra Norges Bank til Finansdepartementet 16. mars 1999 1. Innledning

Detaljer

KARTLEGGING AV SKOLENES FORHOLD TIL «BRING YOUR OWN DEVICE»

KARTLEGGING AV SKOLENES FORHOLD TIL «BRING YOUR OWN DEVICE» KARTLEGGING AV SKOLENES FORHOLD TIL «BRING YOUR OWN DEVICE» Beregnet til Senter for IKT i utdanningen Dokumenttype Rapport, versjon 1.1 Dato 1. mars 2013 SENTER FOR IKT I UTDANNINGEN KARTLEGGING AV SKOLENES

Detaljer

Flere hoder tenker bedre enn ett. Rapport fra et prosjekt der en prøver ut noen utvalgte læringsstrategier for elever med AD/HD

Flere hoder tenker bedre enn ett. Rapport fra et prosjekt der en prøver ut noen utvalgte læringsstrategier for elever med AD/HD Flere hoder tenker bedre enn ett Rapport fra et prosjekt der en prøver ut noen utvalgte læringsstrategier for elever med AD/HD Grete Hoven Anne Lise Angen Rye STATPED SKRIFTSERIE NR. 30, Trøndelag kompetansesenter,

Detaljer

EVALUERING AV PROSJEKTET NETTBASERT KARRIEREVEILEDNING

EVALUERING AV PROSJEKTET NETTBASERT KARRIEREVEILEDNING EVALUERING AV PROSJEKTET NETTBASERT KARRIEREVEILEDNING Senter for IKT i utdanningen skal bidra til at IKT bidrar til økt kvalitet i utdanningen og bedre læringsutbytte og læringsstrategier for barn i barnehagene,

Detaljer