Hva er Big Data og hva kan det brukes til? Chronos seminar 16.6.2014 Prof II Høgskolen i Narvik og rådgiver Chronos AS Bernt A.



Like dokumenter
KUNNSKAP GJENNOM DATA

Digital Grid: Powering the future of utilities

Digital Transformasjon

Hva legges i begrepet Big Data Hvilke muligheter eller betydning vil dette ha for den enkelte virksomhet Bruksområder Oppsummering. Arild S.

Alt-i-en-boks. Et konsept for integrasjon i hjemmet og veien til nye forretningsmodeller

Social Media Insight

Slope-Intercept Formula

SAK- & PORTALDAGENE 2018

Analyse av kundeavgang IBM Watson Content Analytics. Oslo, 19. november, 2015 Mons Nørve, Capgemini

KUNSTEN Å VITE DATA SOM KILDE TIL INNSIKT DFDS PEARL SEAWAYS 11. JUNI 2015 BERNT BREMDAL, PROF II - HIN, RÅDGIVER

Retail Property 2015 NETTHANDEL JA TAKK

Robotene kommer - Introduksjon om RPA og AI

Bostøttesamling

Information search for the research protocol in IIC/IID

2A September 23, 2005 SPECIAL SECTION TO IN BUSINESS LAS VEGAS

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

GEO231 Teorier om migrasjon og utvikling

TDT4117 Information Retrieval - Autumn 2014

Utvikling av skills for å møte fremtidens behov. Janicke Rasmussen, PhD Dean Master Tel

Hvordan ser pasientene oss?

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Endringer i ISO-standarder

GeWare: A data warehouse for gene expression analysis

"Alle" snakker om BI men er det blitt allemannseie? Lars- Roar Masdal Daglig leder

Enkel og effektiv brukertesting. Ida Aalen LOAD september 2017

NVE Rammevilkår for smartgrid

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

PATIENCE TÅLMODIGHET. Is the ability to wait for something. Det trenger vi når vi må vente på noe

Familieeide selskaper - Kjennetegn - Styrker og utfordringer - Vekst og nyskapning i harmoni med tradisjoner

Juridiske aspekter ved publisering i åpne institusjonelle arkiv

Gir vi IKT-kandidatene egnet kompetanse for fremtiden? Morten Dæhlen Dekan

Den som gjør godt, er av Gud (Multilingual Edition)

Forecast Methodology September LightCounting Market Research Notes

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

Futurisme som metode. hvordan forstå digitale forretningsmodeller

Issues and challenges in compilation of activity accounts

FIRST LEGO League. Härnösand 2012

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Neural Network. Sensors Sorter

TEKSTER PH.D.-KANDIDATER FREMDRIFTSRAPPORTERING

Tradisjonelt har næringslivet gruppert sin verdiskapning i 3 distinkte modeller:

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

PARABOLSPEIL. Still deg bak krysset

Barbara Wasson, Director. NIFU Workshop on Learning Analytics 25 May 2016

Hvordan føre reiseregninger i Unit4 Business World Forfatter:

Hvordan kvalitetssikre åpne tidsskrift?

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

... Annita Fjuk DESIGN THINKING

Copyright 2010, SAS Institute Inc. All rights reserved.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Nettnøytralitet - regulering på jakt etter markedssvikt. Bjørn Hansen, Telenor Research Nettnøytralitetsforum 27. november 2014

Forelesning 1 Joachim Thøgersen

Big Data. Dataforeningen, 13. februar 2013 Ove Skåra, informasjonsdirektør

The CRM Accelerator. USUS February 2017

Kan vi forutse svindel? Eric Mandeville Capgemini Norge AS

Algeseminar Val. 23. November Vigdis Tuseth, Innovasjon Norge Trøndelag

Hva er arketyper, og hvilken betydning får de i fremtiden? Gustav Bellika Institutt for Informatikk, UIT gustav@cs.uit.no

FASMED. Tirsdag 21.april 2015

Elektronisk fakturering mellom bedrifter

EXAM TTM4128 SERVICE AND RESOURCE MANAGEMENT EKSAM I TTM4128 TJENESTE- OG RESSURSADMINISTRASJON

Emneevaluering GEOV272 V17

TDT4300 Datavarehus og datagruvedri3, Våren 2014

GEO326 Geografiske perspektiv på mat

Trigonometric Substitution

SINTEF Energiforskning AS 1. Implementering av Internett- baserte løsninger l kraftbransjen: Veien til Smart Energi

Presentation Title Date Copyright Capgemini All Rights Reserved

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

Samlede Skrifter PDF. ==>Download: Samlede Skrifter PDF ebook

Eksamensoppgaver til SOSANT1101. Regional etnografi: jordens folk og kulturelt mangfold. Utsatt skoleeksamen 12. desember 2013 kl.

Rolf Michael Odland Leder for Innovasjon & HMSK Boreal Transport Norge AS

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

Brukbar branding Veslemøy Holt Tord F Paulsen

Bedre innsikt og raskere beslutninger SMART BRUK AV DATA

// PRESENTASJONER FRA NJAVA

Rapporterer norske selskaper integrert?

MANGFOLDSLEDELSE I BYGGENÆRINGEN UTVALGTE FUNN FRA FORSKNINGSRAPPORTEN «FLERKULTURELLE ARBEIDSPLASSER I BYGGENÆRINGEN»

STILLAS - STANDARD FORSLAG FRA SEF TIL NY STILLAS - STANDARD

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

eoperasjoner OMS oppgaver

Flest nordmenn ferierte i eget land i 2013, mens 84 prosent av befolkningen også var på utenlandsreise

Mats Lyngstad Account Manager Facebook Norge

VELKOMMEN TIL WHAT S HOT #EVRYWHATSHOT

Tilbakemelding: Hvilken tur var du på / land? Gourmeridetur/Danmark Hvilken dato? oktober Hvordan vil du beskrive din rideferie generelt?

Arts Audiences: insight

Hva skjer med jobbene?

Prosjektet Digital kontaktinformasjon og fullmakter for virksomheter Digital contact information and mandates for entities

Hva er et Prosjekt? NVivo ikke bare koding. Noen sentrale komponenter i NVivo, ord og uttrykk m.m.

Samle inn eller samhandle om statistiske data?

buildingsmart Norge seminar Gardermoen 2. september 2010 IFD sett i sammenheng med BIM og varedata

Digital eller digitull?

Erfaringer med smidige metoder på store prosjekter i Telenor. Kristoffer Kvam, Strategic Project Manager, Portfolio & Projects, Telenor Norway

Praktiske løsninger med Microsoft Power BI. CIO Forum Analytics Paul Andreas Osuldsen

Utfordringer for fripoliser med lavt rentenivå og nye kapitalkrav

Digitalt lederskap i global konkurranse. - mulig for norsk

Supply chain management

«Big data» som verktøy. Hans Petter Aalmo Head of web and mobile, Visit Norway

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Senter for IKT i utdanningen. Interaktive tavler - endringer i klasserommet?

Transkript:

Hva er Big Data og hva kan det brukes til? Chronos seminar 16.6.2014 Prof II Høgskolen i Narvik og rådgiver Chronos AS Bernt A. Bremdal

Fanger og samler data fra ulike kilder Registrerer endringer Systematiserer ANALYSE AV INFORMASJON SKAPER MERVERDI

V1 = Volume (Volum) Store mengder data V2 = Variety (Variasjon) Forskjellige datatyper, strukturert, semi-strukturert, ustrukturert Fordelt på ulike kilder både innenfor og utenfor egn organisasjon V3 = Velocity (Hastighet) Konstant akkumulering av data.. V4 = Vision (Visjon) Virksomhetsorientert målsetting og plan V5 = Verification (Konformitet) Sikre samsvar med spesifikasjoner for kvalitet V6 = Validation (Målsikring) Sikre samsvar med målsetting og plan Chronos

SD adresserer et spesifikt spørsmål datainnsamlingen designes deretter SD benytter typisk strukturerte data SD data er bearbeidet for en bestemt hensikt fra start SD har stort sett kontroll på alle kilder BD er målorientert, men fleksibel BD er i stor grad basert på datamengder akkumulert for andre formål enn analyse BD er ikke orientert rundt et spesifikt analysespørsmål, men mange som også ikke nødvendigvis er stilt enda BD må håndtere ustrukturerte data BD er spredd rundt i det digitale rommet BD har liten/ingen kontroll med kildene

Uavhengighet Desentralisering Mangfold Den svake stemmen Big Data og uavhengighet

Hvis du spør en stor nok gruppe bestående av ulike, uavhengige mennesker om å gjette eller estimere en sannsynlighet og dermed beregne det enkle gjennomsnittet av svarene vil dette som regel bli mer nøyaktig enn det forslaget til selv de beste eksperter. Enkelt sagt bidrar hvert individ med informajon og unøyaktigheter basert på sitt spesifikke verdensperspektkiv. Hvis alle forholder seg til det samme problemet forsterkes den samlede informasjonen og feilene kanseleres ut. Dette forutsetter at gruppen som helhet ikke blir påvirket av en ensidig kilde.

Ask a hundred people to answer a question or solve a problem, and the average answer will often be at least as good as the answer of the smartest member. With most things, the average is mediocrity. With decisionmaking, it s often excellence. You could say it s as if we ve been programmed to be collectively smart. James Surowiecki in Wisdom of Crowds Google surveying three billion Web pages and finding the right page quickly is built on the wisdom of crowds. The more people that have linked to a page, the more influence that page has on the final decision Sergey Brin and Lawrence Page

Big Data støtter de store talls lover Big Data støtter opinionsanking fra mange mennesker/kilder Big Data skiller bedre mellom mening og «hvit støy» Tilfeldigheter og feil blir undertrykt Big Data er morgendagens beslutningsplattform

Strukturere det ustrukturerte Identifikasjon og de-indentifikasjon Ontologier og semantikk Introspeksjon Dataobjekter må kunne beskrive seg selv Dataintegrasjon og SW interoperabilitet Uforanderlighet og udødelighet Måle og analysere Visualisere

Data fusion Samle og kople datakilder og data og søke etter møsnter og tendenser «Finn nåla i høystakken» Crowdsourcing Mobilisere mennesker for å respondere på kildeinformasjon eller andre signaler for prediksjon og/eller beslutningssstøtte Mønster og tendenser Ensemble Models Samle og kople ulike dataprosesseringsmodeller (beregningsprogram) «A bag of models» og lage en syntese av resultatet ved hjelp av CS teknikker

Statistikk Freksvensanalyse Enkle regresjoner Autoregressive integrated moving average (ARIMA) Kollaborativ filtrering Multi-variat analyse Multi-variable regresjoner Singular Value Dcomposition (SVD) Prinsipal komponentanalyse (PCA) Business intelligence OLAP Maskinlæring Swarm intelligence Reinforcement learning Neural Networks Reglelbasert induksjon Genetiske algoritmer Data mining Mean-variance analysis K-means clustering Text mining & search Key term extraction Inverted frequency analysis Manhattten clustering Latent semantic analysis Parafac2 Corpoorum Operasjonsanalyse Lineær programmering Dynamisk programmering Stokastisk programmering Knowledge management

El-bransjen i stor endring - Utnyttelse av ny teknologi Kapitalisering på investering i smarte målere/ams infrastruktur Utvikling av energi og nettprodukter for: Bedre utnyttelse av nettet Økt energieffektivitet i hele systemet Økt segmentering og kundetilpasning for utvikling av høymargintilbud Tids og geo-swapping Aktuelt case: BD arbeid kan spare 60-100 mill NOK og reformere dagens praksis for energisalg Chronos

1. Fungerer som en effektiv sensor for bruker og andre 2. Gir økt gjennomsiktighet i distribusjonsnett og sluttbrukerledd «Alle får smarte målere innen 1.1.2019»

51,8 mill records Energiforbruket sammen med pengebruk utgjør det mest grunnleggende fotavtrykket som vår livsførsel gir

«Footprint» forbruksprofiler ulike segmenter Add subtitle Profil Sommerhytte Profil Husholdning Add subtitle Profil Næring/kontor Metoder: Cluster analyse Prinsipal Component Analyse

17000 16500 16000 15500 15000 14500 MW 22/3/13 14000 13500 13000 12500

kw 25000 20000 15000 10000 5000 Maks nettkapasitet Innmating 22.3.2013 100% Hjemmelading 6,6 kw 100% Hjemmelading 3,3 kw 100% Nødlading 2,3 kw 50% Hjemmelading 6,6 kw 50% Hjemmelading 3,3 kw 50% Nødlading 2,3 kw 10% Hjemmelading 6,6 kw 10% Hjemmelading 3,3 kw 10% Nødladning 2,3 0

Light Moisture Movement Radio unit Sound Antall verdier: 27 millioner Metode: PCA, regresjoner og nevrale nett

ENØK og energieffektivisering Utvikling og utnyttelse av ny teknologi Behov for kostnadskutt og reduksjon/eliminasjon av oljefyr Mer intelligent styring Kostnadskutt Økt samspill med netteier og leietaker Aktuelt case: Årlig reduksjon i strømutgifter på 400.000 kroner mulig for ett bygg Salg av «fleksibilitet» som tilsvarer morgenrushet i nettet tilsvarende 800 eneboliger Chronos

Nedbrytning av profiler: De ulike kursene i time 11 i desember desember 2012

PC2 Temp inne Temp ute Kurs-4 Kurs-3 Kurs-2 Kurs-1 PC1

Hente ut statistikk Skjema skjuler en ontologi Kople flere kilder Enkel text mining Business Cases: Samkjøring av HMS statistikk i stort industriselskap Risiko awareness i oljeselskap Verdi 3,4 milliarder kroner Bernt A. Bremdal

Hovedkatalog Navn Tekst Antall forsøk Publisering Bernt A. Bremdal

Antall: 1,2 millioner forskjellige mediasider Metode: semantisk analyse, cluster analyse og enkel statistikk

Behov for å kartlegge reklamekampanjers effekt Vurdering av gjennomslagsevne og potensiell påvirkningskraft Vurdering av potensiell «pick-up» rate og kjøpsrespons Innhenting av tilbakemeldinger på prototyper eller demoversjoner Aktuelt case: Motorola Penetrasjonsevnen for produktnyheter var uventet lav Oppdaget at egne mediatiltak finansierte og skapte god PR for konkurrenter Atkins Oppdaget at en liten lobby produserte gjennomgående, negativ omtale Chronos

Motorola T720 9% Motorola V60 6% Motorola V60p 6% Motorola V400 3% Motorola C343 3% Motorola 120 Motorola V70 Motorola V300 Motorola T720 Motorola V60 Motorola V60p Motorola V400 Motorola C343 Motorola V300 12% Motorola 120 46% Motorola V70 15%

Meta-data ekstraksjon Source Document Sammendrag

Pre-process Screen meta-data Theme Classification Mode classification Positive/ negative Influence Classification Extract important messages Combine and report

Divide into subsets based on company references in documents How much publicity on companies in the US? Redefined as: What is companies reporting frequency in US media? Statistics can be easily refined on the corpus using CORPORUM # articles on the several companies motorola 32% nokia 43% siemens 14% sony ericsson 11%

Chronos

Følge ulike tråder i en sak hvor flere SH er involvert Hvem sier og skriver hva til enhver tid? Analyse av relasjoner Kartlegging av innflytelsessfærer Business case: Anti-svindel forsikring 80 millioner spart på tre tilfeller

Vollviks formueutvikling 2005 0 2006 5 234 023 2007 35 529 614 2008 0 2009 6 530 180 2010 0 Events detected can be added to a calendar Histogram shows corresponding numerical data (i.e. Revenue volume, assets, sales etc.)

Følge med på konkurrenters eller «stakeholders» hjemmesider og sosiale media Sanntidsanalyse av pris, ønsker, kommentarer etc. Rask posisjonering Kopling til bestillings- og servicesystem Business case: Prisovervåkning Kampanjestyring/segmentering

Modell Fabrikant Laveste pris? Pris Størrelse Tillegg 800 600 400 200 0 Antall menn Antall kvinner Mest populære produkt?

Chronos