KUNNSKAP GJENNOM DATA



Like dokumenter
Hva er Big Data og hva kan det brukes til? Chronos seminar Prof II Høgskolen i Narvik og rådgiver Chronos AS Bernt A.

Hva legges i begrepet Big Data Hvilke muligheter eller betydning vil dette ha for den enkelte virksomhet Bruksområder Oppsummering. Arild S.

Alt-i-en-boks. Et konsept for integrasjon i hjemmet og veien til nye forretningsmodeller

SAK- & PORTALDAGENE 2018

Digital Grid: Powering the future of utilities

Social Media Insight

Digital Transformasjon

Information search for the research protocol in IIC/IID

Slope-Intercept Formula

TDT4117 Information Retrieval - Autumn 2014

Retail Property 2015 NETTHANDEL JA TAKK

Analyse av kundeavgang IBM Watson Content Analytics. Oslo, 19. november, 2015 Mons Nørve, Capgemini

Big Data. Dataforeningen, 13. februar 2013 Ove Skåra, informasjonsdirektør

NVE Rammevilkår for smartgrid

Sosial og digital kommunikasjon. En strategisk tilnærming for deltagelse i nettsamtalen

Utvikling av skills for å møte fremtidens behov. Janicke Rasmussen, PhD Dean Master Tel

KUNSTEN Å VITE DATA SOM KILDE TIL INNSIKT DFDS PEARL SEAWAYS 11. JUNI 2015 BERNT BREMDAL, PROF II - HIN, RÅDGIVER

Bostøttesamling

2A September 23, 2005 SPECIAL SECTION TO IN BUSINESS LAS VEGAS

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

Praktisk info. Tidsramme Pause Toalett 1 til 1-veiledning Spør undervegs! Deltagerskjema

BIGDATA CHRONOS THON CONFERENCE, VIKA ATRIUM 16. JUNI 2014 ESPEN REMMAN

Robotene kommer - Introduksjon om RPA og AI

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Hvordan forberede seg til en datatsunami?

Den som gjør godt, er av Gud (Multilingual Edition)

Juridiske aspekter ved publisering i åpne institusjonelle arkiv

Måling med kvalitative metoder Fra et psykologisk perspektiv.

"Alle" snakker om BI men er det blitt allemannseie? Lars- Roar Masdal Daglig leder

Barbara Wasson, Director. NIFU Workshop on Learning Analytics 25 May 2016

The CRM Accelerator. USUS February 2017

Nettnøytralitet - regulering på jakt etter markedssvikt. Bjørn Hansen, Telenor Research Nettnøytralitetsforum 27. november 2014

Hva er arketyper, og hvilken betydning får de i fremtiden? Gustav Bellika Institutt for Informatikk, UIT gustav@cs.uit.no

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

GEO231 Teorier om migrasjon og utvikling

Neural Network. Sensors Sorter

Gir vi IKT-kandidatene egnet kompetanse for fremtiden? Morten Dæhlen Dekan

Hvordan ser pasientene oss?

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

Continua Service Center Samling i kommunenettverket på Gardermoen den 2. februar 2015

Elektronisk fakturering mellom bedrifter

Prosumenten. Bernt A. Bremdal

Hvordan bedømmer Gartner de lange linjene?

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

CODECROWD PRESENTASJON OG INVITASJON. kollektiv viten når ekspertene ikke vet. Next2Five UNLOCK YOUR FUTURES

Issues and challenges in compilation of activity accounts

Eksamensoppgaver til SOSANT1101. Regional etnografi: jordens folk og kulturelt mangfold. Utsatt skoleeksamen 12. desember 2013 kl.

// PRESENTASJONER FRA NJAVA

Praktiske løsninger med Microsoft Power BI. CIO Forum Analytics Paul Andreas Osuldsen

Tradebroker Reiseseminar Oktober Carl Wilhelm van Kervel Barth Direktør Salg & KAM

Bedre innsikt og raskere beslutninger SMART BRUK AV DATA

Endringer i ISO-standarder

Algeseminar Val. 23. November Vigdis Tuseth, Innovasjon Norge Trøndelag

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

Familieeide selskaper - Kjennetegn - Styrker og utfordringer - Vekst og nyskapning i harmoni med tradisjoner

GeWare: A data warehouse for gene expression analysis

Forelesning 1 Joachim Thøgersen

Brukbar branding Veslemøy Holt Tord F Paulsen

Mennesker og maskiner i samspill

Strategi med kunden i fokus

Mats Lyngstad Account Manager Facebook Norge

Trigonometric Substitution

Smart bruk av sosiale medier i PwC

Smartere byer gir bedre miljø og nye gevinstmuligheter. Morten Thorkildsen 2009 IBM Corporation

Nye databasar og systematiske litteratursøk

Altinn API Altinn «der du er»

EXAM TTM4128 SERVICE AND RESOURCE MANAGEMENT EKSAM I TTM4128 TJENESTE- OG RESSURSADMINISTRASJON

Arts Audiences: insight

P(ersonal) C(omputer) Gunnar Misund. Høgskolen i Østfold. Avdeling for Informasjonsteknologi

TEKSTER PH.D.-KANDIDATER FREMDRIFTSRAPPORTERING

Rolf Michael Odland Leder for Innovasjon & HMSK Boreal Transport Norge AS

Enkel og effektiv brukertesting. Ida Aalen LOAD september 2017

Hvordan kvalitetssikre åpne tidsskrift?

Styr Smart i Smart Grid

Tradisjonelt har næringslivet gruppert sin verdiskapning i 3 distinkte modeller:

Kan innføringen av AMS skape nye forretningsmuligheter for energiselskapene? Anna Silje O. Andersen Forretningsutvikler BKK as

Prosjektet Digital kontaktinformasjon og fullmakter for virksomheter Digital contact information and mandates for entities

Samle inn eller samhandle om statistiske data?

- En essensiell katalysator i næringsklyngene? Forskningsrådets miniseminar 12. april Mer bioteknologi i næringslivet hvordan?

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Copyright 2010, SAS Institute Inc. All rights reserved.

PATIENCE TÅLMODIGHET. Is the ability to wait for something. Det trenger vi når vi må vente på noe

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Grunnlag: 11 år med erfaring og tilbakemeldinger

Flest nordmenn ferierte i eget land i 2013, mens 84 prosent av befolkningen også var på utenlandsreise

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

Digital eller digitull?

Intelis Intelligent Advice

Bibliotekundervisningens fremtid nytt fokus på metodikk og digitalisering

Motivasjonen for Styr Smart i Smart Grid

buildingsmart Norge seminar Gardermoen 2. september 2010 IFD sett i sammenheng med BIM og varedata

Forbedret kundeopplevelse og reduserte driftskostnader ved bruk av maskinlæring i nettskyen. Heidi Brunborg IT-direktør i Lånekassen

Synergier mellom energieffek.visering, plusshus og smartgrid- teknologi

Kan vi forutse svindel? Eric Mandeville Capgemini Norge AS

Futurisme som metode. hvordan forstå digitale forretningsmodeller

Miljøstatus Fra ord til handling? Sund Energy Green Energy Day, Bergen, 23 september

Slipp forskningen løs: Fra forskning til bedre beslutninger

Transkript:

KUNNSKAP GJENNOM DATA BIGDATASEMINAR BERNT BREMDAL PROFESSOR II HØGSKOLEN I NARVIK OG RÅDGIVER CHRONOS AS DATO: 18. JUNI 2014 19.06.2014 1

KUNNSKAP GJENNOM DATA Hva er Big Data og hva kan det brukes til? Chronos seminar 16.6.2014 Bernt A. Bremdal Prof II, Høgkolen i Narvik og rådgiver i Chronos AS

BD OG FORRETNINGSSENTRERT ANALYSE Fanger og samler data fra ulike kilder Registrerer endringer Systematiserer ANALYSE AV INFORMASJON SKAPER MERVERDI

BIG DATA = 6 X V V1 = Volume (Volum) Store mengder data V2 = Variety (Variasjon) Forskjellige datatyper, strukturert, semi-strukturert, ustrukturert Fordelt på ulike kilder både innenfor og utenfor egn organisasjon V3 = Velocity (Hastighet) Konstant akkumulering av data.. V4 = Vision (Visjon) Virksomhetsorientert målsetting og plan V5 = Verification (Konformitet) Sikre samsvar med spesifikasjoner for kvalitet V6 = Validation (Målsikring) Sikre samsvar med målsetting og plan

SMALL DATA VS. BIG DATA SD adresserer et spesifikt spørsmål datainnsamlingen designes deretter SD benytter typisk strukturerte data SD data er bearbeidet for en bestemt hensikt fra start SD har stort sett kontroll på alle kilder BD er målorientert, men fleksibel BD er i stor grad basert på datamengder akkumulert for andre formål enn analyse BD er ikke orientert rundt et spesifikt analysespørsmål, men mange som også ikke nødvendigvis er stilt enda BD må håndtere ustrukturerte data BD er spredd rundt i det digitale rommet BD har liten/ingen kontroll med kildene

SIR FRANCIS GALTON AND THE FAT OXEN OR THE CROWD IS ALWAYS RIGHT Uavhengighet Desentralisering Mangfold Den svake stemmen Big Data og uavhengighet

GRUNNIDÉ Hvis du spør en stor nok gruppe bestående av ulike, uavhengige mennesker om å gjette eller estimere en sannsynlighet og dermed beregne det enkle gjennomsnittet av svarene vil dette som regel bli mer nøyaktig enn det forslaget til selv de beste eksperter. Enkelt sagt bidrar hvert individ med informajon og unøyaktigheter basert på sitt spesifikke verdensperspektkiv. Hvis alle forholder seg til det samme problemet forsterkes den samlede informasjonen og feilene kanseleres ut. Dette forutsetter at gruppen som helhet ikke blir påvirket av en ensidig kilde.

OM RØKLA Ask a hundred people to answer a question or solve a problem, and the average answer will often be at least as good as the answer of the smartest member. With most things, the average is mediocrity. With decision-making, it s often excellence. You could say it s as if we ve been programmed to be collectively smart. James Surowiecki in Wisdom of Crowds Google surveying three billion Web pages and finding the right page quickly is built on the wisdom of crowds. The more people that have linked to a page, the more influence that page has on the final decision Sergey Brin and Lawrence Page

BIG DATA S NØKKELKVALITETER Big Data støtter de store talls lover Big Data støtter opinionsanking fra mange mennesker/kilder Big Data skiller bedre mellom mening og «hvit støy» Tilfeldigheter og feil blir undertrykt Big Data er morgendagens beslutningsplattform

NOEN GRUNNLEGGENDE PRINSIPPER Strukturere det ustrukturerte Identifikasjon og de-indentifikasjon Ontologier og semantikk Introspeksjon Dataobjekter må kunne beskrive seg selv Dataintegrasjon og SW interoperabilitet Uforanderlighet og udødelighet Måle og analysere Visualisere

BIG DATA ANALYSENS 3 FASETTER OG 2 MÅL Data fusion Samle og kople datakilder og data og søke etter møsnter og tendenser «Finn nåla i høystakken» Crowdsourcing Mobilisere mennesker for å respondere på kildeinformasjon eller andre signaler for prediksjon og/eller beslutningssstøtte Mønster og tendenser Ensemble Models Samle og kople ulike dataprosesseringsmodeller (beregningsprogram) «A bag of models» og lage en syntese av resultatet ved hjelp av CS teknikker

MANGE ANALYSETEKNIKKER Statistikk Freksvensanalyse Enkle regresjoner Autoregressive integrated moving average (ARIMA) Kollaborativ filtrering Multi-variat analyse Multi-variable regresjoner Singular Value Dcomposition (SVD) Prinsipal komponentanalyse (PCA) Data mining Mean-variance analysis K-means clustering Text mining & search Key term extraction Inverted frequency analysis Manhattten clustering Latent semantic analysis Parafac2 Corpoorum Business intelligence OLAP Maskinlæring Swarm intelligence Reinforcement learning Neural Networks Reglelbasert induksjon Genetiske algoritmer Operasjonsanalyse Lineær programmering Dynamisk programmering Stokastisk programmering Knowledge management

EKSEMPLER & BUSINESS CASES

BUSINESS CASE: FORRETNINGSUTVIKLING El-bransjen i stor endring Utnyttelse av ny teknologi Kapitalisering på investering i smarte målere/ams infrastruktur Utvikling av energi og nettprodukter for: Bedre utnyttelse av nettet Økt energieffektivitet i hele systemet Økt segmentering og kundetilpasning for utvikling av høymargintilbud Tids og geo-swapping Aktuelt case: BD arbeid kan spare 60-100 mill NOK og reformere dagens praksis for energisalg Chronos

AMS OG «SMARTE MÅLERE» 1. Fungerer som en effektiv sensor for bruker og andre 2. Gir økt gjennomsiktighet i distribusjonsnett og sluttbrukerledd «Alle får smarte målere innen 1.1.2019»

TIMESMÅLINGER AV STRØM MED AMS 51,8 mill records Energiforbruket sammen med pengebruk utgjør det mest grunnleggende fotavtrykket som vår livsførsel gir

«FOOTPRINT» FORBRUKSPROFILER ULIKE SEGMENTER Profil Sommerhytte Profil Husholdning Profil Næring/kontor Metoder: Cluster analyse Prinsipal Component Analyse

DØGNPROFIL - INNMATING 17000 16500 16000 15500 15000 14500 MW 22/3/13 14000 13500 13000 12500

EL-BILER OG KLASSISKE UTFARTSDAGER TRAFIKK- OG LASTBILDET 22.3.2013, «PALMEFREDAG» M/ ULIKE LADESYSTEMER OG ULIK ANDEL AV EL-BILER kw 25000 20000 15000 10000 5000 Maks nettkapasitet Innmating 22.3.2013 100% Hjemmelading 6,6 kw 100% Hjemmelading 3,3 kw 100% Nødlading 2,3 kw 50% Hjemmelading 6,6 kw 50% Hjemmelading 3,3 kw 50% Nødlading 2,3 kw 10% Hjemmelading 6,6 kw 10% Hjemmelading 3,3 kw 10% Nødladning 2,3 0

KLIMA OG ENERGIFORBRUK I BYGG Light Moisture Movement Radio unit Sound Antall verdier: 27 millioner Metode: PCA, regresjoner og nevrale nett

BUSINESS CASE ENØK og energieffektivisering Utvikling og utnyttelse av ny teknologi Behov for kostnadskutt og reduksjon/eliminasjon av oljefyr Mer intelligent styring Kostnadskutt Økt samspill med netteier og leietaker Aktuelt case: Årlig reduksjon i strømutgifter på 400.000 kroner mulig for ett bygg Salg av «fleksibilitet» som tilsvarer morgenrushet i nettet tilsvarende 800 eneboliger

NEDBRYTNING AV PROFILER: DE ULIKE KURSENE I TIME 11 I DESEMBER DESEMBER 2012

PC2 Temp inne Temp ute Kurs-4 Kurs-3 PC1 Kurs-1 Kurs-2

UTNYTTELSE AV DATA FRA STØTTE OG SERVICEFUNKSJONER Hente ut statistikk Skjema skjuler en ontologi Kople flere kilder Enkel text mining Business Cases: Samkjøring av HMS statistikk i stort industriselskap Risiko awareness i oljeselskap Verdi 3,4 milliarder kroner

FRA SKJEMA TIL SEMANTIKK Hovedkatalog Navn Tekst Antall forsøk Publisering

REKLAMEKAMPANJER OG PR Omtale Negative reaksjoner Gjennomslag Crowdsourcing Twitter SMS Media Facebook Forums Blogger Antall: 1,2 millioner forskjellige mediasider Metode: semantisk analyse, cluster analyse og enkel statistikk

BUSINESS CASE Behov for å kartlegge reklamekampanjers effekt Vurdering av gjennomslagsevne og potensiell påvirkningskraft Vurdering av potensiell «pick-up» rate og kjøpsrespons Innhenting av tilbakemeldinger på prototyper eller demoversjoner Aktuelt case: Motorola Penetrasjonsevnen for produktnyheter var uventet lav Oppdaget at egne mediatiltak finansierte og skapte god PR for konkurrenter Atkins Oppdaget at en liten lobby produserte gjennomgående, negativ omtale

MARKEDSPENETRERING: MOTOROLA ANALYSE AV MEDIA FOR Å MÅLE HVOR GODT MARKEDSBUDSKAPET OM ET NYTT PRODUKT TREFFER MARKEDET, ABSOLUTT OG RELATIVT TIL ANDRE PRODUKTER Motorola T720 9% Motorola V60 6% Motorola V60p 6% Motorola V400 3% Motorola C343 3% Motorola 120 Motorola V70 Motorola V300 Motorola T720 Motorola V60 Motorola V60p Motorola V400 Motorola C343 Motorola V300 12% Motorola 120 46% Motorola V70 15%

ARBEID MED TEKSTBASERTE DATA (CORPORUM ): INFORMASJON OG EKSTRAKSJONSMETODER GJØR INFORMASJON I TEKST MER TILGJENGELIG Meta-data ekstraksjon Source Document Sammendrag

MEDIA MONITORING REFINEMENT TRAIN Pre-process Screen meta-data Theme Classification Mode classification Positive/ negative Influence Classification Extract important messages Combine and report

MOTOROLA MARKEDFØRER FOR NOKIA MOTOROLA CASE FINANSIERER OMTALE AV NOKIA Divide into subsets based on company references in documents How much publicity on companies in the US? Redefined as: What is companies reporting frequency in US media? Statistics can be easily refined on the corpus using CORPORUM # articles on the several companies motorola 32% nokia 43% siemens 14% sony ericsson 11%

MEDIAPENETRERING/OMTALE: ATKINS DIET

«STAKEHOLDER» ETTERRETNING Følge ulike tråder i en sak hvor flere SH er involvert Hvem sier og skriver hva til enhver tid? Analyse av relasjoner Kartlegging av innflytelsessfærer Business case: Anti-svindel forsikring 80 millioner spart på tre tilfeller Twitter Facebook Media Telefonkatalog Nettaviser etc. LinkedIn Proff.no o.l. Søkemotorer

FINANSNÆRING: SYNTESE AV INFORMASJON FRA SOSIALE SYSTEMER, TELEFONKATALOGER, ON-LINE BIBLIOTEKER ETC. PÅ WEB FOR Å SPISSE FORSIKRINGSPOLISER OG REDUSERE RISIKO

INFORMATION FUSION Vollviks formueutvikling 2005 0 2006 5 234 023 2007 35 529 614 2008 0 2009 6 530 180 2010 0 Events detected can be added to a calendar Histogram shows corresponding numerical data (i.e. Revenue volume, assets, sales etc.)

NYHETSEKSTRAKTER KOMBINERT MED NUMERISKE DATA HENTET FRA ÅPNE KILDER

NAVNEKSTRAKTER FRA ÅPNE KILDER

KAMPANJEOVERVÅKNING Følge med på konkurrenters eller «stakeholders» hjemmesider og sosiale media Sanntidsanalyse av pris, ønsker, kommentarer etc. Rask posisjonering Kopling til bestillings- og servicesystem Business case: Prisovervåkning Kampanjestyring/segmentering Twitter Facebook Media Telefonkatalog Nettaviser etc. Søkemotorer

PRIS OG ETTERSPØRSELSANALYSE FOR PRODUKTER Fabrikant Modell Pris Laveste pris? Tillegg Størrelse 700 600 500 400 300 200 100 0 Antall menn Antall kvinner Mest populære produkt?

TAKK FOR OPPMERKSOMHETEN!