Store data til dem som trenger det

Like dokumenter
Digital humaniora

Fra (sfi) 2 til Big Insight

Håndtering av forskningsdata og utvikling av datahåndteringsplaner (DMP) Solveig Fossum-Raunehaug (Forskningsavdelingen)

the evolution of music continues

Håndtering av forskningsdata og utvikling av datahåndteringsplaner (DMP) Solveig Fossum-Raunehaug (Forskningsavdelingen)

Stordata i offentlig sektor OSDF 7.12

ITS, IoT, Big Data og personvern

Beregningsperspektiv i ingeniørutdanningen? Knut Mørken Institutt for informatikk Senter for matematikk for anvendelser Universitetet i Oslo

NMBUs arbeid med Open Science. Solveig Fossum-Raunehaug Seniorrådgiver Forsknings- og innovasjonsavdelingen

Kan vi forutse svindel? Eric Mandeville Capgemini Norge AS

Kronikken i ComputerWorld, 19. nov. 2010:

Tom Røise 9. Februar 2010

Lage større programmer (Python, relatert til teoridelen om Software Engineering ) TDT 4110 IT Grunnkurs Professor Guttorm Sindre

Hva kreves av institusjonene for å implementere retningslinjene?

License Management Morten A. Steien EDB Business Partner Industri

SAP Lumira Demo Session

Refleksjoner knyttet til forretningsmessig utnyttelse av store datavolumer. Oslo 18. April 2013

Oppløsning vil si antallet pixler det er i skjermen, i min skjerm er det 2560x1600px.

Nytt verktøy for helhetlig dynamisk risikostyring på rigg. Øyvind Rideng

Dynamisk risikostyring i petroleumssektoren. Øyvind Rideng

UiO 8 Universitetet i Oslo Notat

Gir vi IKT-kandidatene egnet kompetanse for fremtiden? Morten Dæhlen Dekan

Litt ideer Noark5 kjerne, digitalisering, big data Sognsvann, 26. april 2013

Introduksjon til 3290

Håndtering av forskningsdata ved UiT en introduksjon

Mastergrad Læring i Komplekse Systemer

Big data teknologier og potensialet for datadrevet innovasjon sett fra forskningens perspektiv

Masterclass i partikkelfysikk

Datavarehus hva er det?

Betydningen av tidlig og langsiktig forankring i institusjonenes ledelse

Romlig datamanipulering

EGA Svar på spørsmål, oppdatert pr

All you need is the plan, the road map, and the courage to press on to your destination.

Generelt om operativsystemer

Systemutvikling (Software Engineering) TDT 4110 IT Grunnkurs Professor Guttorm Sindre

GeoForum sin visjon: «Veiviser til geomatikk» og virksomhetsideen er: «GeoForumer en uavhengig interesseorganisasjon for synliggjøring og utvikling

KUNDENS KRAVSPESIFIKASJON

Hvordan skal vi finne svar på alle spørsmålene?

Marius Rogndalen Karlsen, Informatikk Lab oppgave

Spørsmål og svar til Konkurransegrunnlag

Bruk av data kan deles i data for transaksjonsbruk og data for analyse bruk:

ElCad NettDok Nye selektivitetstabeller (Ny funksjon )

Erfaringer og eksempler fra Nord-Europas største implementering av SAP BPC for konsolidering. Stig Skoglund Leading Consultant Statoil

// PRESENTASJONER FRA NJAVA

Software Carpentry og Data Carpentry

Datavarehus hva er det?

Lysneutvalget

Smart Grid og Smarte Regioner

Stordatapolitikk eller politikk for store data? Skatteetatens erfaringer og perspektiver på analyse av store datamengder

Aleksander Thanem Bjøru Seniorkonsulent MCSE og Citrix CCIA

oppgavesett 4 INF1060 H16 Hans Petter Taugbøl Kragset Øystein Dale Christian Resell 27. september 2016 Institutt for informatikk, UiO

Spørsmål og svar til Konkurransegrunnlag

IS Introduksjon til informasjonssystemer

Fleksible Forskningstjenester Allmøte usit 9 mars

FÅ KONTROLL PÅ DE USTRUKTURERTE DATAENE

GDPR og ny lov om personvern

TDT4110 IT Grunnkurs Høst 2014

Software applications developed for the maritime service at the Danish Meteorological Institute

ORDBMS og OODBMS i praksis

Hovedfagspresentasjon. Preprosessing Large Scale Linear Systems

SAP Komplett.no

IT Service Management - ITIL v3. Av Are Sivertsen Sjefskonsulent Atea AS are.sivertsen@atea.no

Deling og lagring av forskningsdata ved UiO

AGENDA. Gjennomgang av utkast til løsningskonsepter. Plan og arbeidsform frem mot endelig leveranse. Annet

What's in IT for me? Sted CAMPUS HELGELAND, MO I RANA Tid

SAP Lumira Hans-On Session

En harddisk består av et lite antall plater av et magnetisk materiale.

RSaaS Research Services as a Service eller BYOD tilgjengeliggjøre (spesial)løsninger via fjernaksess

Status for CSE-prosjektet

EN INNFØRING I BPM

Hva legges i begrepet Big Data Hvilke muligheter eller betydning vil dette ha for den enkelte virksomhet Bruksområder Oppsummering. Arild S.

Datateknologi - masterstudium (2-årig) MIDT år

Margunn Aanestad: Velkommen til INF3290! 27. august 2012

Parallelle og distribuerte databaser del III

Overordnet beskrivelse av programmet i Matematikk

Artikkel 5 Astrofotografering med Starlight Express koplet til Skywatch som Objektiv

Metadata for gjenfinning og bevaring. Jonny Edvardsen Avdelingsdirektør Tilvekst og kunnskapsorganisering Nasjonalbiblioteket

Koblingen utdanning, forskning, og innovasjon hva skal til? Morten Dæhlen

Kap. 10 Systemutvikling System Engineering

Samarbeid mellom sikkerhetsforskning og sikkerhetspraksis

Atea Klientologi. - Læren om leveranse av innhold til klienter

Veileder for opplasting av AKTIV sporlogg til PC

Ad-hoc / selvkonfigurerende sensornettverk. Knut Øvsthus, PhD Professor Høgskolen i Bergen

Noen sentrale komponenter i NVivo, ord og uttrykk. Hva er et Prosjekt? NVivo ikke bare koding

Mot fremtidens trafikkteknikk

Hvordan dele dine forskningsdata

Programvareutvikling (store systemer)

Betydningen av tidlig og langsiktig forankring i institusjonenes ledelse

Innhold. 2 Kompilatorer. 3 Datamaskiner og tallsystemer. 4 Oppsummering. 1 Skjerm (monitor) 2 Hovedkort (motherboard) 3 Prosessor (CPU)

Strålevernets behov for datainnsamling. EPI CT prosjektet. Status og planer for norsk deltagelse

Stordata (Big Data) Forskning og kompetanseoppbyggning i Norge. John Krogstie - NTNU

Kjenn din pc (Windows Vista)

Kommunikasjonsbærere Mobil/GPRS. Toveiskommunikasjon EBL temadager Gardermoen mai 2008 Harald Salhusvik Jenssen gsm.

oppgavesett 4 INF1060 H15 Øystein Dale Hans Petter Taugbøl Kragset September 22, 2015 Institutt for informatikk, UiO

Kunnskapsdepartementet august 2017 nasjonale mål og retningslinjer for åpen tilgang til vitenskapelige artikler

mnemonic frokostseminar

Ultralydmålinger og analyse

FoU-statistikk for de nordiske land. Figurer og tabeller om FoU-utgifter og FoU-årsverk

RUSSISKE HACKERE I AKSJON. Copyright 2016 EMC Corporation. All rights reserved.

Transkript:

Store data til dem som trenger det Martin Giese UiO, institutt for informatikk 16. oktober 2015 Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 1 / 16

Litt om meg selv Professor ved Institutt for Informatikk, UiO Bakgrunn i Logikk Flere prosjekter med Norsk olje & gassindustri, offentlig sektor, Assistant Scientific Director i Optique End-user Access to Big Data EU-finansiert forskningsprosjekt, 2012 2016, 14M. Nytt SFI: SIRIUS Center for Scalable Data Access in the Oil & Gas Domain NFR-finansiert senter, 2015 2023. Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 2 / 16

Hva er Big Data? Big Data (Wikipedia) Datasett som er så store eller komplekse at konvensjonelle metoder for databehandling ikke er tilstrekkelige Behandling: datafangst lagring transfer analyse visualisering tilgang Moving Target Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 3 / 16

Big Data: Mer enn bare Mengde Velocity BIG DATA Volume Variety Complexity Garnter Inc. Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 4 / 16

Volume Datamengde 1 Terabyte: Harddisken i din PC 1 Petabyte=1000 TB: passer inn i et skap (Norges DNA: 3,5 PB) 1 Exabyte=1000 PB: datasenter på 5,8 mål. Hva er stort? Kommer an på hva man vil: lagre? hente ut innen sekunder? lete etter bestemt informasjon? finne skjult informasjon? Velocity BIG DATA Volume Variety Complexity Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 5 / 16

Velocity Hastighet Large Synoptic Survey Telescope: 20TB/natt Large Hadron Collider: 1 PB/sekund Reduseres til 25 PB/år Hva er raskt? Må alt lagres? Kan det komprimeres? Fort nok? Trenger man å analysere alt? Analyse on-the-fly, eller i etterkant? Velocity BIG DATA Volume Variety Complexity Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 6 / 16

Complexity Kompleksiteten Statoil EPDS: 1500 tabeller, 16000 kolonner UiO sitt SAP system: 80000 tabeller, 1M kolonner Harald Pettersen/Statoil Hva er komplekst? Må jeg bruke data til nye formål? Må man kjenne til alt? Må man prosessere alt? Velocity Volume BIG Variety Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det TA DA Complexity 16. oktober 2015 7 / 16

Variety Variasjon Informasjon foreligger i form av Databaser Sensorstrømmer Textdokumenter Regneark Bilder, Lydfiler, Video Ofte flere i kombinasjon! Forskjellige måter å prosessere hver form. Vanskelig å kombinere. Velocity Variety BIG DATA Volume Complexity Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 8 / 16

Forskningens Perspektiv software Håndtering hardware kreft epidemologi genetikk Bruk geologi astronomi meteorologi Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 9 / 16

Flaskehalsen: Tilgang til data Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 10 / 16

The Art of the Possible Mye kan lagres, men langt ifra alt Mye av det kan leses fort, men langt ifra alt Mye av det vi kan lese kan analysere, men langt ifra alt Kun eksperter kan jobbe med Store Data! eksperter på maskinvare eksperter på programvare eksperter på de selve dataene og hva de betyr Store data er fjerne fra Brukeren! Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 11 / 16

Tilgang til data, i Teorien predefined queries Engineer Interface Application answers Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 12 / 16

Tilgang til data, i Realiteten information need IT-expert specialised query Engineer Interface Application answers Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 12 / 16

Tilgang til data, med Datavarehus queries ETL Engineer Application Data- Warehouse answers ETL Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 13 / 16

Tilgang til data, med Optique information need Translation translated query Interface Engineer Application answers Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 14 / 16

Tilgang til data, med Optique information need Translation translated query Interface Onto- Map- Engineer Application logy pings answers Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 14 / 16

Data Science @ UiO Optique, SIRIUS: datatilgang BigInsight: dataanalyse Samlet vil UiO bli til en ledende institusjon innen Data Science Martin Giese (UiO, institutt for informatikk) Store data til dem som trenger det 16. oktober 2015 16 / 16