Databearbeiding direkte i memory på LASR server nye muligheter? Trond Holmen, SAS Institute

Like dokumenter
Bruk av data kan deles i data for transaksjonsbruk og data for analyse bruk:

Datavarehus hva er det?

Nine Best Practices for Big Data Dashboards i SAS Visual Analytics Trond Holmen, SAS Norge

Applikasjonsutvikling med databaser

DATAUTFORSKNING I EG, EG 7.1 OG EGENDEFINERTE FUNKSJONER SAS FANS I STAVANGER 4. MARS 2014, MARIT FISKAAEN

1. SQL server. Beskrivelse og forberedelse til installasjon

Datamodellering og databaser SQL, del 2

Hvordan komme langt med lite? NMBU Innsikt - Ledelsesinformasjonsverktøy for NMBU Digitaliseringskonferansen for høyere utdanning og forskning,

WebSmart. Trond E. Nilsen Select AS

Datamodellering og databaser SQL, del 2

Innhold. Introduksjon til parallelle datamaskiner. Ulike typer parallelle arkitekturer. Prinsipper for synkronisering av felles hukommelse

Datamodellering og databaser SQL, del 2

NYHETER I ENTERPRISE GUIDE 7.12

NextBridge referansen innen Business Intelligence

SENTRAL FELLES KARTDATABASE. Geir Heksem

Introduksjon til fagfeltet

TDT4300 Datavarehus og datagruvedri3, Våren 2014

Transaksjoner. transaksjon. når starter/slutter 1 trans.?

Tilrettelegging av store datagrunnlag for analyse med SAS Scalable Performance Data Engine (SPDE) Steinar Helstrup 8.juni 2017

Hva har vi gjort? SQL og Databasedesign

SAP HANA 1.0 er her Hva nå?

SolidPlant er perfekt for deg som jobber med design av rørsystemer og anlegg, og er kjent med SolidWorks.

HVA ER XML? extensible Markup Language En standardisert måte å strukturere ulike typer data Åpent format Enkelt:

5XQH.MHOYLN )URQW3DJHRJGDWDEDVHU

FS-API Status og veien videre. Kai Quale og Mario Ledinscak KDTO

Databaser kort intro. Tom Heine Nätt

Manual for å oppgrade TS 1000 fra:

EGA Svar på spørsmål, oppdatert pr

ORDBMS og OODBMS i praksis

INF 329: Web-Teknologier. Dataimplementasjon. Fra Kapittel 11 i «Designing Data-Intensive Web Applications» Presentasjonsdato: 17/10/2004

Installasjonsveiledning

Tilkobling og Triggere

Febdok Server må være installert på den datamaskinen du sitter på. Last ned siste versjon fra Febdok sin hjemmeside eller gjennom programmet.

EKSAMEN ITF Webprogrammering 1 Dato: Eksamenstid: Hjelpemidler: 2 A4 ark (4 sider) med egenproduserte notater (håndskrevne/maskinskrevne)

Flytte Lønn 5.0 fra SQL 2000 til SQL 2005 / 2008

Datavarehus hva er det?

Vedlegg 1: Oversikt over noen mulige leverandører

Søkeproblemet. Gitt en datastruktur med n elementer: Finnes et bestemt element (eller en bestemt verdi) x lagret i datastrukturen eller ikke?

Operativsystemer og grensesnitt

5602 DATABASER Bokmål/nynorsk. 17 (inkludert denne forsiden) Eksamensresultatene blir offentliggjort på Studentweb.

- analyse og implementasjon

Forelesning 3 DAS - Systemtabeller, indekser, distribuerte systemer m.m. - Tom Heine Nätt/Edgar Bostrøm

Databaser & objektorientering.

SAS I TNS GALLUP. Fra spesialistverktøy til standard rapporteringsog analyseverktøy. Copyright 2010 SAS Institute Inc. All rights reserved.

Forprosjektrapport Skrevet av: Filnavn: Status: Versjon: Opprettet: Sist endret: Sider:

STORED PROCESS KJØRT FRA SAS VISUAL ANALYTICS FANS I STAVANGER , MARIT FISKAAEN

SAP Lumira Hans-On Session

DIGITAL INFRASTRUKTUR. Oslo byarkiv/ Digitalt Museum

Hvordan databasesystemene kan hjelpe RAM-produsentene

SQL Server guide til e-lector

November 2012 Stig Claussen, Senior Consultant Psiam. Infor 10 EAM

Flytte System 4 fra SQL 2000 til SQL 2005 / 2008

Innhold. 2 Kompilatorer. 3 Datamaskiner og tallsystemer. 4 Oppsummering. 1 Skjerm (monitor) 2 Hovedkort (motherboard) 3 Prosessor (CPU)

2. Beskrivelse av installasjon av SQL Server 2005 og hvordan lage databasen som trengs av administrasjonsprogrammet:

DT4300 Datavarehus og datagruvedri3

Personec Lønn Personec Lønn Pr

EXCELERATOR KENNETH TORSTVEIT. Sensitivity: Internal

Minnehåndtering i operativsystemer

Stikkord: Java EE, EJB, JSF, JPA, SWT, klient/tjener, Glassfish server, Application Client.

Datavarehus. Beslutningsstøttesystemer

SOFTWARE REQUIREMENT & DESIGN DOCUMENT. Home Automation System. Nickolas Helgeland, Jon Erik Nordskog og Kristian Sande Sjølyst

SAP Lumira Demo Session

E2 Leveranser av modelldata ut på anlegg Praktiske erfaringer og muligheter

EKSAMEN 6102 / 6102N DATABASER

9 Online Backup. Priser KR 100 / PC lisens KR 300 / Server lisens (inkluderer bl.a. SQL/Exchange) KR 0,50 / GB

Dette dokumentet beskriver feilrettinger og endringer gjort i patcher til versjon 7.42 (Oracle) og 7.43 (MSSQL)

som blanker skjermen (clear screen). Du får en oversikt over alle kommandoene ved å skrive,

NOVUG 3 februar 2009

Datastrukturer for rask søking

Småteknisk Cantor Controller installasjon

Effektiv Systemadministrasjon

1. Brukeradministrasjon og kompatibilitet med ISY Eiendom 8 web moduler

Nytt i NIMES

Teknisk Tips & Triks PER TORE HOFF

Nytt i NIMES

Oppgave 2: Gå til roten (/) av systemet. Finn minst tre forskjellige måter å gå tilbake til hjemmekatalogen din på.

faunistisk seminar oktober

Nadine Pedersen GRIT Datamaskinen- kjenn din Mac

Demoversjon. Installasjon Uni Økonomi V3. - økonomisystemer fra start til børs

TIPS OG TRIKS AMESTO ANALYZE. Øystein Gjertsen

Intelle har siden starten i i leverandør av av programvare for data- og og systemintegrasjon.

Tildeling av minne til prosesser

PostGIS som navet i dataforvaltningen ved Skog og landskap

Funksjonalitet og oppbygning av et OS (og litt mer om Linux)

1. Systemsikkerhet Innledning. Innhold

Uni Micro Solutionpartner. Demoversjon Installasjon

INF2270. Input / Output (I/O)

Sikkerhet i Pindena Påmeldingssystem

Fakultet for informasjonsteknologi, Løsning på kontinuasjon i TDT4186 Operativsystemer August 2005,

Innføring av sentral lagring av FKB er et nasjonalt løft for kartbransjen

Tekniske Krav Aditro Lønn

Vi anbefaler at du setter deg litt inn i maskinen på forhånd. Det er en DELL Optiplex 620.

Social Network Analysis. Process Capability Analysis. Vector Autoregressive Models. Discrete Event Simulation. Decision Trees. Psychometric Analysis

Scan Secure GTS PAS

Løsningsforslag for Eksamensoppgave i TDT4190 Distribuerte systemer

INF3100 V2018 Obligatorisk oppgave nr. 2

Styret Helseforetakenes senter for pasientreiser ANS 23/10/13

Kan du byta BI-lösning eller är du fast? Trondos vågade och gjorde det!

Oppsummering. Thomas Lohne Aanes Thomas Amble

Database security. Kapittel 14 Building Secure Software. Inf329, Høst 2005 Isabel Maldonado

Transkript:

Databearbeiding direkte i memory på LASR server nye muligheter? Trond Holmen, SAS Institute

Bakgrunn: Hvordan virker en tradisjonell database Store datamengder har tradisjonelt vært lagret på disk For å bearbeide data leses i prinsippet en og en rad fra disk til memory for deretter å bli «bearbeidet» og skrives ut til disk igjen. Ved å lese til og fra disk skapes IO som en flaskehals. Les/skriv til disk tar tid. Ofte tar dette mye mer tid enn selve prosesseringen av dataene. For å bøte på dette er det utarbeidet metoder og teknikker for å speede opp tempoet: Lagre dataene i stjerneskjemaer (Kimbell/Inmon, metodikker) Indeksere utvalgte kolonner for direkte tilgang til rader i stedet for sekvensielt å lese hele datakilden. Lese deler av datakilden inn i memory: arrays, hash-tabeller, oa Lage OLAP kuber Multi-threading

Bakgrunn: Hvordan virker en tradisjonell database For bearbeiding av databasetabeller er det laget spørrespråk mot databasene: For eksempel SQL, MDX og datasteget. Disse spørrespråkene er svært fleksible.

In-Memory Utviklingen av hardware gjør at mye større datakilder kan være i memory samtidig, og dette fører til at applikasjoner som settes på toppen av datakilder i memory har mye raskere responstid. SAS og andre leverandører har derfor laget rapporteringsverktøy som kan gå mot så store mengder detaljedata at man bare kunne drømme om det for få år siden. Man spør derfor direkte mot ferdige tabeller i memory via en rapporteringsløsning. Tradisjonelt har databaser kværnet gjennom data og lastet nye oppdaterte memory-tabeller i batch-jobber på natterstider. De store mengdene memory-data har ført til at batch-jobbene kan være krevende.

Bearbeiding av in-memory data Stadig økende behov for «live data» og oppdatering av in-memory dataene! Behov: Lasting av stjerneskjemaer i memory Hyppig delta-last i memory Aggregeringsfunksjoner i memory Tradisjonell databasefunksjonalitet med f.eks. å lage avledede kolonner If.. Then else / case funksjonalitet Foreløpig bruker mange å gjøre disse operasjonene i en database før man laster dataene opp i memory. Dette er også en anbefalt løsning hvis man kan benytte dette. Hvis man kunne gjøre dette direkte i memory ville det være mer effektivt og sikre «live data» for rapporteringsløsningene.

Hvilke muligheter finnes i SAS? Tradisjonell SAS database: Proc SQL, Datasteget, oa In-Memory LASR: Proc Imstat Består av to deler: Data and server management Analytics Gir enkel stjerneskjema-generering. Enkel update av tabeller Lage avledede kolonner Aggregering Delta-last

Nye måter å tenke på? Store skjulte memory-detaljetabeller som man bruker IMSTAT for å lage håndterbare tabeller for applikasjoner? Backup i HDFS/LASR-database Delta-last til memorytabeller fra trad. Databaser/LASR databaser Bruk av IMSTAT gir ikke lock på tabeller

Problemstilling skjematisk - Telenor Lesing fra disk AST transaksjoner Lesing i minnet Ferdig koblet datakilde fra Oracle Tung batch-jobb om natta SAS Stjerneskjema Stjerneskjema Faktatabell lastes i batch, kobling i LASR Oracle Faktatabell deltalast Deltalast fra Oracle til fakta og bygge stjerne i LASR. Tar en brøkdel av tiden

Aggregering i minnet Fakta Fakta aggregert 1 Fakta aggregert 2

Demo (Litt «hardcore» SAS-kode)