Bilag 3 til Kjøpsavtalen (SSA-K lille) KUNDENS TEKNISKE PLATTFORM Avtalereferanse: NT-0310-14 Kjøpsavtale Løsning for prediktiv analyse
Innholdsfortegnelse 1 DAGENS LØSNING... 3 1.1 Overordnet infrastruktur... 3 1.2 Viktige komponenter i datavarehusløsningen... 4 1.3 Produksjon-, test- og utviklingsmiljøer... 4 1.4 Tabellstørrelser... 7 1.5 Datadistribusjon... 7 1.6 Forventet økning i datamengde... 8 1.6.1 Interaktive spill (Multix/Belago)... 8 1.6.2 Tradisjonelle spill (Lotto, Vikinglotto, Tipping mm.)... 9 1.7 Databaseobjekter... 9 1.8 Brukere... 10 Side 2 av 10
Bilaget inneholder en beskrivelse av nåværende tekniske plattform som er relevant for leveransen. Dette er kun en beskrivelse, og her er ikke krav fremsatt. 1 DAGENS LØSNING Dagens løsninger er plassert i to datahaller. De er konfigurert basert på at hver datahall er redundant samt at datahallene er redundante mellom hverandre, dvs. two-site løsning med en aktiv-aktiv filosofi. Salgstransaksjoner kommer inn fra forskjellige salgskanaler, både via Internett og leide linjer i et IP/VPN nettverk. Begge typer trafikk er basert på løsninger som utøver feiltoleranse og lastbalansering mellom datahallene. LAN er delt inn i flere soner og disse er adskilt med brannmurer. Den tekniske infrastrukturen er basert på utvalgte produkter der det er bygget høy kompetanse internt. Infrastrukturen er basert på virtualisert teknologi, eksempelvis ved AIX dynamisk LPAR, VMware og virtuell brannmurløsning. 1.1 Overordnet infrastruktur Norsk Tipping benytter i dag IT infrastruktur fra flere produsenter. Listen under viser noen av de viktige hovedkomponentene i porteføljen: Nettverksløsninger, LAN/WAN o LAN / WAN tjenester - Cisco o Brannmur tjenester - Crossbeam/ Checkpoint o Proxy tjenester - Ironport / Varnish Lagringsløsning, datalagring o Diskløsning - Netapp Servere / OS: o Intel baserte servere HP, Linux og Windows. Virtualisert med VMware o Power baserte servere IBM, AIX. Virtualisert med LPar Mellomvare: o WebSphere Databaser: o Oracle o Netezza Overvåkning o Tivoli o PRTG o Graphite Diverse o Citrix o Microsoft Active Directory o Glassfish NT bruker Intel-baserte, bærbare arbeidsstasjoner med Windows 7 og Microsoft Office. Side 3 av 10
1.2 Viktige komponenter i datavarehusløsningen Bilag 3 til Kjøpsavtalen: Kundens tekniske plattform PowerCenter Datawarehouse -Informatica PowerCenter v9.5 IBM P795 / AIX v6.1 TL8 SP2 - PowerCenter Siebel Marketing Informatica PowerCenter v9.1 - IBM P795 / AIX v6.1 TL8 SP2 Datavarehus / Staging Oracle 11.2.0.3 - IBM P795 / 1 CPU, 4 vcpu, 4 Threads / 350GB RAM / AIX v6.1 TL8 SP2 Datafile size: 2.8TB (Netapp) Partisjonskomprimering (uten komprimering; ca 8TB) Business Objects Microsoft exchange Microsoft Exchange Server 2010 SP3 Netezza 1.3 Produksjon-, test- og utviklingsmiljøer Replikering av data mellom datahaller Norsk Tipping har to datahaller og en IKT-policy som stadfester at det må være mulig å operere med kun én datahall i kortere perioder. Vår datavarehusløsning er ikke klassifisert som et absolutt virksomhetskritisk system. Av den grunn anser vi det ikke som nødvendig å ha en «aktiv-aktiv» redundans mellom datahallene. Derimot må det være mulig å flytte databaser fra primær til sekundær datahall for videre operasjon der. I vanlige driftsituasjon er begge datahaller online og belastning kan være distribuert over Side 4 av 10
begge datahaller. Løsningen må være basert på redundans og inneha nok kapasitet til å kunne kjøre alle databaser (utvikling, QA, pre-produksjon og produksjon) i ÉN datahall for kortere perioder. Dette kan innebære en mulig lavere ytelse. Prosessen med å flytte databaser fra en datahall til en annen kan være manuell, men NT ser for seg at denne bør være automatisert i størst mulig grad. Periodene hvor det vil være aktuelt for NT å kun kjøre i en datahall vil vanligvis være planlagt. Det må være mulig å starte løsningen i sekundær datahall både i forbindelse med en uforberedt driftsstans og i forbindelse med en kontrollert stopp av primær datahall og påfølgende start i sekundær. I vanlig driftssituasjon skal det ikke spille noen rolle hvilken datahall som er aktiv. Et mulig oppsett er vist under. Datahal X Datahal Y Data Replikering Aktiv : Produksjon Standby: DEV/QA/PreProd Standby: Produksjon Aktiv: DEV/QA/PreProd Miljøer NT har miljøer for utvikling, QA/test, pre-produksjon og produksjon. Miljøene er delt opp i soner (f.eks. QA01..QA05) hvor alle systemer er satt opp. På grunn av utnyttelse av ressurser og lisenser, har NT i enkelte miljøer satt opp en «felles» sone (eksempelvis våre QA/test-miljøer). Disse har en Informatica Powercenter-server i QA00 som fasiliterer 5 forskjellige repositories i fem ulike soner og tilhørende databaser. Hver sone (for eksempel QA00..QA05) har sin egen VLAN. Det er ingen kommunikasjon mellom sonene; kun med felles sone (Eksempel: QA01 kan ikke kommunisere med QA02 men, QA01 og QA02 kan kommunisere med felles sone QA00). I dag har NT 5 forskjellige QA-soner, men i framtiden skal det være mulig å sette opp flere. Mellom miljøene ellers (QA/Prod/osv.) er det ingen kommunikasjon. Løsningen må også kunne støtte NTs utviklingsmiljø. Dette innebærer at løsningen må kunne fasilitere mange forskjellige databaser i ulike soner, men at f.eks. brukere av QAdatabaser ikke kan kommunisere med databaser i Produksjon. Dette betyr at hver database må kunne knyttes til en sone (eksempel QA01) eller miljø-vlan (eksempel QA00). I følgende skisse er en del soner/miljøer grå fordi de ikke er aktive pr. i dag, men vi ser for oss et behov i framtiden. Side 5 av 10
DEV QA PRE PROD PROD DEV 01 DEV 02 QA 01 QA 02 QA03 PREPROD 01 PROD 01 DEV 00 QA 00 Datasenter Datahall 1 Datahall 2 Utviklingsmiljø: Pr. i dag benyttes en felles varehusbase til nyutvikling i prosjekter og forvaltningsmessige utviklingsoppgaver. Vi ser for oss at vi fortsatt vil kunne ha det slik, men at det kan være ønskelig med flere parallelle utviklingsdatabaser ved behov. I utviklingsmiljøet benytter vi en nedskalert, liten database. (databasen har en antatt størrelse på ca. 10% av produksjon til enhver tid). Test- & QA-miljøer: Pr. i dag har vi opp til fem konfigurerbare og parallelle miljøer til test og QA. De brukes til test og QA av pågående utviklingsprosjekter og forvaltning. Dette er et mønster vi vil opprettholde. I test- og QA-miljøene benytter vi nedskalerte, små databaser (hver av de små databasene har en antatt størrelse på ca. 10% av produksjon til enhver tid). Produksjonskopi / pre-prod: Det er ønskelig å kunne ha en fullverdig produksjonskopi i et eget miljø. Side 6 av 10
Norsk Tipping har behov for enkelt å kunne administrere alle disse selvstendige databaseinstansene også i ny løsning. Vi kan ha behov for å generere «tomme» test- og utviklingsdatabaser basert på script eller en annen eksisterende basestruktur (inkl. produksjonsdatabasen). Vi må også kunne kopiere hele eller deler av eksisterende baser fra produksjon til test/utvikling eller populere eksisterende test-/utviklingsdatabaser med større eller mindre datamengder fra produksjon til test/utvikling. 1.4 Tabellstørrelser Tabellen under viser de største tabellene i dagens datavarehus, sortert etter antall rader. Tabellnavn Rader x 1.000.000 Radlengde (gj.snitt) Størrelse (*) FACT_MX_GAME_ROUND 3.790 93 328 GB FACT_COUPON 1.585 78 115 GB AGG_DAY_DRAW_CUST_RET_PM 1.452 57 77 GB AGG_DRAW_CUST_GAME_CP_PM 1.209 49 55 GB AGG_DAY_CUSTOMER_GAME_RET_PM 835 48 37 GB AGG_DAY_CUSTOMER_GAME 774 51 36 GB Merk: Størrelse = Rader x Gj.snitt radlengde og ikke lagringsplass benyttet av Oracle. Inkluderer ikke størrelse på indekser. Tabellen under viser de største tabellene (utenom aggregater) i dagens datavarehus, sortert etter antall rader. Tabellnavn Rader x 1.000.000 Radlengde (gj.snitt) Størrelse (*) FACT_MX_GAME_ROUND 3.790 93 328 GB FACT_COUPON 1.585 78 115 GB FACT_COUPON_MATCH 368 76 26 GB FACT_CHARITY_CONTRIBUTION 236 52 11 GB FACT_ROW 217 61 12 GB FACT_WINNER 168 83 13 GB Merk: Størrelse = Rader x Gj.snitt radlengde og ikke lagringsplass benyttet av Oracle. Inkluderer ikke størrelse på indekser. 1.5 Datadistribusjon Ca. 45% av vårt datavolum i dag består av aggregater. Resterende 55% utgjør fakta- og dimensjonstabeller. Side 7 av 10
1.6 Forventet økning i datamengde 1.6.1 Interaktive spill (Multix/Belago) FACT_MX_GAME_ROUND Kvartal Rader x 1.000.000 2010-Q1 133 2010-Q2 148 2010-Q3 163 2010-Q4 182 2011-Q1 196 2011-Q2 211 2011-Q3 223 2011-Q4 238 2012-Q1 270 2012-Q2 300 2012-Q3 328 2012-Q4 352 2013-Q1 370 2013-Q2 407 450 400 350 300 250 200 150 100 50 0 Introduksjonen av spill med høy brukerfrekvens (IVT, internett og mobil) forårsaker stor økning i antall transaksjoner. Denne tabellen inneholder spilltransaksjoner for IVT (Interactive Video Terminals). Økningen i transaksjonmengde ser ut til å vedvare. Om økningen fortsetter (+40% hvert år) blir antall transaksjoner: År Rader x 1.000.000 2010 626 2011 868 2012 1250 2013 1750 2014 2450 2015 3430 2016 4802 2017 6723 2018 9412 2019 13176 2020 18447 2021 25826 For øyeblikket inneholder datavarehuset transaksjoner for siste 5 år. Side 8 av 10
1.6.2 Tradisjonelle spill (Lotto, Vikinglotto, Tipping mm.) Bilag 3 til Kjøpsavtalen: Kundens tekniske plattform FACT_COUPON Kvartal Rader x 1.000.000 2010-Q1 77 2010-Q2 67 2010-Q3 68 2010-Q4 74 2011-Q1 65 2011-Q2 67 2011-Q3 69 2011-Q4 83 2012-Q1 73 2012-Q2 67 2012-Q3 72 2012-Q4 76 2013-Q1 70 2013-Q2 68 90 80 70 60 50 40 30 20 10 0 Tradisjonelle NT-spill har en relativt stabil transaksjonsmengde. Ca. 2/3 av datavolum/lagringsplass i datavarehuset utgjøres av tradisjonelle NT-spill. I hovedsak består disse dataene av relativt stabile mengder transaksjonsdata, kunde- og agentdata osv. 1.6.3 Totaler Med utgangspunkt i dagens datamengde, introduksjon av nye spill og spillkonsepter, økt behov for historikk og framtidig introduksjon av ustrukturerte data, estimerer vi følgende utvikling i datamengde, basert på 50% økning hvert år: År Datamengde I TB (ukomprimert) 2013 8 2014 12 2015 18 2016 27 2017 40,5 2018 61 2019 91 2020 137 2021 205 1.7 Databaseobjekter Dagens varehusløsning består i hovedsak av tabeller og views i tillegg til enkelte andre objekter: Tabeller Standardtabeller, partisjonerte tabeller (ingen subpartisjonering), indeks-organiserte tabeller, partisjonerte indeks-organiserte tabeller. Side 9 av 10
For partisjonerte tabeller, gjelder at eldre partisjoner er komprimert (vha. en ukentlig batchjobb). Så og si alle tabeller har unike nøkler i tillegg til indekser (og partisjonerte indekser i de tilfellene tabellene i seg selv er partisjonerte). Enkelte tabeller har definert flere indekser og/eller kombinerte indekser. Størrelsen på enkelte indekser er i visse tilfeller like stor som datamengden i selve tabellen. Indekser For øyeblikket benytter varehusbasen følgende typer indekser: Unike, Ikke-unike, funksjonsbaserte, partisjonerte (unike/ikke-unike), indeksorganiserte, bitmap. Views Materialiserte Views Vi benytter materialiserte views til en viss grad i dag. Noen views blir oppdatert av ETL-jobber, andre trigget av Tivoli. Databaselinker For øyeblikket benyttes enkelte linker til andre interne Oracle-databaser. NT har startet en prosess for å fjerne bruken av databaselinker, men foreløpig er løsningene våre implementert slik at det er nødvendig med databaselinker. Funksjoner Funksjoner er i bruk i begrenset omfang. Brukes til balansering mellom tabeller og til støtte for annen forretningslogikk. Packages Packages er i bruk i begrenset omfang. Brukes til balansering mellom tabeller og til støtte for annen forretningslogikk. Prosedyrer Enkelte prosedyrer er definert. Brukes f.eks til oppdatering av materialiserte views. Sekvenser Alle sekvenser styres via funksjonalitet i Informatica Powercenter. 1.8 Brukere Norsk Tipping forventer en stor endring i bruk av datavarehuset. I dag har vi omkring hundre interne brukere som kjører (tunge) rapporter og analyser. I tillegg har vi eksterne brukere som henter mindre rapporter. Kunder (spillere 2,1 mill.) har i dag ikke tilgang til datavarehuset, men vi ser for oss at vi etterhvert skal bruke informasjon fra datavarehus for å tilby en mer personalisert opplevelse på f.eks. webside eller mobil. Alle NTs IT-systemer må i fremtiden kunne understøtte denne type utvikling i bruksmønster. Norsk Tipping går i retning av mer selvbetjent analyse og økt fokus på avansert analyse og prediktiv analyse. Side 10 av 10