DVH Appliance Saksnr.: PROSJ-010-13 Spørsmål og svar til Konkurransegrunnlag # 3, utsendt 21.03.2014
1. Introduksjon 1.1 Formål Formålet med dette dokumentet er å gi svar på innkomne spørsmål til Konkurransegrunnlaget vedrørende konkurransen «DVH Appliance» for Norsk Tipping AS med referanse PROSJ-010-13. 1.2 Spørsmål vedrørende konkurransen og konkurransegrunnlaget Vi gjør oppmerksom på at all korrespondanse vedrørende denne konkurransen bes rettet via e-post til: PROSJ-010-13@norsk-tipping.no Frist for å stille spørsmål til Konkurransegrunnlaget er 24. mars 2014 kl. 12:00. Denne anskaffelsen er underlagt Lov og forskrift om offentlige anskaffelser og Norsk Tipping anser det derfor særdeles viktig at alle leverandører behandles likt, også i forhold til informasjon. Ethvert forsøk fra leverandørene på å skaffe seg informasjon vedrørende denne anskaffelsen via andre kanaler enn e-postadressen over kan medføre avvisning. Norsk Tipping AS, 2014 Side 2/8
2. Spørsmål og svar Dokumentet inneholder svar på alle spørsmål mottatt pr. 20.03.2014. Nye spørsmål som er besvart i dette dokumentet er spørsmål 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 og 27. Nr. Mottatt Spørsmål Svar 1 28.02.2014 Vedr. krav 3.5.5 i Bilag 1 til Kjøpsavtalen (SSA-K): NT krever at løsningen supporterer big data og at den håndterer bruk av avanserte analysemetoder (prediktiv analyse, data mining, statistisk analyse, komplekse SQL mm.) på big data. a. Har NT verktøy og programvare for prediktiv analyse, data mining, statistisk analyse, komplekse SQL mm, og forutsetter at DVH appliance n som tilbys støtter dette? Eller skal tilbudet for DVH Appliance inneholde programvare til dette formålet? b. NT bruker begrepet big data. Er det noe NT har løsninger for, eller mener NT at løsningen skal kunne brukes på en "big data"-måte på sikt? I utvidet forstand, hva definerer Norsk Tipping som Big Data, og hva gjør dataene deres til Big Data? c. NT bruker begrepet avansert analyse. Hva slags prediktiv analyse er NT interessert i? Er det snakk om regresjonsmodeller, klassifisseringsmodeller, association rules, hidden Markov models, clusteranalyse, datamining på grafer? d. Hva slags data er tanken å utføre analyse på (transaksjonsdata, persondata e.l.)? a. Tilbudet for DVH Appliance skal ikke inneholde verktøy og programvare for prediktiv analyse, data mining, statistisk analyse, komplekse SQL mm. NT kommer ila. 2014 til å kjøre en egen anskaffelse for denne typen verktøy og programvare. b. Pr. i dag forholder NT seg i liten grad til big data og vi har heller ingen løsning for det. Vi ser for oss at vi i framtida kommer til å gjøre analyser også på big data. Vi ser da for oss at vi skal bruke en tredjepartsløsning for å strukturere ustrukturerte data. Når det gjelder vår definisjon av Big Data, henviser vi til Bilag 1, 1.2 Begrepsdefinisjoner. c. NT er interessert i å kunne benytte flere av de nevnte modellene for prediktiv analyse. d. NT planlegger å kjøre analyse på alle typer strukturerte data fra ulike kilder som vi måtte få behov for å analysere på. Norsk Tipping AS, 2014 Side 3/8
2 3 4 5 6 7 8 9 10 04.03.2014 I konkurransegrunnlaget står det i pkt 2.10 at bruk av underleverandører skal godkjennes av Norsk Tipping. Godkjenner Norsk Tipping en tilbyderkonstellasjon av leverandør- A/leverandør-B der deler av referansebasen er internasjonal? Og er det i så fall viktig for Norsk Tipping hvem som er lead og hvem som er underleverandør? 07.03.2014 Hvor mange ETL/ELT jobber totalt? - hva slags verktøy kjører Norsk Tipping fra? Kjøres alle ETL/ELT jobber fra Informatica PowerCenter? 07.03.2014 Hvor mange tabeller totalt? Vi har totalt ca. 900 tabeller i dag. Norsk Tipping vil godkjenne underleverandører basert på besvarelsen av kap. 8 i tilbudet (jf. pkt. 5.3 i konkurransegrunnlaget). Norsk Tipping krever at det er en hovedleverandør som er avtalepartner. Hovedleverandør kan benytte underleverandører men det tillates ikke en tilbyderkonstellasjon med leverandør A og leverandør B som hovedleverandør. I dette tilfellet godtas kun enten leverandør-a som hovedleverandør med leverandør-b som underleverandør eller leverandør-b som hovedleverandør med leverandør-a som underleverandør. Det er ikke stilt krav til at referanser skal være norske. Vi har i dag ca. 40 workflows som kjører på natt, totalt ca. 700 mappinger. Alle jobber kjører fra Informatica PowerCenter. 07.03.2014 I bilag 2 til SSA-K krav 2.3.1 er det spørsmål om bruk av fri programvare. Er fri programvare å oppfatte som «open source»? Fri programvare er å oppfatte som «open source». 07.03.2014 Hvor er de 2 datahallene geografisk? Datahallene er på Hamar i Norsk Tippings lokaler. 07.03.2014 Hvilken båndbredde finnes mellom de to datasentrene? Hvor mye båndbredde kan dedikeres til datavarehus trafikk? 07.03.2014 Tivoli nevnt i bilag 3 til SSA-K hvilke konkrete verktøy fra Tivoli benyttes? Hvilke andre driftsverktøy for datavarehus benyttes? 07.03.2014 I bilag 3 til SSA-K foreslås en aktiv passiv løsning hvor det er tilstrekkelig med en passiv løsning som gjøres aktiv dersom den aktive går ned. Hva er Recovery Time målsetning? Hva er Recovery Data målsetning? Hva er Recovery Point målsetning? 07.03.2014 I bilag 3 til SSA-K pkt. 4.3 står Data File Size 2.8TB, er dette eksklusiv RAID eller annen Det er høy kapasitet mellom de to datasentrene i dag. Vi ser for oss å kunne dedikere opp til 10Gbit hvis nødvendig til DVH. Fra Tivoli benytter vi Omnibus samt TWS (Tivoli Workload Scheduler). For dagens datavarehus benyttes Oracle Cloud controll. Våre målsetninger er: Recovery Time (RTO): Maksimalt 4 timer Recovery Point (RPO): Nær 0. Data File Size 2.8 TB er eksklusiv RAID og annen duplisering av data. Norsk Tipping AS, 2014 Side 4/8
duplisering av data for datasikring? 07.03.2014 Hva slags backup og restore løsning brukes Vi bruker i dag Oracle RMAN for backup og restore. RMAN skriver til NetApp. 11 idag? Kan den gjenbrukes for et nytt Det antas at det er avhengig av tilbudte løsning om dagens løsning for datavarehus? backup/restore kan gjenbrukes. 12 13 07.03.2014 I bilag 3 til SSA-K er det beskrevet at «Preprod» skal være en fullverdig kopi av «prod». I dagens miljø er dette markert grått og ikke aktivt (figur side 18). Er det riktig å anta at dette ekstravolum i dagens 8 TB og i estimater for kommende år ikke er tatt hensyn til? 07.03.2014 Bilag 3 til SSA-K pkt. 4.7.3 estimatene tar utgangspunkt i dagens volum på 8TB og en årlig tilvekst på 50%. Videre er det opplyst i pkt. 4.6 datadistribusjon at dataens datamengde inneholder 45% aggregat og 55% facts & dimensions. Det står intet om hvor mye av dagens 8 TB består av indeks, materialiserte views etc. Kan dere oppgi hvordan dagens 8 TB fordeler seg på: Facts & Dimensions (Base Data) Indekser, materialiserte views etc Aggregater Og hvordan årlig tilvekst på 50% fordeler seg på disse kategoriene, om den fordeler seg likt eller ujevnt på kategoriene Det er riktig at ekstravolum til «Preprod» ikke er med i dagens 8 TB i og med at vi ikke benytter preprod i dag. Ekstravolumet til «Preprod» ER hensyntatt i estimater for kommende år, ved at vi i bilag 7 til SSA-K har bedt om å få pris på 2 ganger det faktiske behovet. Materialiserte views er lite brukt og utgjør en liten andel av total datamengde. Under følger oversikt over komprimert datamengde pr. type databaseobjekt. I oversikten inngår indeksorienterte tabeller under segment_type INDEX. 14 07.03.2014 Dagens data tar opp 2.8 TB, hvilket gir en komprimeringsgrad på 2.8x (8/2.8). Hvordan er komprimeringsgraden fordelt på: Hvordan årlig tilvekst på 50% fordeler seg på disse kategoriene, vil blant annet være avhengig av OM/i hvilken grad vi fremdeles må ha aggregater og indekser på ny plattform. Uten endring ift. indekser og aggregater, vil fordelingen mellom objekttypene bli som i dag. Komprimeringsgraden i de forskjellige objektene er veldig variabel og avhengig av datamønster. Norsk Tipping AS, 2014 Side 5/8
Facts & Dimensions (Base Data) Indekser, materialiserte views etc Aggregater 15 16 17 18 07.03.2014 I bilag 3 til SSA-K pkt. 4.11 Brukere. Hva slags aksessmønster har dere på data i tabeller idag? Går de fleste queries mot den siste perioden (Måned, kvartal, år?), eller spenner spørringene over hele historikken? Kommer dette til å endres i framtiden? 07.03.2014 I bilag 3 til SSA-K nevnes bruk av Business Object XI, og planer om oppgradering. Hva er tidsplanen for migrering? Vil alt konverteres, eller vil tidligere versjoner fortsatt kjøre? Rent konkret hvilke versjoner av BO er det planlagt oppgradering til? Er det planlagt oppgradering til Business Object BI f.eks.? Funksjonaliteten i BO XI skal være tilgjengelig i BO BI v.4.1. 17.03.2014 I bilag 3 til SSA-K side 17 står det «Mellom miljøene ellers - (QA/Prod/osv.) er det ingen kommunikasjon.». På side 19 står det: Vi må også kunne kopiere hele eller deler av eksisterende baser fra produksjon til test/utvikling eller populere eksisterende test- /utviklingsdatabaser med større eller mindre datamengder fra produksjon til test/utvikling.». Hvordan løses dette i dagens løsning? Er det i en fremtidig løsning akseptabelt å åpne nettverk mellom produksjon og QA for å løse dette eller må dette løses ved å kopiere via en server (f.eks. en filserver) i en annen sone? 17.03.2014 Er det et krav at DEV QA og PROD skal kjøres på tre ulike fysiske eller virtuelle servere som ligger i hvert sitt forskjellige VLAN eller er det akseptabelt at sperring for aksess mellom databasene skjer på annen måte? Hvis det ikke skal kunne kommunisere mellom miljøene, hvordan kopieres data da i dag mellom miljøene? Er det evt. forskjell på sikringen av I hovedsak foregår spørringen mot varme data (måned, kvartal, år). Unntaksvis foregår spørringer på større deler av historikken. Vi ser ikke at dette kommer til å endres i framtiden. Vi regner med å være på SAP BO 4.1 før ny appliance er på plass. Etter oppgradering til SAP BO 4.1, vil det ikke bli kjørt noen eldre versjoner av SAP BO. Vi planlegger oppgradering til den versjonen som hos SAP heter: SAP BusinessObjects Business Intelligence platform 4.1. Om det med «Business Objects BI» mener «SAP BusinessObjects Business Intelligence platform», så planlegger vi oppgradering til Business Objects BI. Pr. i dag kopieres data mellom sonene via en server/backup/restore i en annen sone. Det er opptil hver enkelt leverandør å foreslå og beskrive løsninger som kan ha en akseptabel risiko, da spesielt med tanke på sikkerhetsstandarden ISO2001. Dev, QA, og Prod kan kjøres på samme fysiske infrastruktur, men på forskjellige virtuell infrastruktur som separeres i for eksempel forskjellige VLAN. Pr. i dag kopieres data mellom sonene via en server/backup/restore i en annen sone. Det er de samme kravene til sikring mellom DEV/QA og QA/PROD. Norsk Tipping AS, 2014 Side 6/8
sonene, ved at det f.eks. kan være akseptabelt 19 med deling av server mellom DEV og QA/Test men ikke mellom QA og produksjon? Stilles samme krav til duplisering av DEV og QA mellom datasentrene eller er det akseptabelt med manglende duplisering av disse? 17.03.2014 Preprod av datavarehuset er listet i figuren på side 17 i billag 3 til SSA-K men grået ut på side 18. Kan dere bekrefte eller avkrefte at Preproduksjon ikke er en del av forespørselen til ny løsning i dag? Vi har de samme kravene til duplisering av DEV og QA mellom datasentrene. Hvordan Norsk Tipping velger å sette opp miljøene, må være fleksibelt og enkelt konfigurerbart. Preproduksjon er en del av forespørselen til ny løsning. Som det står på SSA-K s. 17: I følgende skisse er en del soner/miljøer grå fordi de ikke er aktive pr. i dag, men vi ser for oss et behov i framtiden. 20 21 22 23 24 25 26 Ekstravolumet som trengs til Preprod er hensyntatt i estimater for kommende år, ved at vi i bilag 7 til SSA-K har bedt om å få pris på 2 ganger det faktiske behovet. 18.03.2014 Hor mange views er det i dagens løsning? Vi har 155 views i dagens løsning. 18.03.2014 Hvor mange databaselinker mot eksterne databaser i dagens løsning? 18.03.2014 Hvor mange SQL*Loader rutiner er det i dagens løsning? Vi har pt. 2 databaselinker mot eksterne databaser. Disse skal utfases i nærmeste framtid. Vi har ingen SQL*Loader rutiner i dagens løsning. Alle lastinger av filer foregår via Informatica PowerCenter. Vi har 36 metadata univers i dagens løsning. 18.03.2014 Hvor mange Metadata universer er det i dagens løsning? 18.03.2014 Hvor mange rapporter i dagens løsning? 766 forskjellige rapporter ble kjørt i 2013. 18.03.2014 Hvor mange kuber er laget i dagens løsning? Vi har ingen kuber i dagens løsning. 20.03.2014 I konkurransegrunnlaget under punkt 3.3 kreves innlevert «Siste tilgjengelige delårsregnskap med balanse for inneværende år, dersom det er mer enn seks måneder siden siste årsregnskap». I forhold til dette punktet menes at det skal innleveres et foreløpig regnskap med balanse for 2013. Dersom regnskapet for 2013 er godkjent skal det godkjente regnskapet for 2013 innleveres. Mener Norsk Tipping at det skal fremskaffes et foreløpig regnskap for inneværende år (januar og februar) eller skal dette tolkes som at Norsk Tipping ønsker et foreløpig regnskap for 2013? Norsk Tipping AS, 2014 Side 7/8
27 20.03.2014 I bilag 2 til SSA-V under krav V.2.13 krever Norsk Tipping at leverandøren gir en detaljert beskrivelse av alle hardware- og softwarekomponenter i tilbudt DVH Appliance som er gjenstand for support- og vedlikeholdsytelsene. Betyr dette at hardware- og softwarekomponenter detaljeres på artikkelnivå eller aksepteres det at all hardware supporteres på en måte mens software supporteres på en annen? Leverandøren skal for hver hardware- og softwarekomponent som er gjenstand for support liste opp alle komponentene med en detaljert beskrivelse av hver komponent. Det er ikke behov for at dette detaljeres på artikkelnivå men det skal tydelig fremgå hvilke hardware- og softwarekomponenter som inngår, slik at det ikke er tvil om hva som inngår i support- og vedlikeholdsytelsene. Norsk Tipping AS, 2014 Side 8/8