Det enkle er ofte det beste Arne Sødal Fagansvarlig - arne.sodal@matiq.no
Nortura - Norges ledende merkevareleverandør innen kjøtt og egg. Garanterer et mangfold av kvalitetsprodukter med likeverdige tilbud i hele landet. Omsetter for ca 17 milliarder kroner. 5 100 årsverk innen ulik industrivirksomhet i 34 kommuner over hele landet. Organisert som et samvirke Eies av 17 800 norske bønder.
Norge rundt med Nortura! Hovedkontor Nøkkeltall 2010 Ca. 17 milliarder kroner i årsomsetning Lanserte 128 nye produkter til norske forbrukere Årsproduksjon på nesten 223 000 tonn slakt og 39 000 tonn egg Industrivirksomhet i 34 kommuner og 15 fylker 5 790 årsverk Eid av 17 800 bønder organisert i et samvirke
Norge rundt med Matiq! Nøkkeltall Trondheim Hovedkontor Ca. 220 millioner kroner i årsomsetning Leverer årlig 100 110.000 prosjekttimer til Nortura Årsproduksjon på over 100 prosjekter God innsikt i Norturas verdiskapende prosesser 88 medarbeidere 100% eid av Nortura
Bakgrunn AIX / Oracle (for 4 år siden) 1. Dagens situasjon - hvor står vi i dag? Kartlegging Rutiner / dokumentasjon? Tilgjengeligheten til tjenestene (HA)? Katastrofeløsning (DR)? Krav til maximum nedetid ved feil (RTO) Krav til minimum datatap ved feil (RPO)
Bakgrunn AIX / Oracle (for 4 år siden) 2. Ambisjoner - hvor vil vi i fremtiden? Avbruddsfri drift HA/DR - RPO/RTO Gjør ting mye enklere
Bakgrunn AIX / Oracle (for 4 år siden) 3. Tiltaksliste - hvordan kommer vi oss dit? Masse arbeid Masse tid Investeringer
Bakgrunn AIX / Oracle (for 4 år siden) 4. Erfaringer i dag - bekreftelse på suksess?
HA High Availability Når komponenter i IT infrastrukturen feiler / stopper enten planlagt eller ikke planlagt HW eller SW Tjenesten for brukere vil ikke bli berørt eller blir berørt i liten grad HA ivaretas innad i ett datasenter
Stort utfall som berører flere eller alle komponenter på en lokasjon (mer enn bare IT) All IT-tjeneste er utilgjengelig Oppstart / recovery i datasenter 2 Management nivå IT-tjeneste tilgjengelig i løpet av timer / dager Må påregne tap av data DR ivaretas mellom 2 datasenter DR Disaster Recovery
RPO RPO Recovery Point Objective Mengde data / transaksjonslogger som virksomhet tåler å tape Virksomheten må bestemme RPO-verdien ikke teknologien
RTO Recovery Time Objective RTO Tiden det tar før brukere kan jobbe igjen etter stopp av ITtjenesten Eksempel 30 minutter: Tjenesten kan være nede i max 30 minutter uten alvorlig omfang for virksomheten Virksomheten må bestemme RTO-verdien ikke teknologien
Kartlegging HA DR 1. Dagens situasjon hvor står vi i dag? Komplekse tilpasninger Fungerte ikke Komplekse tilpasninger Ingen / ufullstendig / ikke testet Mangel på øvelser RPO Minimum datatap Økonomisk konsekvens i etterkant RTO Minimum nedetid Økonomisk konsekvens i etterkant
Building Cluster Systems APS 1 file01 WTS 1-60 AOS [1-10 ] Batch [1-10 ] Interconnect Interconnect Interconnect Oracle Instance 1 BATCH + Appl app (/u03) Oracle Instance 2 USERS Oracle Database Oracle Instance 3 USERS Oracle Instance 4 USERS
Reorganisering SAN-disker BSIS1 BSFO1 FSFO1 GVFO1 FSIS1 NNFO1 NKFO1 FSIS1 GVFO2 28 databaser 40 SAN-LUN s 4427 databasefiler Utvider der det plass Logisk feil på 1 SAN-LUN kunne ødelegge 16 databaser
2. Ambisjoner hvor vil vi i fremtiden? Business needs vs costs and complexity RPO = no data loss eller så nære 0 som mulig RTO = så liten som mulig Avbruddsfri drift med enkle prinsipper Færrest mulige enheter vertikal vs. horisontal Synkron speiling innad i datasenter Kopiering/replikering mellom datasenter Tjenester skal være tilgjengelige dersom utfall av ett datasenter Tilstrekkelig kapasitet i ett datasenter Redundans i komponenter innad i datasenter Teknisk vedlikehold kan utføres utenfor servicevindu HA innad i datasenter DR på tvers av datasenter Gjenbruk av tankemåter, kompetanse og prinsipp Keep it simple
3. Tiltak hvordan kommer vi oss dit? Avbruddsfri drift med enkle prinsipper Design Masse planlegging RPO - forretningens forventninger RTO forretningens forventninger Masse tid og arbeid Fokus Investeringer Støtte i forretningen Felles tankesett i alle fagområder Stol på HW Stol på SW Hold graden av kompleksitet nede Lag enkle prosedyrer for DR
2 uker dimensjonering 3 ukers levering 1 uke montering 1 uke kabling 1 uke partisjonering 1 uke dokumentering Opplæring Rutiner Prosedyrer Keep it simple 4 uker migrering Tiltak AIX / Oracle Max nedetid mindre enn ett døgn for det største miljøet under migrering Export 9 timer Import 5 timer
fra mange små til 2 store
Oracle Dataguard Oracle10 Oracle 11 Read-Only p595 Apply Lag=0-2sek Maximum Performance Async Log Ship p595 LAN failover/switchover 11G Apply Lag=0-15sek Maximum Performance Async Log Ship failover/switchover 10G SAN DS8300 DS8300
Oracle failover Oracle10 Oracle 11 Read-Only p595 p595 ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY LAN 5 MIN PR DATABASE Recovery Time Objective=5min Recovery Point Objective=max 2sek ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY SAN DS8300 DS8300
Oracle switchover Oracle10 Oracle11 Read-Only p595 ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY 7 MIN PR DATABASE ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY p595 ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY LAN SAN DS8300 DS8300
HW migrering 2012 p770 p595 p595 LAN SAN DS8300 DS8300
Standardisering og gjenbruk Samme teknologi men forskjellige skaleringer Enklere administrasjon Sentral administrasjon 4. Erfaringer i dag Klare og enkle prosedyrer ved failover Forenklet hverdag for IT-ansatte Fra reaktivt til proaktivt arbeid Stabile tjenester Reduksjon i management, økning i Infrastruktur 3 -> 1,5 AIX 3 -> 1,5 Oracle Redusert arbeidsbelastning Lavere lisenskost ved konsolidering CPU pools Samme core cpu lisensiering som før
>5X increase in performance per watt over POWER6+ >10X increase in performance per watt since POWER5+ >10 years of changing the server landscape rperf per KWatt * POWER4 p670 1.1 GHz KWatts: 6.7 POWER4+ p670 1.5 GHz KWatts: 6.7 POWER5 570 1.65 GHz KWatts: 5.2 POWER5+ 570 1.9 GHz KWatts: 5.2 POWER6 Power 570 4.7 GHz KWatts: 5.6 POWER6+ Power 570 4.2 GHz KWatts: 5.6 POWER7 Power 780 3.8 GHz KWatts: 6.9 POWER7+ Power 780 3.7 GHz KWatts: 7.7 * rperf values used, CPW would be similar
Solitaire Interglobal 4. Erfaringer i dag 43.000 customer sites running Windows, Linux and AIX
? Arne Sødal Matiq 07/11 2012