Overvåkning av Cerebrum

Like dokumenter
Overvåkning med Nagios

E-post ved UiO for Systemgruppeforum. Bård H.M. Jakobsen Gruppe for drift av meldingstjenester (GMT)

Nyhende i Cerebrum. Joakim Hovlandsvåg. 18. september. Cerebrum-seminar Nyhende i Cerebrum

Referat Cerebrum-seminar 2019 usit.uio.no/om/tjenestegrupper/cerebrum/seminar/2019/ Referent: Andreas Ellewsen

Deteksjon og forsvar med ELK. Espen Grøndahl IT-sikkerhetssjef UiO

Cerebrum Komponentarkitektur

Løsningsforslag Integrasjon mot EIS / ephorte

To-kampus: En visjon i sør

IT-konferansen 2013 Exchange-etablering

Bruk av Elasticsearch til søk og klassifisering. Ove Haugland Jakobsen 26 november 2018

Oppgradering av Handyman til ny versjon

KONKURRANSEGRUNNLAG. Bilag 4 Prosedyre A63-V01 Krav til ekstern driftsleverandør

Konfigurasjonsstyring, automatisering, endringskontroll og overvåking. Jarle Bjørgeengen University of Oslo / USIT

Cerebrum-seminaret Oslo, September 2014

Velkomment til å installere BAS21

GSM Fixi SMS. Sikom AS og Android: Oversikt: Kompatibilitet: Installasjon: Kostnader: Konfigurasjon og bruk:...

Anbefaling om igangsetting av løsning for resultatutveksling

Del 1 Generelt. Del - 1 Generelt. Generelle tips ved innføring av Gat!

Effektiv Systemadministrasjon

Ny avtale for utskrift og kopi

Allmøtet 22. januar 2015: Årsplan for USIT for : Tiltak og prioriteringer. IT-direktør Lars Oftedal

Introduksjonskurs for bachelorstudenter. IT-tjenester ved UiO. Simon Wolff

- analyse og implementasjon

einnsyn PoC: Demo for fjerde Sprint

Teknisk hjørne RiskManager

Ny Multikanal funksjonalitet for Unit4 og ERP Innfordring ODD EGIL ORØY, PRODUKTSJEF MULTIKANAL, EVRY JUL TOMAS BRUSTAD, SJEFSKONSULENT UBW

Releaseinfo Winorg april-2018

Samdok samla samfunnsdokumentasjon

Presentasjon av arbeidet med einnsyn Proof of Concept

Releaseinfo i Winorg 3.0 JUNI-2016

Årsplan for USIT for : IT-direktør Lars Oftedal. Rammer og føringer (I) Tiltak og prioriteringer

IT Service Management

VirtHome eller muligens WebID Bedre forslag? Send en e-post til

INSPERA- brukerveiledning for student hjemmeeksamen i gruppe

Canvas for IT-vakter

altinn tjenester 3.0

Brukermanual Brother Meter Read Tool

INSPERA- brukerveiledning for student hjemmeeksamen i gruppe

Innholdsliste Installasjon og oppsett. Registrering. Innstillinger

NYHETER OG FORBEDRINGER SIDEN SIST. Drift

GSM Alarm Controller III

KS SvarUt. Hvordan konfigurere, bruke og administrere tjenesten

Ny teknologi for overvåking av skredhendelser, erfaringer så langt

IT Service Management

DIPS Communicator 6.x. Installasjonsveiledning

RFID AutoLogOff - et studentprosjekt

BOSSNETT AS. Retningslinjer for drift, vedlikehold og service for tilkobling til bossnettet Dokument 9. Revisjonshåndtering

Innledende Analyse Del 1: Prosjektbeskrivelse (versjon 2)

GJENNOMGANG UKESOPPGAVER 9 TESTING

FOR MAC Hurtigstartveiledning. Klikk her for å laste ned den nyeste versjonen av dette dokumentet

E-post ved UiO for Systemgruppeforum. Bård H.M. Jakobsen Gruppe for drift av meldingstjenester (GMT)

BOSSNETT AS Bergen sentrum

Canvas ipad App for studenter

Konfigurasjonsstyring

Automatisering og robotisering av dokumentasjonsforvaltning. Kristine Synnøve Brorson ELSA II Kick-Off, NAV

Hvordan angripe en større oppgave? (og hva skal jeg gjøre i oblig 7!?)

CS-Web SMS og E-Post

Fagdag om elektronisk meldingsutveksling i NT E-meldinger. Stiklestad 5.Desember 2014 Arne Gunnar Barstad

Hovedprosjekt i Anvendt Datateknologi Våren 2008 FORSIDE

Overgang til RT4 hjelp for saksbehandlere

8 myter om datasikkerhet. du kan pensjonere i

Presentasjon Bacheloroppgave 051E

Jobbkø. Innhold. Versjon 1.0 Copyright Aditro Side 1 av 18

Folkehøgskolens Informasjonssystem NAVI, HISTORIKK. Historikk

Demo for første sprint

Lykke til! Eksamen i fag SIF8018 Systemutvikling. 20 mai, 2003 kl Fakultet for fysikk, informatikk og matematikk

Unified Communication

Huldt & Lillevik Lønn 5.0. Produktnotat

WISEflow brukerveiledning for deltaker

WP-WATCHER WORDPRESS SIKKERHET

IT-HJELP/ IT.UIB.NO Hvordan bidra med informasjon til IT-avdelingens hjemmesider (En innføring)

ProMed. Brukermanual for installasjon av. Elektronisk meldingshåndtering / EDI inklusiv DIPS Communicator. for. for Windows

1 INNLEDNING Hva er IntellAgent? HENDELSESOPPSETT... 4

minfagplan.no Brukerveiledning - Beskrivelse av SMS funksjonalitet for brukere av minfagplan.no Dokumentnummer: BV-001 Revisjon Dato:

Innføring av ny telefonløsning Erfaringer og utfordringer. Kjetil Otter Olsen Avdeling for IT-drift, USIT

Sikkerhet ved PC-basert eksamen

Innhold. efaktura Visma AutoInvoice til v Oppsett/Vedlikehold Systemkoder og Hovedkoder Systemkoder og e-faktura...

Ofte stilte spørsmål

MONTERINGS- OG BRUKSANVISNING FOR GARASJEPORTÅPNER

Releaseinfo Winorg september-2018

Installasjonen tar normalt ca 10 minutter

IT-Reglement for Telemark fylkeskommune (TFK) 1 Reglementets virkeområde

WinTid g2. Oppgradering til versjon HRM

WT-1672A GSM Strømbrudd Alarm

Planlegging og iverksetting av sikkerhetsavhengige tjenester i forskjellige systemer

Integrasjon - fra strategi til vellykket implementering. Integrasjonsdagene Halden, august 2013 Ståle Hustad, TrønderEnergi Nett AS

PANVAK: kort intro.

USITs virksomhet i 2016

Referat. Møte i ekspertgruppen for sak arkiv 3. juni 2014

Installere programvare gjennom Datapennalet - Tilbud

Installasjon av FINALE Årsoppgjør og FINALE Rapportering i ASP-miljø

TESTVEILEDNING. PAPIRFLY Fotoweb. EiendomsMegler 1 Norge AS ved Marit Låtun Papirfly ved Christine Skaar. DATO: April, 2013

Småteknisk Cantor Controller installasjon

Oppgradering av Handyman til siste tilgjengelige versjon

Boligalarmprosjektet.

Systemet tilpasses brukerområdet og overvåker blant annet temperatur, CO2, fuktighet, partikler og strømforsyning.

Nr.6 Rutine om IKT-løsninger lokalt. Meldingsutveksling

Monitoring Framework - Kravspesifikasjon

Sikkerhet ved outsourcing. Espen Grøndahl IT-sikkerhetssjef UiO

Transkript:

Overvåkning av Cerebrum Cerebrum-seminar 2019 Kai Vaade, Cerebrum-Drift 30/04/2019 1

Agenda Overvåking av Cerebrum (hovedsakelig fra et drifts-perspektiv) Eksempel på avvik i Cerebrum, 2. feb 2019. 30/04/2019 2

Overvåkning av Cerebrum Hvordan har vi oversikt over at ting fungerer slik de skal? Hvordan oppdager USIT problemer? Er overvåkingen god nok? Overvåkes av ukevakt i kjernetid; kl 09:00-14:30. Ukevakt-ordning; én person har ansvar for å følge med. Utenfor kjernetid vil det variere når feil fanges opp. Prøver å være proaktiv i stedet for reaktiv, men det er mange forskjellige integrasjoner og utfordring i at det er mye automatikk, integrasjoner, data som ikke lett å teste... 30/04/2019 3

Konfigurasjons- og kodeendringer legges ut i Produksjon a) - Konfigurasjonsendringer gjøres hovedsakelig av Drift. b) - Kodeendringer uføres av utvikler, testes lokalt - Godkjennes av én eller flere utviklere - Prodsettes av utvikler I koden kan det legges inn sjekker på at resultat ser riktig ut, men vanskelig å sjekke for alt som kan skje. 30/04/2019 4

De ulike overvåkingskanaler vi har på kode i Produksjon RT Ticketbasert system hvor brukere melder inn problemer/utfordringer (reaktivt) Mattermost Lynmeldinger mellom IT-ansatte ved UiO (har overtatt etter XMPP). - Varslinger mellom utviklerne og drifterne, og også med driftssentret samt øvrige UiObrukere. Zabbix Monitoreringssystem hvor man kan kjøre tester nesten på hva som helst, og sette opp alarmer (e-mail, ELK, Jabber, Mattermost, SMS) Oppgradert til ver. 4.0 den 5. mars - mistet dashboard, bør opprettes igjen. 30/04/2019 5

De ulike overvåkingskanaler vi har på kode i Produksjon (forts) Zabbix (forts) Utover en basic overvåkning (load, disk, cpu etc) av servere er det satt opp alarmer på: Felles - bofhd - job_runner - antall filer i job_runner directory - antall filer eldre enn 2 år UiO - consumer_sap - exchange_daemon - radius-karantene-fil - git (versjonering av cerebrum-koden) 30/04/2019 6

De ulike overvåkingskanaler vi har på kode i Produksjon (forts) Sentry Akkumulerer opp feil i Cerebrum. Har erstattet gammelt "system" der cerebrum-feil i logger ble sendt ut på e-post. Ingen alarmer, må sjekkes manuelt. Generell overblikk og søk etter nøkkelord slik som: too many, failed processing, person, similarsizewriter, manual intervention, multiple, exit_code=1, etc. ELK - Elasticsearch Logstash og Kibana ELK brukes til mottak, prosessering, lagring, analyse og visualisering av loggdata. Vi har brukt mye ressurser på å sette opp ELK, men bruker det kanskje i for liten grad. 30/04/2019 7

Eksempel på avvik i Cerebrum, 2. februar 2019 Avviksrapport (Cerebrum fjernet fnr, studenter mistet tilgang). Problem oppdages IT-drift hos Høgskolen i Østfold (HiØ) merker at overførte filer fra Cerebrum (LDAP og ABC) har blitt markant mindre, og sender e-post til Cerebrum-drift om problemet (RTsak). Tiltak - USIT hjemmevakt har opprettet en egen kanal på Mattermost for intern koordinering ved slike større hendelser. [Gjort] - USIT reviderer prodsettingsrutinene for Cerebrum slik at det blir tydeligere hvordan en endring må testes før den settes i produksjon. [Under arbeid] - USIT reviderer interne rutiner for varsling ved uforutsette hendelser for Cerebrum. [Under arbeid] - USIT vurderer hvilke automatiske varsler som kan settes opp for å oppdage om noe lignende skjer igjen. [La oss begynne med dette nå, kom med innspill!] - USIT forbedrer loggingen, så den inneholder relevant informasjon, og med riktig loggnivå. [Utviklingsjobb, står i kø] 30/04/2019 8