Samdok samla samfunnsdokumentasjon

Like dokumenter
Ole Myhre Hansen Seksjon for digitalt depot, RA

Innføring av earkiv i offentlig forvaltning

Samdok samla samfunnsdokumentasjon

Testverktøy Status og videre tanker

ARKIVVERKETS EARKIV- PROSJEKT : STATUS

REFERANSE: DATO: VERSJON: ANSVARLIG: [Skriv inn referanse] Marte Brekke. Rapport. Proof of concept - einnsyn

Nytt om elektronisk arkiv og deponering. v/tormod Engebu, IKAVA

Samdok samla samfunnsdokumentasjon

To RDF or not to RDF Fagdag om Noark 5 og RDF

Synkron overføring - Digitalt skapt materiale fra kommunene. Petter B. Høiaas Rådgiver, IKA Kongsberg

Samdok samla samfunnsdokumentasjon. Arkivarkitektur. Samdok-konferansen 12. november Hans Fredrik Berg, Riksarkivet.

Deponering og avlevering

Noark-5 hva blir det til? Ståle Prestøy IKA Trøndelag. 23. mai 2007 Noark-5 - hva blir det til? 1

SAMDOK. Riksarkivarens program for helhetlig samfunnsdokumentasjon. KDRS samling Trondheim juni 2014 Kari Frodesen/Ingrid Nøstberg

Samdok. PRIORITERT OPPGAVE Arkiv i eforvaltning. samla samfunnsdokumentasjon

Agenda: Overordnet mål for møtet: Presisering av oppgaver

Demo for første sprint

SAMDOK. Riksarkivarens program for helhetlig samfunnsdokumentasjon. Kontaktkonferansen 2014 IKA Trøndelag 21. mai Kari Frodesen

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

Noark 5 tjenestegrensesnittet Hvor er vi nå?

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

Public. earkiv 360. Integrasjonsmuligheter og nye metoder for import Stian Gregory

BLIR DET ENDELIG ORDEN PÅ DE ENORME DATAMENGDENE? Sett i lyset av Arkivverkets forslag om earkiv

Samdok samla samfunnsdokumentasjon

Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

TK-Arkiv Trondheim kommunes nye arkivkjerne

Status, deponering og avslutning for ephorte. Ved Leif Kristiansen

Bevaring av dokumentasjon i læringssystemer Lars-Jørgen Sandberg, Riksarkivet

earkiv som mulig felleskomponent for KDRS? 10. mars 2015 Fagdag - Riksarkivet - Oslo

Enkel arkivering, sikker gjenfinning og deling av virksomhetskritisk informasjon i et stort informasjonslandskap

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

IKA kjernen SAMDOK konferansen Gardermoen

Kontaktkonferansen 2015

Samdok samla samfunnsdokumentasjon

PRESENTASJON NORDIG OKTOBER Alle skal kunne teste alt - overalt

Samdok samla samfunnsdokumentasjon

Spørsmål og svar. Anskaffelse av elektroniske faktureringstjenester

Samdok samla samfunnsdokumentasjon

Kontaktkonferansen Jean-Philippe André Caquet

Bevaring og tilgjengeliggjøring- Hvor ligger forbedringspotensialet?

Samdok samla samfunnsdokumentasjon

Alle skal kunne teste alt - overalt KDRS TRONDHEIM JUNI 2017

Del 2: Uttrekk fra udokumentert database

White paper. e-arkiv

ARK2200-H18 - Digital arkivdanning og -bevaring II. Mappeeksamen

Uttrekk med Asta Mapper. Asta Mapper

DIGITALISERING MED INTERACT-FLOW

Standarder for en tjenesteorientert arkitektur

Bruk av komponenter i ADDML

Samdok. Samdok og. Arkiv i e-forvaltning. KDRS-samling 14. november Arkiv i e-forvaltning. Hans Fredrik Berg, Riksarkivet

Periodisering og avlevering av elektronisk arkiv hvem, hva, når? Rådgiver Ole-Bjørn Fossbakk og rådgiver Solveig Heløe Olsen, IKA Troms

einnsyn PoC: Demo for fjerde Sprint

Registrering av e-post e-postrekker og dokumentbegrepet. Norsk arkivråds høstseminar Øivind Kruse Arkivar, Riksarkivet

Hva jeg skal snakke om

Master Data Management

Velkommen til Riksarkivarens undersøkelse for kommunale arkivtjenester 2015 (Storbyundersøkelsen)

Samdok samla samfunnsdokumentasjon

Samdok samla samfunnsdokumentasjon

Konseptutredning om modernisering av arkivvedlikehold og overføring til depot (MAVOD) SAMDOK-konferansen 2017

Validering Noark 5-uttrekk Gjemnes kommune etter innlevering til Digitalt Depot IKAMR Torbjørn Aasen, IT-rådgiver

Teknisk hjørne RiskManager

Om det pågående arbeid med standard for arkivering av EPJ Hva med kommunenes behov?

Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland

Retningslinjer for deponering og avlevering av digitalt arkiv. Kontaktkonferansen 2018 Arkiv Troms v/jan Grav, IT-rådgiver

Langtidsbevaring av helsedata ved bruk av en åpen depotplattform

einnsyn PoC: Demo for tredje sprint

Brukerdokumentasjon. Outlook2Ephorte Gecko Informasjonssystemer AS Jarle Trydal

Referat. Møte i Arkivgruppen

Sikker, digital arkivering av personsensitiv informasjon

Hva har NOARK5 å bety for arkivet? Tormod Engebu, IKT-Rådgiver IKAVA

GODKJENT NOARK UTTREKK OG FORMIDLINGSLØSNINGER FOR KOMMUNALE FAGSYSTEM 14/06/2013. Documaster skanning og arkiv IKA Rogaland -30.

Samdok samla samfunnsdokumentasjon

Engie bygde deres «File Plan» inn i sin nye ECM løsning. Virker det tro? 28. oktober 2015

Få kontroll i et elektronisk arkiv

Samdok samla samfunnsdokumentasjon

Archivematica og AtoM: «State of the art» programvare for digital bevaring og tilgjengeliggjøring

Regelverk, instrukser, bestemmelser og metode

Del 3: Noark 5-basert databasestruktur

Samdok samla samfunnsdokumentasjon

Konseptutredning om modernisering av arkivvedlikehold og overføring til depot (MAVOD) Bakgrunn, problemområde, mål og avgrensninger

Nye krav til planer tilrettelagt for effektiv byggesaksbehandling

360⁰ ebyggesak. Hvordan effektivisere byggesaksposessen og videre planer. Bjørn Tore Eriksen

Hva er datakvalitet? Hvordan skal arkivtjenesten forholde seg til det?

DEN DIGITALE TIDSALDER

Automatisering av uttrekk fra bevarte databaser

Stikkord: Java EE, EJB, JSF, JPA, SWT, klient/tjener, Glassfish server, Application Client.

InnlandsGIS - Dataflyt og temadata

Samdok samla samfunnsdokumentasjon

Samdok samla samfunnsdokumentasjon

Samdok samla samfunnsdokumentasjon

Konseptutredning om modernisering av arkivvedlikehold og overføring til depot (MAVOD)

ISY Park Go og nye ISY Park. Endre Lykke, NoIS

Samdok samla samfunnsdokumentasjon

Produksjonslinje for bevaring og formidling av elektroniske arkiv fra kommunal sektor KDRS RIKSARKIVARENS ARKIVUTVIKLINGSMIDLER

Arkiv i e- forvaltning. Agenda 2014

Utvidet kravspesifikasjon for ArkN4

Noark 5 hvor går veien videre? Arkiv i e- forvaltning Gardermoen, 4. desember 2013 Øivind Kruse og Jon Atle Haugen

Nokios 2013 Forsvarlig håndtering av elevdokumentasjon i grunnskole og videregående skole

Transkript:

Samdok samla samfunnsdokumentasjon RAPPORT 2014 PRIORITERT OPPGAVE Arkiv i e-forvaltning ( Synkron avlevering (STAT) /Riksantikvaren (RDF) Utarbeidet av Øystein Isaksen, Gunnar Urtegaard, Kari Frodesen Rapportdato

1 av 8 OPPGAVE ( Synkron overføring av arkivmateriale til depot (STAT) / Riksantikvaren (RDF) Ansvarlig strategigruppe Arbeidsgruppens leder Arbeidsgruppens medlemmer Målformulering Sammendrag Arkiv i e-forvaltning Gunnar Urtegaard Bouvet: Graham Moore, Øystein Isaksen, Tom Bech Riksantikvaren: Marte Brekke, Lise Storfjord Riksarkivet: Kari Frodesen, Gunnar Urtegaard, Ole Myhre-Hansen, Jon Atle Haugen, Tor Anton Gaarder, Hans Fredrik Berg, Arne-Kristian Groven, Espen Tønnesen Etablere en pilot for avlevering av NOARK 5 data fra en statlig etat til Riksarkivet, der overføring og lagring skal benytte RDF basert teknologi. Samdok-prosjektet ville prøve ut metodikk for løpende eller synkron overføring av data frå arkivskaper til Riksarkivet. Arbeidet startet opp i november 2014 og skal være avsluttet i februar 2015. Riksantikvaren er pilotetat og data frå deres sak/arkiv-system (P360) skal være testdata i prosjektet. Prosjektet henter data løpende fram Riksantikvaren, og overfører disse til et mellomarkiv hos Riksantikvaren som er bygget opp bvasert på RDF som datamodell. Sommeren 2014 ble det utviklet en RDF-basert versjon Noark5. Den ble langt til grunn for datamodellen i prosjektet. I overføringen bli data validert hos Riksantikvaren og deretter hos Riksarkivet. Ved feilvalidering sendes det løpende meldinger til arkivtjenesten hos Riksantikvaren. Det er etablert en enkel innsynsløsning både hos Riksantikvaren og hos Riksarkivet. Alle endringer i metadata hos Riksantikvaren fører til ny validering og automatisk oppdatering av data i mellomarkiv. Ved avsluttede saker i P360 blir saken sendt til Riksarkivet. Dersom den valideres der blir dokumenter med tilhørende vedlegg hentet frå Riksantikvaren. I tillegg til å henta data frå P360, kan og XML-uttrekk i Noark5-format plasseres i filkatalog hos Riksantikvaren og sak for sak valideres og overføres til Riksarkivet Prosjektet avsluttes i slutten av februar. Data fram Mattilsynet er og planlagt som testdata i piloten. Prosjektet er finansiert av Riksarkivet/Samdok. Kostnadsramme: 500.000

2 av 8 Vedlegg PDF On the use of RDF in records management and archiving Lenker: Sesam: Informasjon om Sesam konsept og teknologi: www.sesam.no Prosjektrom benyttet i prosjektet: https://pingvinen.bouvet.no/kunder/riksarkivet/prosjekter/synkronavlevering Riksarkivet/ Github: https://github.com/sesamresearch https://github.com/sesamresearch/records-management-and-archive-systems- Research Oppfølging 2015 Status Riksarkivet vil oppsummere prosjektet på en fagdag i februar/mars. Der vil en og drøfte vidre arbeidet med RDF som datamodell og overføringsformat. Flere statlige etater har signalisert at de kan være interessert i å prøve ut RDF som overføringsformat. Ferdig

3 av 8 Innledning Riksarkivet ønsker å prøva ut nye måter å få avlevert data fra forvaltningen til langtidslagring i Riksarkivet sitt digitale sikringsmagasin. I flere år har man arbeidet med uttrekk fra eldre og avsluttede systemer/databaser. Dette har av ulike grunner vist seg vanskelig og kostbart. Det er grunn til å tro at en mer løpende eller synkron overføring etter hvert som saker eller journalposter blir avsluttet, kan visa seg mer effektivt, billigere og kan trolig gi bedre kvalitet på data som blir overført. Trolig vil en slik metode være bedre for både arkivskaper/avleverende organ og for Riksarkivet. Utgangspunktet i dette prosjektet er at et statlig organ har etablert en server som lagrer data i RDF og at Riksarkivet får tilgang til å hente data etter nærmere definerte regler fra denne serveren. Spesifisering av oppgaven Det ble i starten av prosjektet gjort en del spesifiseringer i forhold til omfanget og fortolkning av oppgaven: Riksantikvaren ble forespurt og takket ja til å være arkivskaper/avleverende organ. Et sett med NOARK 5 xml eksempelfiler ble bestemt laget for å teste flyt mellom Riksantikvaren og Riksarkivet på et så tidlig tidspunkt som mulig. Public 360 er NOARK 5 system det skal arkiveres fra. Det skal leveres data fra Public 360 hos Riksantikvaren som er i produksjon. (Ikke testserver) NOARK 5 dataene skal valideres først hos Riksantikvaren og kun godkjente data skal synkroniseres videre til Riksarkivet. Data som ligger hos både Riksantikvaren og Riksarkivet skal kunne vises i et grensesnitt. (Søk) Det skal sendes en epost med tilbakemelding om en validering hos Riksantikvaren feiler. Langtidslagring skal leveres til en RDF database. Bouvet sitt konsept/tjeneste Sesam benyttes. Sammensetning av arbeidsgruppen Arbeidsgruppen er sammensatt av representanter fra Riksantikvaren, Riksarkivet og Bouvet. Hos Bouvet er følgende personer vært mest involvert: - Graham Moore - Øystein Isaksen - Tom Bech Hos Riksantikvaren er følgende personer vært mest involvert: - Marte Brekke - Lise Storfjord Fra Riksarkivet er følgende personer mest involvert: - Kari Frodesen - Gunnar Urtegaard

4 av 8 - Ole Myhre-Hansen - Jon Atle Haugen - Tor Anton Gaarder - Hans Fredrik Berg - Arnt-Kristian Groven - Espen Tønnesen Avhengigheter Prosjektet er i hovedsak avhengig av at IT drift hos både Riksantikvaren og Riksarkivet klarer å behandle forespørsler innen rimelig tid, da det er en del nettverkskommunikasjon organisasjonene som må på plass for at prosjektet blir vellykket. Prosjektet er også avhengig av at arbeidsgruppe klarer å besvare spørsmål angående validering av NOARK 5 data, samt andre punkter hvor det kreves domenekunnskap og inngående arkivkunnskap. Funn Selv om prosjektet først avsluttes i slutten av februar, ser en alt nå at denne tilnærmingen fungerer både teknisk og metodisk. Validering av data fungerer godt og tallet sjekkpunktet for Noark5 kan reduseres dramatisk. På samme tid sikrer en bedre kvalitet. Løsningen vil bli testet live og med større datamengder i februar Drøfting Det er ulike elementer med løsningen som gjør at prosjektet mener framgangsmåten som er valgt egner seg godt til problemstilling den søker å løse, de mest fremtredende egenskapene er diskutert i de kommende avsnitt. Konsept og teknologi Det er i dette prosjektet benyttet Sesam som konsept/tjeneste for å tilfredsstille Riksarkivets krav til synkron avlevering. Nedenfor beskrives de mest relevante prinsippene i konseptet og hvorfor dette er nyttig i nettopp dette scenarioet. Konseptuelt prinsipp Alle Sesam komponenter er løst koblet. noe som oppnås ved bruk av «publish-subscribe» modellen, alle kildekomponenter publiserer sine data uten å ha noe forhold til mottakerkomponenten(e) som abonnerer på dataene. Datadrevet arkitektur. Data flyter mellom komponenter ved bruk av Verdi for Riksarkivet Dette er viktig for å ikke få noen direkte avhengigheter mellom arkivskaper og Riksarkivet. Hvis en lignende modell som denne skal benyttes mot flere hundre statlig etater(arkivskaper) i fremtiden, er det ekstremt viktig at hverken statlig etat er avhengig av at Riksarkivet til enhver tid er tilgjengelig (100% oppetid på mottaksservere), eller at Riksarkivet er avhengig av at alle statlige etater er tilgjengelige til enhver tid for å utveksle data. 100% tilgjengelighet er svært kostnadsdrivende og heller ikke nødvendig i denne sammenheng. Data er stadig i endring, behov er stadig i endring og det er aldri mulig å definere et ferdig modell for hvilke data som skal overføres

5 av 8 åpne standarder, det defineres ingen faste grensesnitt mellom kilde og mottaker, slik som i en tjenesteorientert arkitektur. Fleksibel skjemaløs datamodell (RDF) Publiser endringer fortløpende for all fremtid. Riksarkivet har svært langt perspektiv på data og det vil også være en stor fordel om en tjeneste for synkron avlevering har et svært fleksibelt forhold til hvilke data de ulike statlige etatene oversender. Her er det snakk om mange ulike systemer over svært mange år og både kravene til avleverte data samt måten de avleverte dataene lages på vil endres hele tiden. Hvis Riksarkivet skulle tilbudt et sett med statiske grensesnitt for avlevering (web services for eks), måtte disse i tilfelle til stadighet måtte endres i tiden fremover. Da måtte Riksarkivet enten støttet svært mange ulike versjoner eller krevd at statlige etater endret sine systemer til å avlevere mot siste oppdatert versjon, ingen av delene er spesielt gunstig. Bruken av en skjemaløs database betyr at i motsetning til mange datavarehusprosjekter, trenger man ikke å bruke tiden på å bestemme, lage og vedlikeholde en felles datamodell for hele virksomheten. Sesam gjør det mulig å lagre og sammenkoble data i fra forskjellige kilder uten å måtte endre på deres "form". Istedenfor å kjøre store jobber svært sjelden, oppdateres alle dataene med jevne mellomrom med mye hyppigere intervall. Det er kun endringer siden forrige synkronisering som blir overført, dermed slipper løsningen å overføre voldsomme mengder med data hver gang. Det blir dermed mye enklere å rette opp i eventuelle feilsituasjoner, mindre sjanse for brudd på forbindelser mellom servere i løpet av en overføring, samt mindre belasting av arkivet hos statlig etat, da det kun blir bedt om endringer siden forrige synkronisering og ikke store jobber som henter ut alt eller svært store deler av arkivet hver gang en synkronisering kjøres. Lagre alle metadata i et sentralt Datanav Alle metadata som kommer igjennom systemet blir lagret i et sentralt Datanav (RDF database), dette betyr at dataene enkelt kan eksponeres i en søkemotor. Dette gir svært gode muligheter for gjenfinning, både av arkivert materiale i seg selv, men også om data rundt arkiveringsprosessen, som valideringsfeil eller andre operasjonelle data. Dataene kan også brukes til rapportering, eksport til ulike formater, eksponering mot statlig etat som har avlevert dataene eller integrasjon mot andre systemer hos Riksarkivet hvor alle eller deler av dataene er relevante.

6 av 8 Valideringsfunksjon For dette prosjektet er det laget en egen valideringskomponent, som har som oppgave å validere RDF baserte NOARK 5 data opp mot NOARK 5 sine valideringsregler. For å oppnå dette er følgende gjort: Det er laget en syntaks for å beskrive NOARK 5 modellen i RDF, inkludert betingelser (contstraints). Syntaksen er basert på vedlagte dokument «On the use of RDF in records management and archiving, skrevet av arbeidsgruppe deltaker Graham Moore fra Bouvet. Både modell og regler (contstraints) er beskrevet i data og lagres i RDF databasen sammen med resten av dataene. Dette gjør det enkelt å synkronisere modell/regler fra Riksarkivet til arkivskaper, slik at validering av NOARK 5 RDF hos arkivskaper skjer med best mulig forutsetninger. Det er valgt ut et begrenset antall regler (contstraints) i dette prosjektet. Valideringskomponenten skriver tilbake resultatet av valideringen til RDF database. Hvis resultatet av validering hos arkivskaper er vellykket, sendes dataene videre til Riksarkivet der dataene valideres på nytt, er resultatet igjen vellykket sendes dataene til langtidslagring. Valideringskomponent støtter også enkel validering av binær fil som skal arkiveres. (PDF-A) Public 360 integrasjon For å hente ut data fra et eksisterende NOARK 5 system benyttes det en Sesam Public 360 komponent mot Riksantikvarens Public 360 server. Denne fungerer på følgende måte: Henter automatisk operasjonelle data fortløpende fra Public 360 etter hvert som det skjer endringer i databasen. Bruker av systemet trenger ikke å eksportere manuelt eller vite om at dataene hentes. Henter data via standard Public 360 API. I pilot hentes et begrenset sett av metadataene, hovedsakelig de dataene som skal til for å tilfredsstille de reglene (constraints) som er definert i valideringskomponenten. Henter ikke data fra personalmapper. Data blir først transformert til RDF, deretter til NOARK 5 RDF formatet, slik at valideringskomponent kan gjøre valideringen.

7 av 8 Løsningsskisse

Konklusjoner 8 av 8 Prosjektet viser lovende resultater selv om det ikke blir sluttført for i februar. Komponenter utviklet i prosjektet vil bli tilgjengelig som åpen kildekode. Videre arbeid Riksarkivet vil oppsummerer prosjektet på en fagdag i februar/mars.der vil en og drøfte vidre arbeidet med RDF som datamodell og overføringsformat. Flere statlige etater har signalisert at de kan være interessert i å prøve ut RDF som overføringsformat.