Arkivering i den digitale tidsalder Samdok samla samfunnsdokumentasjon - Du må lykkes i dag, for å kunne lykkes i morgen DELPROSJEKT Privatarkiv Arne-Kristian Groven, Seniorrådgiver, Riksarkivet KAI-konferansen 2016, Sandefjord, 15.09 2016
Litt om meg selv Seniorrådgiver på Riksarkivet, siden 2011. Bakgrunn fra Universitetet i Oslo (IT/informatikk), Norsk Regnesentral, Institutt for energiteknikk/halden Reactor Project. Har arbeidet med digital «records management» og langtidsbevaring av digitalt arkivmateriale i ca. 10 år. IT-sikkerhet, risikoanalyse, IT-drevne endringsprossesser, programvareutvikling, fri programvare m.m. enda lengre Var kursansvalig i kurset ARK2000, Digitalt depot, ved Høgskolen i Oslo og Akershus for et par år siden
Digital arkivering og langtidsbevaring - vanskelig, vanskelig Arkiv-Norge har de siste 10-20 årene forsøkt å langtidsbevare digitalt arkivmateriale. Det har vekslet mellom tro, håp og fortvilelse Mange har tenkt og prøvd mye, men få suksesshistorier Dette eren tilstand vi kan slite med de neste 10-20 årene også. Men det finnes programvare, standarder, løsninger som vi kan ta i bruk i dag! Hvis vi vil og har kompetanse.
Kompetansebygging (innenfor SAMDOK, Privat) Vi har som de første i Norge, ønsket å bygge kompetanse rundt forskjellig type programvare, fritt tilgjengelig for enhver: Archivematica: «Front-end» til depotløsninger AtoM (Access to Memory): For tilgjengeliggjøring (aksess, visning), søk og «metadata management» Siard Suite: For bevaring av databaser (Erfaringer fra flere samarbeidsprosjekter, med KAImiljøet og internasjonalt) Erfaringer rundt dette vil jeg nå dele med dere
Prosjekt-gruppa Oppgave PRIV 10_Metodikk for høsting og langtidslagring av privatarkiv Ellen Røsjø (leder) (Riksarkivet) ellros@arkivverket.no Arne Kristian Groven, RA (Riksarkivet / fagressurs) arngro@arkivverket.no Martin Ellingsrud (Arbark) Martin.Ellingsrud@arbark.no Pål Mjørlund (Fylkesarkivet i Oppland i samarb. m OPAM) pal.mjorlund@oppland.org Stig Brunstad (Bergen byarkiv) Stig.Brunstad@bergen.kommune.no Torkel Thime (Statsarkivet i Stavanger/NOGA Norsk olje- og gassarkiv) toth@arkivverket.no Per Kristian Ottersland (Riksarkivet) peot@arkivverket.no Jørgen Ø. Vik-Strandli (Riksarkivet) jorvik@arkivverket.no Rolf Petter Waage (Stokke AS / referanseressurs) waage@stokke.com
Hva jeg vil prøve å vise dere på noen få minutter Gangen i arkivarens arbeidsprosess Ulike verktøy (programvare) arkivaren kan bruke Effektiviseringspotensialet Dersom automatisert programvare benyttes Dersom internasjonale standarder benyttes At det som før tok dager og uker, nå kan ta timer
Dette vil jeg også nevne Kvalitetsforbedringspotensialet Automatisering framfor manuelt arbeid Potensiale for økt tillit til materialet Automatisering framfor manuelt arbeid Logging i hensiktsmessige formater Bruk av sjekksummer Aksesskontroll
Hvordan ser det ut det vi ønsker å ta vare på for ettertiden? Vanlige fil- og mappestrukturer Inneholdende det som ønskes bevart Dataene (arkivverdig innhold) Tilleggsinformasjon som gjør oss I stand tilå tolke dataene NB: Her,ingen krav til spesielle filformat!
Dette lastes så inn i Archivematica, som er inngangsporten til depot
Verdt å merke seg I vår tradisjon, Noark-tradisjonen, er det de som har skapt eller forvalter arkivet som skal Såkalt konvertere filformater, det vil si anvende spesialprogramvare som bringer data fra en filtype til en annen Et lite sett av presumptivt bestandige filformater er definert av Riksarkivet Først og fremst (varianter av) PDF/A
Men Denne filformat-konverteringen er en risiko for kvalitet (lesbarhet og funksjon) Det er også en risiko for framtidig tillit til arkivmaterialet Dette fordi det er mye forskjellig spesialprogramvare å velge mellom, av varierende kvalitet Denne spesialkompetansen mangler ofte I Archivematica kan en sende inn originalen, filformat-konvertering «skjer under panseret»
Arbeidet kan starte (via web-en): Automatisert prosessering, med beslutningspunkter underveis
Internasjonale standarder benyttes av Archivematica Dublin Core informasjon kan tastes inn METS og PREMIS genereres underveis, under panseret Informasjonspakker i OAIS (SIP-er, DIP-er og AIP-er) genereres underveis, under panseret
Arkivarene slipper å tenke særlig mye på Virussjekk, karantene, identifisering av filformater, hvordan datastrukturen til SIP/DIP/AIP ser ut, kvaliteten på konverterings-programvare, pluss mye mer, ikke minst IT-teknisk. Fokus kan flyttes til det arkivfaglige!
Ha fokus på det arkivfaglige!! Fylle inn metainformasjon i henhold til internasjonale standarder Ordne i mappestrukturene som ønskes bevart Kvalitetssikre det som produseres Ta beslutninger om SIP, DIP, eller AIP skal produseres etter endt kvalitetssikring Ta beslutninger om å sende resultatet til visningsog depotløsninger, geografisk plassert hvor som helst Eller rett og slett legge resultatet i et filsystem
Kvalitet og tidsbesparelser Tradisjonelt har enhver deloperasjon foregått ved manuelt arbeid, og mye klipp og lim Nå skjer det automatisert, med bruk av internasjonale standarder og strukturert logging Dette gir såkalt sporbarhet i forhold til å dokumentere manipulasjonene gjort på materialet Tidsforbruket blir redusert fra dager og uker til timer og minutter
Litt om visningsomgivelsen AtoM
AtoM (Access to Memory) oppsummert Web-basert grensesnitt, som Archivematica Visningspakker, DIPer I OAIS terminologi, kan importeres til AtoM fra Archivematica Metainfomasjon og beskrivelser av depotinstitusjoner, arkivskapere og arkivmateriell kan legges inn Forskjellige samarbeidende depotinstitusjoner kan benytte samme installasjon Depotinstitusjoner på ulike geografiske lokasjoner likeså
Arkivarens oppgaver I AtoM Depotinstitusjoner kan beskrives i henhold til ISDIAH standarden De som har skapt arkivmaterialet (arkivskaperne) beskrives i henhold til ISAAR(CPF) standarden Arkivmaterialet beskrives i henhold til ISAD(G) standarden Arkivmaterialet, i form av en visningspakke (DIP i OAIS terminologi) kan bli importert direkte fra Archivematica Ved søk og oppslag kan arkivmateriale vises, sammen med assosierte metadata (på ISAD
SiardSuite kan brukes til å bevare relasjonsdatabaser
Hvorfor er bevaring av relasjonsdatabaser vanskelig De ulike leverandørene har utnyttet svakheter i SQL spesifikasjonen slik at leverandørspesifikke konstruksjoner tas med Konsekvens: Databaser kan ikke eksporteres til andre leverandørers databasesystemer Dette løser SiardSuite verktøyet og SIARD formatet opp i uten at jeg har tid til å bli mer spesifikk om dette nå
Slik ser SIARD-formatet ut Metadata og data fra databasen blir lagret sammen i en ukomprimert ZIP64-fil. Filens suffiks er.siard
En SIARD fil er som andre filer Om en fil- og mappestruktur inneholder DOCX-filer, PDF-filer, eller SIARDfiler, er helt likegyldig for Archivematica Filer/dokumenter
Avslutningsvis Jeg har nå gitt dere en smakebit, ikke en utfyllende gjennomgang Men det er ikke noe i veien for å gå hjem og installere det jeg nå har fortalt om, dersom ITkompetansen finnes i egen organisasjon Dere kan også for Archivematica og AtoM sin del leie infrastruktur og support, men hold dere foreløpig til privatarkiv-materiale Det er ikke noe i veien for å gå hjem og arkivfaglig eksperimentere med disse verktøyene
Problematiseringer løser ikke våre utfordringer Det er mange problematiseringer en kan finne i det jeg nettopp har sagt, eksempelvis: Grensedragninger til lover og forskrifter, Noark og ADDML, Asta osv. Finansiering m.m. Etter mitt syn må en prøve å skape kontroll i eget hus først Da er ikke grensedragninger noe stort problem Men kompetanse må bygges og tid eller penger må allokeres Da vil det jeg nå presenterte kunne være et bra sted å starte
Takk for meg! Spørsmål og kommentarer kan sendes til: arngro@arkivverket.no