Hvordan bevare bits & bytes?



Like dokumenter
Dias, Ny lagringsmodell for elektroniske arkiver

Ny modell for et digitalt depot i Arkivverket i Norge

DIAS-prosjektet. Status mht. gjennomføring, resultater og produkter. LLP-konferanse, Trondheim Trond Sirevåg

DIAS - Digital arkivpakkestruktur

Presentasjon av implementasjonen av ESSArch i Arkivverket

Kommunale, digitale depot i endring Trøndelagsmodellen. Kari.Remseth@ika-trondelag.no

Kravspesifikasjon til forvaltningssystem for DIAS-arkivpakker

Digitale depot. Terje Pettersen-Dahl Seksjon for Digitalt Depot Riksarkivet. KAI-konferanse 2013 Balestrand 13. september 2013

Prosjektramme. Muligheter for programutvikling og for kompetansebygging i arkivmiljøene etter ordinær prosjektslutt

Bevaring av digitalt skapt arkiv metode gitt i OAIS og DIAS

Vel bevart! Rapport fra samarbeidsprosjektet DIAS Digital arkivpakkestruktur. Riksarkivaren 8. juni 2012

OAIS og tilknyttede standarder

Nordisk Arkivakademi. Arkivpakkestruktur. i det norske Arkivverkets nye digitale magasin. Boden, Trond Sirevåg

Uttrekk og bevaring av elektroniske arkiv

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

Digitalt og autentisk. Planlegging av ny depotløsning for Arkivverkets digitalt skapte arkivmateriale. Kortversjon av prosjektrapport

<Digitale_arkiver>fra A til #??A_#%,&</Digitale_arkiver> Digitale arkiver fra A til Å

Autentiske data hva er det og hvordan sikres det?

Overgang fra papirarkiv til digitale arkiv. IKA Finnmark, 26. september 2017

Arbeidsfordeling mellom kommuner, IKA og KDRS ved uttrekk av elektronisk arkiv Kontaktkonferansen 2014, tirsdag 23. april 2014 Tor Eivind Johansen,

Digitalt og autentisk. Planlegging av ny depotløsning for Arkivverkets digitalt skapte arkivmateriale. Prosjektrapport

DIAS og TRAC. SUHS-konferansen Petter Pedryc Interkommunalt arkiv IKS

Samdok samla samfunnsdokumentasjon

Fra produksjonsmiljø til bevaring - produksjonslinje for earkiv. v/sigve Espeland og Harald Nordli

Del 2: Uttrekk fra udokumentert database

Archivematica og AtoM: «State of the art» programvare for digital bevaring og tilgjengeliggjøring

Digitalt og autentisk

Produksjonslinje for bevaring og formidling av elektroniske arkiv fra kommunal sektor KDRS RIKSARKIVARENS ARKIVUTVIKLINGSMIDLER

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

Validering Noark 5-uttrekk Gjemnes kommune etter innlevering til Digitalt Depot IKAMR Torbjørn Aasen, IT-rådgiver

Tidskapselen Digital langtidslagring i Arkivverket

Testverktøy Status og videre tanker

Prosjektet «Utforming av felles prosesser og rutiner for digitalt skapt materiale» 21. november 2012

Fagsystemer. Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Digital Arkivbehandling fra A til Å

KAI-konferansen Innblikk i KDRS digitalt depot løsning og arbeidsflyt 16. september 2015 Arendal

Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland

Bevaring av fagsystem og Noark 5

Noark-5 hva blir det til? Ståle Prestøy IKA Trøndelag. 23. mai 2007 Noark-5 - hva blir det til? 1

ARKIVVERKETS EARKIV- PROSJEKT : STATUS

Bevaring og tilgjengeliggjøring- Hvor ligger forbedringspotensialet?

Bevaring og innsyn i elektroniske arkiver i Bergen kommune. IKAH kontaktkonferanse 2. juni 2015 jan.helle@bergen.kommune.no

Samdok samla samfunnsdokumentasjon

Metadata for gjenfinning og bevaring. Jonny Edvardsen Avdelingsdirektør Tilvekst og kunnskapsorganisering Nasjonalbiblioteket

Kravspesifikasjon Arkade 5 Testverktøy for digitale arkivpakker

Automatisering av uttrekk fra bevarte databaser

Arkiv i Nordland Kontaktkonferansen 2013

PRESENTASJON NORDIG OKTOBER Alle skal kunne teste alt - overalt

Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

Vedlikehold og langtidslagring av elektronisk arkivmateriale

IT, arkivarens verktøy eller forbannelse? Arne-Kristian Groven, Riksarkivet 24. mars 2015

KDRS digitalt depot Spesifikasjon av tjenesten

ADDML. Archival Data Description Markup Language. Generell del. Versjon PA 0.07 Sist oppdatert: TPD. ADDML_8_2.doc 03/03/2011 1(12)

HelsIT 2015 Submission/Paper 9 (rev.)

Kravspesifikasjon Arkade 5 Uttrekks- og testverktøy for digitale arkivpakker

Veiledning for avlevering av elektroniske arkiv

Fra uttrekk til edepot

Ole Myhre Hansen Seksjon for digitalt depot, RA

KDRS status, veien videre Tor Eivind Johansen, daglig leder KDRS Bodø

KOMMUNEREFORM ARKIV OG DOKUMENTASJONSFORVALTNING. FASE II Hva må gjøres etter at vedtak om sammenslåing er fattet?

Innsynsløsningen til bergen byarkiv

Samdok samla samfunnsdokumentasjon

ARKIVBESKRIVELSE I ATOM KOMPETENT ÅPEN PÅLITELIG SAMFUNNSENGASJERT

Samdok samla samfunnsdokumentasjon

Digitalt skapte arkiver og kommunenes rolle i bevaringsarbeidet IKATs kontaktseminar, fredag 23. mai 2014 Tor Eivind Johansen, daglig leder KDRS

Metoder og verktøy for overføring, analyse og tilgjengeliggjøring av digitalt arkivmateriale

Digitalt depot. Instruks deponering

Daglig leder Tor Eivind Johansen Kommuneseminaret

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

Elektronisk arkiv - hva er det? Karin Amalie Holmelid kaho@hib.no Arkivleder/leder for Dokumentsenteret ved Høgskolen i Bergen

Digital Arkivbehandling fra A til Å

Samdok samla samfunnsdokumentasjon. Arkivarkitektur. Samdok-konferansen 12. november Hans Fredrik Berg, Riksarkivet.

Noark 5 tjenestegrensesnittet Hvor er vi nå?

DEN DIGITALE TIDSALDER

EPJARK-standarden (Standard for arkivavlevering av elektronisk pasientjournal til Norsk helsearkiv )

Periodisering og avlevering av elektronisk arkiv hvem, hva, når? Rådgiver Ole-Bjørn Fossbakk og rådgiver Solveig Heløe Olsen, IKA Troms

Digitale arealplaner. Arkivloven Lars-Jørgen Sandberg, Riksarkivet

Kandidatnummer 832. Migrering av data

Elektroniske lagringsformat

Konvertering av arkiv til digitale lagringsmedier. Digitalisering for kassasjon

Innføring av earkiv i offentlig forvaltning

Fra allment arkivskjema til funksjonsbasert arkivbeskrivelse. Det 6. norske arkivmøtet Ålesund, 18. april 2013 Jon Atle Haugen

Uttrekk fra elektroniske arkiver

Digitalt arkivdepot. Forprosjekt i Byarkivet

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

Transkript:

Hvordan bevare bits & bytes? Olav Hagen Sataslåtten underdirektør, Riksarkivet olasat@arkivverket.no EDOK 2012

Etablering av digitalt sikringsmagasin i Riksarkivet Teknisk løsning ved lagring av elektroniske arkiver -både hardware og software. Løsninger for behandling av digitalt skapt materiale. Sikkerhetsaspekter knyttet til langtidsbevaring av elektronisk materiale

Oais-modellen Preservation planning P r o d u c e r SIP Descriptive info Ingest AIP Data management Archival storage Descriptive info AIP Access DIP C o n s u m e r Administration Management

Definert av den amerikanske romfarts organisasjonen Er ikke en implementerings modell, men en referanse- og begrepsmodell Modell for å innlemme, administrere og bruke bevart arkivmateriale i et depot Er bygd opp rundt informasjonspak ker Beskriver funksjoner, prosesser og informasjonsflyt

SIP AIP DIP OAIS (Open Archival Information System) Submission Information Package) - Innleverings pakke AIP (Archival Information Package) Arkivpakke DIP (Disseminati on Information Package) - Visningspakk e

Nasjonalt samarbeidsprosjekt mellom Riksarkivet og kommunale arkiver (IKA er og byarkiv) og utvikling av verktøy for håndtering og oppfølging av disse Vi introduserer Dias Baserer seg på standardene OAIS og TRAC Resulterer i standarder for arkivpakker

DIAS-prosjektets produkter Spesifikasjoner 1) Arkivpakkemodell: Basis arkivpakkestruktur Prosessmodell for vedlikehold i digitalt depot 2) Tilpassede xml-skjemaer til støtte for modellen: DIAS-METS og DIAS-PREMIS Regler for mapping av (fullstendige ) EAD- og EAC-CPFskjemaer fra Asta 3) Kravspesifikasjon til forvaltningssystem Programvare for å anvende spesifikasjonene Forvaltningssystemet ESSArch Rutineopplegg for håndtering av DIASarkivpakker i ESSArch

Særtrekk ved det digitale Digitale arkiver er ferskvare ; de er forgjengelig på en helt annen måte enn papirarkiv Hvordan sikre slike grunnleggende behov som autentisitet og integritet for noe som i utgangspunktet kun er basert på tallkoder? Finnes det internasjonale standarder vi kan og bør følge?

Utfordringene mht. integritet og autentisitet Digital informasjon kan enkelt endres og manipuleres Digitale arkiver kan ikke bevares statiske. De er i en prosess med stadig transformasjon gjennom hele livssyklusen til fundamental forskjell fra papirarkiver Men hvordan kan folk stole på at stadig omskapt arkivmateriale fortsatt er autentisk? Hvordan garderer vi oss når det settes søkelys på hva ulike aktører har hatt mulighet for å endre? Hvordan lar det seg bekrefte at en aktør har nøyd seg med å foreta de endringer som sies å være utført? Jf. O. J. Simpson-saken i USA i 1995, hvor retten underkjente politiets fingeravtrykk-bevis

TRAC-standarden TRAC - Trustworthy Repository Audit and Certification - Criteria and Checklist (2007) Requirements to ensure the sustained integrity and authenticity of objects in repository custody http://www.crl.edu/pdf/trac.pdf

Et godt renommé er ikke nok Bevisbyrden snus Krav i OAIS og TRAC Endret virkelighet for digitale arkivdepoter Depotet må eliminere muligheter for tvil eller spekulasjon om materialets autentisitet, integritet og evt. konfidensialitet Depotet må selv kunne verifisere med dokumentasjon TRAC spesifiserer 90 kriterier som ledd i et opplegg for en sertifisering av arkivdepoter Arbeidsoppgave nr. 1 for et arkivdepot: Å kunne verifisere at informasjonsinnhold er bevart uendret fra og med mottak Garanterer ikke at informasjonen er ekte og troverdig i seg selv men da er vi over i et annet tema

Fysisk vs. logisk integritetskontroll Integritetskontroll er enkelt på fysisk nivå (bit-nivå) Sjekksummer kan brukes for å bekrefte at digital informasjon er lagret fysisk uendret (v/kontroll av uendret bit-strøm) Men digital bevaring uten fysiske endringer er umulig Bevaring av digital informasjon krever regelmessig vedlikehold med fysisk transformasjon av data for å opprettholde lesbarheten Det er til å leve med at arkivinformasjon er fysisk transformert bare vi kan bekrefte et uendret logisk informasjonsinnhold Men det eksisterer ingen enkel metode tilsvarende sjekksum-kontroll for å bekrefte at logisk informasjonsinnhold er uendret

Integritetskontroll på fysisk nivå Uendret bit-strøm kontrolleres ved bruk av unik sjekksum Word-2000 Word-2007

Modell for kontinuerlig integritetssikring i DIAS Integritetsproblematikken løses ved å bygge på resepten i TRAC: Alt bevares som tillegg uten å endre eldre informasjon Sjekksummer kan da brukes på alle objekter/filer - og tjene som bestandige mekanismer for verifisering En mottatt arkivversjon (SIP) bevares uendret og sjekksumsikret slik den ble mottatt for alltid Operasjoner i depot etter mottak bevares og dokumenteres som tillegg (med tilhørende sjekksummer) utenfor SIP-en Ved senere konverteringer/transformeringer bevares en ny generasjon av vedk. arkivpakke (AIP) i tillegg til den opprinnelige Alternativt kan enkle AIU-er brukes for å lagre tillegg, både fordi en eksisterende AIP aldri skal oppdateres, og fordi det er behov for å unngå at enhver depotoperasjon skal kreve en ny, transformert AIP

Prosess ved generering av arkivpakker AIC Pakkeinformasjon Bevaringsmetadata Informasjonsinnhold Samlet sjekksum for AIC SIP-TAR Pakkeinformasjon Bevaringsmetadata TAR Pakkeinformasjon Bevaringsmetadata Adm. metadata Kontekst-info Adm. metadata Kontekst-info Annen medflg dokumentasjon Metadata for dokumenter Depotoperasjoner Metadata for dokumenter Informasjonsinnhold Informasjonsinnhold Datafiler/ dokumenter Tekniske metadata Datafiler/ dokumenter Tekniske metadata Mottatt SIP AIP-0 (lagret SIP) AIP-1. Når SIP lagres, genereres her også en transformert AIP (AIP-1). SIP-ens medfølg-ende info. + dokumentasjon av depotoperasjonene ved mottak innarbeides i AIP-1

ESSArch forvaltningssystem Svensk system som tilpasses for DIAS slik at det oppfyller samtlige punkter i prosjektets kravspesifikasjon Avtaler undertegnet 21.11.2011 etter åpen tilbudsinnhenting Leverandøren, ES Solutions AB, er også ansvarlig for tilpasning og videreutvikling Systemet er basert på åpen kildekode (GPLv3), og vil bli distribuert vederlagsfritt til alt og alle Riksarkivets vedlikeholdsavtale for ESSArch kan også fungere som en sentral vedlikeholdsavtale for kommunale depoter Dvs. at all leverandørkontakt må kanaliseres via en sentral instans i Riksarkivet Kommunale depoter har også adgang til å inngå egne avtaler om vedlikehold

ESSArch forvaltningssystem 1) Genererer arkivpakker iht. DIAS-modellen og på grunnlag av DIAS xml-skjemaer 2) Styrer arbeidsprosessene fra innsjekking til lagring i depot, ivaretar integritetssikring i alle ledd, og utfører tilgangskontroll 3) Styrer vedlikehold av arkivpakker iht. DIAS-prosessmodellen 4) Styrer import/eksport av informasjon til/fra digitalt depot 5) Har egen database med nøkkelinformasjon om arkivpakkene i digitalt depot og arbeidsprosesser i tilknytning til dem 6) Ivaretar også lagringsadministrasjon (skriving til multiple media, kopiering/migrering mellom medier + verifisering) 7) Kan tilpasses for ulike lagringsløsninger/mediekonfigurasjoner

DIAS/ESSArch i prosessene tilknyttet digitalt depot DIAS-prosjektets fokus DSM Digitalt sikringsmagasin Eksport/import Kartlegging Avlevering Mottakskontroll ESSArch Testing Innmelding av systemer Kartlegging gjen. prosjekter BK-vurdering Betty/Astaregistrering Avtaler og planer om avlevering Oppflg./inndriving av avleveringer Gjennomføring av avleveringer Innholdskontroll Integritetssikring Virus-skanning Bettyoppdatering Fysisk sikring av medier Inn-/utsjekk av SIP for testing Generering av arkivpakker Inn-/uthenting til/fra DSM Eksport av DIP og rapporter Test av format og struktur Dokumentasjon av testing Tilrettelegging av AIP Evt. tilrettelegging av DIP ESSArchprosjektets hovedfokus

Vi introduserer XML Utprøving og komplettering av den logiske arkivpakkemodellen Utforming av kravspesifikasjon til programvare for generering av arkivpakker Programutvikling av programvare for generering av arkivpakker

Dias -skjemaer og standarder Pakkeinformasjon - METS Tekniske metadata ADDML Bevaringsmetadata - PREMIS Aktørbeskrivelse EAC-CPF Arkivbeskrivelse - EAD

Arkivpakke (AIP) iht. OAIS En container hvor et arkivobjekt er lagret som en selvstendig enhet integritetssikret, og fast forbundet med all tilhørende informasjon All nødvendig informasjon for å forstå objektet som arkivmateriale: kontekst proveniens bevaringshistorikk Pakkeinformasjon Bevaringsmetadata ( logiske metadata ) Informasjonsinnhold Datafiler Tekniske metadata All nødvendig informasjon for å fremstille objektet på ny Arkivobjektet Samlet sjekksum for pakken Integritetssikring Varianter: Leveringspakke (SIP), Bevaringspakke (AIP) og Brukspakke (DIP)

SIP Mottakskontroll DIAS-modellen Adgang etc Testing Standard operasjoner Innhenting Pakking 5 DIP Admin Rapportering Innlegging Magasin Søk Uthenting Magasinkontroll Asta Magasinstyringssystem (m/san el.)

Forvaltningssystem for digitalt sikringsmagasin Automatisert magasinforvalter Legger arkivpakker inn i magasinet Henter arkivpakker ut av magasinet Genererer arkivpakker Automatisert kontrollør Kontrollerer innholdets integritet Har egne lukkede områder for materialet Genererer rapporter

Arkivpakke Overordnet struktur AIC SIP AIU AIP AIU AIP 1. generasjon Supplement 2. generasjon Supplement 3. generasjon Navngis som AIP 0 1. generasjon 2. generasjon

Implementeringsstandarder: DIAS xml-skjemaer Bevaringsmetadata: METS (DIAS-METS) PREMIS (DIAS-PREMIS) EAD EAC-CPF Overordnet organisering av arkivpakker ( container -beskrivelse) og oversikt over pakkeinnhold Bevaringsmetadata i betydningen håndteringshistorikk (i arkivdepot) Arkivbeskrivelse Beskrivelse av arkivskapere o.a. aktører Tekniske metadata: ADDML Struktur- og postbeskrivelse av tabell- uttrekk fra databaser mm. DIAS-METS og DIAS-PREMIS er spesifikke tilpasninger av METS og PREMIS for DIAS. EAD/EAC brukes uten tilpasninger, men mappes mot Asta

Arkivpakke AIP Struktur En arkivpakke (AIP) kan deles opp i følgende hoveddeler Informasjonsinnhold Selve informasjonen som skal bevares Administrative metadata Arkivskaper, proveniens og annen kontekstuell informasjon Tekniske metadata Teknisk beskrivelse av informasjonsinnholdet Depotoperasjoner Håndtering og arbeidsoperasjoner depotet har utført på informasjonsinnholdet

Arkivpakkemodell Alt bevares i sin opprinnelige form (SIP). Ved tekniske endringer dannes en ny pakke (AIP) i tillegg til den opprinnelige. Operasjoner i depotet bevares og dokumenteres som tillegg. Ved senere vedlikehold (f.eks. konvertering av formater) dannes alltid en ny pakke (AIP). All informasjon fra pakkenivå ned til filnivå kan verifiseres med sjekksummer.

Planer og fremdrift Iterasjon 1 til 3 ble gjennomført i 2011. Iterasjon 6 ble ferdigstilt 24. februar. Testing og supplerende utvikling ble utført i april og mai. Akseptansetest avholdes 14. til 25. mai. Prosjektet ferdigstilles 31. mai. Produksjon i Arkivverket startes 1. juni.

Oversikt Gradert materiale Digitalt sikringsmagasin (DSM) Arkivpakker - Versjoner for langtidslagring Sluse Forvaltningssystem Sluse Kontroll område Arbeids område Bruks-versjoner for Arkivverket Tilrettelagte brukskopier

Revidert oversikt

Revidert oversikt

Interne operasjoner -Kontroll Kontrollerer pakking. Kontrollerer lagringslokasjoner disk og tape. Ansvarer for all kommunikasjon ut. og all kommunikasjon inn. Håndterer logging. Genererer rapporter.

Digitalt sikringsmagasin (DSM) Den tekniske løsningen vil være i egen sone. Sonen vil inneholde En lagringsserver det egentlige DSM To taperoboter som en del av DSM En server med kontrollområde som vil være områdekontrollens ene arbeidsområde. En server med ESSArch og et temp-område for pakking av AIPer områdekontrollens andre arbeidsområde.

DIAS forvaltningsforum 1) Permanent samarbeidsforum for DIASoppfølging f.o.m. prosjektslutt 31.05.2012 2) Eget prosjekt støttet av Kulturrådet i 2012 for å etablere forumet (start 01.04.2012)

Oppgaveramme for DIAS-forum Ramme mht. utførende oppgaver: 1) Vedlikehold og videreutvikling av DIAS-standarder (xml-skjemaer) DIAS forvaltningsforum 2) Forvaltning av ESSArch og ESSArch-avtaler for et samlet brukermiljø 3) Kompetansesenter for fag- og driftsmiljøer