Nordisk Arkivakademi OAIS og tilknyttede standarder Konsekvenser for tenking, strategier og metodikk i Norge Boden, 10.11.2009 Trond Sirevåg 1
OAIS modellen Basis for planleggingen av Arkivverkets digitale magasin [Mer om dette senere] Fordel: modellens konsentrasjon om overordnede kategorier Særlig viktig: at digitale objekter har både konseptuelle og tekniske aspekter Har understøttet en nyorientering hvor intellektuelt innhold ( records ) frikobles fra teknisk system implementering Noark 5: avleveringsversjoner frigjort fra databasestruktur Samme utvikling i UK og Estland mht. Records Management Konsekvens (p.t.): dualisme i det norske Arkivverket: To poler : teknisk vs. logisk definerte arkiveringsversjoner 2
Planlagt anvendelse av standarder i nytt digitalt magasin METS PREMIS Standarder for implementering av OAIS TRAC Standard for integritetssikring i depot OAIS Standard for arkivering 3
TRAC Trustworthy Repository Audit and Certification Criteria and Checklist (2007) TRAC vektlegges spesielt sterkt i Norge (?) Bakgrunn: planleggingen av digitalt magasin i Riksarkivet (Elmag prosjektet) Grunnlag for Elmag: 3 TRAC baserte kravspesifikasjoner 1. Redigert norsk sammendrag av TRAC 2. Kravsett til Arkivverkets arbeid med elektronisk skapt arkivmateriale (TRAC + tilleggskrav til ingest og pre ingest) 3. Spesifikke krav til Arkivverkets arbeid med elektronisk skapt arkivmateriale i tilknytning til nytt digitalt magasin 4
Elmag 2 Kravspesifikasjoner basert på TRAC
TRAC Nye krav til digitale depoter Akkumulerer sterkt voksende mengder med informasjon Må være gjenstand for innsyn, vurdering og evaluering i en grad som avspeiler deres forpliktelser Må objektivt kunne dokumentere og bekrefte sin evne TRAC = opplegg for å evaluere og sertifisere digitale depoter som Trustworthy Et depot må aktivt kunne demonstrere sin evne til å oppfylle (universelle) minimumskrav herunder krav til ledelse/ansvarlighet, langsiktighet, organisatorisk levedyktighet, økonomi og finansiell bærekraft TRAC videreutvikles nå til en ISO standard av CCSDS 6
Generelt bakteppe for TRAC Pålitelighetskrav til digital arkivinformasjon Behov for sikrere regler for informasjonshåndtering, jf: O. J. Simpson saken i USA (1995) Fingeravtrykk ble underkjent som bevis Forsvareren klarte ikke å påvise fusk eller forfalskning Det holdt å sannsynliggjøre at politiet kunne hatt mulighet for manipulering Granskning av flyulykker Behov for detaljerte og pålitelige logger om utførte aktiviteter ved vedlikehold av fly Alexander Kielland ulykken i Nordsjøen (1980) Helt nye krav til pålitelig dokumentasjon av aktiviteter innen konstruksjons og offshore bransjen. 7
TRAC 90 kriterier som må oppfylles for å oppnå sertifisering Hovedkategorier av kriterier i TRAC: A. Organisatorisk infrastruktur 1. Styringsforpliktelser og organisatorisk levedyktighet 2. Organisasjonsstruktur og bemanning 3. Ansvarlighet basert på dokumenterte prosedyrer og policy rammeverk 4. Finansiell bærekraft 5. Kontrakter, lisenser og forpliktelser (i forh. til. arkivskapere og leverandører) B. Administrasjon av digitale objekter 1. Overføring: akvisisjon av arkivinnhold 2. Overføring: utforming/organisering av pakke for arkivering 3. Planlegging av (langtids)bevaring 4. Arkivbevaring og vedlikehold av AIP er 5. Organisering av bevart informasjon ( Information management ) 6. Krav til brukertjenester ( Access management ) C. Teknologier, teknisk infrastruktur og sikkerhet (også ISO 17799) 1. Teknisk infrastruktur 2. Riktig tilpassede teknologier 3. Sikkerhet 8
TRAC kriterier som fremstår som krevende (1) A3: Ansvarlighet basert på dokumenterte prosedyrer og policy rammeverk A3.8: Depotet må sikre arkivbestandens integritet. Det må kunne vise at bevart innhold fortsatt samsvarer med mottatt innhold. Informasjonstap ved migrasjon eller andre bevaringstiltak må være dokumentert. (jf. også B2.3, B4.2, B4.3 og B6.10). B2: Overføring: utforming/organisering av pakke for arkivering B2.3: Det må kunne vises hvordan et bevart digitalt objekt er konstruert på grunnlag av objektet som opprinnelig ble mottatt for bevaring, f.eks. gjennom en prosess med transformering eller datanormalisering. B3: Opplegg for (langtids)bevaring B3.1: Det må være utformet bevaringsstrategier for å håndtere media og formater som blir forgjengelige og for å hindre korrumpering av data. B3.2: Det må finnes mekanismer som varsler om fare for teknologisk forgjengelighet. 9
TRAC kriterier som fremstår som krevende (2) B4: Arkivbevaring og vedlikehold av arkivpakker (AIP er) B4.2: AIP migreringer som resulterer i en transformering av innhold, må være ettersporbare. B4.3: Depotet må kunne demonstrere at bevarte AIP er på en pålitelig måte avspeiler det som var gjenstand for datafangst ( capture ) ved overføringen. Dette innebærer at opprinnelige AIP er må bevares. Det må også finnes linker til disse fra nye, transformerte AIP er. B6: Krav til brukertjenester ( Access management ) B6.10: Brukere av materialet må kunne ha tillit til at de har en autentisk kopi av det originale objektet, eller at det lar seg spore tilbake til det originale objektet. C1: Teknisk infrastruktur C1.5: Alle former for korrumpering eller tap av data må detekteres umiddelbart uansett kilde eller årsak. Det gjelder også feil ved migrering eller synkronisering av kopier 10
Konsekvenser av TRAC Endret virkelighet for digitale arkivdepoter Et godt renommé er ikke nok (heller ikke et monopol) Bevisbyrden snus: Depotet må eliminere muligheter for tvil om autentisitet, integritet og ev. konfidensialitet Herunder spekulasjon basert på feil eller manipulasjoner/ uautoriserte endringer som kan være mulige i et arkivdepot Depotet må selv kunne verifisere med dokumentasjon Metode: et defensivt og forebyggende vedlikeholdsarbeid med kontinuerlig beskyttelse mot uautoriserte hendelser Fulldokumenterte rutiner, Loggføring av alle operasjoner på bevart materiale Sporing av endringer med mulighet for tilbakespoling til tidligere versjoner etter utførte konverteringer. 11
Begrensninger ved TRAC Pålitelige depoter vs. pålitelig informasjon Oppgaven for et depot: å kunne bekrefte at materiale er bevart uendret (integritetssikret) etter mottak Men for samfunnet er ikke dette tilstrekkelig Det er avgjørende at informasjonen også er ekte og troverdig i seg selv, og at dette kan verifiseres Det trengs mekanismer for å opprettholde integritet og autentisitet gjennom saksbehandlingen og alle migreringer og konverteringsprosser inntil avlevering herunder selve prosessen med fremstilling av avleverings versjon til arkivdepot 12
Et videre scope enn TRAC Hele livsløp og total integritetssikring Integritetssikring f.o.m. produksjonsfasen er spesielt viktig for records i ISO 15489 forstand. Deres funksjon og sentrale egenskap er nettopp å bevitne handlinger og hendelser ( Records are evidence ) Mest problematisk ( moment of risk ): prosessen ved fremstilling av arkivversjoner Her foretas gjerne både en selektering og omformatering av informasjon, og dette skjer typisk utenfor produksjonssystemets kontroll og gjerne uten at det finnes identifiserbare enheter i vedk. produksjonssystem som arkivversjonens informasjonsinnhold enkelt kan verifiseres mot. 13
Informasjon i RM systemer (sak/arkivsystemer) Krav til pålitelighet gjennom livssyklusen Arkivdanningsfasen Avlevering Arkivdepot Pålitelighetskrav: Autentiske arkivdokumenter*) Autentisitetskravet gjelder også evt. medfølgende dokumentasjon om behandlings og autorisasjons prosesser. *) InterPARES: Autentisitet inkluderer opprettholdt integritet (og integritet inkluder er fullstendighet) Pålitelighetskrav: Opprettholdt autentisitet etter migrering, konvertering og reformatering (verifiserings behov) Opprettholdt integritet etter at avleverings versjon er produsert Pålitelighetskrav: Opprettholdt integritet etter mottak Lagringssikkerhet Opprettholdt lesbarhet og anvendbarhet Tilgangskontroll Autentisitet: Avhenger av i hvor stor grad autentiserende opplysninger (og verifiserende mekanismer) arves fra 1) arkivdanningsfasen 2) prosessen med fremstilling og overføring av arkivversjonen 14
OAIS Oppfølgende og implementerende standarder (og noen andre standarder)
OAIS oppfølgende/implementerende standarder 1 OAIS versjon 2 CCSDS: OAIS Update (review stage for ISO 14721): http://public.ccsds.org/sites/cwe/rids/lists/ccsds%206500p11/attachme nts/650x0p11.pdf Trust sertifisering av arkivdepoter RLG/NARA: TRAC Trustworthy Repository Audit and Certification Criteria and Checklist (2007), http://www.crl.edu/pdf/trac.pdf CCSDS: Audit and Certification of Trustworthy Digital Repositories (review stage for ISO standard) http://public.ccsds.org/sites/cwe/rids/lists/ccsds%206520r1/attachmen ts/652x0r1.pdf CCSDS: Metrics for Digital Repository Audit and Certification (review stage for ISO standard) http://wiki.digitalrepositoryauditandcertification.org/pub/main/webhome/ MetricsForDigitalRepositoryAuditAndCertificationWBv03a.doc 16
OAIS oppfølgende/implementerende standarder 2 Generering av SIP pakker mm. CCSDS: PAIMAS, Producer Archive Interface Methodology Abstract Standard (ISO 20652 2004): http://public.ccsds.org/publications/archive/651x0b1.pdf CCSDS: PAIS, Producer Archive Interface Specification (review stage for ISO standard) http://mailman.ccsds.org/pipermail/moims dai/attachments/20060602/8ee057c5/paimas_implementationwb_04 0001.obj CCSDS: XFDU, XML Formatted Data Unit Structure and Construction Rules (ISO 13527: 2009) http://public.ccsds.org/publications/archive/661x0b1.pdf Strukturbeskrivelse CCSDS: EAST, The Data Description Language EAST Specification (ISO 15889) http://public.ccsds.org/publications/archive/644x0b2.pdf 17
OAIS oppfølgende/implementerende standarder (og noen andre standarder) Semantisk beskrivelse. CCSDS: DEDSL, Data Entity Dictionary Specification Language (ISO ISO 22643 : 2003) http://public.ccsds.org/publications/archive/647x2b1.pdf Records Management ISO 15489 ISO 23081 (Metadata) 18