Struktur og innhold i en avleveringspakke (SIP) fra arkivsystemer basert på Noark 5- standarden Nordisk arkivakademi Boden, 0. november 2009 Jon Atle Haugen Riksarkivet, Norge
LDB-centrum: bevaring av databaser Tabeller kan bevars som "Flata filer": Denna strategi innebär att varje tabell tas ut som en egen textfil. Det är en relativt enkel metod som samtidigt är primitiv. Den största nackdelen är att bevarandet är beroende av teknik då materialet inte kan göras tillgängligt innan det har överförts till en annan relationsdatabas. Även om fullständig systemdokumentation finns kräver det en stor arbetsinsats då man måste förstå hur databasen är uppbyggd och skriva nya frågor till den, alternativt kontrollera funktionen hos de gamla frågorna. Tabeller i XML-format: Rätt använt kan det ge bättre möjlighet till felkontroll för att säkerställa att all data kommit med. Kräver mindre manuellt arbete vid tillhandahållandet om kopplingar, datatyper och övrig metadata finns beskriven i maskinläsbar form. Bevarandet sker dock fortfarande i en teknikberoende form. Processtänk med XML: inom LDB-projeket/LDB-centrum har vi jobbat med ett annat angreppssätt som har sin utgångspunkt i verksamhetens processer i stället för i tekniken. Efter att ha identifierat vilken information som ska bevaras skapas en struktur i exempelvis XML med all den information som ska bevaras, strukturerad för att kunna beskriva ärendeinformationen på ett för verksamheten logiskt sätt. När det är dags att arkivera de avslutade ärendena samlas all information ihop från de olika tabellerna som hör till det aktuella ärendet och lagras enligt den tidigare beslutade strukturen. 2
Classification Scheme Moreq2 Business classification scheme CONTAINS Class IS MADE UP OF MAY CONTAIN File Retention & Disposition APPLIES TO Schedule Functions Sub-functions Activities (processes) Activity (instance of a process) MAY BE DIVIDED INTO MAY BE DIVIDED INTO Sub-file APPLIES TO MAY BE DIVIDED INTO Document Type Volume HAS Document IS FORMED OF IS STORED IN Record HAS Record Type Transaction IS MADE UP OF IS MADE UP OF Key: Component Exactly one 0 Zero or one Zero or more One or more Exclusive OR 3
Noark 5 SV: Verksamhetsbaserat arkivredovisning Funksjoner ikke emner! Arkiv - arkivskaper Serier, perioder, papir/elektronisk, sakarkiv/fagsystem osv. DK/NO: sag/sak SV: ärende, akt DK/NO: journalpost SV: handling Hoveddokument vedlegg Versjoner, offentlige varianter, dokumentformater 4
Content Information Submission Information Package (SIP) 2345678.pdf 2345678.pdf 3456782.pdf 4567823.pdf 5678234.pdf 6782345.pdf 7823456.pdf 8234567.pdf 8765432.pdf 7654328.pdf 6543287.pdf 5432876.pdf 4328765.pdf 3287654.pdf 2876543.pdf loependejournal.xml offentligjournal.xml Én informasjonspakke = hele avleveringen, ett dokument, én mappe/sag/ärende??? Ett dokument = én fil Dokument innkapslet i XML (base64)??? Dokumentformater: PDF/A, TIFF v. 6, ren tekst (ISO 8859-, UTF- 8), XML (ODF, OOXML???) Journalutskrifter: kronologisk En avleveringspakke skal inneholde en avsluttet arkivperiode. Hovedregel ved periodisering: uavsluttede saker overføres til neste periode. 5
Preservation Description Information Submission Information Package (SIP) 2345678.pdf 2345678.pdf 3456782.pdf 4567823.pdf 5678234.pdf 6782345.pdf 7823456.pdf 8234567.pdf 8765432.pdf 7654328.pdf 6543287.pdf 5432876.pdf 4328765.pdf 3287654.pdf 2876543.pdf loependejournal.xml offentligjournal.xml arkivstruktur.xml endringslogg.xml avlevering.xml Fem hovedtyper informasjon: Reference Information Context Information Provenance Information Fixity Information Access Rights Information arkivstruktur.xml: Noark 5 metadata Attributt-lister i Noark 4 (95 tabeller og 885 attributter) TNA: Requirements for Electronic Records Management (basert på Dublin Core) Moreq2 (basert på ISO 2308 Metadata for Records) Hierarkisk XML endringslogg.xml: logging av endringer som skal bevares avlevering.xml: info om produksjon av avleveringspakken 6
Metadata for basismappe Disse metadata skal kunne forekomme i alle mappetyper Nr. Navn Noark 4 Obligatorisk Forekomst Avleveres M00 systemid SA.ID Obligatorisk En Avleveres M003 mappeid (SA.SAAR+SA. SEKN) Obligatorisk En Avleveres M080 mappetype SA.TYPE Obligatorisk En M020 tittel SA.TITTEL Obligatorisk En Avleveres M025 offentligtittel SA.OFFTITTEL Bet. oblig. En Avleveres M02 beskrivelse Valgfri En Avleveres M022 nøkkelord Valgfri Mange Avleveres M300 dokumentmedium SA.PAPIR Valgfri En Avleveres M30 oppbevaringssted Valgfri En M600 opprettetdato Obligatorisk En Avleveres M60 opprettetav Obligatorisk En Avleveres M602 avsluttetdato Bet. oblig. En Avleveres M603 avsluttetav Bet. oblig. En Avleveres M200 referanseforelder KL.ORDNVER Obligatorisk En Avleveres M20 referansebarn Obligatorisk Mange Avleveres M208 referansearkivdel SA.ARKDEL Obligatorisk En Avleveres
Metadata for saksmappe Disse metadata kommer i tillegg til metadata for basismappe Nr. Navn Noark 4 Obligatorisk Forekomst Avleveres M00 saksdato SA.DATO Obligatorisk En Avleveres M305 administrativenhet (SA.ADMID) Obligatorisk En Avleveres M306 saksansvarlig (SA.ANSVID) Obligatorisk En Avleveres M308 journalenhet (SA.JENHET) Valgfri En Avleveres M052 saksstatus SA.STATUS Bet. oblig. En M06 utlåntdato SA.UTLDATO Valgfri En M309 utlånttil (SA.UTLTIL) Valgfri En M209 referansesekundær Klassifikasjon (KL.ORDNVER) Valgfri Mange Avleveres
Metadatakatalog Alle metadataelementer er definert i metadatakatalogen, hvert element har en unik identifikasjon Nr M00 Navn saksdato Obligatorisk/valgfri Obligatorisk Forekomster En Definisjon Arkivenhet Kilde Arv Betingelser Datoen saken er opprettet Saksmappe Settes automatisk til samme dato som M600 opprettetdato Nei Skal kunne endres manuelt inntil saksmappen avsluttes, men ikke til en dato som ligger fram i tiden Kommentarer Referanse krav
Representation Information Submission Information Package (SIP) 2345678.pdf 2345678.pdf 3456782.pdf 4567823.pdf 5678234.pdf 6782345.pdf 7823456.pdf 8234567.pdf 8765432.pdf 7654328.pdf 6543287.pdf 5432876.pdf 4328765.pdf 3287654.pdf 2876543.pdf loependejournal.xml offentligjournal.xml arkivstruktur.xml endringslogg.xml avlevering.xml arkiv. xsd mappe.xsd metadatakatalog.xsd loependejournal.xsd offentligjournal.xsd arkivstruktur.xsd endringslogg.xsd avlevering.xsd XML-skjema Virksomhetsspesifikke metadata kan inkluderes Vil store XML-filer være vanskelig å håndtere? arkivstruktur.xml kan eventuelt deles opp i mindre filer: en fil for hver arkivenhet? en fil for hver mappe? 0
Packaging Information/ Package Description Submission Information Package (SIP) 2345678.pdf 2345678.pdf 3456782.pdf 4567823.pdf 5678234.pdf 6782345.pdf 7823456.pdf 8234567.pdf 8765432.pdf 7654328.pdf 6543287.pdf 5432876.pdf 4328765.pdf 3287654.pdf 2876543.pdf loependejournal.xml offentligjournal.xml arkivstruktur.xml endringslogg.xml avlevering.xml arkiv. xsd mappe.xsd metadatakatalog.xsd loependejournal.xsd offentligjournal.xsd arkivstruktur.xsd endringslogg.xsd avlevering.xsd info.xml info.xsd Innkapsle, identifisere og gjenfinne pakken Innholder bl.a. sjekksum for avlevering.xml (som igjen inneholder sjekksummer for arkivstruktur.xml, endringslogg.xml, loependejournal.xml og offentligjournal.xml)