Del 2: Uttrekk fra udokumentert database



Like dokumenter
Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

Kommunale, digitale depot i endring Trøndelagsmodellen. Kari.Remseth@ika-trondelag.no

Retningslinjer for avlevering av elektronisk arkivmateriale til Interkommunalt arkiv Troms

Del 3: Noark 5-basert databasestruktur

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

ARK2200-H18 - Digital arkivdanning og -bevaring II. Mappeeksamen

Bevaring av fagsystem og Noark 5

<Digitale_arkiver>fra A til #??A_#%,&</Digitale_arkiver> Digitale arkiver fra A til Å

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

Validering Noark 5-uttrekk Gjemnes kommune etter innlevering til Digitalt Depot IKAMR Torbjørn Aasen, IT-rådgiver

Retningslinjer for deponering og avlevering av digitalt arkiv. Kontaktkonferansen 2018 Arkiv Troms v/jan Grav, IT-rådgiver

Bevaring av dokumentasjon i læringssystemer Lars-Jørgen Sandberg, Riksarkivet

1. Hva betyr det at en løsning er Noark 5-godkjent?

Del 1: XML som langtidsbevaringsstrategi

Noark-5 hva blir det til? Ståle Prestøy IKA Trøndelag. 23. mai 2007 Noark-5 - hva blir det til? 1

Avlevering av digitale arkiver (DA)

Periodisering og avlevering av elektronisk arkiv hvem, hva, når? Rådgiver Ole-Bjørn Fossbakk og rådgiver Solveig Heløe Olsen, IKA Troms

HelsIT 2015 Submission/Paper 9 (rev.)

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

DIAS - Digital arkivpakkestruktur

EPJARK-standarden (Standard for arkivavlevering av elektronisk pasientjournal til Norsk helsearkiv )

Eks. på uttrekk fra fagsystem inkl. dokumenter. Sigve Espeland Interkommunalt Arkiv i Rogaland IKS

Dias, Ny lagringsmodell for elektroniske arkiver

Utvikling av BK-plan for Postog teletilsynet. Seksjonssjef Liv Reppen Seksjon for dokumentforvaltning

Fra produksjonsmiljø til bevaring - produksjonslinje for earkiv. v/sigve Espeland og Harald Nordli

Noark 5 tjenestegrensesnittet Hvor er vi nå?

Vedlikehold og langtidslagring av elektronisk arkivmateriale

Eks. på uttrekk fra fagsystem inkl. dokument. Produksjon av SIP og AIP

KOMMUNEREFORM ARKIV OG DOKUMENTASJONSFORVALTNING. FASE II Hva må gjøres etter at vedtak om sammenslåing er fattet?

Bevaring av digitalt skapt arkiv metode gitt i OAIS og DIAS

Samdok samla samfunnsdokumentasjon

Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Uttrekk og bevaring av elektroniske arkiv

ARKIVVERKETS EARKIV- PROSJEKT : STATUS

Endelig tilsynsrapport og varsel om pålegg

Fra uttrekk til edepot

Testverktøy Status og videre tanker

Framgangsmåte for klargjøring og avlevering av elektronisk arkivmateriale til arkivdepot Supplerende bestemmelser for kommuner tilknyttet IKAT

Kandidatnummer 832. Migrering av data

Periodisering Petter Pedryc

ARK Digital arkivdanning og -bevaring II Mappeeksamen. Eksamen består av fire deler

Periodisering og uttrekk av elektroniske arkiver. v/tormod Engebu IT Rådgiver

Ole Myhre Hansen Seksjon for digitalt depot, RA

Generell metode. v/sigve Espeland, IKA Rogaland

Veiledning for avlevering av elektroniske arkiv

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

Fagsystemer. Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Hva har NOARK5 å bety for arkivet? Tormod Engebu, IKT-Rådgiver IKAVA

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

Mot det heilelektroniske arkiv - begreper og juss - Sigve Espeland Interkommunalt Arkiv i Rogaland IKS

Samdok samla samfunnsdokumentasjon. Arkivarkitektur. Samdok-konferansen 12. november Hans Fredrik Berg, Riksarkivet.

Elektronisk uttrekk Erfaringer med en vellykket deponering til Arkivverket

Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland

Arkivplan og tilsyn. - Erfaringer fra Statsarkivet i Trondheim

Daglig leder Tor Eivind Johansen Kommuneseminaret

Digitalt depot. Instruks deponering

Deponering og avlevering

Norsk helsearkiv og helsearkivregisteret

Produksjonslinje for bevaring og formidling av elektroniske arkiv fra kommunal sektor KDRS RIKSARKIVARENS ARKIVUTVIKLINGSMIDLER

Digitale arealplaner. Arkivloven Lars-Jørgen Sandberg, Riksarkivet

Bevaringsmetodikk NOARK-metode. v/ Harald Nordli Interkommunalt Arkiv i Rogaland

Noark 5-godkjenning av sak/arkiv-system. Erfaringer fra systemleverandør.

GODKJENT NOARK UTTREKK OG FORMIDLINGSLØSNINGER FOR KOMMUNALE FAGSYSTEM 14/06/2013. Documaster skanning og arkiv IKA Rogaland -30.

Erfaringer med avlevering/uttrekk av fagsystemet Profil

Elektronisk arkiv - hva er det? Karin Amalie Holmelid kaho@hib.no Arkivleder/leder for Dokumentsenteret ved Høgskolen i Bergen

ARKIVVERKETS UNDERSØKELSE AV ARKIVHOLDET I STATLIGE VIRKSOMHETER

Periodisering, bortsetting og avlevering

Dokumenter som må være på papir i en fullelektronisk verden?

Riksarkivarens årlige undersøkelse for kommunale arkivtjenester storbyundersøkelsen 2012

Hvordan tenkes og jobbes det i dataindustrien til tema som bevaring og avlevering av earkiv til arkivdepot institusjoner

R I K S A R K I V A R E N S U N D E R S Ø K E L S E F O R K O M M U N A L E A R K I V T J E N E S T E R

Overgang fra papirarkiv til digitale arkiv. IKA Finnmark, 26. september 2017

Arkivplan, hvilke krav og forventninger har tilsynsmyndigheten? Kjetil Reithaug statsarkivar i Kristiansand

Samdok. Samdok og. Arkiv i e-forvaltning. KDRS-samling 14. november Arkiv i e-forvaltning. Hans Fredrik Berg, Riksarkivet

Elevdokumentasjon og nye bevarings- og kassasjonsregler. Gro Hendriksen Seksjon for bevaring og kassasjon Riksarkivet

ADDML er død, lenge leve ADDML. (ADDML 7.3 er ikke helt død, lenge leve ADDML 8.3)

Noark-5. KDRS Petter Pedryc

Høringsnotat endringer av riksarkivarens forskrift 2019

Registrering av e-post e-postrekker og dokumentbegrepet. Norsk arkivråds høstseminar Øivind Kruse Arkivar, Riksarkivet

NORMALINSTRUKS. for arkivdepot i kommuner og fylkeskommuner. Gitt med hjemmel i arkivforskriften 5-12

Bruk av komponenter i ADDML

Transkript:

Del 2: Uttrekk fra udokumentert database Oppgaven tar utgangspunkt i en udokumentert database, som vises i oppgavens vedlegg 1. Databasen skal bevares ved at dataene trekkes ut i XML-format. Det skal også lages XSD-filer som viser strukturen i XML-uttrekket, og som kan brukes til å validere uttrekket. I tillegg skal det forklares hvordan disse dataene kan brukes i depot i fremtiden. Det er altså valgt migrering av dataene til et teknologiuavhengig format (XML) som bevaringsstrategi. Det fremgår av dataene i vedlegg 1 til oppgaven at databasen har vært brukt i Verdal kommune til å lagre informasjon og saksdokumenter i barnevernssaker. Jeg går derfor ut fra at databasen er en del av et fagsystem brukt av barnevernet i Verdal kommune. Barnevernet i Verdal kommune er underlagt arkivloven med forskrifter, og fagsystemet skulle derfor ha vært integrert med et godkjent sakarkivsystem eller selv fulgt spesifikasjonene i Noark. Jeg antar at dette ikke er tilfellet her, men databasen til fagsystemet skal uansett avleveres til kommunalt depot for langtidsbevaring, dessverre ikke fullstendig, men i alle fall til en viss grad i tråd med bestemmelsene i lovverket. Fordi dataene i databasen er relativt nye (år 2002), går jeg ut fra at dataene ikke skal avleveres til depot ennå, dvs. at de fortsatt skal oppbevares og muligens brukes i kommunen (ev. at uttrekket skal deponeres i depot, uten at det endrer forutsetningen her). Av samme grunn foretar jeg ikke en bevarings-/kassasjonsvurdering for å bestemme hvilke data som skal inngå i uttrekket, da jeg går ut fra at databasestrukturen skal bevares i sin helhet, samtidig at samtlige data også skal bevares. Normalinstruksen for avlevering av arkivmateriale til kommunale og fylkeskommunale arkivdepot, fastsatt av Riksarkivaren i medhold av arkivloven (forskrift om utfyllende tekniske og arkivfaglige bestemmelser om behandling av offentlige arkiver, kapittel VIII om elektronisk arkivmateriale som avleveres eller overføres som depositum til Arkivverket), gir føringer for hvordan bevaring av databaser og elektroniske register skal skje (ABM-skrift 43 s. 10). Data i slike register skal eksporteres som definerte tabelluttrekk i sekvensielle tekstfiler (en fil pr. tabell), uttrekket skal dokumenteres i en egen struktur og innholdsbeskrivelse skal medfølge avleveringen (ABM-skrift 43 s. 10). Selv om dataene fra herværende database ikke skal avleveres ennå, bør dataene lagres slik at det er tilrettelagt for avlevering (ABM-skrift 43 s. 28). Da kan man unngå merarbeid, 1 (7)

og redusere risikoen for tap av informasjon pga. teknologiforgjengelighet eller for lang avstand i tid til arkivdanningsprosessene. Et komplett uttrekk av databasen vil sammen med nødvendig dokumentasjon av innholdet i uttrekket, utgjøre en avleveringspakke, som kan overføres til depot når tiden er inne. Det er dette OAIS omtaler som en Submission Information Package (SIP) (The Consultative Committee for Space Data Systems [CCSDS] 2012 s. 1-15), som er leveransen fra arkivskaper til depot. Uttrekk fra Noark-godkjente systemer vil også utgjøre slike avleveringspakker (Riksarkivet 2013a s. 93-94). I depot blir SIP-en/-ene omgjort til én, en del av eller flere Archival Information Packages (AIP-er) (CCSDS 2012 s. 2-8). En avleveringspakke består av innhold og bevaringsbeskrivelser (Riksarkivet 2013a s. 94). Det er innholdet arkivdokumenter og eventuelle journalrapporter som er gjenstand for bevaring, mens bevaringsbeskrivelsene (dvs. metadata om arkivdokumentene, f.eks. deres kontekst, proveniens, integritet og sensitivitet, i tillegg til tekniske metadata og overordnede metadata om pakken), skal bidra til å opprettholde innholdets autentisitet og også gjøre det mulig å forstå og bruke det i fremtiden (Riksarkivet 2013a s. 94). Ifølge Noark 5 skal avleveringspakken inneholde en overordnet dokumentasjon av innholdet i arkivuttrekket i en fil som heter arkivuttrekk.xml og metadata om dokumentene i en fil som heter arkivstruktur.xml (Riksarkivet 2013a s. 97). Overordnet informasjon om pakken skal finnes i filen info.xml (Riksarkivet 2013a s. 93). Å lage uttrekk fra databaser/systemer som ikke følger Noark, er annerledes enn å lage uttrekk fra Noark-godkjente systemer. Det betyr likevel ikke at man ikke kan bruke relevante deler av standardene også i arbeidet med uttrekk fra slike systemer, noe det også legges opp til i lovverket, jf. 8-25(1) i forskrift om utfyllende tekniske og arkivfaglige bestemmelser om behandling av offentlige arkiver. Selv om det er viktig i størst mulig grad å bevare informasjonsstrukturen i opprinnelsessystemet når man migrerer dataene (ABM-skrift 43 s. 29), kan konformitet med etablerte og kjente standarder bidra til å gjøre bruk av dataene enklere i fremtiden. Uansett bør man, før man utformer en bevaringsstrategi for udokumenterte systemer/databaser, samle inn detaljert informasjon om hvordan og hvorfor systemet har vært brukt, da slik informasjon vil være svært verdifull når dataene skal brukes i depot i fremtiden. 2 (7)

Normalinstruksen bestemmer i punkt 4.3.3 at i uttrekk fra relasjonsdatabaser skal hver tabell i databasen utgjøre én fil, og relasjoner mellom tabellene i datauttrekket skal være entydig beskrevet i den medfølgende dokumentasjonen (Riksarkivaren 2002). Databasen til barnevernet i Verdal kommune inneholder 7 tabeller. I tabellene ligger informasjon om sak, henvendelse, barnet saken gjelder, barnets adresse(r), systembrukere, samt dokumentobjektene og hvor disse er lagret. I tillegg finnes det en koblingstabell som viser sammenhengen mellom henvendelse og dokumentobjekt. I motsetning til uttrekk fra systemer som følger Noark, skal uttrekk fra fagsystem som dette også inkludere tomme felter (ABM-skrift 43 s. 29), altså skal felter uten verdi i tabellene i databasen også inngå i uttrekket. Jeg strukturerer uttrekket (arkivversjonen) fra databasen slik: /Verdal_kommune_barnevernsaksystem/ omuttrekket.xml omuttrekket.xsd /Arkiv/ /dokumenter/ arkivinfo.xml arkivinfo.xsd dokumenter.xml dokumenter.xsd henvendelser.xml henvendelser.xsd klienter_adr.xml klienter_adr.xsd klienter_pers.xml klienter_pers.xsd kobling.xml kobling.xsd saker.xml saker.xsd systembrukere.xml systembrukere.xsd 3 (7)

Fordi uttrekket er såpass lite i omfang, synes det tilstrekkelig kun å ha to nivåer over nivået med arkivdokumentene. Et depots overordnede strategi for utarbeidelse og mottak av uttrekk fra udokumenterte databaser, bør, om mulig i større detalj enn lovverket og normalinstruksen, spesifisere hvordan slike uttrekk og tilhørende dokumentasjon skal struktureres, samt hvilken informasjon uttrekket og dokumentasjonen skal inneholde. Dersom man finner det naturlig og/eller formålstjenlig, er det, som tidligere antydet, ingenting i veien for at filene info.xml og arkivuttrekk.xml, slik disse er spesifisert i Noark 5 (i henholdsvis info.xsd (foreligger kun som utkast pr. november 2013 (Riksarkivet 2013b)) og addml.xsd), også kan brukes i bevaring av uttrekk fra systemer som ikke er Noark-godkjente. I andre situasjoner, f.eks. der private virksomheter setter seg fore å langtidsbevare sine systemer/databaser i teknologiuavhengig format, uten intensjoner om å avlevere til offentlig depot, vil dette være mindre naturlig. Jeg har valgt å forsøke å lage uttrekket fra barnevernsaksystemet i Verdal kommune som en selvforklarende enhet/avleveringspakke, slik dette er beskrevet over. Jeg har ikke brukt Noark 5s malfiler direkte i utarbeidelsen av avleveringspakken, men jeg har tatt utgangspunkt i arkivlovverkets bestemmelser, og også inkludert enkelte objekt- og strukturelementer fra Noark 5 i dokumentasjonen. Dette vil naturligvis kunne gjøre det mer arbeidskrevende, og antakelig vanskeligere, å sammenstille bevarte data fra denne databasen med bevarte data fra andre databaser i fremtiden, dersom uttrekket fra denne databasen skiller seg fra uttrekk fra de andre databasene, og uttrekkene fra alle de andre databasene er bygget opp likt. En slik situasjon er usannsynlig, men illustrerer likevel at standardisering for å sikre interoperabilitet kan være svært formålstjenlig, dog ikke helt uten negative sider, f.eks. dersom formaliseringen påvirker eller kan tenkes å påvirke arkivdanningsprosessene negativt eller endre informasjonen slik at budskapet kompromitteres (Öberg & Borglund 2006 s. 70). Filene omutrekket.xml og arkivinfo.xml her, er laget i overensstemmelse med 8-30 i forskrift om utfyllende tekniske og arkivfaglige bestemmelser om behandling av offentlige arkiver, som forteller hvilke opplysninger som skal ligge ved arkivmaterialet når det avleveres til eller deponeres i en arkivinstitusjon. Filene beskrives i sine tilhørende XML-skjemaer. Jeg har utelatt informasjon om periodisering og kassasjon, da dette ikke ser ut til å være relevant for den aktuelle databasen. Informasjonen i filene omutrekket.xml og arkivinfo.xml kunne vært samlet i én fil, men dette ville 4 (7)

vanskeliggjort den ekstra integritetssikringen ved at filen omuttrekket.xml kan oppbevares separat fra resten av uttrekket (se besvarelsens del 4 for grundigere beskrivelse av dette). Hver XML-fil i katalogen /Arkiv/ inneholder data fra én tabell i databasen, slik normalinstruksen bestemmer, og strukturen i tabellen er angitt i tilhørende XSD-fil, som skal brukes til å forklare og validere XML-filen. Med mer kunnskap om databasens oppbygning og bruk, kunne man inkludert mer omfattende og avanserte spesifikasjoner i XSD-filene, f.eks. restriksjoner. Beskrivelsene i XSD-filene her, er lagt inn som kommentarer. Dokumentene som skal lagres sammen med uttrekket, legges i katalogen /dokumenter/ under /Arkiv/. I det opprinnelige systemet ble dokumentene lagret på disk hos arkivskaper, og filbanen til lagringsmappen er angitt i dokumenttabellen. Filbanen må endres i uttrekket fordi dokumentene blir flyttet, men jeg lar uttrekket også vise den gamle filbanen, fordi dette forteller noe om hvordan fillagringen foregikk mens systemet var i bruk hos arkivskaper. I tillegg må dokumentene konverteres til PDF/A, som er blant filformatene som er godkjent av arkivmyndighetene for langtidsbevaring. Jeg lar dokumentene beholde filnavnet (som ser ut til å være basert på løpenummerering), og i uttrekket angis den nye filbanen, samt det nye filformatet ved at filene får.pdf-endelse. I tillegg gis hver fil en sjekksum for å kunne kontrollere at innholdet ikke er endret. Det synes å være enkelte feil i dokumentlagringen, f.eks. er den samme filen tilknyttet både den inngående og den utgående henvendelsen i sak 1, noe som ikke stemmer overens med registreringene i tabellene. Omfanget av slike feil vil måtte kartlegges i arbeidet med uttrekket, og de ansvarlige for databasen og uttrekket må bestemme hvorvidt feilene skal rettes (i den grad det er mulig) eller om databasen skal lagres med feilene som oppdages, og det må også bestemmes hvordan man vil dokumentere feilene og den eventuelle rettingen av dem. Det er i tillegg underlig at inngående dokumenter ser ut til å være lagret som.doc-filer, og også dette bør undersøkes og forklares underveis i arbeidet med uttrekket, f.eks. i en medfølgende katalog/rapport fra uttrekksarbeidet. Fordi min kunnskap om databasen og bruken av det tilhørende systemet, er begrenset, er dette utelatt i denne besvarelsen. 5 (7)

En forutsetning for at arkivmateriale skal kunne brukes, er at det er mulig å få tilgang til og også at det er mulig å forstå (Egeland 2013 s. 109). For "digitalt født" arkivmateriale er dette vanskelig fordi digitale data bevares isolert fra sin kontekst, adgangen til dataene begrenses ved at digitale data må sammenstilles før de kan forstås, og store datamengder og måten de lagres på gjør det vanskeligere å skumme gjennom arkivmaterialet for å få oversikt (Egeland 2013 s. 109). I tillegg kan det antas at bruken av elektroniske sakarkivsystemer vanskeliggjør strukturerte søk (arkivnøkkelsøk) i depotsammenheng fordi den fremtidige arkivbrukeren ikke har de samme forutsetningene og forkunnskapene som saksbehandlere i arkivdanningsvirksomhetene (Egeland 2013 s. 123). Pga. dens innhold er det lite sannsynlig at brukere (dog med unntak av forskere og andre som er gitt særlig tillatelse) vil få direkte tilgang til dataene fra barnevernsaksystemet i Verdal kommune, i alle fall ikke før dataene nærmer seg 100 år. Enkeltdata vil kunne hentes ut og stilles til disposisjon for parter i de registrerte barnevernssakene, men kun etter at en depotarkivar har mediert. For å hente ut dataene, vil man måtte gjøre seg kjent med uttrekkets struktur og relasjonene mellom de ulike tabellene, som er beskrevet i XSDfilene. Man vil f.eks. kunne importere en kopi av dataene i en database og deretter foreta søk i databasen ved hjelp av et databasehåndteringssystem, SQL-spørringer eller annet. Skulle en slektsforsker 100 år frem i tid ville bruke dataene i sine undersøkelser, er det for oss i dag umulig å vite hvilke verktøy han eller hun har til sin disposisjon. Nettopp dette er også hovedargumentet for å bevare dataene i teknologiuavhengig format. Slik mener vi å tilrettelegge som best vi kan for at fremtidens teknologi, og dermed fremtidige brukere, skal kunne se, lese og forstå dataene vi har bevart. Kilder ABM-skrift 43. (2007). Minnehåndtering. Metode for digital langtidslagring i kommunal sektor. Tilgjengelig 6. oktober 2013 via http://kulturradet.no/vis-publikasjon/- /asset_publisher/n4dg/content/publikasjon-minnehandtering Arkivloven. (1992). (2009). Lov av 4. desember 1992 nr. 126 om arkiv med forskrifter. Oslo: Cappelen akademisk forlag. 6 (7)

Consultative Committee for Space Data Systems, The. (2012). Reference model for an open archival information system (OAIS). Tilgjengelig 28. september 2013 via http://public.ccsds.org/publications/refmodel.aspx Egeland, A.-K. (2013). Kan vi forstå de digitale arkivalier om 100 år? I Lange, H., & Spring, U. (Red.), Til arkivet. Formidling for framtida tanker om arkiv. Oslo: ABM-media AS. Riksarkivaren. (2002). Normalinstruks for arkivdepot i kommunar og fylkeskommunar. Riksarkivet. (2013a). Noark 5. Standard for elektronisk arkiv. Versjon 3.1. (m. vedlegg). Tilgjengelig 3. november 2013 fra www.arkivverket.no Riksarkivet. (2013b). info. Tilgjengelig 10. november 2013 fra Tilgjengelig 29. november 2013 via http://arkivverket.no/arkivverket/offentlegforvalting/avlevering/for-kommunar/normalinstruks http://arkivverket.no/arkivverket/arkivbevaring/elektroniskarkivmateriale/standarder/info Öberg, L.-M., & Borglund, E. (2006). What are the characteristics of records? International Journal of Public Information Systems 2006(1). Tilgjengelig 6. desember 2013 via http://www.ijpis.net/issues/no1_2006/ijpis_no1_2006_p4.pdf 7 (7)