Kandidatnummer 832. Migrering av data

Like dokumenter
Elektronisk arkiv - hva er det? Karin Amalie Holmelid kaho@hib.no Arkivleder/leder for Dokumentsenteret ved Høgskolen i Bergen

Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

Del 2: Uttrekk fra udokumentert database

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

Bevaring av dokumentasjon i læringssystemer Lars-Jørgen Sandberg, Riksarkivet

Bevaring av fagsystem og Noark 5

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

Regelverk, instrukser, bestemmelser og metode

DIAS - Digital arkivpakkestruktur

Retningslinjer for deponering og avlevering av digitalt arkiv. Kontaktkonferansen 2018 Arkiv Troms v/jan Grav, IT-rådgiver

<Digitale_arkiver>fra A til #??A_#%,&</Digitale_arkiver> Digitale arkiver fra A til Å

kommunesamling 6. Juni 2007 Svein Amblie

Dias, Ny lagringsmodell for elektroniske arkiver

Digitale arealplaner. Arkivloven Lars-Jørgen Sandberg, Riksarkivet

Periodisering og avlevering av elektronisk arkiv hvem, hva, når? Rådgiver Ole-Bjørn Fossbakk og rådgiver Solveig Heløe Olsen, IKA Troms

Retningslinjer for avlevering av elektronisk arkivmateriale til Interkommunalt arkiv Troms

KOMMUNEREFORM ARKIV OG DOKUMENTASJONSFORVALTNING. FASE II Hva må gjøres etter at vedtak om sammenslåing er fattet?

Uttrekk og bevaring av elektroniske arkiv

Produksjonslinje for bevaring og formidling av elektroniske arkiv fra kommunal sektor KDRS RIKSARKIVARENS ARKIVUTVIKLINGSMIDLER

Avlevering av digitale arkiver (DA)

Arkivlovgivning i endring

Vedlikehold og langtidslagring av elektronisk arkivmateriale

Kommunale, digitale depot i endring Trøndelagsmodellen. Kari.Remseth@ika-trondelag.no

Noark-5 hva blir det til? Ståle Prestøy IKA Trøndelag. 23. mai 2007 Noark-5 - hva blir det til? 1

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

Hva har NOARK5 å bety for arkivet? Tormod Engebu, IKT-Rådgiver IKAVA

Bevaring av nettsider

Endelig tilsynsrapport og varsel om pålegg

Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Nye arkivforskifter. Monika Kurszus Håland Fagdag onsdag 30.mai 2018

Arkiv, lagring og gjenfinning. Kari Myhre, Trondheim kommune

Bevaring og tilgjengeliggjøring- Hvor ligger forbedringspotensialet?

Registrering av e-post e-postrekker og dokumentbegrepet. Norsk arkivråds høstseminar Øivind Kruse Arkivar, Riksarkivet

OFFENTLIG ARKIVREGELVERKS OVERFØRINGSVERDI FOR PRIVATE VIRKSOMHETER? 7. desember 2017

SAMDOK prosjekt, partnerskap og utviklingsarena

Validering Noark 5-uttrekk Gjemnes kommune etter innlevering til Digitalt Depot IKAMR Torbjørn Aasen, IT-rådgiver

Overgang fra papirarkiv til digitale arkiv. IKA Finnmark, 26. september 2017

Fagsystemer. Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Studieplan 2008/2009

Digitalt depot. Instruks deponering

FRA KALVESKINN TIL DATASJØ ARKIVLOVUTVALGETS NOU 2019:9 MEDLEMSMØTE I NA REGION VEST 7. JUNI 2019 NY LOV OM SAMFUNNSDOKUMENTASJON OG ARKIVER

Dokumenter som må være på papir i en fullelektronisk verden?

Hva gjør Arkivverket for å følge opp Riksrevisjonens rapport? Norsk arkivråds kommuneseminar 15. Februar 2011 Anne Mette Dørum, Riksarkivet

Samdok konferansen 2013 Fra digital arkivdanning til digitalt depot i kommunene Tor Eivind Johansen, daglig leder KDRS

R I K S A R K I V A R E N S U N D E R S Ø K E L S E F O R K O M M U N A L E A R K I V T J E N E S T E R

Endelig tilsynsrapport og pålegg om utbedringer

Endelig tilsynsrapport og pålegg om utbedringer - Lenvik kommune

Vi viser til tilsendte høringsdokumenter av med forslag til endring av forskrift om offentlige arkiver (arkivforskriften).

ARKIVVERKETS AMBISJONER. Digitalt to dager til ende 9. November 2017

Noark 5 tjenestegrensesnittet Hvor er vi nå?

DEN DIGITALE TIDSALDER

Arkivplan og tilsyn. - Erfaringer fra Statsarkivet i Trondheim

ARKIVVERKETS EARKIV- PROSJEKT : STATUS

Riksarkivarens årlige undersøkelse for kommunale arkivtjenester 2012

Skytjenester - utfordringer for Arkivverket og for offentlige organ underlagt arkivlova. Arkivloven

Daglig leder Tor Eivind Johansen Kommuneseminaret

Riksarkivarens årlige undersøkelse for kommunale arkivtjenester storbyundersøkelsen 2012

Tilsyn med arkiv i kommunal sektor

Samdok samla samfunnsdokumentasjon

Informasjon om Arkivverkets tilsyn med arkivarbeidet i Nordland fylkeskommune

ARK2200-H18 - Digital arkivdanning og -bevaring II. Mappeeksamen

PRESENTASJON NORDIG OKTOBER Alle skal kunne teste alt - overalt

Endelig tilsynsrapport og pålegg om utbedringer - Hamarøy kommune - ny utsendelse

Endelig tilsynsrapport og pålegg om utbedringer

Noark 5 hvor går veien videre? Arkiv i e- forvaltning Gardermoen, 4. desember 2013 Øivind Kruse og Jon Atle Haugen

Digital Arkivbehandling fra A til Å

Reviderte arkivforskrifter

Riksarkivarens årlige undersøkelse for kommunale arkivtjenester storbyundersøkelsen 2013

Arkivverket Dokumentasjonsforvaltning - ny struktur. Kjetil Reithaug Fagdirektør Seksjon for Dokumentasjonsforvaltning,

Riksarkivarens årlige undersøkelse for kommunale arkivtjenester 2013

Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland

Tilsyn med arkiv i kommunal sektor funn og erfaringer.

Archivematica og AtoM: «State of the art» programvare for digital bevaring og tilgjengeliggjøring

Reviderte forskrifter pr : Arkivforskriften - Riksarkivarens forskrift. Kommentar til endringer og prioritering av arbeid framover.

Er de elektroniske forvaltningsarkivene en trussel mot rettsikkerheten? Thomas Sødring HiOA.

Kort om earkiv/ikt-sidene ved arkivregelverket

1. Hva betyr det at en løsning er Noark 5-godkjent?

Stortingsmelding om arkiv -kva no? Geir Håvard Ellingseter, nestleder Norsk Arkivråd

Arkivforskriften og Riksarkivarens forskrift. Ikrafttredelse

Endelig tilsynsrapport og pålegg om utbedringer - Songdalen kommune

Uttrekk fra elektroniske arkiver

EVALUERING AV NORSK ARKIVSTANDARD

Framgangsmåte for klargjøring og avlevering av elektronisk arkivmateriale til arkivdepot Supplerende bestemmelser for kommuner tilknyttet IKAT

Endelig tilsynsrapport og pålegg om utbedringer - Hobøl kommune

Automatisering av uttrekk fra bevarte databaser

Langtidsbevaring av helsedata ved bruk av en åpen depotplattform

Periodisering, bortsetting og avlevering

Periodisering Petter Pedryc

Hva jeg skal snakke om

Arkiv i e- forvaltning. Agenda 2014

Testverktøy Status og videre tanker

ESSArch som felles depotstyringssystem for arkivsektoren

Kommunereformen og IKA Trøndelags eierkommuner

PERIODISERING AV ELEKTRONISK JOURNAL OG ARKIV

Arkivloven og -forskriften

Transkript:

Kandidatnummer 832 Migrering av data Bacheloroppgave 2015 Bachelor i arkiv og dokumentbehandling Høgskolen i Oslo og Akershus, Institutt for arkiv-, bibliotek- og informasjonsfag 1

Innholdsfortegnelse 1.0 Innledning og utredning...s. 4 1.1 Innledning... s. 4 1.2 Utredning av situasjonen i norsk arkivsektor...s. 4 2.0 Metode og teori...s. 6 2.1 Metode...s. 6 2.2 Teori...s. 7 2.3 Redegjørelse for OAIS...s. 8 2.5 Hovedkrav for langtidsbevaring...s. 9 3.0 Migrering...s. 10 3.1 Hva er migrering?...s. 10 3.2 Migrering som bevaringsstrategi...s. 13 3.3 Lovverk for offentlige arkivet...s. 13 3.4 Er man pålagt å migrere?...s. 14 3.5 Fagsystemer...s. 14 3.6 Produksjonsformat...s. 19 3.7 Arkivformat...s. 21 3.8 Godkjente arkivformater og lagringsmedier...s. 22 3.9 Lagringssikkerhet...s. 23 4.0 Arkivuttrekk...s. 26 4.1 Hva er et uttrekk?...s. 24 4.2 SIP...s. 27 4.3 Opprettholdt lesbarhet...s. 27 4.4 Opprettholdt forståelighet...s. 31 4.5 Metadata...s. 33 4.6 PDI...s. 32 4.7 Designated community...s. 34 4.8 Independentely understandable... s. 33 2

4.9 Semantikk...s. 35 4.10 Representasjonsinformasjon...s. 36 4.11 ADDML...s. 37 4.12 SIARD...s. 38 5.0 Sammendrag og konklusjon...s. 39 5.1 Sammendrag...s. 41 5.2 Konklusjon...s. 44 Litteratur...s. 45 3

Problemstilling: Hvordan ivaretar standardene ADDML og SIARD hovedkravene til langtidsbevaring ved migrering av data fra et fagsystem til et uttrekk? Hvilke hovedkrav oppnås gjennom uttrekksprosessen ved hjelp av standardene? Finnes det forbedringspotensiale ved standardene ADDML og SIARD? 1.0 Innledning og utredning 1.1 Innledning Jeg ønsker å skrive om dette temaet fordi dette innebærer å bruke migreringsstrategien som er en viktig bevaringsstrategi i norsk arkivsektor. Dette er et viktig tema fordi det er en viktig del av arbeidet med å imøtekomme fagsystemproblematikken, temaet tar også for seg en tilnærming som baserer seg på viktige hovedkrav for langtidsbevaring som kan brukes også i andre standarder enn de jeg tar for meg i denne oppgaven. Det jeg ønsker å drøfte er hvordan standardene ADDML og SIARD ivaretar hovedkravene til langtidsbevaring når man migrerer data fra et fagsystem til et uttrekk med langtidsbevaring som mål. Jeg vil også undersøke nærmere hvilke hovedkrav standardene ivaretar under uttrekksprosessen, og hva disse hovedkravene innebærer for langtidsbevaring av elektronisk arkivmateriale. Til slutt vil jeg drøfte manglene ved disse standardene, om det finnes forbedringspotensiale for dem og eventuelt hvilke grep som kan gjøres for å ivareta alle hovedkravene til langtidsbevaring. 1.2 Utredning av situasjonen i norsk arkivsektor Arkivenes funksjoner i samfunnet går ut på å sikre ekte og autentiske spor etter handlinger og hendelser som har foregått i en virksomhet, arkivene inneholder spor etter og bevis på menneskelig aktivitet i samfunnet. Sporene fra nær fortid finnes bl.a. hos arkivskaper, mens spor fra fjern fortid er det en forventning om å bli funnet i arkivdepotene rundt om i landet. Hvor enn arkivene befinner seg, så er de fundamentale deler av minnet til enkeltpersoner, for virksomhetene og samfunnet i sin helhet, alle vil ha nytte av arkivene siden disse er de viktigste kildene til kunnskap om samfunnet og kulturen vi har. Arkivenes livssyklus starter i arkivdanningen til virksomheten eller hos enkeltpersoner, når disse arkivene blir eldre leveres de til et arkivdepot hvor arkivmaterialet blir gjenstand for langtidsbevaring og blir tilgjengeliggjort for allmennheten, på denne måten kan arkivene bli en del av samfunnet kollektive minne. Arkivene kan være viktige for både 4

enkeltpersoner og samfunnet som helhet siden de dokumenterer handlinger og hendelser som vedtak og avtaler, utvekslet informasjon, vurderinger som er gjort eller beslutninger i en rettssak. Dette er informasjon som er nødvendig for å opprettholde den enkelte borgers eller grupper av menneskers rettigheter, dette er forutsetning for å opprettholde et demokratisk samfunn (Kulturdepartementet 2013: 5). I norsk arkivsektor er det i dag store utfordringer når det gjelder langtidsbevaring av digitalt skapt arkivmateriale, dette gjelder spesielt deponering og avlevering av digitalt materiale fra arkivskapere til arkivdepotene. Størst er problemene i såkalte fagsystemer som er i bruk i offentlige forvaltninger og i privat sektor, ifølge Kulturdepartementet er det i kommunal sektor alene flere tusen ulike fagsystemer i bruk som inneholder viktig rettslig dokumentasjon, bl.a. fra sosialtjenesten, omsorgstjenesten og barnevernet. Fagsystem problematikken finner man også i statlig sektor, all dokumentasjon i fagsystemene står i fare for å gå tapt, derfor haster arbeidet med å sikre dette digitale arkivmaterialet slik at det kan langtidsbevares samtidig som autentisitet og integritet opprettholdes (Kulturdepartementet 2013: 99). Det som gjør at fagsystemene skaper problemer i arkivsektoren er at det blir kjøpt inn systemer som ikke har tilfredsstillende arkivfunksjoner, derfor er dette et arkivfaglig problem som starter i arkivdanningen. Fagsystemer mangler utforming og implementering av arkivfunksjoner som man ellers finner i f.eks. Noark5 standarden, dette er med på å skape problemer for arkivdokumentene i resten av dets livsløp. Man kan si at arbeidet med arkivbevaring starter hos arkivskaper, mangler man systemer som tar hånd om arkivfaglige behov som tilførsel av metadata ved opprettelse av arkivdokumenter eller ved avlevering til depot så får man problemer med autentisiteten og integriteten til informasjonen i ettertiden (Andresen 2015a: s. 20). Sett fra arkivfaglige synspunkter er en avlevering fra et Noark5 system enklere å håndtere enn et fagsystem fordi standarden beskriver hvilken informasjon som skal avleveres og hvordan dette skal struktureres. Et fagsystem har ingen slike bestemmelser for utarbeidelse av uttrekk og arbeid med avlevering, mye av grunnen til dette er også at arbeidet med å lagre og motta uttrekk fra fagsystemer knapt er i gang. Situasjonen er dermed alvorlig når man vet at fagsystemene ikke er basert på arkivfaglige behov og fordi det er minimal erfaring med avleveringer av disse til depotene. Ifølge ABM-utvikling er ikke fagsystemene laget med tanke på langtidsbevaring fordi de ikke har gode nok mekanismer for å lage uttrekk av dataene de inneholder, dette fører til at dataene ikke blir avlevert og de vil da over tid gå 5

tapt (Riksrevisjonen 2010: 39). I Riksrevisjonens rapport fra år 2010 kommer det frem at ingen fagsystemer har blitt godkjent av Riksarkivaren, en slik godkjenning ville være med på å sikre at fagsystemene oppfølger krav til bevaring og levering. I rapporten kommer det også frem at elektronisk arkivmateriale må aktivt vedlikeholdes for å sikre at informasjonen ikke går tapt og at den forblir leselig (Riksrevisjonen 2010: 75). 2.0 Metode og teori 2.1 Metode Metode betyr at man skal følge en bestemt veg mot et mål. Kvalitativ forskning har som mål å utforske hvordan individer oppfatter og tolker sin egen omverden, en kvalitativ forsker skal ta et «insider perspektiv», i en fagkrets f.eks. i arkivsektoren prøver individer å tolke omgivelsene i denne fagkretsen, forskeren skal da prøve å skjønne hvordan individer i fagfeltet tolker denne omverdenen (Krumsvik 2013: 9-10). Når man driver forskning er det viktig å kjenne til konteksten rundt temaet, derfor er det viktig å kjenne til konteksten når man skal utarbeide et forskningsspørsmål om det man vil utforske og deretter finne de rette metodene for å finne svaret på dette forskningsspørsmålet. Det er her viktig å avklare hva som er målet for studien, målet kan være basert på forskjellige momenter som egeninteresse, intellektuelle mål eller praktiske mål for studien. Målet for denne besvarelsen er basert på momentet intellektuelle mål fordi jeg ønsker å øke forståelsen om et vitenskapelig forhold på området. Når målet med oppgaven er bestemt må man utarbeide et forskningsspørsmål, grunnen til det er at man ikke skal blande inn personlige og praktiske mål i forskningspørsmålet, dette er for å unngå normative preg som forskning ikke kan svare på ut ifra et forskningsspørsmål. Målet med forskningsspørsmålet er å hjelpe til med fokuset til studien, og å vise veg for hvordan den kan utføres (Krumsvik 2013: 15, 19-21, 47). Som forsknings strategi er case studiet brukt i mange situasjoner for å støtte opp om vår kunnskap om forskjellige fenomener, case studier er brukt i mange forskjellige fagfelt. Uansett hvilket fagfelt et case studie skulle bli benyttet i, så er årsaken et ønske om å forstå komplekse sosiale fenomener. Et case studie tillater den som undersøker et tema å beholde meningsfulle karakteristikker av 6

virkelige hendelser. Når man velger en strategi for studiet må man identifisere situasjoner hvor strategien har sine fordeler, for et case studie er dette når spørsmål som «hvordan» og «hvorfor» blir spurt om virkelige hendelser som etterforskeren har liten eller ingen kontroll over. Et case studie er ikke en taktikk for å samle data, men en omfattende forskningsstrategi. Hvordan den defineres er gjort på forskjellige måter av mange, derfor er definisjoner ofte uklare. De viktigste oppgavene til en case studie er uansett å forklare antatte sammenhenger i virkelige intervensjoner som er for komplekse for undersøkelser eller eksperimentelle strategier. Den kan også beskrive en intervensjon og dens kontekst, en annen ting den kan gjøre er å illustrere visse emner innenfor en evaluering, i tillegg kan den bli brukt til å utforske situasjoner som den evaluerte intervensjonen ikke har noen klare og enkle utfall, den kan også være en metaevaluering som er en studie av en evaluering. En case studie kan være gjennomført ut ifra forskjellige motiver, dette kan f.eks. være enkle presentasjoner av individuelle saker (Yin 2003: 1-2, 9, 14-15). Metoden for denne oppgaven er en kvalitativ case. For å avgrense oppgaven har jeg valgt et case som ikke undersøker hvordan arbeidet med et uttrekk foregår i bare kommunal sektor eller ved hjelp av en overordnet standard for norsk offentlig arkivdanning og bevaring som Noark5 eller DIAS. Jeg gjorde dette valget fordi jeg ville at caset skulle gi en generell beskrivelse av en løsning på fagsystemproblematikken, i sted for å forklare standarder som i nær fremtid sannsynligvis ikke er gjeldende lenger. Selv om jeg har valgt å beskrive standarder som kan løse dette problemet har jeg valgt de som gjenspeiler et case som kan brukes til å beskrive og undersøke fagsystemproblematikken både i dag og forhåpentligvis i fremtiden ved hjelp av liknende caser og standarder som bruker liknende tilnærminger (McKemmish, Gilliland 2013: 94). En teoretisk tilnærming som gir en konseptuell løsning heller enn en praktisk løsning som er låst til dagens mangelfulle kunnskap på området, vil derfor være den riktige metoden for denne besvarelsen, målet med dette er også for at tilnærmingene kan brukes for digitalt arkivmateriale også i fremtiden. 2.2 Teori I denne besvarelsen har jeg valgt å fokusere på standarder og tilnærminger som kan løse problemstillingen jeg har valgt, for å undersøke dette har jeg brukt kilder fra pensum og forelesninger fra emnene ark2100, ark2200 og ark2000 på dette studiet, i tillegg til kilder fra internettsøk og diskusjoner med veileder som grunnlag for valg av tilnærmingene. De to 7

standardene jeg har valgt å bruke for beskrive tabelluttrekk, henholdsvis ADDML og SIARD har lite teoretisk stoff å bruke, derfor tar jeg utgangpunktet i forelesninger som omhandler disse. Dette gjenspeiler i grunn den manglende kunnskapen på dette området av arkivsektoren. Hovedvekten når det gjelder teori ligger derfor på tilnærmingene som kan brukes for å sikre dataene og de tekniske og logiske metadataene og om hvorfor dette er viktig. I denne oppgaven fokuserer jeg på hvordan man kan lage et uttrekk av data fra et fagsystem ved hjelp av forskjellige tilnærminger for å sikre at de elektroniske arkivdokumentene bevares samtidig som autentisiteten og integriteten opprettholdes. Besvarelsen baserer seg i hovedsak på tekstmateriale, jeg har ikke brukt undersøkelser eller intervjuer av personale i arkiver siden det er få som har erfaringer med denne problemstillingen, spesielt i depot siden det er avlevert minimalt med elektronisk arkivmateriale fra fagsystemer (Sødring 2015: personlig korrespondanse). Derfor har jeg heller fokusert på teoretisk stoff som omhandler tilnærmingene jeg og veileder ble enige om at jeg skulle å undersøke. Ved å undersøke hva det teoretiske stoffet sier om disse tilnærmingene, skal jeg undersøke og drøfte hva de har å si for et uttrekk fra et fagsystem. 2.3 Redegjørelse for OAIS OAIS står for Open Archive Information System, den er en åpen standard som betyr at den ikke er utviklet eller styrt av leverandører (Andresen 2015b: 3). Hovedmålet til OAIS modellen er å sørge for at et arkiv eller et depot har som hovedoppgave å bevare samlinger av informasjon i form av digitale arkivobjekter og gjøre disse tilgjengelig og i brukbar form for en utpekt målgruppe som i OAIS kalles Designated Community (Sødring 2014a: 10). Denne standarden er styrende for arbeidet med langtidsbevaring av elektronisk arkivmateriale og har begreper som blir brukt i norsk langtidsbevaring, derfor trengs det en innledende forklaring på hva denne standarden og dens begreper handler om. Standarden er aktuell å bruke for alle slags arkiver, men spesielt for depoter som har som mål langtidsbevare og tilgjengeliggjøre arkivdokumenter, standardens funksjonsmodell tar for seg arkivdokumentenes livssyklus fra uttrekk hos arkivskaper til langtidsbevaring i depot. Dette kommer frem i funksjonene som handler om mottak av arkivmateriale i depot, behandling i depot og tilgjengeliggjøring for allmennheten (CCSDS 2012: 1-2, 4-1). Standarden beskriver det den kaller informasjonspakker som er en pakke som består av Content Information 8

(innholdsinformasjon) som er selve innholdet som gjenstand for bevaring med tilhørende Representation Information (representasjonsinformasjon) som sørger for at dataene i innholdsinformasjonen er forståelig for den utpekte målgruppen, og Preservation Description Information (bevaringsbeskrivende informasjon) som er informasjon som hører til innholdsinformasjonen, dette er nødvendig for å bevare innholdet i arkivdokumentene, sørge for at den er identifiserbar, og for å forstå hvorfor innholdinformasjonen ble skapt og hvilke omgivelser det ble skapt i (CCSDS 2012: 2-6). Ifølge standarden er det tre typer arkivpakker, disse er SIP, AIP og DIP. En SIP er en arkivpakke som sendes fra arkivskaper til depot, denne inneholder vanligvis alle delene av en arkivpakke som beskrevet over. En AIP er versjon av SIPen som behandles i arkivdepotet slik at den blir klargjort for langtidsbevaring. En DIP er en arkivpakke som sendes ut av depot til en bruker på bestilling (CCSDS 2012: 2-8). I denne besvarelsen er det arkivpakketypen SIP som er det sentrale, et uttrekk inngår i en SIP som sendes fra arkivskaper til depot. OAIS standarden sier at kravene til brukerne (tiltenkt målgruppe) av arkivene kan endre seg over tid på grunn av hyppige teknologiskifter, en arkivskaper som lager et uttrekk som sendes til depot må derfor velge en bevaringsstrategi som reduserer risikoen for at samlinger av arkivdokumenter blir ubrukbare, et uttrekk er da en slik samling (CCSDS 2012: 1-2; Sødring 2014a: 21). 2.5 Hovedkrav for langtidsbevaring Langtidsbevaring av digitale dokumenter fører til store utfordringer og en rekke risikofaktorer. Arkivverket har særlig fokus på tre behov for langtidsbevaringen av digitalt arkivmateriale for å imøtekomme hovedutfordringene ved dette arbeidet. Disse tre behovene er; lagringssikkerhet, opprettholdt lesbarhet og opprettholdt forståelighet (Sødring 2014c: 8). Etter diskusjon med veileder kom jeg frem til at hovedtilnærmingen som skal brukes for denne oppgaven er basert på disse tre behovene, ifølge veileder er det vanlig å kalle dette for en «lagre, lese, forstå» tilnærming. Dette kommer av hovedkravene Arkivverket stiller til digital langtidsbevaring, disse legger vekt på løsninger for å sikre materialets integritet og autentisitet, i Elmag prosjektet kommer disse frem, her heter de lagringssikkerhet, opprettholdt lesbarhet og oppretthold forståelighet (Riksarkivet 2010: 8). Disse hovedutfordringen til arkivverket kommer også frem i Thomas Sødring sin forelesning om integritet og autentisitet (Sødring 2014c: 8). De kommer også frem i dokumentet «A Metadataframework to Support the Preservation of Digital Objects» som er basert på OAIS standarden, her beskrives viability (lagre), renderability (lese), og understandability (forstå) (The OCLC/RLG Working Group on Preservation Metadata 2002: 1), her beskrives bevaringsmetadata 9

som informasjonen som er nødvendig for å oppfylle disse hovedkravene, dette viser at disse hovedutfordringene er en kjent tilnærming også internasjonalt. Ifølge OCLC/RLG Working Group on Preservation Metadata sikrer egenskapen «lagre» (viability) at de digitale bitene er lagret intakt og er leselig fra lagringsmediet som det er lagret på. Her kombineres kategorien fixity (sjekksum) med forutsetningen om at det skal være leselig fra lagringsmediet. Egenskapen «lese» (renderability) sikrer at de digitale bitene er gjenkjennelig og leselig for den nåværende IT teknologien (maskinvare og programvare) som blir brukt. Dette forutsetter at de originale bitene til et digitalt objekt blir migrert (tranformert) for å sørge for at kravet om lesbarhet av digitale bits for en datamaskin eller system som følger den nyeste IT teknologien som er i bruk. På denne måten kan de lagrede digitale bitene bli gjengitt gjennom programvaren på en måte som er leselig for mennesker (Vermaaten 2012: 6). 3.0 Migrering 3.1 Hva er migrering? «Digital langtidsbevaring uten fysiske endringer er umulig» (Sirevåg 2015: 16). Migrering er en periodisk oppgave for kontinuerlig vedlikehold av digitalt materiale ved å flytte det fra et programvare/maskinvaresystem til et annet, eller fra en gammel generasjon av slike systemer til nyere generasjoner. Det ultimate formålet med migrering er å sikre integriteten til digitale objekter enten hos arkivskaper eller i depot, det skal også sikre brukerne av arkivet sin mulighet til å finne og hente ut materiale, lese og bruke materialet på ulike måter uten hindringer fra den hyppige teknologiske utviklingen innen den digitale verden (Garret 1996: 6). Å sikre integriteten til informasjonen gjør at informasjonsobjektet sine unike funksjoner blir bevart, på denne måten kan informasjonsobjektet skille seg ut som et helhetlig og unikt verk eller arbeid som kan ha forskningsmessige og rettslige verdier (Garret 1996: 12). En primitiv form for migrering er å printe digital informasjon på papir eller mikrofilm, man kan tenke seg at dette er en sikker måte å migrere på siden papirer eller mikrofilm er mer stabile enn digitale lagringsmedier som en CD plate som vanligvis har en holdbarhet på bare fem år (Rothenberg 1999: 3), papirer kan vare i hundrevis av år uten vedlikehold hvis man unngår å utsette materialet for fukt eller brann. Ved lagring av digitale data på elektroniske lagringsmedier som harddisker er realiteten når det kommer til stabilitet under 10

langtidsbevaring en helt annen (Garret 1996: 27). Utskrift av digitale filer på papir kan fortsatt brukes for primitive filer som rene tekstdokumenter uten spesifikasjoner som vedlegg eller linker til andre dokumenter, men går dokumentene over til mer avansert funksjonalitet så vil ikke dette la seg gjengi i en form som representerer alt av informasjonsinnholdet. En relasjonsdatabase med linkinger mellom tabeller gjennom fremmednøkler lar seg f.eks. ikke lagres og leses på papirer, funksjonalitet som er avhengig av den aktuelle programvaren vil da gå tapt. Selv om papirutskrifter er en sikker måte å sikre langtidsbevaring av viktig digitalt skapt informasjon er dette ikke tilstrekkelig migreringsmetode for dagens og fremtidens teknologiske realitet når det kommer til hyppig utbytting av IT løsninger (Sødring 2014b: 12-13). Det elektroniske lagrings- materialet/mediet varer ikke like lenge som papirmateriale og er mer sårbart for påkjenninger som elektroniske feil, men utfordringene med langtidsbevaring av digitalt arkivmateriale ligger også i selve filene eller de digitale dataene (bits). En migrering av data fra et lagringsmedie til et annet kan være tilstrekkelig hvis informasjonen består av digitale data som er av det primitive slaget, dette vil si data som kan leses og lagres uavhengig av programvaren som dataene ble skapt gjennom, med universelle tegnsett i flate filer (Garret 1996: 27). Digitalt lagret informasjon av slik karakter var en realitet i gamle datasystemer, men med dagens teknologi har digitale dokumenter utviklet seg i funksjonalitet og kompleksitet. Før forbundet man tekstdokumenter med bare tekst i innholdet, mens det i dag kan inneholde både tekst, bilder, lyd og til og med video, tekstdokumenter kan i dag være beholdere for multimediafiler. Et tekstdokument kan ikke ses på som et digitalt objekt som inneholder kun tekst, man må se det som flere digitale enheter av bits som er organisert sammen og kodet til å utgjøre en fil. Dagens digitale dokumenter er derfor meget avhengig av at man bruker den rette programvaren til å lese og vise innholdet gjennom, en gammel utgave av et tekstredigeringsprogram vil ikke nødvendigvis kunne lese alle disse dataene som utgjør en fil med informasjonsinnhold, dette gjelder også samme type programvare fra andre leverandører produsert på samme tidspunkt. Dette problemet vil dessverre også gjelde fremtidens versjoner av programvaren. Ettersom man oppdaterer programvarer, operativsystemer eller maskinvare blir man nødt til å migrere disse dokumentene over til den gjeldende IT løsningen som blir brukt i organet. (Garret 1996: 27) 11

Å kopiere data fra et medium til et annet ved å printe til papir og mikrofilm eller bevare flate filer er den enkleste og mest universelle formen for migrering, dette sikrer informasjonen slik at det ikke går tapt på en enkel måte, dette er en metode som fører til lave kostnader. Men skal man migrere mer avanserte digitale dokumenter så vil ikke denne enkle metoden sikre dokumentenes struktur eller form, tap av dette vil føre til tap av autentisiteten til informasjonen. Slik autentisk informasjon blir ved denne typen migrering slettet fordi man ikke tar hensyn til dataene som opprinnelsesprogrammet bruker til å skape struktur eller form som fet, kursivert eller farget skrift, grafiske bilder, indeksering eller linker til andre dokumenter som det var forbundet til. Opprinnelsesprogramvaren til slike dokumenter har tradisjonelt blitt sett på som komplekse, men i forhold dagens teknologiske standarder er dette vanlig, derfor er ikke enkle migreringer som utskrift på papir godt nok for dagens og fremtidens komplekse dokumenter som inneholder f.eks. multimediainnhold (Garret 1996: 28). Dokumenter som oppstår i komplekse opprinnelsesomgivelser krever komplekse migreringsprosesser (Det Norske Veritas 2007: 16). For å gjøre langtidsbevaringen av digitale dokumenter mindre kompleks er det viktig å ha få filformater å forholde seg til, dette gjør mengden av dokumenter mer håndterlig og det er lettere å unngå at struktur og teknisk form går tapt. I norsk arkivsektor har man tatt grep for å gjøre arkiveringen av digitale materiale enklere gjennom Riksarkivarens sin forskrift jf. 8-17, her er det satt opp pålagte filformater for tekst, bilde og grafikk, det er et krav at alle filer som deponeres eller avleveres skal være i disse formatene. For å imøtekomme dette kravet må man utføre migreringer ved å konvertere filene over til godkjent filformat, dette er også en metode som er nødvendig for å imøtekomme den teknologiske utviklingen som stadig innfører nye filformater som bare fungerer på nyeste versjon av den aktuelle programvaren, man konverterer fra et foreldet format til et som er oppdatert. Ettersom det introduseres nye filformater må man stadig migrere til gjeldende format for at dokumentene skal kunne brukes og leses i organets oppdaterte system. Ettersom teknologien utvikler seg vil en slik migrering ikke være tilstrekkelig mer enn i korte perioder om gangen, dette kan også ses på som en enkel migreringsmetode (Garret 1996: 28). I denne besvarelsen tilsvarer begrepet migrering en transformasjon slik det er beskrevet i OAIS standarden, her beskrives en transformasjon som en migrering hvor det er endringer i innholdsinformasjonen og metadataene, det kan bety at man migrerer data fra et system til et annet, dette inkluderer også en formatkonvertering og en migrering fra et lagringsmedie til et annet. Dette tilsvarer arbeidet med å lage et uttrekk som beskrives i denne oppgaven, her brukes begrepet migrering og konvertering om 12

hverandre, fordi en konvertering etter min mening og er en migrering, et format etter min mening er også et slags system man overfører data seg imellom. OAIS bruker denne betegnelsen transformasjon for migrering mellom arkivpakker i depot, men betegnelsen kan også brukes ved migrering et fagsystem til et uttrekk (SIP) (CCSDS 2012: 5-5-5-8). 3.2 Migrering som bevaringsstrategi I norsk arkivsektor har man valgt migrering som strategi for å bevare elektronisk informasjon, denne kalles migreringsstrategien. Denne strategien går ut på å trekke data med informasjon ut av et produksjonssystem og overfører disse til et format som er uavhengig av produksjonssystemet det ble skapt i, data som går tapt i migreringen skal dokumenteres hjelp av metadata. Målet med dette er at informasjonen skal være flyttbar og håndterlig slik at informasjonen blir gjenfinnbar og leselig på teknologiplattformer som er under hyppig endringer. På grunn av disse hyppige endringene av teknologiplattformer, krever strategien at man kontinuerlig vedlikeholder det digitale arkivmaterialet gjennom migreringer til nye lagringsenheter og til nye formater. Denne bevaringsstrategien gjenspeiler problemstillingen i denne besvarelsen hvor jeg skal diskutere migrering fra produksjonsformat i et produksjonssystem (fagsystem) til et format som er uavhengig av produksjonssystemet (arkivformat) (Kulturdepartementet 2013: 33; ABM Skrift # 43 2007: 10). 3.3 Lovverk for offentlige arkivet Når det gjelder migrering har disse lovene relevante bestemmelser for offentlige organer; arkivlova, arkivforskrifta, og Riksarkivaren si forskrift. Kommuner og fylkeskommuner skal følge egne regler for bevaring av eldre og avsluttede arkiver (Arkivverket.no 2014a) Disse skal følge en normalinstruks med spesifikasjoner utarbeidet av Riksarkivaren jf. Forskrift om offentlege arkiv 5-12. Arkivloven er en generell lov for alle typer offentlige arkiver, men det har også bestemmelser for bevaring av private arkiver. Formålet med arkivlova er å sikre at arkiver som har omfattende kulturell eller forskningsmessig verdi eller som inneholder rettslig eller viktig forvaltningsmessig dokumentasjon blir tatt vare på og gjort tilgjengelig for ettertiden. Arkivforskrifta utdyper arkivlova og regulerer de fleste sidene ved arkivfunksjonen i offentlig forvaltning (Arkivverket.no 2014a). Riksarkivarens si forskrift har utfyllende tekniske og arkivfaglige bestemmelser og behandlingen av offentlige arkiver (Arkivverket.no 2014b). Ifølge arkivlova 2-11 skal arkivmateriale tas vare på for ettertiden ved å benytte et godkjent 13

lagringsmedium, her kommer det også frem at arkivmateriale på elektroniske lagringsmedier må kopieres eller konverteres (migreres) til nye lagringsenheter i den grad det er nødvendig for å ta vare på og ha tilgang til dokumentinnholdet. Her kommer det altså frem at det er lovpålagt for offentlige organer å utføre migreringer for å sikre bevaring og tilgang til arkivmateriale for ettertiden. Når det gjelder normalinstruks for arkivdepot i kommunar og fylkeskommunar, så tar denne for seg krav til materiale som avleveres og regler for tilbakelån. Kravene til materiale som avleveres viser til arkivforskrifta 5-8, det vil si at kommuner og fylkeskommuner følger samme regler som gjelder for avleveringer for statlige organer (Riksarkivaren 2002: 3). 3.4 Er man pålagt å migrere? I norske arkiver må man migrere data mellom formater og systemer fordi lovverket krever at dette gjøres. I arkivloven står det; «Føremålet med denne lova er å tryggja arkiv som har monaleg kulturelt eller forskingsmessig verde eller som inneheld rettsleg eller viktig forvaltningsmessig dokumentasjon, slik at desse kan verta tekne vare på og gjorde tilgjengelege for ettertida.» jf. arkivlova 1. Man må også migrere fordi arkivene skal avleveres fra arkivskapere til arkivdepoter jf. arkivlova 10. I arkivforskriften er bestemmelser som sier at arkivmateriale i aktive arkiver inkludert fagsystemer som inneholder arkivserier som ikke lenger er aktive skal skilles ut fra det aktive arkivet og plasseres i et bortsettingsarkiv jf. forskrift om offentlige arkiver 2-4. Arkivforskriften sier også at arkiver som ikke er i bruk til administrative formål lenger skal leveres til depot, dette gjelder også materiale i organer som er nedlagt eller har avsluttet sin virksomhet jf. forskrift om offentlige arkiver 5-1. Lovverket har altså bestemmelser som gjør at det er nødvendig å utføre migreringer av digitale data i arkivene. Videre, grunnet lovverket må man følge de detaljerte bestemmelsene for elektronisk arkivmateriale som skal avleveres til Arkivverket som nevnt tidligere også gjelder for kommuner og fylkeskommuner. Her finner man bestemmelser for hvordan man utarbeider et uttrekk som avleveres til depot, med krav til bl.a. formater og lagringsmedier som må brukes i dette arbeidet jf. Behandling av offentlige arkiver kapittel VIII. 3.5 Fagsystemer Som vi så i lovverket så er det bestemmelser som sier at arkivmateriale i aktive arkiver inkludert fagsystemer som ikke er i aktivt bruk for administrative mål lenger skal tas bort av det aktive arkivet og overføres til depot, det samme gjelder når virksomheten avsluttes. Derfor vil jeg først undersøke nærmere hva et fagsystem er siden begrepet fagsystem kommer frem både i lovverket og 14

i forskningsspørsmålet mitt. Begrepet fagsystem er omfattende og lite presist. Et elektronisk fagsystem blir ofte definert som et støttesystem som er spesialisert for saksbehandlingen i et organ (Arkivverket.no 2014c). Det er uenigheter i arkivsektoren om begrepet fagsystem og hvordan dette skal forstås, derfor er det også uklart hvilke arkivfaglige krav som gjelder for et fagsystem og hvordan data og dokumenter i systemet skal behandles. Det mange forbinder med et fagsystem er at det er et samlebegrep for systemer som ikke er basert på Noark-5. Riksarkivaren si forskrift kap. VIII har en definisjon på begrepet fagsystem, der kommer det frem at det dreier seg om registre og databaser som brukes som grunnlags- eller støttesystemer for saksbehandling. For arkivarer er det greit å si at et fagsystem er databaser som ikke er basert på Noark5 (Arkivverket 2015a). Som arkivar er uansett det viktigste å fokusere på de arkivfaglige spørsmålene som må stilles når man skal vurdere et fagsystem, man må se på hva som fins av opplysninger og dokumenter, om regelverket er fulgt og hva som skal til for at det blir fulgt. Spørsmålene man må stille seg er om fagsystemet er et handlingsbasert system uten dokumenter, eller med virtuelle dokumenter; er det et ikke-korrespondansebasert system med dokumenter; er det et korrespondansebasert system med arkivdokument og tilknyttede metadata; eller er det er system med sammensatte løsninger? (Arkivverket 2015a). Ifølge arkivforskrifta 2-4 kan man se på et fagsystem som et arkiv, derfor gjelder arkivloven med forskrifter for fagsystemene hvis de er utviklet etter 01.01.1999. For fagsystemene vil det f.eks. si at det skal brukes filformater og lagringsmedium som er godkjent av Riksarkivaren, at fagsystemet skal være godt nok dokumentert til at materialet kan brukes også etter overføring til depot, og at opplysninger som ikke lenger er aktuelle ikke skal slettes (Arkivverket 2015a). Når det gjelder Riksarkivarens forskrift så gjelder kapittel VIII for fagsystemer, her presiseres bestemmelser for avlevering eller deponering fra statlig forvaltning til Arkivverket. Dette omfatter generelle vilkår for elektronisk materiale, tekniske krav til uttrekk fra IT-system og krav til dokumentasjon som skal følge med i et uttrekk. Det presiseres også at opplysningene i et uttrekk skal være i et systemuavhengig format godkjent av Riksarkivaren i samme kapittel. Normalinstruksen for kommuner og fylkeskommuner skal følge de samme reglene som statlig forvaltning (Arkivverket 2015a). I Riksarkivaren sin forskrift kap. IX kommer frem at ved avlevering eller deponering skal fagsystemer med dokumenter kunne produsere et uttrekk som inneholder alle obligatoriske metadata som er beskrevet i arkivstruktur.xsd og metadatakatalog.xsd. 15

Dette skal sikre et minimum av metadata og arkivstruktur som er nødvendig for å sette dokumentene inn i en kontekst, opprettholde autentisitet, og sørge for gjenfinning. Videre presiseres det at om ikke dette vil la seg gjøre så må man vurdere andre typer tabelluttrekk som dokumenteres med ADDML (Arkivverket 2015a). Videre er det presisert at dokumentene skal lagres i godkjente lagringsformater som er garantert tilgjengelig og som har full autentisitet og integritet i det tidsrommet dokumentene skal være arkivert. Når det gjelder lagringsmedium så er det et krav at dokumentene er bevart i tilgjengelig form inntil avlevering til depot. Når dokumentene blir lagret på et eksternt lagringsmedie som CD plate eller harddisk så må dokumentene kopieres over til nye lagringsmedier i god tid før materialet blir utilgjengelig fordi lagringsmediet blir teknisk foreldet. Det presiseres at det alltid skal være minst en sikkerhetskopi av elektroniske saksdokumenter på en separat lagringsenhet (Arkivverket 2015a). Som sagt så skal et uttrekk fra et fagsystem i både statlige, kommunale og fylkeskommunale organer følge retningslinjene i Riksarkivarens forskrift kap. VIII. Uttrekket skal inneholde detaljer om bl.a. periode, innhold og struktur, det må her tas hensyn til hvert individuelle fagsystem i samarbeid mellom arkivskaper, depotet og Riksarkivaren som skal kontaktes når man planlegger dette arbeidet. Når det er planlagt å avvikle et fagsystem, og man har ingen planer om å videreføre de digitale dataene over i et nytt system, så er det anbefalt at eieren av fagsystemet gjøre flere oppgaver. For det første skal Riksarkivaren kontaktes for å vurdere bevaringsverdien til informasjonen, hvis fagsystemet inneholder bevaringsverdig informasjon så skal det defineres uttrekksmetoder, og uttrekket skal deretter deponeres eller avleveres til depot (Arkivverket 2015a). Hvis det er planlagt å oppgradere eller erstatte det gjeldende fagsystemet med et nytt system hvor dataene skal videreføres i denne nye versjonen så skal dette gjøres. Riksarkivaren skal kontaktes for en vurdering av bevaringsverdi og uttrekksmetoder, kontakt skal også opprettes hvis dataene blir endret eller slettet, det blir da vurdert om det skal gjøres en komplett deponering eller avlevering. Ved oppgradering til nytt system skal det ifølge arkivverket bygges inn funksjonalitet som tilfredsstiller kravene i Noark. Integrering med fagsystem var en av de viktigste grunnene til en oppgradering av Noark4 til Noark5, på grunn av dette har Noark5 de to løsningene Noark5-kjerne og komplett Noark5. Noark5-kjerne skal kunne bygges inn i hvilken som helst omgivelse, den er derfor ikke et ferdig definert system slik at den kan fungere sammen med andre systemer, dette kan da være et eller annet fagsystem, dette er opp til brukeren og leverandøren (Arkivverket 2015a). 16

Systemer basert på Noark5 er enklest å håndtere når man skal lage uttrekk fordi standarden beskriver hvilken informasjon som skal avleveres og hvordan avleveringen skal foregå (ABM Skrift # 43 2007: 26). Bestemmelser om arkivering av fagsystemer blir hjemlet i arkivforskrifta 2-14, her kommer det frem at slike systemer skal ha eksportfunksjoner som sikrer at bevaringsverdig data i systemet kan sikres ved å bli lagret i arkivformat slik at det kan leveres til depot, det kreves også fullverdig dokumentasjon av arkivmaterialet jf. Arkivforskiften 2-14. Dette betyr at et uttrekk fra et fagsystem skal bestå av data lagret i arkivformat og at disse dataene eller innholdet skal være dokumentert med metadata. Et fagsystem vil ifølge minnehåndteringsrapporten i hovedsak ulike typer relasjonsdatabaser som vil kunne eksportere tabelluttrekk i godkjent arkivformat selv om de ikke skulle tilfredsstille kravene til helelektronisk lagring, dette er forutsatt at nødvendig dokumentasjon er tilgjengelig (ABM Skrift # 43 2007: 23). For at man skal kunne dokumentere uttrekk av data fra et fagsystem så er det viktig at systemet blir kartlagt når det er i bruk hos arkivskaper, dette er en forutsetning for at man har nok informasjon å gi til depot når man senere skal jobbe med et uttrekk. Et minimum av dokumentasjon man må ha om systemet er informasjon som identifiserer navn på systemet, hvor det benyttes (hvem som er arkivskaper) og hva som er formålet med bruken av det. I tillegg bør man dokumentere hvilke funksjonstyper og informasjonsinnhold fagsystemet består av, dette er da den informasjon som kreves for å vurdere om dokumentene er bevaringsverdige. Derfor må man beskrive hvilke moduler systemet er bygget opp av og hva slag type informasjon som produseres, videre er det viktig å beskrive forhold rundt lagringen, hva slag produksjonsformater som brukes, ansvarsforhold osv. I en relasjonsdatabase i et fagsystem er det viktig å kunne beskrive systemets datamodell, altså tabeller og dokumenter i systemet og relasjonene mellom tabellene, et ER-diagram kan være nyttig i denne sammenheng. En grafisk oversikt over systemet er nyttig, dette er med på å vise hvilken informasjon ulike moduler produserer. En kartlegging av moduler som genererer informasjonssammenstillinger som gir helhetlig informasjon om hvert objekt som navn på personer, saker, eller nøkkelbegreper. En hovedregel for dokumentasjon av et fagsystem er at brukerdokumentasjon tas vare på hvis dette er mulig (ABM Skrift # 43 2007: 23-24). 17

Før man setter i gang med å trekke ut data fra en relasjonsdatabase for å lage et uttrekk, så er det viktig at man gjennomfører en bevaringsvurdering slik at man ikke belaster depot med unødvendig mengde arkivdokumenter som ikke er bevaringsverdige. Dette er viktig for migrering som bevaringsstrategi, siden dette må utføres når man velger ut hvilke tabeller eller hvilke deler av tabellene som inneholder den informasjonen som skal bevares. Under bevaringsvurderingen er det viktig å få en oversikt over systemets funksjonelle oppbygging slik at man får en oversikt over hva slags informasjon som registreres og hvordan den behandles, dette er med på å bestemme hvilken informasjon som skal være med i uttrekket. Det er også viktig å få med informasjon om hvordan systemet har blitt brukt og hvilke rutiner man har hatt for registrering. Uansett hva man ender opp med så er det viktigst å sørge for at nødvendig bevaringsverdig informasjon blir trukket ut, samtidig som at informasjonen gir mening når man i ettertiden skal forstå innholdet uavhengig av opprinnelsessystemet (ABM Skrift # 43 2007: 24-28). Når man har vurdert hva som skal bevares fra fagsystemet så har man en oversikt over hvilke tabeller eller andre former for informasjonsnoder som skal være med i uttrekket. Består fagsystemet av en relasjonsdatabase så vil dette bestå av tabeller, arbeidet med å lage et uttrekk vil da bestå av å eksportere tabellene og migrere dataene over til flate filer eller XML filer, en tabell i relasjonsdatabasen (opprinnelsessystemet) skal utgjøre en tabell i uttrekket, man får dermed en tabell i hver XML fil. Filer som utgjør dokumenter i databasen skal også være med i uttrekket disse skal da migreres over til godkjent arkivformat, for tekstdokumenter kan dette være PDF/A jf. Behandlingen av offentlige arkiver 8-17 d). Hvert dokument skal utgjøre en fil, er disse tilknyttet til resten av databasen så skal disse tilknytningene opprettholdes. Til sammen vil alle tabeller lagret i XML filer og dokumenter i godkjent arkivformat, utgjøre innholdsinformasjonen (OAIS; Content Information) i en SIP (ABM Skrift # 43 2007: 29-30). For å utføre et uttrekk fra et fagsystem må man ha tilgang til opprinnelsessystemet som skapte dataene på dets opprinnelige plattform, altså den riktige kombinasjonen av programvare og maskinvare. Dette kan arkivskaper gjøre tilgjengelig for dem som utfører arbeidet med uttrekket, men dette forutsetter at den teknologiske utviklingen ikke gjør systemet utdatert. Hvis en relasjonsdatabase blir såpass gammel og utdatert at arkivskaper har problemer med å gjøre den operativ i deres system så kan alternativet være å lage en databasedump å levere denne til depot som deretter gjør denne operativ i et egnet verktøy (ABM Skrift # 43 2007: 30). 18

3.6 Produksjonsformat Arkivskapere produserer dokumenter med et formål om å støtte opp om deres egne bruksbehov for informasjon over et kort tidsperspektiv, derfor blir ikke risikoene ved langtidsbevaring og tilgjengeligheten av disse dokumentene tatt hensyn til. Når arkivskapere ikke tar hensyn til dette vil de elektroniske dokumentene ta med teknologiske problemer inn i fremtiden, dette vil på et eller annet tidspunkt føre til alvorlige risikoer for informasjonen. Formatet til de elektroniske dokumentene skaper problemstillinger for både arkivskaperne og arkivdepotene, man kan spørre seg om hvorfor man enkelt og greit ikke bruker de samme formatene hos begge og løser mange av problemene med en gang. Grunnen til at dette ikke er mulig i dag er at arkivskaperne har helt andre behov for formatene enn det som stilles for langtidsbevaring i depot. Forskjellige behov gjennom dagens teknologi fører dermed til at arkivskapere bruker andre formater enn det depotene vil ha tilsendt før de gjør dokumentene klar for langtidsbevaring. Men problemet stopper ikke i depotet, dette er fordi fremtidens brukere av arkivene stiller nye krav til formatene gjennom den tids gjeldende teknologi. På grunn av forskjell mellom produksjonsformatene, arkivformatene og fremtidens nye krav til arkivformater så ser det ut til at migrering mellom formater fortsatt vil være en realitet i fremtiden (Folk 2003: 1). Arbeidet med langtidsbevaring av elektronisk arkivmateriale er basert på at arkivskaper følger kravene til innhold, funksjonalitet og rutiner som er beskrevet i gjeldende lovverk. Det er derfor på sin rett å si at arbeidet med å langtidsbevare elektronisk arkivmateriale starter ved arkivdanningen. Arbeidet man gjør under arkivdanning handler om å kartlegge hvilken funksjonalitet og bruksområde systemet skal håndtere, for så å definere hvilke krav systemet skal oppfylle. Man må også sørge for at rutiner bestemmelser for bruker av systemet i organet blir fulgt, dette er med på å sikre at handlinger utført gjennom systemet og autentiserende informasjon blir dokumentert, videre er det viktig at denne dokumentasjonen blir lagret i formater som kan langtidsbevares (ABM Skrift # 43 2007: 20-21). Data hos arkivskapere lagres som oftest i proprietære formater, proprietære formater er de som er avhengig av programvaren som leverandørene selger til arkivskaperne. Formatene er avhengig av leverandørene fordi kildekoden som utgjør programvaren er beskyttet av lisenser, derfor er det ikke mulig for andre interessenter (f.eks. Arkivverket) som benytter seg av formatene å gjøre endringer og tilpasninger som er til fordel for deres bruk av formatene, dette kan være for bruk til langtidsbevaring (Sødring 2014e: 4). Med proprietære formater har man i motsetning til fri programvare ikke mulighet til å studere hvordan programmet fungerer og endre de 19

hindringene man måtte oppleve ved f.eks. langtidsbevaring av dokumenter, proprietære formater fører også til kostnader ved oppdateringer fordi man ikke har mulighet til å redistribuere kopier innenfor f.eks. organer i kommuner (Sødring 2014e: 13). Det store problemet med proprietære formater når det gjelder migrering er at disse formatene i tillegg til være avhengig av programvaren til leverandøren så er de også avhengig av maskinvaren programvaren kjøres på. Proprietære formater er dermed avhengig av en bestemt kombinasjon av maskinvare og programvare for å kunne leses, formatene er med andre ord plattformavhengig. Denne plattformavhengigheten låser man seg til ved å kjøpe løsninger fra leverandører som utvikler systemer som har denne avhengigheten. Dermed blir man fort låst til en leverandør som for å tjene penger oppdaterer og endrer systemene og dermed også formatene som brukerne må forholde seg til. Det er heller ikke lett å bytte fra en leverandør til en annen nettopp på grunn av plattformavhengigheten (Sødring 2014f: 15). Derfor blir man nødt til å migrere data fra gamle generasjoner av plattformer over til nye generasjoner for å opprettholde lesbarheten på gjeldende teknologi. Dette medfører ekstra kostnader når det kommer til migrering mellom proprietære formater, en bruk av åpne standarder åpner i større grad for bruk av nøytrale formater som trenger færre migreringer og da lavere kostnader (Sødring 2014f: 43). Utfordringen ved proprietære formater er at leverandørenes endrende virksomhet i forhold til den hyppige teknologiske utviklingen, målet for dem er å tjene penger og brukergruppene sine behov og ønsker for formater tas ikke hensyn til, en av disse gruppene er dessverre fagfolk i arkivsektoren og brukerne av arkivene. Leverandørene trenger ikke ta hensyn til arkivene fordi de får solgt systemene uansett, derfor ser ikke fremtiden for proprietære formater i forhold til arkivene lys ut. På grunn av dette er det i mange arkivmiljøer et ønske om at arkivskapere går over til fri programvare og åpne formater. På denne måten kan man unngå markedskreftene som fører til hyppige teknologiskifter som er en trussel mot lagringssikkerheten og lesbarheten til elektroniske dokumenter, ved overgang til åpne formater så minker nødvendigheten for jevnlige migreringer (konverteringer) mellom filformater (Folk 2003: 7). Databaser er strukturerte og permanente lagre for data som f.eks. et organ bruker og arkiverer. Brukere av databasen kan legge til data eller informasjon, redigere og vedlikeholde dataene eller gjøre spørringer mot dataene slik at man kan finne den informasjonen man er ute etter, man kan 20

også konstruere spesielle sammensetninger av data. Alt dette må skje via enten et program som kan være det fagsystemet organet bruker, eller via et database management system, gjennom disse kan man også organisere relasjoner mellom dataenheter og regulere tilgangen til databasen. Man skiller mellom produksjonsdatabaser som er i daglig bruk og som blir utsatt for jevnlige endringer, og historiske databaser som er databaser som ikke er i bruk lenger (Groven 2015: 4). Problemene med databaser når det gjelder langtidsbevaring er når arkivskapere bruker forskjellige databaseprodukter fra forskjellige leverandører. Disse databaseproduktene bruker alle SQL som språk, men de har alle sine egne utgaver av SQL språket, en relasjonsdatabase fra et fagsystem som bruker et produkt fra Oracle er derfor ikke bygd opp av samme datatyper som en relasjonsdatabase laget med MySQL i et annet fagsystem. Dette gjør problemene med relasjonsdatabaser i de mange ulike fagsystemene enda større, siden man trenger å forholde seg til mange forskjellige opprinnelsessystemer selv om formatet er det samme (SQL). På grunn av de ulike typene av SQL så kan man i et arkivdepot ikke forholde seg til ett standard databaseprodukt man kan migrere dataene til fordi dette ikke er mulig, den teknologiske utviklingen hos leverandørene er også med på å umuliggjøre dette (Groven 2015: 7). 3.7 Arkivformat Behovene for brukere av langtidsbevarte arkiver er på det tidspunktet man arkiverer elektroniske dokumenter i depot ukjent. Fremtidens brukere har sannsynligvis ikke informasjon om opprinnelsessystemet og konteksten til dokumentene, brukerne vil også være skeptiske til integriteten til dokumentene siden det har vært utsatt for flere migreringer under langtidsbevaring mellom forskjellige lagringsmedier og formater. Plattformene som var tilgjengelig hos arkivskaper og under behandlingen i depot kan være borte for alltid, det samme kan gjelde for dataspråket som systemene bygde på (Folk 2003: 2-3). For å illustrere hva arkivformat dreier seg om kan man trekke frem Riksarkivarens brev til en arkivskaper om overgangen fra arkivformatet PDF til PDF/A som i dag er gjeldende arkivformat for dokumenter med tekst og bilde eller grafikk jf. Behandling av offentlige arkiver 8-17. I dette brevet kommer det frem hvorfor PDF/A er et foretrukket arkivformat, grunner til dette er for å sikre lesbarheten og tilgjengelighet over tid ved å minimalisere avhengigheten til plattformer og den teknologien som måtte være gjeldende. Andre grunner er at PDF/A i større grad enn PDF har autentisitets- og integritetsikring fordi det er utviklet med tanke på arkivering. Det presiseres at 21

overgangen til PDF/A var nødvendig for å sikre tilgjengelighet og lesbarhet over tid og at fremtidige brukere har tillit til at dokumentene er autentiske og ekte (Riksarkivaren 2009: 1-2). I brevet oppfordrer også Riksarkivaren til at leverandører av Noark-baserte systemer og andre systemer som arkiverer elektroniske dokumenter (fagsystemer) sørger for å implementere funksjoner som konverterer filer fra produksjonsformat (proprietære formater) til arkivformatet PDF/A. I brevet presiserer Riksarkivaren at det er to forskjellige utgaver av PDF/A (1a og 1b), her kommer det frem at 1b nøyer seg med å opprettholde dokumentets utseende, mens 1a har flere autentiserende egenskaper innebygd i filen. Men ikke alle konverteringsverktøy i dag kan tilby den beste versjonen, her ser man at konverteringsoppgavene ved PDF formatet kanskje ikke er over riktig ennå (Riksarkivaren 2009: 2-3). Det som også utgjør et godt arkivformat er at det er lett å lagre (Folk 2003: 3) 3.8 Godkjente arkivformater og lagringsmedier Lovverk som gjelder for offentlige arkivskapere som skal lage uttrekk som sendes til depot sier at et uttrekk skal bestå av godkjente filformater på godkjente lagringsmedier. Når det gjelder elektroniske saksdokumenter hos arkivskaper så er det bestemt at disse skal lagres i godkjent filformat jf. Forskrift om offentlege arkiv 2-13. Dermed sikrer man allerede under saksbehandling at godkjent filformat for arkiver brukes, hvis denne bestemmelsen følges så slipper man unna mange filkonverteringer. Godkjente filformater ved deponering og avlevering er fastsatt av Riksarkivaren jf. Behandling av offentlige arkiver 8-17. Alle filformater blir ikke ramset opp her, men for tekstdokumenter så er godkjente filformater TIFF, XML og PDF/A, denne paragrafen fastsetter også i hvilket tegnsett tekstdokumentene skal ha i disse formatene. Det som kjennetegner disse godkjente filformatene er at de er åpne og fullstendig dokumenterte, de er etablerte formater ute på markedet og er utbredt i bruk. Filer i disse formatene er lesbare og kan analyseres på enkle måter, de er selvdokumenterende og er uavhengige av maskinvare og programvare. De er heller ikke patentvernet, har ikke krypteringer, og de er robuste og effektive (Arkivverket.no 2013). Godkjente lagringsmedier for uttrekk som avleveres eller deponeres er fastsatt av Riksarkivaren, et lagringsmedie må også følge godkjent filsystem (f.eks. FAT32 for harddisk). Lagringsmedier som kan brukes til å lagre et uttrekk er CD-R, DVD-R eller DVD+R, harddisk med USB 2.0-tilkobling og minnepinne også med USB-tilkobling jf. Behandling av offentlige arkiver 8-31. Dette er altså lagringsmediene man må migrere digitale data til fra datamaskiner, servere eller fra et lagringsmedie som ikke er godkjent, migrering av data blir også utført mellom to eller flere av de 22