Databasebevaring. Arne-Kristian Groven, KDRS-samling, Trondheim 05.06 2014



Like dokumenter
Automatisering av uttrekk fra bevarte databaser

Metoder og verktøy for overføring, analyse og tilgjengeliggjøring av digitalt arkivmateriale

Bevaring og tilgjengeliggjøring- Hvor ligger forbedringspotensialet?

IT, arkivarens verktøy eller forbannelse? Arne-Kristian Groven, Riksarkivet 24. mars 2015

Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland

Produksjonslinje for bevaring og formidling av elektroniske arkiv fra kommunal sektor KDRS RIKSARKIVARENS ARKIVUTVIKLINGSMIDLER

Fra produksjonsmiljø til bevaring - produksjonslinje for earkiv. v/sigve Espeland og Harald Nordli

DIAS - Digital arkivpakkestruktur

Kommunale, digitale depot i endring Trøndelagsmodellen. Kari.Remseth@ika-trondelag.no

Systemportef lje sortert etter systemnavn

Å lage Noark 4 uttrekk selv. Thomas Sødring thomas.sodring@jbi.hio.no /

Generell metode. v/sigve Espeland, IKA Rogaland

Systemportefølje sortert etter kommune

Løsningsforslag matoppskrifter modellering

Eks. på uttrekk fra fagsystem inkl. dokumenter. Sigve Espeland Interkommunalt Arkiv i Rogaland IKS

Samdok samla samfunnsdokumentasjon

Hamar kommune. Arbeidsgiver-/Arbeidstakerregister. EQS personal (ExtendQualitySystem)

Hedmark fylkeskommune

1. SQL datadefinisjon og manipulering

personal personal personal personal Dexter Barnehage Ringsaker kommune personal

Samdok samla samfunnsdokumentasjon

Archivematica og AtoM: «State of the art» programvare for digital bevaring og tilgjengeliggjøring

Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

Orientering om E-ARK4ALL. Et pågående delprosjekt av CEF earchiving buildingblock

Digital Arkivbehandling fra A til Å

Testverktøy Status og videre tanker

ARK2200-H18 - Digital arkivdanning og -bevaring II. Mappeeksamen

Eks. på uttrekk fra fagsystem inkl. dokument. Produksjon av SIP og AIP

IKA Øst eierkommuner - systemportefølje etter funksjon og arkivskaper

Samdok samla samfunnsdokumentasjon

Noark 5 utvidelser og virksomhetspesifikkemetadata: En praktisk forklaring. Thomas Sødring HiOA

Validering Noark 5-uttrekk Gjemnes kommune etter innlevering til Digitalt Depot IKAMR Torbjørn Aasen, IT-rådgiver

MySQL. Historikk. Nedlasting og installasjon

Presentasjon av implementasjonen av ESSArch i Arkivverket

Miniverden og ER- modell

Hvordan fylle ut skjemaer Nedenfor følger eksempler på utfylling av skjemaet. Vi har laget eksempler på sak/arkivsystemer og ett fagsystem

ARK Digital arkivdanning og -bevaring II Mappeeksamen. Eksamen består av fire deler

Oppgave 1 (Opprett en database og en tabell)

Dias, Ny lagringsmodell for elektroniske arkiver

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

ADDML er død, lenge leve ADDML. (ADDML 7.3 er ikke helt død, lenge leve ADDML 8.3)

1. Generelt. FM-OA, Kompletterende undervisning Innledning Stikkord Prosessen. Spec 2, datert

ADDML. Archival Data Description Markup Language. Generell del. Versjon PA 0.07 Sist oppdatert: TPD. ADDML_8_2.doc 03/03/2011 1(12)

Erfaringer og tanker etter utvikling av et N4 uttrekksmodul

Samdok samla samfunnsdokumentasjon

Digital Arkivbehandling fra A til Å

SuperOffice hurtigstart guide

Avlevering av digitale arkiver (DA)

Itella einvoice Repository Connection

1. Introduksjon til Oracle Express Edition

Del 2: Uttrekk fra udokumentert database

DATAUTFORSKNING I EG, EG 7.1 OG EGENDEFINERTE FUNKSJONER SAS FANS I STAVANGER 4. MARS 2014, MARIT FISKAAEN

Elektronisk arkiv hos IKAVA

Å bruke Java API-et til å sortere tabeller/arraylister der elementene er (referanser til) objekter

ESSArch som felles depotstyringssystem for arkivsektoren

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

Bevaring av fagsystem og Noark 5

Bevaring av fagsystemer i Tysvær kommune

Verktøy for å håndtere siteringer og referanser i masteroppgaven. Citation and reference tools for your master thesis. Citations and references

Tilkobling og Triggere

Folloarkivets dagskonferanse 2014

AvtaleGiro beskrivelse av feilmeldinger for oppdrag og transaksjoner kvitteringsliste L00202 levert i CSV fil

Databaser kort intro. Tom Heine Nätt

Hvilke opplysninger om målingene vil vi lagre?

EMPIC MEDICAL. Etterutdanningskurs flyleger 21. april Lars (Lasse) Holm Prosjektleder Telefon: E-post:

Samdok samla samfunnsdokumentasjon

1 User guide for the uioletter package

Hvordan 3 konsulenter tester et konserndatavarehus

Hvordan setteopp en wordpress site med wampserver. Lokal site på din pc.

Langtidsbevaring av helsedata ved bruk av en åpen depotplattform

TDT4300 Datavarehus og datagruvedri3, Våren 2014

Citation and reference tools for your master thesis

NKKN typeforslag versjon Definisjon av grunntypene

DEN DIGITALE TIDSALDER

Innholdsfortegnelse... 1 Endringslogg UD BETALINGSTERMINAL NETS NEW DRIVERS FULL SUPPORT WINDOWS

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

1. Innføring i bruk av MySQL Query Browser

MPEG-7. Problemstilling:

To RDF or not to RDF Fagdag om Noark 5 og RDF

Samdok. PRIORITERT OPPGAVE Arkiv i eforvaltning. samla samfunnsdokumentasjon

Litt ideer Noark5 kjerne, digitalisering, big data Sognsvann, 26. april 2013

Uttrekk med Asta Mapper. Asta Mapper

Uttrekk og bevaring av elektroniske arkiv

Fagsystemer. Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

RAS - AMF. Teknisk dokumentasjon

SQL: Datatyper m.m. Evgenij Thorstensen V18. Evgenij Thorstensen SQL: Datatyper m.m. V18 1 / 12

ARK Digital arkivdanning og -bevaring II Mappeskildring. OBS Eksamen består av fire delar!

Hvordan strukturere og dokumentere forskningsdata

>>21 Datamodellering i MySQL Workbench

Overgang fra papirarkiv til digitale arkiv. IKA Finnmark, 26. september 2017

Citation and reference tools for your master thesis

ORDBMS og OODBMS i praksis

Opprette dokumentbibliotek med unike rettigheter

Er Noark 5 og Datakvalitet det neste steget for depot? Thomas Sødring thomas.sodring@jbi.hio.no /

Framgangsmåte for klargjøring og avlevering av elektronisk arkivmateriale til arkivdepot Supplerende bestemmelser for kommuner tilknyttet IKAT

Monitoring water sources.

>>12 Arbeide med MySQL

Åpen Noark 5 kjerne i praksis Norsk Arkivråds høstseminar 23. oktober 2013

Forsvunnet katt webside

Transkript:

Databasebevaring Arne-Kristian Groven, KDRS-samling, Trondheim 05.06 2014

For de som ikke kjenner meg, her er litt bakgrunnsinformasjon Har 20 års bakgrunn innen IT-forskning Snart 3 år i Riksarkivet Arbeider med: Innhenting av bevaringsverdig arkivmateriale (uttrekk/sip generering) Innovasjoner/FoU/nye metoder og verktøy

Hvorfor starte her? Dette er presentasjonen jeg holdt på NorDig workshop i København for to dager siden Men jeg vil bruke halvparten av tiden jeg da brukte: Det vil si en 30 minutters presentasjon på 15 minutter For deretter å vise et verktøy som bidrar med ett steg på veien til «evig databaseliv» De siste 30 minuttene vil jeg bruke til å diskutere forbedringspotensialet hva gjelder bevaring og tilgjengeliggjøring

Hvorfor databasebevaring er et velegnet sted for meg å starte Det meste av det digitale materialet vi ønsker å bevare har en databasekomponent i seg Enten databasene representerer dataene man ønsker å bevare eller de er metadataene I det danske Rigsarkivets nye depotsystem er det pr. i dag lagret 500 arkivpakker (AIPer) 90% av dette er bevarte databaser

Hva jeg har drevet med i det siste Kartlegging av arbeidsprosesser og programvare for databasebevaring Dagens praksis i arkiv-norge State-of-art, internasjonalt Bruk av SIARD i prosjekter/piloter siste år: Ny metodikk for bevaring og tilgjengeliggjøring Departementsprosjektet

Et eksempel på systemfloraen i en norsk kommune Acos Bostøtte / St@rtsak Husbanken Epanet Habildata Kompas Overformyn deri Agresso Capitech Ephorte HS-pro Matrikkel Pa Kirke Rita Alreg Aplhareg Cardinal EA Driftssentral Familia (avsluttet) Fond 2000 ArcGis Ecclesia Fronter ISAK Arcibus Ekko innfordringss ystem Arkivplan.no Entro Gemini Arx Access AutoCAD Map/Lt Entry Humanus (avsluttet) InteliCAD Riksgab MD Flyktning PA Kis Sharepoint MD Voksenopplæri ng Micromarc (Avsluttet) Proaktiv Proaktiv kirkegård Sofie (avsluttet) Sysvak G-Prog KF Infoserie Mobilprofil Procasso VA Gemini Gemini Melding KF Tjenestebesk rivelser King QM Norkom Notus (avsluttet) Profil Velferd Familia Visma Link Visma oppvekst bhg. Visma oppvekst skole Visma Unike kulturskole Visma Velferd Web-basert opptakssyste m Barnehage WinMap (GAB) Ps GIS Visma Cultus Wintank EPA GNSS KIS Online Scale Reedsoft Visma familia Wis skole

Dagens status i Norge Mye bevaringsverdig digitalt skapt arkivmateriale forsvinner Systemer og deres informasjonsinnhold dør Spesielt ille for fagsystem: Register, støttesystem... VI TRENGER NOE SOM KAN BEVARE DATABASER: Effektivt! Med høy kvalitet!

Hvilke alternativer har vi?

Arkadukt/ADDML Verktøy ikke distribuert til arkivskapere

Dex Extractor Har av forskjellige årsaker ikke fått stor utbredelse

Chronos For omfattende/dyrt

SIARD Kilde: Save Your Databases! Urs Meyer, SFA ECA 2010, April 2010

SIARD oppsummert Veldefinert bevaringsformat, SIARD-formatet Veldefinerte transformasjoner Normalisering fra ulike databaseplattformer (Oracle, MS SQL Server, MySQL, MS Access, DB/2) til et bevaringsformat (SIARD formatet) Fra SIARD-formatet til en databaseplattform (på SQL:1999 formatet) Velfungerende verktøystøtte, Siard Suite SiardFromDB, SiardToDB, SiardEdit (GUI)

Om SIARD-formatet En SIARD fil er en ZIP fil, på samme måte som DOCX og ODT filer er ZIP filer 64-bit på grunn av databasenes størrelse Bestående av XML filer Muligens også tekst og binærfiler, store objekter UTF-8 tegnsett på tekstfiler og XML filer Innholdet i SIARD-filen i henhold til SQL:1999 standarden Ikke bare syntaktisk, men også I henhold til SQL:1999 sine konsistensregler

SIARD Formatet: Filenes struktur header metadata.xsd metadata.xml content schema1 table1 table1.xsd table1.xml lob1 record1.txt / record1.bin lob2 record2.txt / record2.bin table2 table2.xsd table2.xml schema2 File and folder names short, plain ASCII strings.

Dette tas vare på av SIARD Database Schemas, Users, Roles Schemas Tables, Views, Routines Tables Columns, Rows, Keys (Primary, Foreign, Candidate) Constraints Rows data records containing primary data Views Users, Roles

Kilde: Hartwig Thomas, Enter AG (hartwig.thomas@enterag.ch), 21. januar 2013 Metadata som tas vare på av SIARD Database level version (of SIARD format): 2.0 dbname description schemas List of schemata in the DB users roles privileges Users, Roles, Privileges are defined in SQL:1999 and serve informational purposes. They are not required. Only on this level a minimum amount of non-technical, archivists metadata may be stored.

Kilde: Hartwig Thomas, Enter AG (hartwig.thomas@enterag.ch), 21. januar 2013 Metadata som tas vare på av SIARD Schema level name folder description tables views routines e.g., schema0 List of tables in the schema Views and Routines are defined in SQL:1999 and serve informational purposes (representing code rather than data). They are not required.

Kilde: Hartwig Thomas, Enter AG (hartwig.thomas@enterag.ch), 21. januar 2013 Metadata som tas vare på av SIARD Table level name folder e.g., table0 (in the schema folder) description columns List of the columns in the table primarykey foreignkeys checkconstraints rows number of rows in the table Constraints and Triggers are defined in SQL:1999 and serve informational purposes (ensuring consistency when the database is changed, which never happens to archived data). They are not required.

Kilde: Hartwig Thomas, Enter AG (hartwig.thomas@enterag.ch), 21. januar 2013 Metadata som tas vare på av SIARD Column level name folder name of the LOB folder, e.g., lob0 description type SQL:1999 column type typeoriginal defaultvalue nullable Nullability and DefaultValue are defined in SQL:1999 and serve informational purposes (ensuring consistency when the database is changed, which never happens to archived data). They are not required.

Kilde: Hartwig Thomas, Enter AG (hartwig.thomas@enterag.ch), 21. januar 2013 Metadata som tas vare på av SIARD Column level name folder name of the LOB folder, e.g., lob0 description type SQL:1999 column type typeoriginal defaultvalue nullable Nullability and DefaultValue are defined in SQL:1999 and serve informational purposes (ensuring consistency when the database is changed, which never happens to archived data). They are not required.

Kilde: Hartwig Thomas, Enter AG (hartwig.thomas@enterag.ch), 21. januar 2013 Metadata som tas vare på av SIARD Other table level Metadata Primary key Metadata Foreign key Metadata Reference Metadata Other Metadata View level Routine level User level Role level Privilege level

Eksempel: Transformasjoner fra MySQL datatyper til SIARD datatyper

Erfaringer med SIARD Enkelt/lett å generere SIARD-filene Oppgir databasens adresse og en databasebruker/passord (leseaksess) Databasepersonell hos arkivskapere kan gjøre jobben SIARD Suites GUI muliggjør rask inspeksjon/analyse av data Automatisert, veldokumentert transformasjon gir økt tillit.

MEN: SIARD-filen er bare en del i arkivpakken

SIARD og arkivaren SIARD (Suite) gjør ikke arkivarens jobb Arkivarens jobb starter når SIARD har gjort sin, eller aller helst lenge før Beskrivelser kan skrives både på databasenivå og tabellnivå Data(base)ordbok og annen dokumentasjon bør vedlegges SIARD-filen.

Våre neste aktiviteter For databaser til Noark-4 godkjente system Eksperimentelt definere utrekk, med utgangspunkt i SIARD-filen Et prioritert målformatet vil være en RDF representasjon av Noark 5 Hente inn flere fagsystem ved hjelp av SIARD Suite Dette gjøres allerede av våre kommunale og interkommunale arkivsamarbeidspartenere