To RDF or not to RDF Fagdag om Noark 5 og RDF

Like dokumenter
Ole Myhre Hansen Seksjon for digitalt depot, RA

Noark 5 utvidelser og virksomhetspesifikkemetadata: En praktisk forklaring. Thomas Sødring HiOA

Samdok samla samfunnsdokumentasjon

Del 3: Noark 5-basert databasestruktur

Kan RDF være en del av løsningen i arbeidet med å ta vare på fagsystem fra offentlig sektor? Thomas Sødring HiOA

Testverktøy Status og videre tanker

ARK2200-H18 - Digital arkivdanning og -bevaring II. Mappeeksamen

Automatisering av uttrekk fra bevarte databaser

Saksoversikt 2015/ Noark 5 tjenestegrensesnitt Klassering(er): 1 EMNE2-064 Arkiv- og datasystemer. Saksansvarlig (enhet/initialer): BYARKIV/MOHE

Testing av Noark 5 uttrekk med kdrs-toolboxvalidator og innsyn med kdrs-toolbox-innsyn. Thomas Sødring HiOA

Åpne lenkede data og kulturarv-sektoren

Public. earkiv 360. Integrasjonsmuligheter og nye metoder for import Stian Gregory

Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

Demo for første sprint

Stillingssøknad, spor etter ikke ansatte

ADDML er død, lenge leve ADDML. (ADDML 7.3 er ikke helt død, lenge leve ADDML 8.3)

Datakvalitet og Noark

Bevaring av fagsystem og Noark 5

DIGITALISERING MED INTERACT-FLOW

einnsyn PoC: Demo for tredje sprint

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

Å lage Noark 4 uttrekk selv. Thomas Sødring thomas.sodring@jbi.hio.no /

Erfaringer og tanker etter utvikling av et N4 uttrekksmodul

SPARQL. Daniel Reinholdt. Trondheim Daniel Reinholdt (NTNU) SPARQL Trondheim / 17

Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland

Noark 5 tjenestegrensesnittet Hvor er vi nå?

Bevaring og tilgjengeliggjøring- Hvor ligger forbedringspotensialet?

Fra datasiloer til en samlet informasjonsforvaltning - en trinnvis prosess

Hvordan kan en gjenbrukbar NOARK kjerne bidra til samhandling mellom forvaltningsnivåene?

Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Linked Open Data Kartverkets praktiske erfaringer

Enkel arkivering, sikker gjenfinning og deling av virksomhetskritisk informasjon i et stort informasjonslandskap

Parallelle og distribuerte databaser del III

Samdok samla samfunnsdokumentasjon

Uttrekk med Asta Mapper. Asta Mapper

Periodisering Petter Pedryc

Om det pågående arbeid med standard for arkivering av EPJ Hva med kommunenes behov?

Periodisering og avlevering av elektronisk arkiv hvem, hva, når? Rådgiver Ole-Bjørn Fossbakk og rådgiver Solveig Heløe Olsen, IKA Troms

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

Åpen Noark 5 kjerne i praksis Kontaktkonferanse IKA Møre og Romsdal 24. mai 2013

PRESENTASJON NORDIG OKTOBER Alle skal kunne teste alt - overalt

Hvordan ivareta digital historikk/historie? Geir Harbak, Sjefskonsulent SAK- & PORTALDAGENE 2018

Linked data på Deichman. Asgeir Rekkavik BIBSYS-konferansen 2015

Noark-5 hva blir det til? Ståle Prestøy IKA Trøndelag. 23. mai 2007 Noark-5 - hva blir det til? 1

Hvordan tenkes og jobbes det i dataindustrien til tema som bevaring og avlevering av earkiv til arkivdepot institusjoner

Langtidsbevaring av helsedata ved bruk av en åpen depotplattform

<Digitale_arkiver>fra A til #??A_#%,&</Digitale_arkiver> Digitale arkiver fra A til Å

Deponering og avlevering

og effektiv earkivforvaltning

Uttrekssammenligning

Sentral Felles Kartdatabase - Krav til dataene. Fagdag - Utveksling og forvaltning av geodata Nils Ivar Nes, 22.mai 2017

Erfaringer med bruk av Noark 5 -om et utviklingsprosjekt i NAV

Litt ideer Noark5 kjerne, digitalisering, big data Sognsvann, 26. april 2013

Utvidet kravspesifikasjon for ArkN4

GODKJENT NOARK UTTREKK OG FORMIDLINGSLØSNINGER FOR KOMMUNALE FAGSYSTEM 14/06/2013. Documaster skanning og arkiv IKA Rogaland -30.

ADDML. Archival Data Description Markup Language. Generell del. Versjon PA 0.07 Sist oppdatert: TPD. ADDML_8_2.doc 03/03/2011 1(12)

Digital postkasse Ragnar Sturtzel, løsningsarkitekt ECM

Alle skal kunne teste alt - overalt KDRS TRONDHEIM JUNI 2017

FEILSITUASJONER I ARKIVENE Erfaringer fra prosjekter hos Justisdep. + noen til... Automatiserer og effektiviserer deponeringsarbeidet

Arkivplan - internkontroll

Portico Estate FDVU-System basert på phpgroupware

Hva er datakvalitet? Hvordan skal arkivtjenesten forholde seg til det?

Egenerklæringsskjema for godkjenning av Noark 5-løsning

NOARK 4. Versjon 1, 2 og 3 av NOARK-standarden beskrev krav til elektronisk journalføring. NOARK 4 beskrev i tillegg. Ulemper

Hva jeg skal snakke om

Samdok samla samfunnsdokumentasjon

Blokkjede er løsningen... men hva var spørsmålet?

Noark 5 og fagsystem. Muligheter og utfordringer

Bevaring av fagsystemer i Tysvær kommune

Slipp dataene fri! Det er vår!

Produksjonslinje for bevaring og formidling av elektroniske arkiv fra kommunal sektor KDRS RIKSARKIVARENS ARKIVUTVIKLINGSMIDLER

Notat om Norge digitalt og Norvegiana

Er Noark 5 og Datakvalitet det neste steget for depot? Thomas Sødring thomas.sodring@jbi.hio.no /

White paper. e-arkiv

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

Integrasjon og samspill med fagsystem

Del 2: Uttrekk fra udokumentert database

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

EKSAMENSFORSIDE Institutt ABI og JM

INF 329: Web-Teknologier. Dataimplementasjon. Fra Kapittel 11 i «Designing Data-Intensive Web Applications» Presentasjonsdato: 17/10/2004

Samdok samla samfunnsdokumentasjon

Noark-5. KDRS Petter Pedryc

SOSI-forvaltning - logisk modell

ARKIV I SAMTID OG FRAMTID Utfordringer med portaler og integrering av fagsystemer og sak-/ arkivsystemer. Astrid Øksenvåg Daglig leder ekor as

Presentasjon Nordisk Elarkiv-seminar, Island. ArkN4 og XML-parsing. 26. mai 2011 Hallstein Bakken Seksjon for digitalt depot Riksarkivet, Oslo

Kulturminnedata i Trondheim

einnsyn PoC: Demo for fjerde Sprint

Navngivning av XML elementer

Bruk av komponenter i ADDML

Bevaring av digitale arkiver. - hvordan komme i gang?

Bevaring av dokumentasjon i læringssystemer Lars-Jørgen Sandberg, Riksarkivet

Noark-4 Web Services

Oppsummering. Thomas Lohne Aanes Thomas Amble

Plandataforum SK-Oslo

Fra mange arkiv til ett Ragnar Sturtzel, Løsningsarkitekt SAK- & PORTALDAGENE 2018

Databaser: Relasjonsmodellen, del I

Workshop NGIS API. Lars Eggan, Norconsult Informasjonssystemer desember 2014

Velkommen til Riksarkivarens undersøkelse for kommunale arkivtjenester 2015 (Storbyundersøkelsen)

Hvorfor ny versjon av Noark?

Transkript:

Ragnar Sturtzel 2014-06-17 To RDF or not to RDF Fagdag om Noark 5 og RDF

Diskusjonstemaer Først en kort oppsummering av dagen Så noen spørsmål jeg har satt opp Til slutt åpen debatt 2

Oppsummering 1 Graham Moore o Less is more (KISS) datamodell, utveksling, API ikke UI, søk, rapporter o RDF: «Objekter» med tre «attibutter»: Subject (thing), predicate (property type) og object (value). o Grafer (objekter peker på objekter med egenskap), ikke hierarki o Mulig å modellere Noark og Moreq i RDF, mulig å sette beskrankninger i RDF, mulig å lage tjenester som f.eks. henter ferdige journalposter og saker fortløpende Arne-Kristian Groven o Avlevere uttrekk eller databaser? Stoler vi på uttrekkene som krever mye manuelt arb.? o Mye data der ute, lite avleveres o SIARD med SQL:1999 database? Hele databaser eller arkivdeler? o RDF for å definere fagtilleggene i fagsystemene slik at de blir «Noark»? o RDF for å ta vare på alt som ligger i Noark- og fagsystemene? Uttrekk mister data. 3

Oppsummering 2 Thomas Sødring o Uttrekk gir kostnader o Semantisk web gir bedre muligheter for å hente inn data o Kutte papir = kutte tekstbehandler og relasjonsdatabaser gå for f.eks. RDF o Dagens bevaring er lagring (dbdump), teknisk (XML tabell) eller systemsentrisk (Noark) o Objects of Interrest f.eks. Person (ligger langt nede i en N5 struktur) vreng strukturen o Dokumenter som sluttprodukt laget av metadata (med egen skjerming) o Lage bevaringsstrategiene basert på RDF Christian / Dimitar o Aktive og passive saker i forskjellige systemer, RDF for overføring o Viste overføring i praksis o Noark er ingen trestruktur, men en graf RDF er bedre for grafer 4

Oppsummering 3 Marte / Anders o Én inngang til alle kulturminner (fra fagsystemer, økonomi, arkiv, ), åpne siloene o Plattform for nye tjenester o Laget tagger (Askeladden-ID) på relaterte data i andre systemer o Sesam som søker i mange kilder og sammenstiller ut i fra taggene o Mulighet for å navigere videre i vilkårlige relasjoner (som en «htmlside med lenker») o Mulighet for å koble inn eksterne kilder og la eksterne koble seg til våre ID-er! Arnfinn o Miniprosjekt for å lage RDF o Hvilke URI-er skal benyttes? o Vokabular? o Relatere data inkludere andre kilder o Mangle kilder legger i felles store, sparql-spørringer over http 5

RDF vs Noark 4 og Noark 5 avlevering Noark 5 Sak1 JP1 JP2 Noark 4 Dok1 Dok2 Dok3 RDF Part1 Klasse1 JP1 Sak1 Tittel1 6

Referanseintegritet Noark 4 hadde mange tabeller som ikke alltid var i «sync» Noark 5 har et objekthierarki og vil derfor være mer konsistent, men komplett? Hva er viktigst, data slik de faktisk er eller «korrekte»? En Noark avlevering er alltid en delmengde av en base! Hva gjør vi med data ingen refererer? Hva gjør vi med referanser det ikke finnes data til? Hva hvis arkivet kun skal ha ferdige data da kommer journalposten år før saken? 7

Eksterne referanser URIene Tagging som muliggjør referanser på tvers av arkiver? På tvers av organisasjoner? På tvers av offentlig og privat? Hvem bestemmer URI-ene? 8

Selvstendige objekter vs delobjekter RDF gir mulighet til nye sammenstillinger Noark 5 avlevering gir mulighet til å gå gjennom data uten spesialverktøy Hvor skal vi legge oss på aksen komplette objekter objekt pr. attributt? 9

Uttrekk vs komplett avlevering Ref. Noark uttrekk vs. databaseavlevering Hva med ekstra metadata i databasene (ut over Noark)? o ADDML? o RDF? Men hvilke tagger? Verktøykasse med tagger? Modeller for fagområder? Hvert enkelt system? Hva da med importen? 10

Tilgangsstyring Hvordan tilgangsstyrer vi når data kan settes fritt sammen? Må hver trippel utvides med tilgangsinfo? 11

Hvorfor RDF? Just another «XML»? Felles struktur for alle systemer i depotene? Felles objekttyper for mange systemer? Navigeringsmuligheter ref. Sesam Arkivdepotgreie (f.eks. XSLT) eller noe alle må forholde seg til? Er kravet til at man må ha verktøy en ulempe? «Gammel teknologi» Styrken med koblinger fra andre kilder vil det bli brukt? URI-ene 12