Ragnar Sturtzel 2014-06-17 To RDF or not to RDF Fagdag om Noark 5 og RDF
Diskusjonstemaer Først en kort oppsummering av dagen Så noen spørsmål jeg har satt opp Til slutt åpen debatt 2
Oppsummering 1 Graham Moore o Less is more (KISS) datamodell, utveksling, API ikke UI, søk, rapporter o RDF: «Objekter» med tre «attibutter»: Subject (thing), predicate (property type) og object (value). o Grafer (objekter peker på objekter med egenskap), ikke hierarki o Mulig å modellere Noark og Moreq i RDF, mulig å sette beskrankninger i RDF, mulig å lage tjenester som f.eks. henter ferdige journalposter og saker fortløpende Arne-Kristian Groven o Avlevere uttrekk eller databaser? Stoler vi på uttrekkene som krever mye manuelt arb.? o Mye data der ute, lite avleveres o SIARD med SQL:1999 database? Hele databaser eller arkivdeler? o RDF for å definere fagtilleggene i fagsystemene slik at de blir «Noark»? o RDF for å ta vare på alt som ligger i Noark- og fagsystemene? Uttrekk mister data. 3
Oppsummering 2 Thomas Sødring o Uttrekk gir kostnader o Semantisk web gir bedre muligheter for å hente inn data o Kutte papir = kutte tekstbehandler og relasjonsdatabaser gå for f.eks. RDF o Dagens bevaring er lagring (dbdump), teknisk (XML tabell) eller systemsentrisk (Noark) o Objects of Interrest f.eks. Person (ligger langt nede i en N5 struktur) vreng strukturen o Dokumenter som sluttprodukt laget av metadata (med egen skjerming) o Lage bevaringsstrategiene basert på RDF Christian / Dimitar o Aktive og passive saker i forskjellige systemer, RDF for overføring o Viste overføring i praksis o Noark er ingen trestruktur, men en graf RDF er bedre for grafer 4
Oppsummering 3 Marte / Anders o Én inngang til alle kulturminner (fra fagsystemer, økonomi, arkiv, ), åpne siloene o Plattform for nye tjenester o Laget tagger (Askeladden-ID) på relaterte data i andre systemer o Sesam som søker i mange kilder og sammenstiller ut i fra taggene o Mulighet for å navigere videre i vilkårlige relasjoner (som en «htmlside med lenker») o Mulighet for å koble inn eksterne kilder og la eksterne koble seg til våre ID-er! Arnfinn o Miniprosjekt for å lage RDF o Hvilke URI-er skal benyttes? o Vokabular? o Relatere data inkludere andre kilder o Mangle kilder legger i felles store, sparql-spørringer over http 5
RDF vs Noark 4 og Noark 5 avlevering Noark 5 Sak1 JP1 JP2 Noark 4 Dok1 Dok2 Dok3 RDF Part1 Klasse1 JP1 Sak1 Tittel1 6
Referanseintegritet Noark 4 hadde mange tabeller som ikke alltid var i «sync» Noark 5 har et objekthierarki og vil derfor være mer konsistent, men komplett? Hva er viktigst, data slik de faktisk er eller «korrekte»? En Noark avlevering er alltid en delmengde av en base! Hva gjør vi med data ingen refererer? Hva gjør vi med referanser det ikke finnes data til? Hva hvis arkivet kun skal ha ferdige data da kommer journalposten år før saken? 7
Eksterne referanser URIene Tagging som muliggjør referanser på tvers av arkiver? På tvers av organisasjoner? På tvers av offentlig og privat? Hvem bestemmer URI-ene? 8
Selvstendige objekter vs delobjekter RDF gir mulighet til nye sammenstillinger Noark 5 avlevering gir mulighet til å gå gjennom data uten spesialverktøy Hvor skal vi legge oss på aksen komplette objekter objekt pr. attributt? 9
Uttrekk vs komplett avlevering Ref. Noark uttrekk vs. databaseavlevering Hva med ekstra metadata i databasene (ut over Noark)? o ADDML? o RDF? Men hvilke tagger? Verktøykasse med tagger? Modeller for fagområder? Hvert enkelt system? Hva da med importen? 10
Tilgangsstyring Hvordan tilgangsstyrer vi når data kan settes fritt sammen? Må hver trippel utvides med tilgangsinfo? 11
Hvorfor RDF? Just another «XML»? Felles struktur for alle systemer i depotene? Felles objekttyper for mange systemer? Navigeringsmuligheter ref. Sesam Arkivdepotgreie (f.eks. XSLT) eller noe alle må forholde seg til? Er kravet til at man må ha verktøy en ulempe? «Gammel teknologi» Styrken med koblinger fra andre kilder vil det bli brukt? URI-ene 12