Kan RDF være en del av løsningen i arbeidet med å ta vare på fagsystem fra offentlig sektor? Thomas Sødring HiOA
Oversikt Si hvordan jeg oppfatter problemområdet På hvilket nivå skal vi bevare arkivmaterialet Må tenke helhetlig og langsiktig på semantikk Forvaltningsarkivene og programvare må gradvis integreres i den semantiske weben Ikke for å publisere men for å hente inn Hvis vi skal tenke nytt It's time to kill the text editor It's time to kill the relational database
Hva vet depot om meg?
Hvordan har du vært i kontakt med?
Hvordan har du vært i kontakt med?
Hvorfor er det slik?
Hvordan bevarer vi Dagens bevaringstrategi er basert på en tenking som er enten Lagring Lagre databasedump (og krysse fingre) Teknisk Tabelluttrekk i XML Systemsentrisk Noark 4/5 i XML Stykkevis med tanke på systemsentrisk teknisk Forstå Lese Tid System / Standard lagring Lagre
Systemsentrisk arkivdanning <arkiv> <arkivdel> <saksmappe> <journalpost> <korrespondansepart> </korrespondansepart> <dokobjekt></dokobjekt> </journalpost> </saksmappe> </arkivdel> </arkiv>
Objects of Interest (OoI) OoI er det du søker etter Person Med stavefeil og duplikat personer (Ole Olsen 459/43) Byggning Befinner seg i arkivstruktur.xml (n5) avsmot.xml (n4) tabell.xml (addml) database dump (binær)
Vi må vrenge modellen <arkiv> <arkivdel> <saksmappe> <journalpost> <korrespondansepart> </korrespondansepart> <dokobjekt></dokobjekt> </journalpost> </saksmappe> </arkivdel> </arkiv>
Uten å ødelegge den arkivaglige integriteten
Arkivfaglige integriteten...
It's time to kill the word processor! Tekstbehandlingsprogramet har altfor lenge fått bestemme arkivdanningen Det er tekstbehandlingsprogramet som gjør at arkivdanningen er opptatt av papirtenking
rolle Inngående dokument(er) Person Søknad Sak GUI Prosess kompilator Steg 1 Steg 2 Steg 3 Utgående dokument(er)
Først da bryter du papirtenkingen
Semantikk og arkivdanning kilde1 kilde3 arkiv arkivdel sak1 mappe JP1 sak er part i Hans hansen sak2 kilde2 JP2 Struktur Innhold Prosess og beslutningskilder
Semantikk og Arkivstruktur arkiv (KommuneA) har har har arkivdel (barnehagesøknad) mappe (søknad om plass) journalpost (1) har <arkiv beskrivelse="kommunea"> <arkivdel beskrivelse="barnehagesøknad"> <saksmappe tittel="søknad om plass"> <journalpost> 1 </journalpost> <journalpost> 2 </journalpost> </saksmappe> </arkivdel> </arkiv> journalpost (2)
<rdf:rdf xmlns:n5="http://www.arkivlab.no/n5" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <n5:arkiv rdf:nodeid="arkiv_1"> <n5:systemid>1</n5:systemid> <n5:beskrivelse>oslo Kommune</n5:beskrivelse> <n5:errelatert rdf:nodeid="arkivdel_1"/> </n5:arkiv> <n5:arkivdel rdf:nodeid="arkivdel_1"> <n5:systemid>2</n5:systemid> <n5:beskrivelse>barnehage søknader</n5:beskrivelse> <n5:errelatert rdf:nodeid="mappe_1"/> </n5:arkivdel> <n5:mappe rdf:nodeid="mappe_1"> <n5:tittel>mappe for Hans Hansen</n5:tittel> <n5:systemid>3</n5:systemid> <n5:errelatert rdf:nodeid="journalpost_1"/> <n5:errelatert rdf:nodeid="journalpost_2"/> </n5:mappe> <n5:journalpost rdf:nodeid="journalpost_1"> <n5:systemid>4</n5:systemid> </n5:journalpost> <n5:journalpost rdf:nodeid="journalpost_2"> <n5:systemid>5</n5:systemid> </n5:journalpost> </rdf:rdf> RDF <arkiv> <systemid>1<systemid> <beskrivelse>oslo Kommune</beskrivelse> <arkivdel> <systemid>2</systemid> <beskrivelse>barnehage søknader<beskrivelse> <mappe> <systemid>3</systemid> <tittel>mappe for Hans Hansen</tittel> <journalpost> <systemid>4<systemid> </journalpost> <journalpost> <systemid>5</systemid> <journalpost> </mappe> <arkivdel> </arkiv> XML
Oslo Kommune Semantikk og Innhold ansvarlig for Byrådsavdeling for kultur og utdanning ansvarlig for har presedens fra Presedens Sak Barnehage søknad er saksbehandler er part i sak Hans Hansen Maria Hansen
<rdf:rdf xmlns:innhold="http://www.arkivlab.no/innhold" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <innhold:sak rdf:nodeid="presedens_sak_1"> <innhold:sak_id>12334</innhold:sak_id> </innhold:sak> <innhold:person rdf:nodeid="hanshansen"> <innhold:person_navn>hans Hansen</innhold:person_navn> <innhold:person_personnummer>1408197512345</innhold:person_personnummer> </innhold:person> <innhold:person rdf:nodeid="karlkarlsen"> <innhold:person_navn>karl Karlsen</innhold:person_navn> <innhold:rolle>saksbehandler</innhold:rolle> </innhold:person> <innhold:sak> <innhold:part_i_sak rdf:nodeid="hanshansen"/> <innhold:saksbehandler rdf:nodeid="karlkarlsen"/> <innhold:presedens rdf:nodeid="presedens_sak_1"/> </innhold:sak> </rdf:rdf>
Semantikk og Saksgang <rdf:rdf xmlns:saksgang="http://www.arkivlab.no/saksgang" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <saksgang:kilde rdf:nodeid="barnehageloven"> <saksgang:kilde_uri>http://www.lovdata.no/all/nl-20050617-064.html</saksgang:kilde_uri> <saksgang:kilde_type>lovverk</saksgang:kilde_type> </saksgang:kilde> <saksgang:kilde rdf:nodeid="personvernloven"> <saksgang:kilde_uri>http://www.lovdata.no/all/hl-20000414-031.html</saksgang:kilde_uri> <saksgang:kilde_type>lovverk</saksgang:kilde_type> </saksgang:kilde> <saksgang:person rdf:nodeid="hanshansen"> <saksgang:person_navn>hans Hansen</saksgang:person_navn> <saksgang:person_personnummer>1408197512345</saksgang:person_personnummer> </saksgang:person> <saksgang:sak> <saksgang:unntatt_offentlighet> <saksgang:grunnlag rdf:nodeid="personvernloven"/> </saksgang:unntatt_offentlighet> <saksgang:part_i_sak rdf:nodeid="hanshansen"/> <saksgang:utfall saksgang:vedtak="godkjent"> <saksgang:grunnlag rdf:nodeid="barnehageloven"/> </saksgang:utfall> </saksgang:sak> </rdf:rdf>
N4 uttrekk RDF Modell N5 uttrekk fagsystem uttrekk
Definere en utvidbar RDF modell for utrekk fra alle (fag)systemer
Begynner med depot Sematifiser Noark 5 struktur Grunnlegende arkivstrukturen som vi kan hekte innhold på Definer og bygg ut Innholdsobjekter (OoI) Person / Byggning / Kommune / Utvalg Bygge ut virksomhetspesiffikemetadata for de forskjellige fagområdene Tilby friprog mappingverktøy til fagsystem leverandører
Semantikk og Datakvalitet Relatert til dette er et felt som heter datakvalitet (Information Quality). Vet vi noe om datakvalitet ved danning eller ved bevaring? Det er mye arbeid som skal gjøres her Hvordan hanger DK og RDF sammen? Denne type tilnærming og bruk av semantikk som en del av Noark vil være et utrolig spennende forskningsprosjekt
Vi trenger en Kommunal model for Digitale avleveringer som gir èn RDF-basert Samling
Kort oppsumert Arkivdanning frakobles papirtenking n6 er en ren RDF modell Danning og bevaring ikke lenger systemsentrisk men objektsentrisk basert på RDF Med de viktige arkivfaglige integritets og autentisitets mekaniser ivaretatt Lag en utvidbar modell som begynner med n5 strukturen og som utvides med virksomhetspesifikkemetadata La det kommunale arkivmiljøet gjøre det!