AUTORITETSREGISTRE I NRK LØSNINGSARKITEKTUR OG FORVALTNING AV PERSONREGISTER KORG 30.mai 2016 Roy Grønmo, Acando/NRK 03.06.2016 Bunntekst 1
Hva er et autoritetsregister? "Med autoritetsregister forstår vi det register som til enhver tid inneholder de riktige verdier av en forekomst, og som andre systemer skal forholde seg til." - Universitet og Høgskolerådet
Hva er autoritetsregisteret i NRK? Autoritetsregisteret er en felles tilgjengeliggjøring av NRKs autoritative data.
Hva er Autoritetsregisteret i NRK? Alle ressursene (autoritetene) får unike, oppslagbare URI-er som andre systemer skal referere til. Dette sikrer at samme ressurs identifiseres likt på tvers av systemer unngår duplisering forenkler samhandling oppdatert og "riktig" informasjon blir brukt
Autoritetstyper dataordbok kategorier roller personer (Lønn og Personal, Digitalt MusikkArkiv) steder (stadnamn.nrk.no) hendelser (samarbeid med NTB, NB, Amedia, TV2, m.fl.) platelabels (samarbeid med IFPI, osv)
Hvordan representeres personer i dagens NRKsystemer? Mange uavhengige systemer med fritekstangivelse av person som medvirkende i et program
Åpne, lenkede data og semantisk teknologi Semantisk teknologi godtar at det er mange autoritetsregister eller kilder om samme person Egenskapene fra de ulike kildene hører til ulike navnerom som forteller hvor det kommer fra Utfordringen ligger i å gjenkjenne når en person fra et kildesystem er lik som en person fra et annet kildesystem
Hvordan har vi laget et personregister i NRK Lønns- og personalsystemet alle personer som har hatt oppdrag for NRK Ca. 23 000 Digitalt musikkarkiv det meste av musikk som er brukt i NRKs program - Ca. 500 000 artister og band
Sammenslåing av personer personer med eksakt samme navn og fødselsdato slås sammen 258 matchende personer i DMA og Lønn og Personal F.eks. Erik Bye Robert Stoltenberg
Klassediagram for Artister og Band
Forvaltning av ressurser og URIer Globalt unik URI URI-en kan ikke endres/slettes når klienter tar den i bruk
Forvaltning av ressurser og URIer http://authority.nrk.no/agent/123 officialname 510255796 Inger Lise Rypdal http://authority.nrk.no/agent/240 offficialname n12345 Inger Lise Rypdal 14th of Dec 1949
Forvaltning av ressurser og URIer http://authority.nrk.no/agent/123 contributor Radiolangs http://authority.nrk.no/agent/240 contributor Radiokontakten officialname officialname n12345 510255796 Inger Lise Rypdal 14th of Dec 1949 n12345 Inger Lise Rypdal 14th of Dec 1949
Versjonering av personer Når en person endres, skal vi da lage en ny versjon? Skal vi kunne svare på hva en persons navn var på et gitt tidspunkt? Vi har valgt å ikke versjonere, men det er likevel støtte for både: Flere navnevarianter og å lenke direkte til en av disse, samt Lenke til siste offisielle navnevariant
Forvaltning av navnevarianter Radiokontakten contributor Radiolangs http://authority.nrk.no/agent/123 officialname http://authority.nrk.no/agent/123/n ame/rypdal%2c_inger_lise name Inger Lise Rypdal contributor namevariant http://authority.nrk.no/agent/123/name/ande rsen%2c_inger_lise name contributor Inger Lise Andersen Ungdommens radioavis 1968
Teknologi Authority.nrk.no (Pubby) Docker, Mesos REST (JSON, RDF) SPARQL Java Turtle-RDF Triplestore (Virtuoso) Lønns- og personalsystem Digitalt MusikkArkiv
Arkitektur
Hvorfor semantisk teknologi? Både menneskeforståelig og maskinprosesserbart Åpne standarder, kjente vokabularer, designet for enkelt å kunne lenke og publisere data på Web URI-er, navnerom, ontologier og vokabularer fasiliterer interoperabilitet global gyldighet, sammenstilling og integrasjon av data fra ulike kilder Verktøystøtte og leverandøruavhengighet, små til medium størrelse løsninger kan gjøres helt uten dyre lisensavtaler Dynamisk modell Dataene kan leveres i ulike formater
Inger Lise Rypdal
Chipahua
Erik Bye
Stadnamn.nrk.no
Norsk hendelsesregister Initiativ mellom norske mediehus der vi ønsker å lage et felles register over hendelser. Målet er at alt innhold som produseres og distribueres om en hendelse blir knyttet sammen på en strukturert og presis måte. Innledende møter startet opp i 2015 Aktører: NTB, Nasjonalbiblioteket, Schibsted, NRK, TV2, Aftenposten, Amedia Hendelser basert på maskinlæring/data mining/fornuftig arbeidsflyt Semantisk teknologi/rdf NTB skal ha eierskap til arkivet Status: lande samarbeidsavtale, Minimumspilot i september 03.06.2016 Bunntekst 24
NRKs autoritetsregistre samarbeid med eksterne? I første omgang bare internt utviklede registre til bruk for interne systemer Registrene kan potensielt benyttes av eksterne I en ideell verden, vil den mest egnede instansen ta ansvaret for autoriteter for sitt domene (brreg for biler, folkeregisteret for personer, tono for musikk, etc.) Tilgang for diverse eksterne aktører fordrer: Skalerbarhet Avklaring av sensitive data ( inkl. Muligheter for sammenstilling med andre registre) Ytelse Sikkerhet Forvaltning av endringer/nye oppføringer
Spørsmål