SEMANTISK TEKNOLOGI I NRK Roy Grønmo, Acando We-conference, Karlstad, 26-28.august 2016 1
OVERSIKT Mål og utfordringer for NRKs metadatabank Semantisk teknologi Autoritetsregisterene i NRK Personregisteret Semantisk teknologi i NRK 2
ARKIV FOR RADIO, TV, NETT, KLIPP MÅL OG VISJONER Tilgjengeliggjøre historisk og nytt materiale Integrere data fra kildesystemer Automatisering av manuelle prosesser Metadatakvalitet for programmer Gjenbruk i nye programmer
PUBLISERINGSLØYPA I NRK Semantisk teknologi i NRK 4
HVORFOR SEMANTISK TEKNOLOGI? Både menneskeforståelig og maskinprosesserbart Åpne standarder, kjente vokabularer, designet for enkelt å kunne lenke og publisere data på Web URI-er, navnerom, ontologier og vokabularer fasiliterer interoperabilitet global gyldighet, sammenstilling og integrasjon av data fra ulike kilder Verktøystøtte og leverandøruavhengighet, små til medium størrelse løsninger kan gjøres helt uten dyre lisensavtaler
ÅPNE, LENKEDE DATA OG SEMANTISK TEKNOLOGI Semantisk teknologi godtar at det er mange kilder om samme person Egenskapene fra de ulike kildene hører til ulike navnerom som forteller hvor det kommer fra Utfordringen ligger i å gjenkjenne når en person fra et kildesystem er lik som en person fra et annet kildesystem
NY PROGRAMINFO PÅ VEI INN TIL RADIOARKIVET Lyd: Sigma Metadata: Digas Metadata: PRF Turtle-RDF Turtle-RDF Turtle-RDF Lagres i Indekseres i Metadataworld Arkivet ElasticSearch
HVA ER ET AUTORITETSREGISTER? "Med autoritetsregister forstår vi det register som til enhver tid inneholder de riktige verdier av en forekomst, og som andre systemer skal forholde seg til." - Universitet og Høgskolerådet
HVA ER AUTORITETSREGISTERET I NRK? Autoritetsregisteret er en felles tilgjengeliggjøring av NRKs autoritative data.
HVA ER AUTORITETSREGISTERET I NRK? Alle ressursene (autoritetene) får unike, oppslagbare URI-er som andre systemer skal referere til. Dette sikrer at samme ressurs identifiseres likt på tvers av systemer unngår duplisering forenkler samhandling oppdatert og "riktig" informasjon blir brukt
AUTORITETSTYPER dataordbok kategorier roller personer (Lønn og Personal, Digitalt MusikkArkiv) steder (stadnamn.nrk.no) hendelser (samarbeid med NTB, NB, Amedia, TV2, m.fl.) platelabels (samarbeid med IFPI, osv)
HVORDAN REPRESENTERES PERSONER I DAGENS NRK- SYSTEMER? Mange uavhengige systemer med fritekstangivelse av person som medvirkende i et program
HVORDAN HAR VI LAGET ET PERSONREGISTER I NRK? Lønns- og personalsystemet alle personer som har hatt oppdrag for NRK Ca. 23 000 Digitalt musikkarkiv det meste av musikk som er brukt i NRKs program - Ca. 500 000 artister og band
SAMMENSLÅING AV PERSONER personer med eksakt samme navn og fødselsdato slås sammen 258 matchende personer i DMA og Lønn og Personal F.eks. Erik Bye Robert Stoltenberg
FORVALTNING AV RESSURSER OG URI-ER Persistent, globalt unik URI URI-en kan ikke endres/slettes når klienter tar den i bruk
FORVALTNING AV RESSURSER OG URIER contributor Radiolangs contributor Radiokontakten http://authority.nrk.no/agent/123 http://authority.nrk.no/agent/240 officialname officialname n12345 510255796 Inger Lise Rypdal 14th of Dec 1949 n12345 Inger Lise Rypdal 14th of Dec 1949
VERSJONERING AV PERSONER Når en person endres, skal vi da lage en ny versjon? Skal vi kunne svare på hva en persons navn var på et gitt tidspunkt? Vi har valgt å ikke versjonere, men det er likevel støtte for både: Flere navnevarianter og å lenke direkte til en av disse, samt Lenke til siste offisielle navnevariant
FORVALTNING AV NAVNEVARIANTER Radiokontakten contributor Radiolangs http://authority.nrk.no/agent/123 officialname http://authority.nrk.no/agent/123/ name/rypdal%2c_inger_lise name Inger Lise Rypdal contributor namevariant http://authority.nrk.no/agent/123/name/ande rsen%2c_inger_lise name Inger Lise Andersen Ungdommens radioavis 1968 contributor
Arkitektur
STADNAMN.NRK.NO
NRKS AUTORITETSREGISTRE SAMARBEID MED EKSTERNE? Rett instans ansvarlig Driftsutfordringer
SEMANTISK TEKNOLOGI I NRK - OPPSUMMERING Semantisk teknologi brukes for å integrere metadata fra diverse interne systemer i NRK Metadatagrunnlaget samt Autoritetsregistrene bygges opp i RDF-baserte triple stores Tilrettelagt for informasjonsdeling på Web og for mulig framtidig samarbeid med eksterne aktører
SPØRSMÅL