Felles autoritetar og identifikatorar Kvifor og kan vi eigenleg få det til? Fagdag om felles autoritetar og URI-ar Robert HP Engels - 54 23'37"S 3 21'53"E robert.engels@bouvet.no Nynorsk omsett av Apertium
Agenda Utfordringa...... og måtar å sikra det pau....måtar å gjere det på...
Utfordringen.
Unike og delte referanser Føles som en åpen dør men det er to gode grunn til ønsket: Identifikasjon på tvers av systemer Identifiserbare kroker for å henge opp informasjon på forskjellige steder Hvorfor gjorde vi ikke dette fra starten av?
Unike og delte referanser Føles som en åpen dør men det er to gode grunn til ønsket: Identifikasjon på tvers av systemer Identifiserbare kroker for å henge opp informasjon på forskjellige steder Hvorfor gjorde vi ikke dette fra starten av?
Unike og delte referanser Føles som en åpen dør men det er to gode grunn til ønsket: Identifikasjon på tvers av systemer Identifiserbare kroker for å henge opp informasjon på forskjellige steder Hvorfor gjorde vi ikke dette fra starten av?
Unike og delte referanser Andre grunn til å ønske dette? Sammenslåing av dine interne datasett (automagisk) Berikelse av dine egne datasett (automagisk) Bruk av gode (trusted?) datasett som autoritetsregistere
Hva kunne vi fått ut av... verk Hendelser (NTB?) personer yago Deichman SNL bands dbpedia Kunstnere + Prod. NRK Nasjonal museum Popsenteret
.. ut av alle disse autoritetsregistere og tilknyttede datasett? BBC http://data.bbc.co.uk/26758 - BBC Philharmonic, - Conductor: Yan Pascal Tortelier http://isbn.org/13/9783254080288 - Der Fliegende Holländer - Textbuch, Einführung und Kommentar (Fassung 1842-1880). WWV 63 - om: http//dpedia.org/resource/richard_wagner Deichman http://id.nrk.no/digas_28034 - Overture: Der Fliegende Holländer - utøver: http://data.bbc.co.uk/26758 http://dbpedia.org/resource/richard_wagner - 22 May 1813 13 February 1883 - komponist, teaterdirektør, dirigent og polemicist DBpedia http://dbpedia.org/resource/paal_waaktaar-savoy - gift med http://dbpedia.org/resource/laura_savoy - fødested: http://geo_names.org/9467529275 - fødseldato: 6 sept 1961 - foaf:depicted http://wikimedia.commons.org/907345 NRK wikimedia http://data.popsenteret.no/band_33 - medlemmer: morten_harket (ID), Magne Furuholmen (ID) og Paul Waaktaar-Savoy (ID) - album: album_132, album_487923, album_4978, album_82345 etc... http://id.nrk.no/digas_982237845 - intervjue: http://data.popsenteret.no/band_33 Nasjonal museum - beskrivelse: progam om morten harket og A-ha tiden Popsenteret
Men også innenfor din organisasjon! Og det ikke bare på det store internettet...
Hvordan.
Unike ID: hvordan? ISBN (International Standard Book Number) ASIN (Amazon Standard Identification Number) CODEN (serial publication identifier currently used by libraries; replaced by the ISSN for new works) DOI (Digital Object Identifier) ESTC (English Short Title Catalogue) ETTN (Electronic Textbook Track Number) ISAN (International Standard Audiovisual Number) ISMN (International Standard Music Number) ISWC (International Standard Musical Work Code) ISRC (International Standard Recording Code) ISSN (International Standard Serial Number) ISTC (International Standard Text Code) ISWN (International Standard Wine Number) LCCN (Library of Congress Control Number) List of group-0 ISBN publisher codes List of group-1 ISBN publisher codes OCLC number (Online Computer Library Center number[31]) Registration authority SICI (Serial Item and Contribution Identifier) Special:Booksources, Wikipedia's ISBN search page Systemene er «lokale domener» og ikke nødvendigvis «unik»! VD 16 (Verzeichnis der im deutschen Sprachbereich erschienenen Drucke des 16. Jahrhunderts)(in English: Bibliography of Books Printed in the German Speaking Countries of the Sixteenth Century) VD 17 (Verzeichnis der im deutschen Sprachraum erschienenen Drucke des 17. Jahrhunderts)(in English: Bibliography of Books Printed in the German Speaking Countries of the Seventeenth Century)
Foreslått løsning for semantisk web: Unified Resource Identificator URI: peker hyperlinks mot en adresserbar objekt Hva kan beskrives vha URIer? real-world objekter: en personer, et verk, et fjell, denne spesifikke bilen, en bok, et museumsobjekt abstrakte ressurser: begrepssytemer, farge, navn, posisjon, osv Noen URIer er veldig gjenbrukbare og burde være tilgjengelig for nettopp det! Autoritetsregistere for: Sosiale enheter, steder, hendelser Emner/kategorier og verk/produksjoner...
Forskjellige tekniske muligheter From: Sandro Hawke, W3C, 2001 Slash: http://id.nrk.no/digas/2013/943829090 Hash: http://data.popsenteret.no/ontology#p_82492 Variable: [producedalbum:<pop:album_24089>; dbpedia:birthplace <geo:sr94388> ] Minting: URN:NBN:no-nb_digibok_2010061408028 TDB: tdb:2001:http//.../creator
Global unik... Skal nøkler inneholde en struktur? There has been a prolonged debate about the relative merits of dumb and intelligent or expressive unique identifiers. They guarantee unambiguous recognition in the system (and for users who know the rules). They support searching, sorting and reporting. (IASA 2010) Ingen nytte på internett! Interpretation verdiløs fordi dette er umulig på tvers av domener og systemer ergo: hjälper inte Gjør heller mening eksplisitt (vi har nemlig ingen plass problem på internett) og tilgjengelig til gjenbruk på tvers av domener 1-84356-028-3 isbn: English-speaking area Simon Wallenberg Press 1-84356-028-3 tel.: Walter Simpson Francisco bay area
Hvor publiserer man slikt? Publiser på egen server I egen IKT omgivelse Involverer egen IKT avdeling Krever oppsett og driftskompetanse (sikkerhet osv?) Varighet? Publiser på egen server I et ekstern virtuell miljø Involverer egen IKT avdeling Krever oppsett og driftskompetanse Varighet? Enklere å skalere, sikkerhetsansvar delvis ett annet sted, enkel å duplisere Publiser på en nett-baserte tjenester OpenConcept Handle Mm KulturNav!
Hvordan sikrer vi oss denne muligheten.
Ikkje trur det er ikkje noko du byrd bekymre deg for!
Oppdatert forslag til krav til digitaliseringsprosjekter Krav til lokaliserbarhet Krav til produksjon av digitale objekter Hvis mulig lag digitale objekter av kulturarv Produser én gang, publiser for alle! Krav til beskrivelse Teknisk metadata (dato, format, oppløsning) Strukturell/Sosial metadata (hvem, hva, hvor, hvorfor?) Administrativ metadata (rettigheter, lisenser, osv) Kopling mot autoritetsregistere!! Krav til varighet HTTP, URI, bruk av åpne standarder, UTF8, DC/DCT Garanter tilgjengelighet I minst 100 år. (oh jee! Hvor får jeg budsjettet fra?) Krav til presentasjon Presenter data i flere former, maskin-lesbar og interpreterbar for mennesker
Oppsummering
Unike og delte referanser Hvorfor? Lokale nøkler vs globale, distrubuerte nøkler Sammenslåing av datasett (automagisk) Berikelse av dine egne datasett (automagisk) Gjør jobben én gang, og der hvor den gjøres best Del dine resultater med andre, får andres resultater delt Automagisk Autoritetslister: sørg for felles referansepunkter I dine datasett: Sosiale entiteter, steder, hendelser emner/kategorier & verk/produksjoner Krav til deling og varighet i digitalisering
Spørsmål?