marc2rdf - konvertering av MARC-data (Ref #1054)



Like dokumenter
Bokanbefalinger (Ref #1048)

Bokanbefalinger til brukerne (Ref # )

Aktive hyller (Ref # )

Modell for en bedre digital hverdag (Ref #acac3ae2)

En bok - en registrering (Ref #ff3a0584)

BIRD - Administrasjon av forskningsdata (Ref #2219b941)

Grieg Research Guide (Ref #3d3c7ac8)

Node til node, skulder mot skulder (Ref #46d669ae)

Verktøy for skole- og folkebibliotek. (Ref #6c930887)

På norsk og på tvers. Visuell navigasjon (Ref #78d9f614)

På vei mot en generell norsk tesaurus (Ref #7de4b4e5)

Merkevare Vestfoldbibliotekene (Ref # )

Digitalt pensumsystem (Ref #1066)

E-læring for bibliotekansatte (Ref #321b0e0b)

Internasjonale studenter som målgruppe (Ref #1d1737f2)

Bibliotekutvikling gjennom brukerdrevet innovasjon (Ref #1040)

Nord-Trøndelag leser (Ref #1136)

Norart + bokanalytter = Sant (Ref #6c39db40)

Digital historiefortelling (Ref #1068)

Rom for flere (Ref # c)

Forskningskommunikasjon i endring (Ref #14c94a46)

Folkebibliotek som litteraturhus (Ref #5ebb0143)

Litteraturhus Lillehammer (Ref # b)

Prøysen-bibliografi (Ref #8e35dac9)

Hva lærer de? (Ref #1109)

eborgerskap Vestfold (Ref #1044)

Store debatter i små bibliotek (Ref #76bb4add)

Barnebokbad (Ref #d9ec3ca4)

PhDportal.uib (Ref #)

Information management for... (Ref # )

Hvordan = mer enn tre (Ref #ae963ba0)

Meninger rundt bordet (Ref #e9e55d97)

Litteraturen viser vei til debatten (Ref #ccd20ccf)

Sølvberget APP (Ref #1120)

Psykisk helse for barn og unge (Ref # )

Barnebibliotek - et kompetanseløft! (Ref #)

Bibliotekrom i Troms (Ref # )

DIGITAL FOLKEOPPLYSNING (Ref # )

Bibliotek i badedrakt (Ref # )

Endring må til! (Ref # )

Barnebokdagene i Gjøvik 2013 (Ref #1037)

Finnmarksbibliotekene (Ref #bccd70d2)

Nytte og hygge (Ref #1075)

DigitalDus. Samarbeids- og utviklingsmidler for Opplysninger om søker. Mål for prosjektet. Prosjektbeskrivelse. Søknadssum kroner

Nye Tjøme folkebibliotek - formidling i sentrum! (Ref #1099)

Fra seks til en (Ref #39b22205)

Hva sier boka? (Ref #4a066bd3)

Portal for utlån av ebøker

Rett til å si det -debatt for folk flest (Ref #f479afa9)

Bibliotekets metamorfose (Ref #99935c14)

Spel for alle - "Kasino mobil" (Ref #c4ef53b5)

Digitale fulltekstarkiv UBB (Ref # )

Fortell meg! Samarbeids- og utviklingsmidler for Opplysninger om søker. Mål for prosjektet. Prosjektbeskrivelse. Søknadssum kroner

Mapping mot norsk webdewey (Ref #684d0eaa)

Furuset bibliotek - arena for alle (Ref #8b1e1dfa)

Jakten på det unike (Ref #b333bf1c)

Folkeverkstedet (Ref #86a25826)

Konferanse om språkkafeer (Ref #de0099b7)

Pilot regionalt konsortium

Boka i sentrum i spredtbygde strøk. (Ref #5262bde9)

Fagbibliotek og systematiske oversikter (Ref #8c3eae23)

Lettare litteraturnett (Ref #77ab3a77)

Bibliotekets kultursal = BYGDAS HJERTE (Ref #6dce515d)

Lesehulen pilot (Ref # )

Samarbeids- og utviklingsmidler for Budsjett. Søknadssum Utgifter. Totale utgifter Inntekter

Eventyrlørdag (Ref # )

Bokmerke Norden (Ref #971e8461)

Helseinfo via folkebibliotek (Ref # )

Flaggskip for norsk litteratur (Ref # )

Ord i spreke spor (Ref #d701bd3d)

«Alle barn leser!» (Ref # )

Fra lokalarkiv til Europeana nye kanaler for formidling

Vertskommunesamarbeid (Ref # )

Kunnskapsbiblioteket i Lillestrøm (Ref #6b26be3e)

Lesersørvis i folkebibliotek (Ref # )

Ung 3.0. Samarbeids- og utviklingsmidler for Opplysninger om søker. Mål for prosjektet. Prosjektbeskrivelse. Søknadssum kroner

Ånd eies av alle - Nordahl Grieg digitalisert (Ref #1122)

Lokaldebatten (Ref #ef356591)

Utviklingsmidler Sluttrapport Konferanse om språkkafeer (Ref #de0099b7) Tildelt beløp: Varighet: Ettårig Kategori: Innsatsområder

Litteraturformidlingskompetanse (Ref #f7666dc)

Biblioteklandskap i endring (Ref # )

ALF inviterer til debatt! (Ref #f704ca59)

Æ e E-Trønder (Ref #12b41826)

Debatt og opplevelser på tvers (Ref #b6a4857c)

Debattgledarar (Ref #b9f95e39)

Open Science Toolbox (Ref #18938ccf)

Juniorakademiet forprosjekt (Ref #6685f678)

Metadata og nye roller Forskerforbundet Rica Nidelven, 8/

Gode lesere på arbeidsplassen. (Ref #1117)

Barn XO - Ta språket! (Ref # a)

Grunnlova (Ref #5dd9e14d)

Notat om Norge digitalt og Norvegiana

Skjema Samarbeids- og utviklingstiltak for arkiv og museum 2012 (bokmål) Referanse Innsendt :51:09

Retningslinjer for TEORA (Telemark Open Research Archive)

Skriving og etisk kildebruk (Ref # )

Musikk og lyrikk. Kunst i møte

Skjema Samarbeids- og utviklingstiltak for arkiv og museum 2012 (bokmål) Referanse Innsendt :48:04

Kunsten å velge bok (Ref # )

Ungdomsrevolusjonen på Gjøvik 2014 (Ref #113e23b5)

Maktens pluttifikasjon

Transkript:

marc2rdf - konvertering av MARC-data (Ref #1054) Søknadssum: 310000 Varighet: Ettårig Kategori: Innsatsområder Samarbeid og partnerskap Ny formidling Opplysninger om søker Organisasjonsnavn / nr Oslo kommune Kulturetaten Deichmanske bibliotek / 992410213 Postboks 1453 Vika 0116 Oslo Institusjonens leder Liv Sæteren Ansvarlig kontaktperson (søker) Benjamin Rokseth 99747184 / Mål for prosjektet Utvikle et gjenbrukbart rammeverk for konvertering av bibliografiske MARC-data fra bibliotekskataloger til RDF Prosjektbeskrivelse *Hvordan* * Rammeverket bygges for å håndtere tilvekst og endring i eksisterende katalog via automatiserte prosesser. * Det utvides med et system for beriking av katalogdata fra eksterne ressurser. * Legge tilrette grunndata for eksperimentering med nye tjenester gjennom åpne APIer. * Koble opp mot prosjekt som Library of Congress Subject Headings og Dewey.info sine åpne data for å utvide klassifiseringsmodell og emnebeskrivelser * Rammeverket testes ved å implementeres på utvalgte referansebibliotek og som grunnlag i tjenester basert på åpne data *Hva* * Rammeverket utforsker potensialet som ligger i semantiske data, systemer og arbeidsmetoder, med tanke på anvendelse i bibliotek *Forventede resultater* * En radikalt utvidet mulighet for vasking/deduplisering av data. Ved et eksponert datasett vil inkonsistenser i eksisterende katalogdata lett kommer til syne, samtidig Side 1 av 6

som de automatiserte prosessene i konverteringen/vedlikeholdet/berikingen kan avdekke svakheter i katalogstruktur * Bedre tjenester for bibliotekbrukerne basert på programmering mot åpne APIer og kobling mellom datasett * Konsolidering av katalogdata slik at den følger etablerte og nye W3C-standarder og dermed lett kan gjenbrukes av programmerere uten katalogkunnskap * Beriking av katalogen gjennom RDF-dataenes lenkestruktur *Beskrivelse* Prosjektet har til hensikt å utvikle et rammeverk for å konvertere bibliografiske metadata fra MARC-poster i et biblioteksystem til semantiske data (RDF) tilpasset internett-utvikling og utvikling av nettjenester og åpne grensesnitt. Utgangspunktet for prosjektet er basert på Deichmanske biblioteks egen erfaring med konvertering av biblioteksposter og nye tjenester basert på åpne data, slik som «Aktive hyller» og «Bokanbefalinger til brukerne». Kartlegging av eksisterende data og modellering er en omfattende oppgave som bør gjøres i et biblioteksfaglig fellesskap, og mange bibliotek har allerede kontaktet oss om muligheten for å låne av vår erfaring til å konvertere egne biblioteksposter. På bakgrunn av dette ser vi et klart behov for et rammeverk som er utviklet i fellesskap med andre bibliotek og som skal kunne brukes av alle. Derfor ønsker vi å flytte denne innsatsen over i et community, slik at alle bibliotek kan dra nytte av hverandres erfaringer med biblioteksdata og bidra. To av innsatsområdene for Nasjonalbiblioteket for 2013, Samarbeid og partnerskap, samt Ny formidling ligger implisitt til grunn for denne søknaden - hvis mål er å etablere en mulighet for alle bibliotek til å åpne og konsolidere sine bibliotekskataloger mot fremtidens formidling. *Begrepsavklaring* RDF står for Resource Description Format og er et relativt nytt format for å beskrive metadata i et format tilpasset internett og lenkede ressurser. Det er også et velegnet format til å utvide den tradisjonelle bibliotekskatalogen til å kunne brukes i et moderne og variert publikumstilbud. MARC står for MAchine Readable Catalogue og er det tradisjonelle metadata-formatet for å beskrive bibliografiske ressurser i bibliotek. Formatet er solid og velutviklet, men står idag foran en rekke utfordringer mht. begrensninger og gjenbrukbarhet. API står for Advanced Programming Interface og er i prinsippet et grensesnitt mellom en database eller en webtjeneste og applikasjoner. Et godt dokumentert API vil gjøre det enkelt og fristende for utvikling av nye tjenester, både for programmerere og lekfolk. Et eksempel er Google Maps API som gjør det veldig enkelt å lage lokasjonsbaserte tjenester, som f.eks. Oslo Bysykkel, som tilbyr sanntids informasjon om tilgjengelige sykler. OAI står for Open Archives Initiative og er en dataprotokoll for høsting om overføring av katalogdata i MARC-formatet. Bakgrunnsinformasjon MARC-formatets fokus på boka og katalogkortet har gjort det vanskelig å lage tjenester som ikke er basert på ren informasjon om fysiske eksemplarer av bøker, men som utvider metadatabegrepet til andre ressurser (digitale og multimediale) samt lenking til annen relevant informasjon. Tjenester på tvers av bibliotek er også vanskelig på grunn av MARC-formatets begrensninger og utallige lokale variasjoner. MARC setter også store begrensninger på gjenbruk av metadata. Ved å Side 2 av 6

konvertere til RDF blir godt gjennomarbeidede MARC-data gjort tilgjengelig for alle, og det åpner seg et vell av muligheter for å lage tjenester basert på disse dataene. Deichmanske bibliotek har gjennom flere prosjekter (Pode, Bokanbefalinger, Aktive hyller) undersøkt mulighetene for å berike opplevelsen av egen katalog og har sett et klart behov for å bytte ut MARC-formatet på formidlingssiden. I tråd med store standardsettende biblioteker som Library of Congress og British Library har vi fokusert innsatsen på RDF og lenkede åpne data. Flere verktøy og referansedatasett har vært under utprøving i de nevnte prosjektene, blant annet Ross Singer fra Talis marc2rdf-modeler, Library of Congress code4rda, Libris datasett Öppna data. Felles for disse er at 1) de er konsentrert rundt marc21-formatet, 2) de gjør begrensede utvalg av datasett og 3) de er unødvendig komplekse og manuelle å ta i bruk. Vi valgte derfor å gjøre modellering og konvertering selv for å kartlegge katalogens hele omfang og muligheter som lå i et konvertert datasett. Resultatet er å finne på data.deichman.no. Flere andre bibliotek har meldt sin interesse for arbeidet vårt (jf. vedlagte Letters of Intent) og dette er grunnlaget for at vi ønsker å løfte dette over i et prosjekt som trenger eksterne midler. *Retningslinjer for prosjektet* 1. APIer og modularitet Verktøyet skal være modulært og gjenbrukbart, helt eller delvis uavhengig av programmeringsspråk. Transaksjoner/tilvekst/spørringer skal skje gjennom et godt dokumentert API slik at administrering og vedlikehold holdes til et minimum. Det skal også være mulig å lage egne API-er mot deler av RDF-basen som biblioteket ønsker å eksponere for utvikling av tjenester. 2. Programvare og dokumentasjon All programvare som utvikles skal være åpen kildekode og publisert på Github.com med en åpen lisens. Programvaren skal dokumenteres i sin helhet, både i kode og på github. 3. Rammeverket skal være enkelt Konverteringsverktøyet skal være enkelt nok til å kunne brukes av et bibliotek med et minimalt driftsmiljø, eller settes ut til en ekstern aktør uten å medføre en kostbar driftsmodell for vedlikehold. 4. Fokus på eksisterende metadata Verktøyet skal overføre mest mulig informasjon. All metadata/informasjon som er tilgjengelig i MARC-formatet skal også være tilgjengelig i RDF. RDF-representasjonen skal kunne leve midlertidig side om side med MARC så lenge MARC er i bruk. Derfor må ALL metadata tas hensyn til. Det skal også gi mulighet for et bibliotek til å reflekterer egne spesielle tilpasninger. Verktøyet skal håndterere tilvekst/oppdatering fra allerede eksisterende bibliotekskatalog via OAI. 5. Beriking Verktøyet skal gi mulighet for automatisk høsting fra andre kilder (bildelenker, isbn, lenker til omtaler, etc.). Det skal også i best mulig grad koble mot allerede eksisterende datasett (f.eks Rådatanå's personautoriteter, DBpedia's personer, emner, geografiske steder, o.l., OpenLibrarys verks- og personautoriteter, VIAF, LCSH, Dewey.info etc.) 6. Samarbeid Rammeverket skal utvikles med tanke på å eksistere i et community. Det bør samarbeides med utvalgte bibliotek i startfasen, men senere åpnes for hele Biblioteknorge. Side 3 av 6

*Inspirasjon/utgangspunkt* http://www.loc.gov/marc/transition/news/framework-103111.html http://kcoyle.net/presentations/lita2011.html https://github.com/digibib/marc2rdf http://marc-must-die.info/index.php/enhancing_the_ils_with_semantic_data http://bisbloggen.blogspot.com/2011/08/konstruktiv-opac-kritik-i-tio-portioner.html http://consulting.talis.com/2011/09/this-post-is-not-about-linked-library-data/ Side 4 av 6

Start- og sluttdato for prosjektet Prosjektvarighet Ettårig Fra dato 01-01-2013 Til dato 30-06-2013 Aktivitetsplan for prosjektet Beskrivelse Fra dato Til dato Kartlegging av katalogpraksiser og etablerte rammeverk 01-01-2013 28-02-2013 Opprettelse av community og kontakt med samarbeidspartnere 01-03-2013 01-02-2013 Utvikling av prototy 01-03-2013 30-04-2013 Testing mot referansebibliotek og ekstern utvikler 01-05-2013 14-05-2013 Feilretting og videreutvikling 01-05-2013 30-06-2013 Funksjonell testing 15-05-2013 15-06-2013 Dokumentasjon og publisering av kode 15-06-2013 30-06-2013 Andre opplysninger Samarbeidspartnere Organisasjon/institusjon Formell avtale Rolle Bergen offentlige bibliotek Strømgaten 6 5015 Bergen ja Referansebibliotek. Bruke verktøyet til "Bergens musikkhistorie" Høgskolen i Oslo og Akershus Postboks 4 St. Olavs plass 0130 Oslo LibrioTech Svarthammarveien 63 8015 Bodø ja ja Utviklingsreferanse. Bistand på modellering og konvertering. Ekstern utvikling. Implementering av verktøyet i det frie biblioteksystemet Koha. Side 5 av 6

Budsjett Søknadsbeløp fra Nasjonalbiblioteket 310000 Utgifter Beskrivelse Denne periode Totalt for prosjektet Teknisk utvikling 220000 220000 Kartlegging av datagrunnlag 50000 50000 Mapping av katalogdata, med ekstern konsulent 100000 100000 Konferanser, reiser og kompetanseheving 100000 100000 Overhead (lokaler, rekvisita, støttefunksjoner økonomi/personal) 47000 47000 Totale utgifter 517000 517000 Inntekter Beskrivelse Denne periode Totalt for prosjektet Tilskudd fra Nasjonalbiblioteket 310000 310000 Egeninnsats Deichmanske bibliotek (bekreftet tilskudd) 207000 207000 Totale inntekter 517000 517000 Vedleggsoversikt Beskrivelse Side 6 av 6