BIRD - Administrasjon av forskningsdata (Ref #2219b941) Søknadssum: 1 000 000 Varighet: Toårig Kategori: Innsatsområder Samarbeid og partnerskap Opplysninger om søker Organisasjonsnavn / nr Handelshøyskolen BI / 971228865 0442 Oslo www.bibsys.no Institusjonens leder Tom Colbjørnsen Ansvarlig kontaktperson (søker) Dagmar Langeggen 46410295 / damar.langeggen@bi.no Mål for prosjektet Politiske myndigheter har signalisert ønske om større grad av åpenhet og krav til deling av forskningsdata. I Forskningsmeldingen kap. 3.4.3. sies det at Bedre tilgang til forskningsdata bidrar til å forenkle forskningssamarbeid og til å høyne kvaliteten på forskningen. Regjeringen ønsker å legge til rette for økt tilgjengeliggjøring av offentlige forskningsdata. Norges forskningsråd er i ferd med å utvikle retningslinjer for arkivering og deling av forskningsdata som går i retning av at forskningsdata innhentet over midler fra NFR skal stilles tilgjengelig for andre forskere. Dette er en oppfølging av Norges Forskningsråd nasjonale strategi for forskningsinfrastruktur og et nytt veikart over strategisk viktige infrastrukturer (2012), og i henhold til de signaler som er gitt av EU i Horizon 2020. Både nasjonalt og internasjonalt er det en pågående diskusjon om hvilken rolle fagbiblioteket skal ha i arbeidet med å sikre en fremtidsrettet infrastruktur for forvaltning og deling av forskningsdata (primært kvantitative data). Nasjonalbiblioteket har som målsetting å være en del av forskningsinfrastrukturen i Norge gjennom bl. a. å bygge opp, registrere, digitalisere og formidle samlingene ut fra forskningens behov. NB vil i denne sammenheng være en leverandør av forskningsdata. Hovedmål for prosjektet er å etablere en lavterskel tjeneste for forvaltning av forskningsdata: o for innhenting og for å kunne kombinere data fra mange kilder o som gjør det trygt og enkelt å dele data o hvor beskrivelsene av data er presise nok til at datasett ikke mistolkes og misbrukes o for avlevering av data Side 1 av 5
o som ivaretar sikkerhetskrav til forvaltning av data Fagbiblioteket har høy kompetanse på metadata og kunnskapsorganisering med gode forutsetninger for å støtte forskeren i prosessen med å identifisere smidige løsninger for forvaltning av datasett. Prosjektet skal bidra til at fagbibliotekene styrker samarbeidet med forskeren og forskningsmiljøene. BIRD vil utvikles med en åpen og generell arkitektur, og kunne brukes innenfor et bredt spekter av fagfelt. Det er et uttalt mål at tjenesten skal bidra til å effektivisere forskningsprosessen og bedre forskning ved å legge til rette for gjenbruk av data og samarbeid på tvers av fagfelt. BIRD vil være et tilbud til alle utdannings- og forskningsinstitusjoner som ønsker å tilby sine forskere et felles verktøy for administrasjon av forskningsdata. Prosjektbeskrivelse Prosjektet er et samarbeid mellom biblioteket ved Handelshøyskolen BI og BIBSYS. Prosjektet er planlagt realisert i perioden 2014-2015 og bygger på resultater av et forprosjekt som er gjennomført i 2013. Prosjektet er forankret i ledelsen hos BI og BIBSYS. Prosjektledelsen vil håndteres av BIBSYS, og arbeidet vil i hovedsak utføres av BIBSYS. Det vil bli nedsatt en arbeidsgruppe med representasjon fra flere fagbibliotek i sektoren for å sikre bred forankring. I forprosjektet er det utviklet en betaversjon basert på den åpne kildekoden DSpace. Andre typer åpen kildekode vil bli vurdert som f. eks. Fedora. I forprosjektet er det også startet en dialog med andre tjenesteleverandører i sektoren som det kan være aktuelt å integrere tjenesten mot. Det gjelder blant annet Uninett-Sigma og Norsk Samfunnsvitenskapelig Datatjeneste (NSD). I den grad det er naturlig, vil det blir tatt en gjennomgang av mulige samarbeidsflater mot prosjekter som Digitale fulltekstarkiv ved Universitetet i Bergen. Prosjektet gjennomføres i fem faser, se framdriftsplan. For å oppnå best resultat vil det jobbes iterativt i fasene, det gjelder spesielt fase 1-3. Dette understøttes av utviklingsmetodikken som BIBSYS benytter (Scrum). Arbeidsgruppen skal bistå arbeidet og sikre bred forankring i sektoren. Fase I Det er i dag mange aktører som har en rolle knyttet til tungregning, avlevering og arkivering av forskningsdata. En kartleggingen skal bidra til å avklare hvilke roller BIBSYS kan ivareta i samarbeid med fagbibliotekene og hvor grenseflatene bør gå mot øvrige aktører. NSD et av verdens største arkiv for forskningsdata og formidler av data og datatjenester overfor forskningssektoren. NorStore lagringstjeneste for forskningsdata (Uninett-SIGMA) Uninett eier av NorStore og tilbyr tjenester for tungregning. Notur II (big data) CRIStin forvalter Forskningsinformasjonssystemet CRIStin. I første fase vil det også arbeides videre med integrasjon mot NSD og Uninett Sigma. Det er overfor NSD fremmet forslag om en automatisk avlevering av forskningsdata fra BIRD til NSD når prosjektet er ferdig. Med Uninett Sigma er det diskutert mulighet for å koble til lagringsressursene som er tilgjengelige i NorStore. Disse initiativene må formaliseres og spesifiseres. Fase II Nødvendig arkitektur for tjenesten etableres. Det skal defineres en informasjonsarkitektur basert på de krav og behov som er avdekket. Denne skal utvikles i samarbeid mellom arbeidsgruppen ledet av BI og BIBSYS. Side 2 av 5
Informasjonsarkitekturen skal dekke et bredt spekter av fagfelt og ulike typer datasett. Det skal også etableres en teknisk arkitektur. Her vil det bli lagt vekt på at denne skal være åpen (SOA). Det skal benyttes åpen kildekode, som dspace eller Fedora. Fase III BIRD videreutvikles basert på informasjonsarkitekturen og de kartlagte kravene. En rekke komponenter vil vurderes, se Detaljert framdriftsplan (Vedlegg 1) for nærmere spesifikasjon. En vil i stor grad kunne nyttiggjøre seg arbeid som er gjort i forprosjektet, dette gjelder også dersom en velger å bruke annen type åpen kildekode i prosjektet. Fase IV Fokus vil knyttes til etablering av rutiner for forvaltning av forskningsdataene. Se Detaljert framdriftsplan (Vedlegg 1) for nærmere spesifikasjon. Noen av rutinene vil kunne automatiseres og legges til som funksjonalitet i BIRD, mens andre vil kreve manuell behandling i deler av prosessen. Her er det viktig å ha kompetanse på metadata, og dette er et område hvor fagbibliotekene har mulighet til å bruke sin kompetanse i en ny sammenheng. Fase V Den siste fasen av prosjektet vil legge til rette for overgang til ordinær drift av BIRD. Konsortiet vil formelt etableres, og det vil gjennomføres nødvendige systemtester og en endelig godkjenning. BI biblioteket bidrar i prosjektet med erfaring fra forprosjektet og betaversjonen, som i prosjektperioden vil være i drift. BIBSYS anskaffer, utvikler og driver fellessystemer for utdannings- og forskningssektoren. BIBSYS bidrar i prosjektet med lang erfaring med å utvikle komplekse systemer i samarbeid med akademiske institusjoner. BIBSYS bidrar også med høy kompetanse på metadata, erfaring med bruk av åpen kildekode og solid erfaring innen drift av konsortieløsninger. Partene har nødvendig kompetanse og forutsetninger for å gjennomføre prosjektet. Gjennom opprettelse av arbeidsgruppen vil flere institusjoner være med å sikre at forskernes behov dekkes. Prosjektet relaterer seg hovedsakelig til innsatsområdet «Samarbeid og partnerskap». Prosjektet er to-årig med totalbudsjett på kr.4.800.000. Det søkes om kr.1.000.000 i 2014 og kr.1.000.000 i 2015. Side 3 av 5
Start- og sluttdato for prosjektet Prosjektvarighet Toårig Fra dato 01-01-2014 Til dato 31-12-2015 Aktivitetsplan for prosjektet Beskrivelse Fra dato Til dato Kartlegging og kravspesifikasjon 01-01-2014 31-03-2014 Arkitektur 01-04-2014 30-06-2014 Videreutvikling 01-07-2014 31-12-2014 Etablere rutiner for dataforvaltning 01-01-2015 30-06-2015 Forberede driftsfase 01-07-2015 31-12-2015 Andre opplysninger Når BIRD går over i en drift, vil finansiering dekkes gjennom et konsortium med deltakere som vil bruke produktet. Konsortiet vil dekke driftskostnadene, bestemme kostnadsrammer for videreutvikling og hvilke endringer som skal prioriteres. Kostnadene vil fordeles etter en prismodell som godkjennes av konsortiet. BIBSYS har lang erfaring med å drifte produkter for flere konsortier og er slik godt kvalifisert for driftsfasen. Samarbeidspartnere Organisasjon/institusjon Formell avtale Rolle BIBSYS 7491 Trondheim ja Prosjektledelsen vil håndteres av BIBSYS, og arbeidet vil i hovedsak utføres av BIBSYS. Det vil bli nedsatt en arbeidsgruppe med representasjon fra flere fagbibliotek i sektoren for å sikre bred forankring. Side 4 av 5
Budsjett Søknadsbeløp fra Nasjonalbiblioteket 1 000 000 Utgifter Beskrivelse Denne periode Totalt for prosjektet Prosjektledelse 200 000 300 000 Investering i teknisk infrastruktur 100 000 300 000 Spesifikasjon og utvikling 2 000 000 4 000 000 Administrasjon av konsortium 0 200 000 Totale utgifter 2 300 000 4 800 000 Inntekter Beskrivelse Denne periode Totalt for prosjektet Tilskudd fra Nasjonalbiblioteket 1 000 000 2 000 000 Egenfinansiering partene 1 300 000 2 800 000 Totale inntekter 2 300 000 4 800 000 Vedleggsoversikt Beskrivelse Vedlegg 1. Detaljert fremdriftsplan Side 5 av 5