Deling og lagring av forskningsdata ved UiO

Størrelse: px
Begynne med side:

Download "Deling og lagring av forskningsdata ved UiO"

Transkript

1 Universitetet i Oslo Notat Til: Dekanmøte Dato: Saksnr..: Bakgrunnsnotat Deling og lagring av forskningsdata ved UiO Bedre tilgang til forskningsdata bidrar til å forenkle forskningssamarbeid og til å høyne kvaliteten på forskningen. Regjeringen ønsker å legge til rette for økt tilgjengeliggjøring av offentlige forskningsdata. [1] Oppsummering Notatet gir en oversikt over utfordringer knyttet til håndtering og deling av forskningsdata, eksisterende prosjekt og tjenester, og relaterer dette til UiOs strategi samt eksterne initiativ. Det anbefales at en arbeidsgruppe bestående av representanter fra ulike forskningsmiljøer, USIT, UB, AF og juridisk kompetanse opprettes. Arbeidsgruppen skal kartlegge eksisterende ressurser og praksis ved UiO, de ulike behov for lagring og deling av forskningsdata, og utrede mulige tiltak og løsninger som samsvarer med krav og retningslinjer gitt av myndigheter og finansieringskilder samtidig som det tas hensyn til de vitenskapelige ansatte. Motivasjon og formål Behovet for tekniske og administrative løsninger for lagring og tilgjengeliggjøring av forskningsdata er tiltagende med økende digitalisering av forskningen. Betydningen av etterprøvbare resultater, krav om tilgjengeliggjøring av data og arkivering av resultatdata fra offentlig finansiert forskning forsterker behovet. Slik e-infrastruktur for forskningsdata må være tilpasset lagring av både resultatdata og kildedata, mens retningslinjer for deling i hovedsak gjelder resultatdata. Etterspørselen fra forskere innen medisin og naturfagene er stor, men også humaniora- og samfunnsvitenskapsfagene etterspør i større grad e-infrastruktur som synliggjør dataene og støtter deling og sitering. Innvendingene mot tilgjengeliggjøring av forskningsdata dreier seg ofte om å miste kontroll over bearbeidelse av egne data, noe som vil kunne løses ved bruk av embargo, siteringsstandarder, rettighetsklareringer og gode beskrivelser i form av metadata. Samtidig er tilgjengeliggjøring av forskningsdata viktig for finansiører som Forskningsrådet og EU som utformer prinsipper og retningslinjer for lagring og deling av forskningsdata knyttet til forskningsprosjekter finansiert av H2020 og Forskningsrådet. For å imøtekomme utviklingen bør UiO være med på å etablere e-infrastruktur, inklusive overordnede tjenester og administrative løsninger, som adresserer de skisserte behovene og sikrer at ulike krav opprettholdes, samt at UiO Universitetsdirektøren Kontoradr.: Lucy Smiths hus, Problemveien 7, 9. et., 0313 Oslo Telefon: Telefaks: postmottak@admin.uio.no

2 2 kan tilby vitenskapelige ansatte de beste løsninger i samsvar med prinsipper fra finansiørene. USIT, UB og AF fremmer derfor initiativ til en kartlegging av dagens situasjon for forskningsdata ved UiO, eksterne og interne interessenter på området - deres iverksatte tiltak og prosjekt så vel som planer og strategier, og institusjonens samlede behov sett i sammenheng. Formålet med arbeidsgruppen er å utarbeide grunnlag for utvikling av prinsipper og retningslinjer for lagring og deling av forskningsdata ved UiO, samt iverksettelse av tiltak og etablering av nødvendige løsninger. Bakgrunn USIT I Strategi 2020 Strategi 5 heter det at Forskning i internasjonal front skal understøttes av strategiske investeringer og samarbeid om forskningsinfrastruktur [2]. UiO ved USIT har ansvar for felles e-infrastruktur for forskning, og har i lengre tid hatt tjenester og ressurser for lagring og behandling av forskningsdata. UiO ved USIT har siden 2007 i tillegg deltatt i nasjonal sammenheng med etablering av NorStore, det nasjonale e-infrastrukturprosjektet for forskningsdata. Strategisk fokus på datalagring har resultert i større investeringer som Astrastore, den tekniske lagringsplattformen som NorStore og en rekke lagringstjenester per i dag er basert på. Gjennom NorStore etableres det nå en nasjonal tjeneste for arkivering av for forskningsdata som ikke er tillagt NSD. Formålet med arkivtjenesten er digital langtidsarkivering og tilgjengeliggjøring av offentlig finansierte forskningsdata[3]. USIT har utviklet en plattform for tjenester for sensitive data (TSD), på bakgrunn av etterspørsel av den type løsninger. Fremdeles gjenstår avklaring av enkelte juridiske problemstillinger i forhold til eierskap, finansiering, ansvar og forpliktelser ved lagring av forskningsdata. Finansiører Forskningsrådet har etablert en arbeidsgruppe som skal utrede ulike problemstillinger knyttet til deling og legge fram forslag til i hvilken grad forskningsrådet som finansiør kan implementere krav om håndtering av forskningsdata i sine utlysninger. Gruppen, ledet av Siri Lader Bruhn, har samlet et ekspertforum for å kartlegge eksisterende løsninger og praksis for deling og lagring av forskningsdata i sektoren, og som har diskutert problemstillinger og mulige løsninger. Flere fra UIO er med i forumet. Bakgrunnen for Forskningsrådets initiativ på dette feltet er OECDs prinsipper og retningslinjer for tilgang til offentlig finansierte forskningsdata, oppfølging av foreslåtte tiltak i stortingsmeldingene Lange linjer og Klima for forskning, samt i rapporten Kartlegging 2008 fra Forskningsrådet. Utover kartleggingsarbeidet har Forskningsrådet foretatt en spørreundersøkelse i sektoren, resultatet er presentert i rapporten «Sharing and archiving of publicly fundede research data». Rapporten viser at utfordringene er tverrfaglige og gjelder alle disipliner. Målet for prosjektet er å heve forskningskvaliteten, styrke nyskapning og innovasjon i norsk forskning, samfunn og næringsliv ved at forskningsdata ivaretas og gjøres tilgjengelig. I løpet

3 3 av 2014 ønsker forskningsrådet å igangsette en pilot for `Klima og polar` der krav om datahåndteringsplan trolig blir en del av utlysningen. De har også sett på de juridiske problemstillingene rundt datadeling og vil anbefale CC.BY 4.0 lisens 1 for data som skal deles, samtidig ser de på hvilke hensyn som ligger til grunn for forskningsdata som ikke skal deles. I HORISONT 2020 fremhever EU at forskningsdata er det «nye gullet», og viser til rapporten Riding the wave. EU anbefaler at alle deltakere (institusjoner) skal tilrettelegge for lagring, deling og tilgjengeliggjøring av forskningsdata; Open access to scientific research data enhances data quality, reduces the need for duplication of research, speeds up scientific progress and helps to combat scientific fraud. In its final report "Riding the wave: How Europe can gain from the rising tide of scientific data" In October 2010, the High Level Expert Group on Scientific Data emphasized the critical importance of sharing and preserving reliable data produced during the scientific process. Policy action on access to data is therefore urgent and should be recommended to Member States [4]. EU vektlegger videre følgende tilnærminger til åpen deling av forskningsdata: Tverrfaglighet: datautveksling på tvers av disipliner og sektorer Støtter fremtidens forskning: åpen forskning og åpen tilgang med optimale løsninger Danner grunnlag for innovasjon: utvikling og testing av innovative løsninger og tilrettelegger for samarbeid med industri, SMEer samt ny teknologi[5] For å danne et bilde av etterspørsel etter e-infrastruktur og legge grunnlag for retningslinjer og prinsipper har EU i H2020 opprettet en pilot hvor de vil undersøke mulighetene ved å lagre og dele forskningsdata fra et utvalg EU-prosjekt, hvor blant annet Open Access portalen OpenAire er med. Samtidig finansierer EU gjennom det 7. rammeprogram prosjektet EUDAT som koordinerer e- infrastruktur for lagring av forskningsdata i Europa. De har fire delprosjekter; sikring av sensitive data (b2safe), tilrettelegging for analyse og visning (b2stage), enkel lagring og deling for forskere (b2share) samt metadata og søketjenester (be2find). Fra Norge er UNINETT Sigma AS deltaker i utviklingen av b2safe sammen med USIT/UiO, USIT er også med i en b2share pilot mellom de Nordiske landene. EU ser for seg at e-infrastruktur og lagringsressurser blir etablert lokalt, men de støtter gjerne opp under de ulike prosesser og oppfordrer institusjoner til å søke om midler. Gjenbruk og synliggjøring av forskningsdata Det er viktig både for de vitenskapelig ansatte og for institusjonen å bevare og gjenbruke datamateriale. Materialet er av verdi både for andre forskere som jobber med tilsvarende forskning, og for institusjonen som kilde til samarbeid med andre institusjoner og deltakelse i prosjekt. Åpne data med høy kvalitet er i tillegg med på å synliggjøre forskingen som foregår ved 1

4 4 institusjonen. Samtidig vil etablering av delings- og lagringsinfrastruktur for forskningsdata, som EU vektlegger, gi alle forskere et større virksomhetsfelt og stimulere til innovasjon og tverrfaglighet. Tilgjengeliggjøring og deling av forskningsdata øker verdien og synligheten av forskning gjennom gjenbruk og datasitering. Internasjonalt er praksis for datasitering i ferd med å komme på plass. En standardisert sitering krever at dataene er sikkert men tilgjengelig lagret og tildelt unike identifikatorer[6]. Per i dag deles det meste av forskningsdata som gjenbrukes direkte mellom kolleger og fagfellenettverk. Dette har flere konsekvenser; junior forskere kan oppleve liten eller ingen tilgang til datamateriale de trenger, og det deles i liten grad forskningsdata på tvers av disipliner[7]. Majoriteten av forskningsdata som genereres kan åpent deles med andre forskere, både innenfor og på tvers av disipliner. Metadata og informasjon om at materialet eksisterer ved institusjonen kan gjøres tilgjengelig selv om forskningsdataene av ulike hensyn ikke kan tilgjengeliggjøres. Forvaltningsplan for deling og lagring av forskningsdata Det er et behov for et helhetlig prinsipp og koordinering fra sentralt hold for å få til gode lagrings og delingsløsninger som dekker bredden av forskningsdata som produseres ved UiO. Figuren under viser ulike roller og ansvarsområder og hvordan disse er koblet sammen.

5 5 Modeller for datahåndtering har ofte en tredelt rollefordeling: Forskerne har et økende behov for lagring og deling - da det i økende grad også kommer krav om dette fra myndigheter og finansieringskilder, tilbydere (providers) av e-infrastruktur har ressurser og ansvar for sikker lagring, mens en tredje rolle vil være støttefunksjoner, kompetanse, informasjon og opplæring i bruk av metadata. Det er vanlig at de to siste rollene er tett sammenkoplet, som for eksempel ved USIT. Det er nødvendig med koordinering og samarbeid på tvers av enheter, figuren viser her flyten av forskningsdata der flere parter er involvert. God samhandling er nødvendig for å kunne levere et godt tilbud til den enkelte forsker, samtidig som man ivaretar felles standarder for både data og metadata, tilgangskontroll, deling og grensesnitt for søking og gjenfinning. Saksbehandlere: Live H. Kvale UB, Hans Eide USIT, og Margaret L. Fotland AF Kilder: 1. Kunnskapsdepartementet, Lange linjer kunnskap gir muligheter , Kunnskapsdepartementet: Oslo. 2. Ottersen, O.P. and G.-E.A. Bjørneboe, Strategi , Universitetet i Oslo: Oslo. 3. Nordby, R.O. Prosjekt for nasjonal arkivtjeneste for forskningsdata [cited ]; Available from: 4. The European commission, Commission Recommendation of 17 July 2012 on access to and preservation of scientific information. Official Journal of the European Union, 2012(L 194): p Glinos, K., e-infrastructures in Horizon 2020, in EUDAT 2nd conference. 2013: Rome. 6. Datacitation Synthesis Group. DRAFT - Declaration of Data Citation Principles [cited ]; Available from: 7. Kvale, L., Data sharing in the life sciences : a study of researchers at the Norwegian University of Life Sciences, in Institutt for arkiv, bibliotek- og info.fag. 2012, Høgskolen i Oslo og Akershus, Universitetet i Tallinn, Universitetet i Parma: Oslo.