Dag Kiberg NSDs tjenester rundt arkivering av data Møte i koordineringsgruppa for 22. juli- forsking 1
Norsk samfunnsvitenskapelig datatjeneste Hva? Etablert i 1971: Institusjonelt tilknyttet Norges forskningsråd Hvorfor? Bygge ned økonomiske, tekniske, kunnskapsmessige, juridiske og administrative barrierer mellom brukere og dataressurser Forbedre muligheter og arbeidsvilkår for empirisk forskning som først og fremst er avhengig av tilgang til data Etter vedtak i Stortinget: Fristilt fra forskningsrådet og etablert 1. januar 2003 som aksjeselskap eid av Kunnskapsdepartementet Et av verdens største arkiv for forskningsdata og datatjenester til forskningssektoren Kompetansesenter som veileder forskere og studenter om datainnsamling, dataanalyse, metode, personvern og forskningsetikk 2
NSDs hovedoppgaver Gi likeverdige tjenester til alle brukere Finne og gjøre data synlige Produsere metadata og dokumentasjon Organisere og tilrettelegge data for forskningsformål Tilrettelegge for lettest mulig tilgang til data for forskningsmiljøene Garantere personvern og datasikkerhet 3
Fordel for dataprodusentene Redusert arbeidsmengde Effek;ve mekanismer for dataleveranser Ekstensiv og kvalifisert bruk Kvalitetskontroll Synlighet og brukervennlig StøEe, ;llie og legi;mitet 4
Fordel for forskningsmiljøene Enkel og likeverdig ;lgang ;l rike dataressurser Konstnads- og ;dseffek;vt Kvalitetsdata og kvalitets- service 5
NSDs omgivelser Forskningsrådet Finansiering av en rekke eksisterende datatilbud Langsiktighet Datatilsynet NSD er et bindeledd mellom Datatilsynet og forskningsmiljøene. NSD er personvernombud for 150 forskningsinstitusjoner. Statistisk sentralbyrå Formell avtale siden 1976 om distribusjon av data til forskningsformål Forskningsmiljøene Tett kontakt med forskningsmiljøene innen en rekke ulike fagfelt 6
OECDs prinsipper Krever at medlemslandene etablerer det rammeverket som er nødvendig for å sikre åpenhet og tilgang til data Advarer mot uformelle og private avtaler sikrer ikke kvalitet og åpen tilgang til data Tillater fleksible løsninger tilpasset behovene A. Openness B. Flexibility C. Transparency D. Legal conformity E. Protec;on of intellectual property F. Formal responsibility G. Professionalism With data management becoming ever more complex H. in Interoperability certain areas of research, traditional informal I. arrangements Quality between researchers may no longer J. Security be adequate and may need to be complemented K. Efficiency by formally agreed practices and procedures. L. Accountability (OECD, april 2007) M. Sustainability 7
Utfordringer Institusjonene legge til rette for at data som etableres kan arkiveres og etterforvaltes på en måte som gir mulighet for datautveksling, gjenbruk og innsyn. (Stikkord: Rutiner, krav og infrastruktur for arkivering og deling av data) Forskerne refleksjon, motivasjon og holdningsendring Most research projects, and the funding provided, have limited duration, whereas ensuring access to the data produced is a long-term undertaking (OECD). 8
Prosjektekstern arkivering Mer empirisk og fortrinnsvis komparativ, forskning av høy kvalitet Å sikre uavhengighet og likebehandling av forskningsmiljøer Å stimulere til samarbeid og samspill på tvers av fag og miljøer Å etablere ordninger som bidrar til åpenhet og innsyn Å bidra til at Norge og norske forskere knyttes opp mot Europeiske og internasjonale forskningsaktiviteter og nettverk 9
Dette er arkivering hos NSD 1. Før mottak av data Informasjon og veiledning av dataprodusent 2. Mottak av data Informasjon og dokumentasjon fra dataprodusent Kvalitetskontroll og datasjekking Dokumentasjon, metadata og tilrettelegging 3. Lagring og bevaring Datalagring og -bevaring Overvåkning av lagringsmedia og bevaringsstrategi Versjonskontroll og endringsprosedyrer 4. Spredning Synlighet Tilgang og tilgjengelighet Verktøy og grensesnitt Overvåkning, gjennomgang og tilbakemelding 10
Datafangst hos NSD Langsik;g avtale med SSB om formidling av data ;l forskning MoEar data fra forskningsprosjekter som et resultat av Forskningsrådets bevilgningsvilkår H10 - Divisjon Samfunn og helse - Avdeling: Helse H20 - Divisjon Samfunn og helse - Avdeling: Velferd og utdanning F10 - Divisjon Vitenskap - Avdeling: Humaniora og samfunnsvitenskap F30 - Divisjon for Vitenskap - Avdeling: Universitets- og høgskolepoli;kk F40 - Divisjon for Vitenskap - Avdeling: Ins;tuEpoli;kk og analyse F50 - Divisjon for Vitenskap - Avdeling: Forskningsinfrastruktur O10 - Divisjon Innovasjon - Avdeling: Bionæringer D00 - FORFI: Ak;viteten FORFI - Kunnskapsgrunnlaget for forsknings- og innovasjonspoli;kken Arkivering av data fra universiteter og forskningsins<tusjoner Arkivering av data fra store surveys i Europa og i resten av verden 11
Dette er arkivering hos NSD Avlevering TilreEelegging Utlevering Tilgang Til reee- legge datasee Depo- Gjennom- Kontroll og Iden;fi- nering av gang av Lage doku- Frigi sere data data mentsee gjennom- hente inn data, oppreeholde datakvalitet, gang legge ;l merverdi studie og Til reee- legge metadata Til reee- legge for online Frigi online Web Server Hensikten med hele prosessen er å gjøre NSD istand ;l å oppdage data, ;lreeelegge for gjenbruk over ;d. Bruker- ;lgang Rådata- lager Oversikt Arkiv Oversikt 12
Før mottak av data hvorfor arkiverer vi? En samfunnsmessig forpliktelse? Bred tilslutning til prinsippet Norges forskningsråd går langt og har kontraktsfestet krav om avlevering for gjenbruk NSDs mandat. Lovverket legger til rette for oppbevaring og gjenbruk, bl.a. personopplysningsloven og helseforskningsloven En forskningsetisk forpliktelse? Ja, sier de nasjonale etiske retningslinjene for samfunnsvitenskap, humaniora, juss og teologi. Etterprøving og etterbruk av forskningsmateriale Forskningsmateriale bør gjøres tilgjengelig for andre forskere for etterprøving og etterbruk Data som er samlet inn for offentlige midler, skal etter en (kortere) periode gjøres allment tilgjengelig 13
Før mottak av data hvorfor arkiverer vi? Sikre lagring av forskningsdata i trygge omgivelser Oppfylling av samfunnsmessige forpliktelser Tillitt til forskningen Forskningens behov (Samfunns-)Økonomi Historisk dokumentasjon Kontroll og kvalitet Merverdi 14
Før mottak av data hva garanterer vi? Sikre lagring av forskningsdata i trygge omgivelser Evighetsperspektiv Politikk/forvaltning Del av nasjonal og internasjonal infrastruktur Verktøy for Forskningsrådet Teknikk/prosedyre Oppdaterte sikkerhetskopier Kompatibilitet Migrering av filformat Ikke påvirket av personellutskiftinger Konfidensialitet og integritet Compliance med gjeldene lov- og avtaleverk Internkontroll og informasjonssikkerhet 15
Før mottak av data hva garanterer vi? Sikre lagring av forskningsdata i trygge omgivelser Kvalitet i alle ledd Teknisk Administrativt Compliance Samarbeid Kommunikasjon 16
Før mottak av data hva arkiverer vi? Dette arkiverer vi: Alle typer elektroniske datafiler Video-filer Lydfiler Bildefiler Elektronisk registrert metadata Ikke-elektronisk registrerte navnelister, koblingsnøkler o.l. Dette arkiverer vi ikke: Data på papir Spørreskjemaer (papir) Utskrifter Foto (papir, lysbilder, film m.m.) Biologisk materiale o.l. 17
Før mottak av data hva trenger vi? Informasjon om vitenskapelig innhold og verdi Nok informasjon til at andre kan vurdere den vitenskapelige verdien av dataene Nok informasjon til å vite at dataene er samlet inn og kan lagres henhold til lovverk og vitenskapelige og etiske normer Metadata Beskrivende metadata: f.eks. hvem har samlet inn dataene, hva er det data om, når foregikk datainnsamlingen o.s.v. Strukturelle metadata: kodebok m.m. som trengs for å prosessere dataene Administrative metadata: informasjon som er nødvendig for å få tilgang til dataene 18
Mottak av data - sjekk Teknisk sjekk Format og lesbarhet Virus og annen skadelig programvare Sjekk av anonymitet Personidentifiserbare data (direkte) Pseudonyme data og personentydige krypterte data Avidentifiserte data (indirekte identifiserbare) Anonyme data 19
Lagring av data versjonskontroll Datasett - variant Endringer i data gir ulike varianter (enheter, variabler, verdikategorier) Originalfil er «variant 1» o.s.v. Dokumentasjon - utgave Endringer i dokumentasjon gir ny utgave Én variant av et datasett kan ha flere utgaver Alle datasett blir lagret, ingen slettes Alle prosesser fram til de ulike versjonene blir lagret Til en hver tids siste utgave og variant benyttes til bruk 20
Lagring av data format Nesstar (dersom mulig) Både data og metadata Sikrer kontinuerlig backup Sikrer framover- og bakover kompatibilitet Sikrer eksportmuligheter til «alle» kjente formater Sikrer mulighet for eksport til andre formater Gir ekstra funksjonalitet Nesstar er et programvaresystem for å publisere data på Web: Finne, bla i, visualisere and analysere data online Publisere ulike typer data, fra survey- data to mul;dimensjonale tabeller KompleE system for å organisere data og metadata 21
Lagring av data tilgang Data arkivert hos NSD kan publiseres på ulike måter: Fritt tilgjengelig med alle opplysninger. (f.eks ISSP og NSDs egne undersøkelser) Med metadata, spørsmålsformuleringer og frekvenser (f.eks SSBs undersøkelser) Med metadata og spørsmål uten frekvenser (noen data fra norske forskningsprosjekter) Bare med metadata (f.eks. kvalitative studier) 22
Lagring og bevaring - gjenbruk Data arkivert hos NSD skal i hovedsak være tilgjengelig for gjenbruk Forskere kan imidlertid reservere seg mot gjenbruk i et kortere eller lengre tidsrom (embargo) (En del av) de data som er benyeet her er hentet fra Database om miljøforsøk i kommunene, 1990. Data i anonymisert form er s;lt ;l disposisjon av Sissel Hovik, Norsk ins;tue for by- og regionforskning (NIBR) gjennom Norsk samfunnsvitenskapelig datatjeneste (NSD). Verken Sissel Hovik, Norsk ins;tue for by- og regionforskning (NIBR) eller NSD er ansvarlig for analysen av dataene, eller de tolkninger som er gjort her. NSD lagrer persondata for oppfølgingsundersøkelser (krever informert samtykke, meldinger, tillatelser etc) Data NSD ikke har eiendomsrett til (eller har avtale om) legges ikke ut fritt tilgjengelig, men kan utleveres til NSDs primærgruppe* mot søknad Utlevering og evnt. tilrettelegging (innenfor rimelighetens grenser) til NSDs primærgruppe er gratis *studenter/forskere 23
Lagring og bevaring - persondata NSD lagrer persondata Gjerne for oppfølgingsundersøkelser Krever informert samtykke eller dispensasjon fra taushetsplikten, og nødvendig melding eller konsesjon Dersom personopplysninger skal lagres etter prosjektslutt, må det opplyses om formålet for videre lagring (for eksempel oppfølgingsstudier), hvor lenge personopplysningene skal lagres og endelig tidspunkt for anonymisering eller sletting Anonymisere ikke slette NSD har spisskompetanse på forskning og personvern *studenter/forskere 24
Spredning tilgang og tilgjengelighet Gi merverdi (her tidsserier) Eks: Meningsmålinger Samle data innenfor ett område Eks: Utdanningsforskning Økt synlighet 25
Spredning verktøy og grensesnitt NSD gir on-line tilgang til data og/eller metadata i Nesstar 26
Oppsummert NSD er et dataarkiv ikke et deponi NSD arbeider for at data skal brukes og at data skal tilføres merverdi NSD arbeider i tråd med forskningspolitiske og - etiske retningslinjer, regelverk, samarbeid og, ikke minst, tillitt Forskningsdata er ikke en død materie, men er dynamiske NSD kan tilby arkivering av alle typer digitalt registrerte data 27
Nye arkiveringssider på vei http://www.nsd.uib.no/nsddata/arkivering/bo_index.html 28