Infrastruktur i samfunnsvitenskap - Om tilgang til registerdata for forskningsformål

Like dokumenter
Mikrodata til forskere - erfaringer og planer fra Norge

Eksamensoppgave for FINF 4001 Forvaltningsinformatikk Fredag Kl (6 timer)

Go to use the code /10/2016. En liten undersøkelse: Mobil/ nettbrett. INF1000/ INF1001: IT og samfunn.

INF1000: IT og samfunn. Uke 6, høst 2014 Siri Moe Jensen

BEHANDLING AV PERSONOPPLYSNINGER

Med forskningsbiobank forstås en samling humant biologisk materiale som anvendes eller skal anvendes til forskning.

Det juridiske rammeverket for helseregistre

Etikk- og personvernshensyn i brukerundersøkelser

Personvern og informasjonssikkerhet

Nye personvernregler

Regelrådets uttalelse. Om: Høring for NOU 2018:7 Ny lov om offisiell statistikk og Statistisk sentralbyrå Ansvarlig: Finansdepartementet

Juridisk regulering av helseregistre brukt til kvalitetssikring og forskningsformål

Rettslig regulering av helseregistre

NAV-evaluering. - behandling av personopplysninger. Voksenåsen, Oslo. Personvernombudet for forskning. 23.oktober 2007

Veiledningsdokument for håndtering av personopplysninger i Norge digitalt

Hvem skal få se pasientene i kortene? Hva veier tyngst av personvern og behovet for deling av medisinsk informasjon?

Innsyn i og håndtering av sensitiv personinformasjon. v/ Kirsti Torbjørnson og Gerd Smedsrud

Personopplysninger og opplæring i kriminalomsorgen

Tilgang til forskningsdata. Bjørn Henrichsen NSD Norsk senter for forskningsdata

Personvernperspektivet og oppbevaring av intervjumateriale

Retningslinjer for utlevering av data fra Kreftregisteret

Mandal kommunes styringssystem for informasjonssikkerhet Utkast, mars 2011

DEL I TILRÅDING ELLER KONSESJON?

Samfunnsnytte og belastninger for den registrerte

Personvernerklæring. Del 1. Personvern og datasikkerhet i Det frivillige Skyttervesen (DFS) Det frivillige Skyttervesen

Databehandleravtale etter personopplysningsloven

VEDLEGG TIL HOVEDAVTALE DATABEHANDLERAVTALE

Utfylt skjema sendes til personvernombudet for virksomheten. 1 INFORMASJON OM SØKEREN 2 PROSJEKTETS NAVN/TITTEL

Retningslinjer for utlevering av data fra Kreftregisteret

Helseforskningsloven - lovgivers intensjoner

DRI1010 Emnekode. Oppgave Kandidatnummer Dato

Prinsipper og nye metoder for formidling av statistikk

Ny personvernlov. Hilde Lange, personvernombud Troms fylkeskommune

Vedlegg C - Datahåndteringsplan

NINAs personverndokument

Særavtale om lønns- og personalregistre

GDPR Ny personvernforordning

Åpne data og juridiske problemstillinger

Høringsuttalelse: Ny lov om offisiell statistikk og Statistisk sentralbyrå

Personvern, offentlighet og utlevering fra matrikkelen. Bakgrunnen for kurset

Informasjon om bruk av personnummer i Cristin-systemet

RETNINGSLINJER FOR BEHANDLING AV SØKNADER OM FORSKNING I KRIMINALOMSORGEN

NORSK LOVTIDEND Avd. I Lover og sentrale forskrifter mv. Utgitt i henhold til lov 19. juni 1969 nr. 53.

Personvern i forskning

Informasjonssikkerhet Retningslinjer for behandling av personopplysninger og annen informasjon underlagt taushetsplikt

Er din bedrift klar for ny personopplysningslov?

Sikkerhetsmål og sikkerhetsstrategi Internkontrollinstruks for Frischsenteret

NORSK LOVTIDEND Avd. I Lover og sentrale forskrifter mv. Utgitt i henhold til lov 19. juni 1969 nr. 53.

Høringssvar fra Helsedirektoratet vedrørende NOU 2018:7 Ny lov om offisiell statistikk og Statistisk sentralbyrå

Helseforskningsloven - intensjon og utfordringer

Hvilken betydning har personvernforordningen på helseområdet

Lærerstudenter, forskning og bacheloroppgaven: Lærerstudenter som forskere?

Rettslig regulering av helseregistre. Dana Jaedicke juridisk rådgiver E-post:

Implementering av det nye personvernregelverket ved UiB

Helseforskningsrett med fokus på personvern

Det må etableres gode og fremtidsrettede helseregistre som gir formålstjenlig dokumentasjon til kvalitetsforbedrende arbeid og forskning.

Nødvendige godkjenningsinstanser

Hvilke krav stiller Folkehelseinstituttet ved søknad om data fra helseregistrene?

Prosedyre for personvern

Regelrådets uttalelse. Om: Høyring av forslag om endringar i reglane om informasjonshandsaminga i Skatteetaten Ansvarlig: Finansdepartementet

Registrering og overvåking i fiskeribransjen rettslig regulering og aktuelle problemstillinger

Notat. Høringsnotat om endringer i fagskoleloven. Bestemmelser om behandling av personopplysninger

Personopplysningsloven: Formål og grunnleggende begreper. DR1010 Personvern i offentlig forvaltning Vår 2011 Seniorrådgiver Mona Naomi Lintvedt, Difi

Tilbakemelding på melding om behandling av personopplysninger

Lagring av personopplysninger. Øyvind Eilertsen UNINETT CERT. SUHS-konferansen Informasjonssikkerhet Behandling av personopplysninger:

Høring av forslag til endringer i opplæringsloven og privatskoleloven

Her får du få svar på sentrale spørsmål knyttet til vurderingsarbeidet. Teksten er ikke uttømmende, men ment som en hjelp i arbeidet.

ET VERKTØY FOR FORSKNING

DET KONGELIGE KUNNSKAPSDEPARTEMENT JUSTISDFPARTENTfil. Vår ref /EMS. Vi viser til Justisdepartementets brev av 3. Juli d.å.

Veileder for behandling av personopplysninger og informasjonssikkerhet i idretten

Helse-og omsorgsdepartementet. Høring: Forslag til endringer i egenandelsregisterforskriften

Brukerinstruks Informasjonssikkerhet

Helsedatautvalget. Marta Ebbing, leder. HelseOmsorg21-rådet, 23. januar 2017

NORSK LOVTIDEND Avd. I Lover og sentrale forskrifter mv. Utgitt i henhold til lov 19. juni 1969 nr. 53.

Eks7. Pics. Adressater i henhold til liste. Helseforskningslovens virkeområde

Mal for Vedtekter for nasjonale medisinske kvalitetsregistre

Bestemmelse om utlevering av personopplysninger til forskning og gjennomføring av spørreundersøkelser

Etikk skal ikke være noe ved siden av -

Samle inn eller samhandle om statistiske data?

Policy for personvern

Planer og meldinger 2007/2. Statistisk sentralbyrå. Strategier 2007

Unødvendig, overdreven bruk av identifisering og biometri vil kunne skade vår sikkerhet og personvernet.

RSK 001 Standard for forvaltningsrevisjon

PERSONVERNERKLÆRING FOR KUNDER OG ANDRE (EKSTERN)

Hva betyr det for din virksomhet?

Personvernforordningen og utfordringer i dagens helsetjeneste

Forskrift om endring i Dødsårsaksregisterforskriften, Kreftregisterforskriften, Medisinsk fødselsregisterforskriften, SYSVAKregisterforskriften,

GDPR. General Data Protection Regulation Personvernforordningen, erstatning for personopplysningsloven - fra 2018

Retningslinjer for bruk av informasjonssystemer i Oppland fylkeskommune

Om personopplysningslovens btdi betydning for systemutvikling. Dag Wiese Schartum, Avdeling for forvaltningsinformatikk (AFIN), UiO

Personvernkrav ved behandling av kundeopplysninger utvalgte emner. Bård Soløy Ødegaard Juridisk rådgiver Datatilsynet

Er det mulig å kombinere personvern og god pasientservice? Jan Erik Myrvold, advokat og direktør i Kreditorforeningen Øst SA

Uttalelse om randomisert felteksperiment

Høringsuttalelse - Endringer i byggesaksforskriften Reglene om sentral godkjenning mv.

Rollen som databehandler innebærer at vi behandler opplysninger på oppdrag fra den ansvarlige virksomheten (itfag.no).

Spørsmål til Topplederforum

Personvern i offentlig forvaltning

OM PERSONVERN TRONDHEIM. Mai 2018

Lov om behandling av helseopplysninger ved ytelse av helsehjelp (pasientjournalloven)

8. Datagrunnlaget. Kåre Vassenden

Transkript:

Infrastruktur i samfunnsvitenskap - Om tilgang til registerdata for forskningsformål Torbjørn Hægeland og Paul Inge Severeide, Statistisk sentralbyrå, Norge Bakgrunn I desember 2002 oppnevnte Norges forskningsråd en utredningsgruppe for å kartlegge dagens infrastruktur når det gjelder registerdata til forskning, herunder rutiner og arbeids- og rollefordeling mellom FoU-miljøene, Statistisk sentralbyrå (SSB), Norsk samfunnsvitenskapelig datatjeneste (NSD) og Forskningsrådet, og videre vurdere forslag til tiltak som kan sikre en økt og mer kostnadseffektiv utnyttelse av registerdata i samfunnsvitenskapelig forskning. Bakgrunnen for dette initiativet fra Norges forskningsråd, var et ønske om å bidra til en bedret infrastruktur innen samfunnsvitenskapelig forskning, særlig når det gjelder tilgang til registerdata for forskningsformål. Utredningsgruppen hadde representanter fra forskningsmiljøene, SSB og NSD. Torbjørn Hægeland (SSB) ledet gruppen, som avga sin innstilling sommeren 2003. I statsbudsjettet for 2004 ble Forskningsrådet gitt en bevilgning til vitenskapelig utstyr hvor det var forutsatt at en del av bevilgningen skulle benyttes til infrastruktur for humanistisk og samfunnsvitenskapelig forskning. Som en oppfølging av utredningsgruppens forslag er det lagt opp til at 4 millioner kroner skal gå til tiltak for å bedre tilgangen til registerdata for forskningsformål. Det er oppnevnt et utvalg, igjen med representanter for forskningsmiljøene, SSB og NSD, for å prioritere bruken av disse midlene. Nedenfor vil vi kort oppsummere de viktigste punktene i utredningen samt redegjøre nærmere for planene for oppfølging slik de nå foreligger. Bakgrunnen for utredningen: En stadig mer dataintensiv samfunnsvitenskap 1 Databehovet og databruken er omfattende innenfor samfunnsvitenskapelig forskning. Dette gjelder både snever samfunnsvitenskapelig forskning og forskning i skjæringsfeltet mellom samfunnsvitenskap og andre fagfelt, for eksempel medisin. Samfunnsvitenskapene har i de senere tiårene blitt stadig mer dataintensive. Hånd i hånd med at tilgangen på datakraft og regnekapasitet har økt dramatisk, har det også vært en sterk vekst i mengden data som er potensielt tilgjengelige for analyse. Dette har flere forklaringer, men en viktig årsak er at man i økende grad har tatt i bruk registerdata i produksjonen av offisiell statistikk. Den underliggende årsaken er selvsagt at det potensielle datatilfanget i samfunnet nærmest har eksplodert, fordi den teknologiske utviklingen har ført til at kostnadene med å samle inn, registrere og lagre mange typer informasjon har blitt sterkt redusert. Dette har ført til at det 1 Deler av teksten i dette og følgende avsnitt er hentet fra utredningsgruppens rapport. Rapporten kan fås ved henvendelse til Torbjørn Hægeland (torbjorn.haegeland@ssb.no) 1

registreres informasjon i langt flere situasjoner enn før, og mengden informasjon som registreres i hver enkelt situasjon er langt større. Empirisk forskning innenfor økonomi og andre samfunnsfag har i stadig større grad orientert seg mot mikrodata, dvs. data for enkeltaktører som individer eller foretak. Slike data kan stamme fra utvalgsundersøkelser, eller være hentet fra statistiske eller administrative registre. Registerdata har den åpenbare fordelen at de gir et langt større datamateriale - ofte omfatter de praktisk talt hele den aktuelle populasjonen. I tillegg er kostnadene knyttet til innsamling av data for forskningsformål relativt lave, siden rådata i utgangspunktet foreligger, innsamlet for et annet formål. I de senere årene har det blitt mer og mer vanlig at data for vitenskapelig analyse er blitt til gjennom kobling av ulike registre. Dette åpner opp et vell av nye analysemuligheter. For det første gir det muligheter for samtidig å observere langt flere variable for samme enhet. For det andre gjør koblinger av registre for ulike årganger det mulig å følge enheter over tid, slik at man kan studere ulike typer forløp på rike og omfattende datasett. For det tredje gjør kobling av registre for ulike typer enheter, f.eks. personer og foretak det mulig å studere interaksjonen mellom disse. Bruk av registerdata i empirisk forskning vil kunne bidra til mer informerte svar på mange viktige samfunnsspørsmål, og øke den samfunnsmessige relevansen av slik forskning. I tillegg vil bruk av registerdata til forskning også ha gunstige tilbakevirkninger på statistikkproduksjonen, som ofte er den opprinnelige årsaken til at mange av disse datakildene eksisterer. I tillegg til at registerdata muliggjør analyser som kan gi bedre svar på mange viktige spørsmål, bidra til en mer informert samfunnsdebatt og være nyttige redskap i samfunnsplanleggingen, gir Norges og de andre nordiske lands nær unike posisjon i denne sammenheng nordiske forskere et konkurransefortrinn. Datarikdommen gjør det mulig å adressere spørsmål av internasjonal interesse på en mer adekvat måte på norske data enn på andre lands data. Dette øker muligheten for norske forskere for gjennomslag i anerkjente internasjonale tidsskrifter, og gjør norske forskere mer interessante som samarbeidspartnere for utenlandske toppforskere, noe som igjen virker stimulerende på kvaliteten på norsk forskning. Selv om bruk av registerdata i forskning åpner opp mange nye analysemuligheter, og gjennomsnittskostnadene ved å fremskaffe data gjennom registre er mye lavere enn andre former for datainnsamling (gitt at data allerede er innsamlet for et annet formål), er det imidlertid ikke kostnadsfritt å realisere det forskningspotensialet som eksistensen av slike data gir. Et viktig aspekt her er konfidensialitetshensyn. Samfunnets stadig økende kompleksitet og de stadig mer detaljerte spørsmål som myndigheter og andre ønsker at forskersamfunnet skal kunne gi svar på, gir en stadig økende etterspørsel etter detaljerte data. Den teknologiske utviklingen, med økt tilgang på datakraft og lagringskapasitet til stadig lavere priser, bidrar også sterkt til å øke etterspørselen. Å sikre tilgang til slike data samtidig som man ivaretar hensyn til personvern og konfidensialitet, krever betydelig ressursinnsats og gode rutiner både hos dem som leverer ut slike data og hos dem som bruker dataene til forskning. Kobling av ulike registre kan som nevnt resultere i data med et bredere sett av variable, men krever at det gjøres et arbeid for å kontrollere konsistensen mellom registrene. Dette kan ofte kreve betydelig innsats, bl.a. fordi registrene kan ha ulikt omfang, bruken av identifikasjonsnumre kan være inkonsistent mellom forskjellige registre, og registrene kan ha ulikt referansetidspunkt. I tillegg er det slik at mange av registrene er opprettet for rent administrative formål og ikke for produksjon av offisiell statistikk. Dette skaper ofte tilleggsutfordringer når dataene skal benyttes til forskningsformål. Videre er det slik at i mange anvendelser er gevinsten ved bruk av registerdata i forskning og analyse knyttet til at 2

man kan følge individer og foretak over tid. Dette krever en ressursinnsats i form av å etablere databaser med lange tidsserier av mikrodata. For enkeltforskere og forskningsmiljøer kan det være svake insentiver knyttet til arbeid med konsistenskontroll o.l. og med å etablere databaser. Dette er arbeid hvor gevinstene ikke høstes fullt ut før etter lang tid. Kompleksiteten i dette arbeidet, den langsiktige innsatsen som kreves av kompetent arbeidskraft, og databasers preg av å være et kollektivt gode, taler for at en vesentlig del av grunnlagsarbeidet knyttet til etablering av registerbaserte databaser for forskning sentraliseres. Videre er dokumentasjon av datakildene viktig. For å kunne utnytte forskningspotensialet i registerdata fullt ut, er det selvsagt nødvendig å vite hva slags datakilder som eksisterer og hva slags variable de inneholder. Det er klare fordeler knyttet til at slikt dokumentasjonsarbeid gjøres sentralt, og at dokumentasjonen er allment tilgjengelig. Utredningsgruppen påpeker at det er viktig å sikre seg at den innsikten man har skaffet seg gjennom arbeidet med registerdata blir utnyttet, slik at man kan høste størst mulig gevinst knyttet til bruk av registerdata til lavest mulig ressursbruk. Dette tilsier at det er nyttig å foreta en gjennomgang av dagens praksis knyttet til utlevering og bruk av registerdata, med henblikk på eventuelle forbedringsmuligheter. Selv om det har vært foretatt bevisste strategiske valg og gjort større satsinger underveis, er dagens praksis og infrastruktur rundt registerdata i forskning i noen grad et resultat av at veien blir til mens man går. Mye av dette fungerer godt, men det er også ting som kan gjøres annerledes og områder der det bør settes inn økte ressurser for å høste ytterligere gevinster. Tilgangen på registerdata i Norge Både den faktiske tilgangen på registerbasert informasjon til forskning og det fulle potensialet for slik tilgang er bedre i Norge og de andre nordiske land enn i de fleste andre land. En av hovedforklaringene til dette er trolig Statistisk sentralbyrås utstrakte bruk av administrative data i statistikkproduksjon. Et viktig mål for Statistisk sentralbyrå er å gjøre arbeidsbyrden for oppgavegiverne i forbindelse med produksjon av offisiell statistikk så liten som mulig. Et annet mål for myndighetene som helhet er at samme informasjon bare skal måtte gis til myndighetene en gang. Dette innebærer at hvis en person eller et foretak oppgir informasjon til skattemyndighetene, skal de slippe å måtte oppgi den samme informasjonen til andre offentlige myndigheter, herunder Statistisk sentralbyrå. I denne forbindelse har det vært en viktig strategi for Statistisk sentralbyrå å bruke informasjon fra administrative registre til å produsere offisiell statistikk. Gjennom statistikklovens 3-2, jf. 2-2, har SSB hjemmel for adgang til administrative datasystemer i statsforvaltningen og landsomfattende kommunale organisasjoner for å utnytte dem som grunnlag for produksjon av offisiell statistikk. Forvaltningsorganer plikter å informere Statistisk sentralbyrå om etablering eller endring av større administrative datasystemer, og om større statistiske undersøkelser som etaten skal gjennomføre. SSB har rett til å foreslå hvordan datasystemer og undersøkelser skal utformes for også å ivareta hensynet til produksjon av offisiell statistikk. Administrative registre representerer i dag en av de viktigste datakildene for produksjon av offisiell statistikk. Pr. i dag benyttes om lag 60 administrative registre som datakilder i produksjon av offisiell statistikk. I tillegg finnes det en rekke andre administrative registre som er meldt til Statistisk sentralbyrå i henhold til statistikkloven. I tillegg til de administrative registrene, som eies av de ulike offentlige etatene, finnes det en rekke statistiske registre, som eies av Statistisk sentralbyrå. Informasjonen i disse registrene er samlet inn av Statistisk sentralbyrå med hjemmel i statistikkloven. 2-2 i denne loven gir 3

hjemmel for å "pålegge enhver å gi de opplysninger som er nødvendige for utarbeidelse av offisiell statistikk, så langt lovbestemt taushetsplikt ikke er til hinder for dette". Det finnes tre basisregistre som definerer og identifiserer de grunnleggende statistiske enheter: Det sentrale folkeregisteret i Skattedirektoratet (personer og familier) Enhetsregisteret i Brønnøysund/Bedrifts- og foretaksregisteret i Statistisk sentralbyrå (juridiske enheter/foretak og bedrifter) Registeret over grunneiendommer, adresser og bygninger (GAB) i Statens kartverk De fleste administrative registre som benyttes av Statistisk sentralbyrå i produksjon av offisiell statistikk, benytter de identifikasjonsnumrene som de er gitt i de tre basisregistrene. På et økende antall områder produseres det også statistikk som er basert på kobling av administrative registre. I arbeidet med å basere mer og mer offisiell statistikk på koblet registerinformasjon, er det av stor viktighet at statistiske enheter, klassifikasjoner og standarder er integrert i administrative rutiner, både hos myndigheter og foretak. Utlevering av data til forskere: Lover og regelverk Lovgivning knyttet til konfidensialitet og beskyttelse av personlig integritet er et viktig rammevilkår for muligheten til å gi tilgang til mikrodata for forskere. Viktige lover i dette tilfellet er Statistikkloven og Personopplysningsloven. Generelt gjelder et prinsipp om at data som er samlet inn med det formål å produsere offisiell statistikk, enten de er samlet inn ved bruk av lovhjemmel eller er gitt frivillig, bare kan benyttes til å produsere statistikk. Unntak kan gjøres for å gi tilgang til dataene for planleggings- og forskningsformål, så lenge dette ikke er uforenlig med det formålet dataene opprinnelig ble samlet inn for. I dette avsnittet gjør vi nærmere rede for sentrale bestemmelser. Personopplysningsloven danner et generelt grunnlag for behandling av personopplysninger i Norge. Generelt ( 8) gjelder at personopplysninger bare kan behandles dersom den registrerte har gitt samtykke til det, det er hjemlet i lov, eller behandlingen er nødvendig for ulike formål. Ett slikt formål loven nevner er "å utføre en oppgave av allmenn interesse". Det er denne formuleringen som sikrer en generell adgang til utlevering av personopplysninger til forskningsformål. For sensitive personopplysninger gjelder noe strengere vilkår ( 9). Det gis adgang til behandling av sensitive personopplysninger dersom "behandlingen er nødvendig for historiske, statistiske eller vitenskapelige formål, og samfunnets interesse i at behandlingen finner sted klart overstiger ulempene den kan medføre til den enkelte". Med sensitive personopplysninger menes informasjon om ( 2 nr 8), (i) rasemessig eller etnisk bakgrunn, eller religiøs, politisk eller filosofisk oppfatning, (ii) at en person har vært mistenkt, tiltalt eller dømt for en straffbar handling, (iii) helseforhold, (iv) seksuelle forhold, (v) medlemskap i fagforeninger. I tillegg ( 11) gjelder det blant annet at bruken av opplysningene ikke må være uforenlig med det opprinnelige formålet med innsamlingen av dataene. Statistikkovens 2-5 regulerer bruk av innsamlede opplysninger: "Opplysninger hentet inn etter fastsatt opplysningsplikt, eller som er gitt frivillig, kan bare nyttes ved utarbeiding av offisiell statistikk, eller til annen bruk som er godkjent av Datatilsynet og som ikke er til skade for rikets sikkerhet." Ved utlevering gjelder taushetsplikten etter 2-4 også mottakeren av opplysningene. Det er også hjemmel for å stille vilkår om bruken av opplysningene og om hvem som skal ha tilgang til opplysningene. Generelt gjelder følgende klassifisering av personopplysninger i registre: 4

Identifiserbare: Registeret inneholder opplysninger som entydig og direkte knytter informasjon til enkeltpersoner, slik som navn eller fødselsnummer. Avidentifiserte: Den direkte personidentifikasjonen er fjernet eller kryptert, men det er likevel mulig å identifisere enkeltpersoner via andre variable, eventuelt i kombinasjon med andre kilder man har tilgang til. Anonymiserte: Det er i praksis umulig å knytte opplysninger i registeret til enkeltpersoner. For å avgjøre om opplysningene er anonymisert, må man ta i betraktning alle de hjelpemidler som med rimelighet kan anvendes for å identifisere enkeltpersoner, enten av de som har tilgang til dataene eller enhver annen. Dette innebærer ofte at mye informasjon må fjernes fra registeret for at opplysninger skal kunne klassifiseres som anonymiserte. Anonymiserte opplysninger regnes ikke som personopplysninger, og Datatilsynet legger ikke direkte begrensninger på utlevering av slike. Datatilsynet tillater at personopplysninger som er hentet inn i henhold til pålagt oppgaveplikt hjemlet i statistikkloven eller er hentet fra administrative registre, kan utleveres til forskning og offentlig planlegging dersom følgende vilkår er oppfylt: (i)mottaker har nødvendig konsesjon fra Datatilsynet. (ii) Opplysningene avidentifiseres i den grad formålet tillater. (iii) Hvis opplysningene er hentet fra andre offentlige organer (dvs. administrative registre), og det er tvil om utlevering bør finne sted, skal Statistisk sentralbyrå forelegge utleveringsspørsmålet for det avgivende organ. (iv) Hvis opplysningene er underlagt taushetsplikt utover statistikkloven, må mottaker innhente dispensasjon fra taushetsplikten. Hvis personopplysninger er innhentet på frivillig grunnlag, må den registrerte i tillegg særskilt ha samtykket i utleveringen. Utlevering til forskningsformål kan bare skje til forskningsinstitutter eller forskere med forskningskompetanse (doktorgrad eller tilsvarende). Hovedfagsstudenter kan også få utlevert data, dersom disse er under veiledning av en forsker med forskningskompetanse. Det er videre et generelt krav til bruk av personopplysninger (jf. personopplysningslovens 11) at behandling av opplysninger ikke må være uforenlig med formålet opplysningene opprinnelig ble samlet inn for. Dette setter begrensninger for hva slags opplysninger som kan utleveres til hvilke formål. For behandling av helseopplysninger, dvs. taushetsbelagte opplysninger om helseforhold og andre opplysninger om eller vurderinger av helseforhold, gjelder i tillegg helseregisterloven. Denne loven stiller blant annet strengere krav til behandling og utlevering av data. Når det gjelder utlevering av data til utlandet, er dagens regelverk og praksis mer restriktiv. Det er bare anonymiserte data som kan utleveres, og bare til forskningsinstitutter eller forskere med formell forskningskompetanse. Hva slags infrastruktur trenger vi? Utredningsgruppens presenterer forslag til hvordan infrastrukturen kan forbedres for å ivareta fremtidens databehov for forskere på en best mulig måte innenfor en forsvarlig ressursramme. Selv om den kommer med forslag til endringer i forhold til dagens situasjon, påpekes det at forholdene for forskning på registerdata i Norge i utgangspunktet er gode, gjennom lover og regelverk som tar hensyn til forskningens interesser samtidig som viktige bibetingelser knyttet til personvern og datasikkerhet er oppfylt, og gjennom at Statistisk sentralbyrå, Norges forskningsråd og andre er velvillig innstilt overfor forskeres databehov, noe som blant annet har gitt seg utslag i bevilgninger til satsninger innenfor feltet. I internasjonal sammenheng gir den gode tilgangen på registerdata norske forskere et klart 5

komparativt fortrinn. Det er likevel klare forbedringsmuligheter, som gruppen mener kan gjennomføres innenfor en forsvarlig ressursramme, og som kan bidra til ytterligere å styrke samfunnsvitenskapelig og annen forskning i Norge basert på registerdata. Gruppen mener at det bør legges inn mer ressurser til tiltrettelegging av data, til dokumentasjon og til dataservice for ytterligere å forbedre forskningsmiljøenes tilgang til data. Forslagene forutsetter at det eksisterende serviceapparat videreføres på samme måte som i dag. Det er utredningsgruppens oppfatning at det ligger et stort forbedringspotensial innenfor utlevering av avidentifiserte data, dvs. data hvor Statistisk sentralbyrå i hovedsak står for den direkte utleveringen til forskning. I hovedsak kan gruppens forslag kort oppsummeres slik: Det bør settes av øremerkede ressurser knyttet til betjening av forskeres databehov i vid forstand. At infrastrukturen knyttet til registerdata til forskning i dag fremstår som noe mangelfull, er trolig et resultat av en mangel på øremerkede bevilgninger. Det bør bygges opp en infrastruktur i Statistisk sentralbyrå som sikrer effektive rutiner for bestilling og utlevering av data samt for tilbakemelding om erfaringer ved bruk av data. Videre bør informasjon om hva slags data som faktisk finnes gjøres lettere tilgjengelig. Arbeid med konsistenskontroll og kartlegging av feilkilder i mye brukte registre bør intensiveres. Det bør allokeres mer ressurser til dokumentasjon som er hensiktsmessig for forskningsformål. Prisstrukturen for tilgang til data bør endres. Tilgang til registerdata bør i utgangspunktet være gratis, men Statistisk sentralbyrå bør kunne kreve betaling av forskningsmiljøer hvis en dataleveranse innebærer stor grad av koblinger av registre utover et definert sett av standardregistre. Selv om størstedelen av gruppens forslag knytter seg til aktiviteter som vil medføre økt arbeidsmengde for Statistisk sentralbyrå, vil forslagene og den økte bruken av registerdata til forskning som vi håper vil følge implementeringen av dem, også medføre en økt arbeidsmengde for NSD på flere områder. Økt tilgjengelighet, bedre dokumentasjon og bedre konsistens på tvers av registre vil trolig øke etterspørselen etter data gjennom NSD. Økt generell etterspørsel etter mikrodata vil også medføre økt arbeid for NSD knyttet til personvernspørsmål gjennom rollen som personvernombud for universitets- og høyskolesektoren og helsesektoren. Videre har NSD en viktig rolle når det gjelder å informere om tilgjengelige datakilder. Utredningsgruppen påpeker at både i oppbyggingen og implementeringsfasen av en forbedret infrastruktur, og i en normal driftsfase, er det viktig med korte kommunikasjonslinjer mellom forskere og de som eier registrene eller disponerer dem for produksjon av statistikk for å sikre en tett interaksjon som utnytter alle parters kompetanse. Dette er spesielt viktig når databehovene til forskerne er kompliserte i form av at de innebærer koblinger av mange ulike registre mv. Utredningsgruppen konkretiserer sine forslag i forhold til følgende seks "kjennetegn ved en god infrastruktur" 1. Det må være kjent hva slags datakilder som eksisterer og er tilgjengelige for forskning, og det må være kjent hva de ulike datakildene inneholder. 2. Datakildene må være standardisert når det gjelder identifikasjon av viktige enheter og det må være mulig å koble dem. 3. Det må være effektive bestillings- og utleveringsrutiner som sikrer at tilgjengeligheten av data til forskere er så rask som mulig, samtidig som hensynet til registereiere og personvern ivaretas på en forsvarlig måte. 4. Data bør som hovedregel være gratis. 5. Det må dokumenteres hva slags data som er levert ut til hvem. 6

6. Det må være gode rutiner for tilbakemelding om bruk av og erfaringer med utleverte data. Oppfølging av forslagene i utredningen: Prioritering og konkretisering Utredningsgruppens forslag er på noen punkter ikke helt konkrete. Den totale rammen for forslagene overstiger også de midlene som pr. i dag et stilt til rådighet. Det er derfor nødvendig med konkretiseringer og prioriteringer. Dette arbeidet er ennå ikke helt avsluttet, men man vil konsentrere seg om følgende satsningsområder. Informasjon om datakildene En fundamental forutsetning for at en datakilde skal kunne tas i bruk for forskningsformål, er at forskerne er kjent med at den eksisterer. Både utredningen og signaler fra forskerne peker i retning av at denne forutsetningen ikke er fullt ut oppfylt i dag. Samtidig understrekes det at dette har høy prioritet blant ønskene om bedre infrastruktur. I utredningen er det foreslått to "typer" informasjon: (i) En oversikt over datakilder. En dokumentasjon som gir oversikt over aktuelle datakilder, og som gir kort informasjon over karakteristika ved datakilder som har relevans for dens anvendelighet i forskningssammenheng. (ii) Detaljert dokumentasjon av registerbaserte datakilder. Mer detaljert dokumentasjon av de enkelte datakilder med beskrivelse av den enkelte variabel, definisjoner, innsamlingsmetoder, pålitelighet, frafall, osv. Punkt (i) vil følges opp på bred basis, mens man under punkt (ii) vil lage detaljerte dokumentasjoner av sentrale registre. Malen for dokumentasjonen utarbeides av SSBs relevante fagseksjoner. De kan se på muligheten for å gjenbruke dokumentasjon som allerede er i systemet. Utfordringen blir å redigere dette på en hensiktsmessig form tilpasset forskernes behov. Dokumentasjonen bør dekke både en tekniske beskrivelse av dataelementene og hvordan forskere og studenter får tilgang og hvordan data brukes. Konsistens og kvalitetskontroll ved kobling av administrative registre. I utredningen påpekes det at SSB i liten grad gjør konsistenskontroll av mikrodata "på tvers av registre" før dataene kommer til forskeren. Det bør derfor etableres prosjekter knyttet til utvidet konsistenskontroll, kvalitetsjekk og samordning på områder hvor forskningen har særlige behov. SSB gjennomfører allerede en del konsistenskontroller av mikrodata på tvers av fagområdene knyttet til den ordinære statistikkproduksjon. En utvidet konsistenskontroll på områder forskningen har særlige behov, må gjøres i tett samarbeid med forskningsmiljøer. Normalt vil dette knyttes til konkrete forskningsoppdrag. Utvalget foreslår imidlertid at dette gjøres uavhengig av konkrete oppdrag og knyttes til settet med "basisregistre". SSB vil ta kontakt med aktuelle forskningsmiljøer og finner fram til "områder" hvor skoen trykker mest i forhold til konsistens, kvalitet og samordning. Innenfor rammene av årets bevilgning settes det i gang ett prosjekt. Erfaringene fra dette prosjektet vil gi føringer for eventuelt videre arbeid på dette området. Prosjektet ledes av SSB. Den viktigste kontrollen ligger i forskernes bruk av data. Tilbakemeldinger fra forskere er derfor helt nødvendig i denne sammenheng. Man må derfor ha et opplegg som fanger opp og er i stand til å gjøre 7

bruk av slik informasjon fra forskningsmiljøene. Det vil antakelig være ulike oppfatninger forskere imellom om hvor mye konsistensretting SSB skal utføre på forhånd. Styrking av service overfor forskere Bedre tilgang til et bredere datatilbud vil kreve en styrking av service overfor forskere som henvender seg til SSB eller NSD med forespørsel om utlevering av data. Utredningsgruppens forslag på dette punktet og for så vidt de øvrige punktene, må sees i sammenheng med forslaget om at tilgang til data og koblinger fra settet med basisregistre i hovedsak bør være gratis for forskere. En slik policy vil kreve en permanent grunnbevilgning til SSB som dekker de marginalkostnadene SSB har for å utføre oppdragene samt midler til NSD for å finansiere økningen i forskningsmiljøenes servicebehov. Det er vanskelig å fastsette hvor stor denne grunnbevilgningen må være. Det er derfor behov for en grundigere gjennomgang for å fastslå dette mer sikkert Kontinuerlig beredskap på et sett av basisregistre. Etter hvert avtegner det seg klare mønstre av hvilke registre og hva slags koblinger som er mest etterspurt av forskningsmiljøene. I første omgang bør man konsentrere seg om et mindre antall registre med antatt stor forskningsmessig verdi. Disse registrene må dokumenteres grundig, og det må være lett tilgang til personale som har særlig god kjennskap til innhold, informasjonsverdi, kvalitet og dokumentasjon av disse registrene. Til denne funksjonen må det også tillegges særlig kompetanse knyttet til forskningens behov for datatilrettelegging og eventuelle metodiske utfordringer. Det bør derfor defineres et sett av basisregistre og - koblinger hvor SSB har en kontinuerlig beredskap. Disse "registrene" bør være kontinuerlig oppdatert uavhengig av konkrete bestillinger. Dette vil medføre ekstra arbeid i første omgang, men kan gi betydelige effektiviserings- og samordningsgevinster på sikt ved at marginalkostnadene knyttet til enkeltbestillinger blir lavere. SSB har erfaringer med flere slike koblinger (f.eks. flyttehistoriefilen). Erfaringene viser at etableringsfasen kan være relativ kostbar, men dersom en får etablert effektive oppdaterings- rutiner vil arbeidet med å holde koblingssystemet oppdatert normalt være på et rimelig nivå. Arkivering av data som utleveres til forskere. Et viktig vitenskapelig kriterium er at forskningsresultater skal være etterprøvbare. For at det skal være mulig, må de data som har vært benyttet i en analyse kunne bli gjort tilgjengelig for andre. Videre er det viktig å sikre mulighetene til gjenbruk av data. Utredningsgruppen foreslår derfor at det bør etableres en ordning med arkivering av data som utleveres til forskere fra SSB. Det eksisterer allerede noen rutiner i SSB på lagring av data som utleveres til forskere. Det er imidlertid ikke noe systematisk opplegg for dette. NSD har en ordning med arkivering av data som SSB vil se nærmere på.. Det bør lages en dokumentasjon av hvert større forskeroppdrag som også bør ligge lagret i NSD. Dette punktet må drøftes av SSB og NSD med sikte på å komme fram til det beste opplegget både økonomisk og faglig. 8

Rutiner for tilbakemelding om erfaringer med bruk av data. Utredningsgruppen mener det bør etableres faste rutiner for tilbakemelding fra forskere når det gjelder hva data har blitt brukt til, og hva slags erfaringer man har med ulike registre og enkeltvariable. Dette bør være integrert i utleveringsprosedyrene fra SSB. Det finnes foreløpig ikke noe systematisk opplegg for dette i SSB. Her har NSD kommet lenger og har etablert en ordning med faste tilbakemeldinger fra forskere på data som utleveres. Siden NSD har lang erfaring med denne typen tilbakemeldinger bør arbeidet gjøres i tett samarbeid mellom SSB og NSD. 9