Dokumentasjon av vitenskapelige publikasjoner

Like dokumenter
Dokumentasjon av vitenskapelige publikasjoner

Kravspesifikasjon for teknisk system i forbindelse med autoritetsregistere for formidling og bibliografiske referanser tilknyttet formidling

Database for statistikk om høgre utdanning. Benedicte Løseth. CRIStin-seminar Oslo, 12. oktober 2010

Til BIBSYS-bibliotekene. Deres ref.: Vår ref.: 2007/14809 Dato: POSTADRESSE: 7491 Trondheim. BESØKSADRESSE: Abelsgt.

Vitenskapelig publisering

Årets NVI-rapportering: frister og rapporteringsinstruksen. Oppstartsseminar for NVI-rapportering Agnethe Sidselrud Nestleder

Ingerid Arbo, forskningskoordinator og forsker St. Olavs hospital / forsker NTNU CRIStin superbruker St. Olavs hospital

Felles CRIStin møte ved NMBU Lisbeth Eriksen og Hilde M. Triseth NMBU Universitetsbiblioteket

Bibliografiske datakjelder i ITAR Bjug Bøyum Norsk samfunnsvitenskapelig datatjeneste AS STYREMØTE 18. JUNI Bokprosjektet

Validering av publikasjoner som rapporteres til Departementet

Høring: Forslag om en felles database for vitenskapelig publisering Norsk vitenskapsindeks (NVI)

NVI-rapportering av 2013-publikasjoner: Frister og felles rapporteringsinstruks

Norart fra allmenn informasjon til vitenskapsindeksering

Gunnar Sivertsen. Bibliografiske datakilder til dokumentasjon av vitenskapelige publikasjoner. NIFU skriftserie nr. 22/2003

Høring av forslag til lov om rapportering til database for vitenskapelig publisering

Høringsuttalelse - Forslag om en felles database for vitenskapelig publisering - Norsk Vitenskapsindeks (NVI)

Rapportering og videre arbeid. Grete Christina Lingjærde Fung. daglig leder Cristin

Rapporteringsinstruks for 2015-publikasjoner frister, presiseringer og endringer

Om NVI-rapportering. Marit Henningsen Rapporteringsworkshop for superbrukere, Gardermoen, 7. februar 2014

Universitets- og høgskolesektorens dokumentasjonssystem for vitenskapelig publisering

Den norske publiseringsindikatoren og nominering til nivå 2

Åpen tilgang, digitalisering og delingsøkonomiens utfordringer

INCENTIVER FOR FORSKNING OG PUBLISERING VEILEDNING

Cristin, NVI, NORA og Open Access

Rapportering av 2017-publikasjoner til Norsk vitenskapsindeks (NVI) i Cristin

Kriterier, holdepunkter og gråsoner i forbindelse med ulike typer bøker og bokartikler som forskere kan være forfattere av

Forskningsdokumentasjon nominering til nivå 2 Nasjonalt råd for teknologisk utdanning.

Current Research Information System In Norway. Asgeir Fløtre Hamar, 19. mars 2010

Fordeling av forskningsmidler ut fra publikasjoner fra forskningspolitisk idé til operasjonell modell

Referat fra møte i Publiseringsutvalget 12. mars 2007

Referat fra møte i Publiseringsutvalget 24. mai 2007

Forskningsrådets prinsipper for åpen tilgang til vitenskaplig publisering

NVI-rapportering av 2018-publikasjoner. Marit Henningsen, Unit Oppstartseminaret 15. oktober 2018

Norsk vitenskapsindeks

Nasjonale retningslinjer for åpen tilgang til vitenskapelige artikler - status

Publiseringsprosessen

Publiseringsstatistikk for HSN Vitenskapelig publisering

Dokumentasjon av vitenskapelig publisering

SAK 14/18 VEDLEGG A SATSINGSFORSLAG 2020

BIBSYS Brage et system for åpne arkiv

Open Access fordi informasjon og kunnskap bør være fritt tilgjengelig. Seminar Forskerforbundet 2 desember 2014

Norske vitenskapelige artikler og institusjonsarkiv

Nasjonale retningslinjer: Åpen tilgang til forskning - et krav for finansiering? Oddrun Samdal Viserektor for utdanning

Kurstilbud fra Universitetsbiblioteket

Videreutvikling av CRIStin

Rapporteringsinstruks for 2016-publikasjoner frister, presiseringer og endringer

Åpen tilgang til vitenskapelig publisering

Publiseringsstatistikk for Universitetet i Sørøst-Norge

Planer og meldinger 2007/2. Statistisk sentralbyrå. Strategier 2007

Universitetsbiblioteket i Bergens strategi

Framdriftsrapport Norges forskningsråd > Mitt nettsted

Felles publisering HiB og UiB

BIRD - Administrasjon av forskningsdata (Ref #2219b941)

Åpen eller lukket publisering hvordan velge tidsskrift

UNIVERSITETS BIBLIOTEKET I BERGEN

Evaluering av den norske publiseringsindikatoren. Surveyundersøkelsen blant forskere i universitetsog høgskolesektoren - Tabelsamling

Finansieringssystem for det nye universitetet mandat for ekspertgruppe

Nasjonale indikatorer for UHbibliotek

Open Access i Norge. Det 72. norske bibliotekmøte Hamar, 18. mars 2010

Kvalitetskontroll av tidsskrifter i kanalregisteret

Kunnskapsdepartementets tjenesteorgan

Fakultet for teknologi, naturvitenskap og maritime fag (TNM)

publiseringsutvalg Introduksjonsseminar Cristin 12. oktober 2010 Øyvind Nystøl

Regelrådets uttalelse. Om: Høring for NOU 2018:7 Ny lov om offisiell statistikk og Statistisk sentralbyrå Ansvarlig: Finansdepartementet

FoU-undersøkelsen 2015 UoH-sektoren

Norart + bokanalytter = Sant (Ref #6c39db40)

Budsjettfordelingsmodell for Høgskolen i Telemark

Utvikling av norsk medisinsk-odontologisk forskning sett i forhold til andre land -Publiserings- og siteringsindikatorer

Vår Grunnkurs i Frida ved Universitetet i Tromsø

Sluttrapport Norges forskningsråd > Mitt nettsted

Betydelig økning i FoU-innsatsen i 2007

CRIStin og ORCID. KORG-dagene Lars Wenaas, Nina Karlstrøm CRIStin Kontakt: Mai 2016

Handelshøyskolen (HH)

Rapportering på indikatorer

Arbeidsplan for UHRs forskningsutvalg 2012

Nasjonalt vitenarkiv. Per Hovde, strategirådgiver Unit

Høring av Sammen om Kunnskap II Operasjonalisering av indikatorer for formidling

Valg av variabler og design

Vitenskapelige publikasjoner Definisjon og avgrensning ved registrering og kvalitetssikring av referanser

Fakultet for teknologi, naturvitenskap og maritime fag

Referat fra møte i Publiseringsutvalget 3. april 2006

Anbefalinger om videreutvikling av Oppgaveregistret

God datakvalitet. Strategi og handlingsplan Gardermoen,

Gjeldende bestemmelser og endringsforslag i studiekvalitetsforskriften

Fagfeltnøytralitet. Om endringen av publiseringsindikatoren fra og med budsjettene for 2017

Publiseringsutvalget. Referat

Nordic Open Access Scholarly Publishing

Presentasjon på VRIs U&H-samling 24. mai Magnus Gulbrandsen Senter for teknologi, innovasjon og kultur, UiO

Kunnskapsdepartementet august 2017 nasjonale mål og retningslinjer for åpen tilgang til vitenskapelige artikler

Personvernerklæring for Cristin (Current Research Information System in Norway)

Høring av NOU 2014:5 MOOC til Norge - Nye digitale læringsformer i høyere utdanning

Referat fra møte i Publiseringsutvalget 14. september 2009

Handelshøyskolen. Vedlegg 1. Publiseringsstatistikk for HSN Vitenskapelig publisering Høgskolen i Sørøst-Norge Biblioteket

Superbrukeren. Rapportering av vitenskapelige bokutgivelser

Høring: Nasjonale retningslinjer for åpen tilgang til forskningsresultater

Forskningsstrategi for Diakonhjemmet Sykehus

Bruk av. å fremme e forskningen ved IMT

Nasjonalt kvalifikasjonsrammeverk - høringssvar

Transkript:

Dokumentasjon av vitenskapelige publikasjoner Opprettelse av nasjonale registre for publiseringskanaler, forfattere og institusjoner Innstilling fra arbeidsgruppe nedsatt av Universitets- og høgskolerådet Oslo 1. juli 2003

Innhold SAMMENDRAG... 3 1 FORSKNINGSDOKUMENTASJONSSYSTEMER... 5 1.1 NASJONALE BEHOV FOR FORSKNINGSDOKUMENTASJON... 5 1.2 NÅVÆRENDE SYSTEM FOR DOKUMENTASJON... 5 1.3 BEHOV FOR NYTT SYSTEM FOR DOKUMENTASJON... 6 1.4 UTDANNINGS- OG FORSKNINGSDEPARTEMENTETS OPPDRAG... 7 1.5 MANDAT OG MÅLSETTINGER... 7 2 AUTORITETSREGISTRE OPPBYGGING OG FUNKSJONER... 10 2.1 DEFINISJON... 10 2.2 OPPBYGGING, VIRKEMÅTE OG DATAFLYT... 12 2.3 KRAV TIL AUTORITETSREGISTRE... 14 2.4 TYPER INFORMASJON OG REGISTRE... 16 2.5 RESSURSBEHOV... 16 3 VITENSKAPELIG PUBLISERING... 18 3.1 VITENSKAPELIG PUBLIKASJON DEFINISJON... 18 3.1.1 Forskjellige publiseringstradisjoner mellom fag... 19 3.2 FORHOLDET TIL FORMIDLING OG ANDRE OPPGAVER... 20 3.3 TRADISJONELLE OG NYE, SPESIELT ELEKTRONISKE, PUBLISERINGSKANALER... 20 4 AUTORITETSREGISTRE TIL BRUK VED VITENSKAPELIG PUBLISERING.. 23 4.1 AUTORITETSREGISTRE FOR PUBLISERINGSKANALER OG PUBLIKASJONSFORMER... 23 4.1.1 Innhenting av data... 23 4.1.2 Tidsskrifter og serier... 24 4.1.3 Forlag og andre utgivere... 26 4.1.4 Publiseringsformer og nivå... 27 4.1.5 Rutiner for publikasjonsregistre ved ny enhet... 28 4.2 AUTORITETSREGISTRE FOR INSTITUSJONER OG PERSONER... 29 4.2.1 Institusjonsregistre... 30 4.2.2 Rutiner for institusjonsregistre... 32 4.2.3 Personregistre... 33 4.2.4 Rutiner for personregistre... 33 4.2.5 Sammenkobling mellom person og institusjon... 34 5 VITENSKAPSDISIPLINER... 35 6 OPPRETTELSE AV NASJONALE ANSVARSSTEDER... 36 6.1 GENERELLE KRITERIER... 36 6.2 PUBLIKASJONSREGISTRE; RESSURSBEHOV... 36 6.3 ADMINISTRATIVE AUTORITETSREGISTRE; RESSURSBEHOV... 37 6.4 OPPSUMMERING FOR ØKONOMISK VURDERING... 37 7 OPPBYGGING AV REGISTRE, VIDERE ARBEID... 39 7.1 FORSLAG TIL VIDERE ARBEID... 40 7.1.1 Tekniske kravspesifikasjoner... 40 7.1.2 Registre for publiseringskanaler og publikasjonsformer... 40 1

7.1.3 Registre for institusjoner og ansatte... 40 7.1.4 Kunstnerisk virksomhet... 41 7.1.5 Andre indikatorer... 41 VEDLEGG... 43-1 FORKORTELSER... 44-2 INSTITUSJONENES DOKUMENTASJONSBEHOV... 45-3 AUTORITETSREGISTRE AKTØRER OG OPPGAVER... 47-4 AUTORITETSREGISTER FOR PERIODIKA OG SERIER (ISSN) OG BOKPUBLIKASJONER (ISBN)... 55-5 DEKNING AV OG REGISTER FOR RAPPORTERTE PUBLISERINGSKANALER... 60-6 EKSEMPEL PÅ IMPORT OG REGISTRERING AV REFERANSE FRA ISI... 62-7 ARTIKKELTYPER KATEGORIER... 66-8 EKSISTERENDE TJENESTER OG RESSURSER... 68 2

Sammendrag Arbeidsgruppen ble nedsatt av Universitets- og høgskolerådet (UHR) på oppdrag initiert av Utdannings- og forskningsdepartementet (UFD). Mandatet var å utarbeide autoritetsregistre for registrering av vitenskapelige publikasjoner foreslå rutiner og ressursbehov for kontinuerlig oppdatering og vedlikehold av registrene Med bakgrunn i de forskjellige forskningsdokumentasjonssystemer som finnes i dag, har arbeidsgruppen gitt kriterier for autoritetsregistre og foreslår at det opprettes nasjonale registre både for administrative forhold, dvs. institusjoner og personale, og for vitenskapelige publiseringskanaler og publikasjonsformer. Arbeidsgruppen har ikke selv kunnet lage disse registrene innen de tidsrammer som var til disposisjon. Registrene er teknisk-administrative, og i seg selv ikke tilstrekkelige for direkte bruk i den nye finansieringsmodellen fra UFD. Vitenskapelig publikasjon. Arbeidsgruppen gir definisjon på en vitenskapelig publikasjon og gir rammene for slike i forhold til formidling og andre oppgaver. Arbeidsgruppen omtaler de nye elektroniske publiseringskanaler. De samme kriterier må legges til grunn for disse som for tradisjonelle kanaler for å bli definert som vitenskapelig. Autoritetsregistre for vitenskapelig publikasjoner kan ikke bygge på egenrapporteringens usikkerheter, men må bygge på informasjon fra bibliometriske datakilder registret ved ISSNnummer for tidsskrifter og serier, og ISBN-nummer for bøker og andre enkeltutgivelser. Registrene bør omfatte de publiseringskanaler norske forskere faktisk bruker. Egenrapportering kan derved reduseres til ca. 5 prosent og blir derfor et supplement og fungerer som introduksjon for nye publiseringskanaler. Arbeidsgruppen foreslår at data om tidsskrifter og serier innhentes fra ISI (Institute for Scientific Information), Norart og nordiske tidsskrifter. Arbeidsgruppen ber UFD ta initiativ til at det startes indeksering av data ved Norart og for nordiske tidsskrifter. Arbeidsgruppen henviser her også til det arbeid UFD får utført fra NIFU, om utarbeiding av en enhet eller organ som vil være ansvarshavende for et nasjonalt publikasjonsregister. Autoritetsregistre for administrative forhold bygges på de oppsatte kriterier og det arbeid som foregår for et felles system for universitetene, og det foreslås at dette samordnes med høgskolesektorens registre til felles nasjonale registre. Vitenskapsdisipliner. Arbeidsgruppen har vist til at tverrfagligheten i de fleste publiseringskanaler, gjør det vanskelig å knytte den enkelte publikasjon til en fagdisiplin. Arbeidsgruppen har ikke utarbeidet selve registrene, men henvist til hvordan de bør lages. gitt vurderinger for de forskningspolitiske valg som må foretas for opprettelse av et system med forskjellig vekting av faktorer og typer vitenskapelige publikasjoner som grunnlag for differensiert finansiering. Dette er spørsmål som må løses i nært samarbeid med fagmiljøene. foreslått registre for andre indikatorer. gått inn på hvordan kunstneriske, arkitektoniske o.a. uttrykksmåter kan innpasses mot vitenskapelig publikasjon. 3

Oppsummering av anbefalingene: FOR PUBLISERINGSKANALER OG PUBLISERINGSFORMER Standardiserte data fra bibliometriske datakilder som ISI, Norart, innhentes. De mest frekvente utgivere av vitenskapelige ISBN-titler for norske forskere inngår i registrene. UFD kontakter norsk og nordisk bibliotekssamarbeid for å etablere tilsvarende indekseringsordninger som ved ISI-basene. En enhet eller et organ som kan ivareta de nasjonale registre, må opprettes. FOR INSTITUSJONS- OG PERSONREGISTRE Ansvar for nasjonale registre legges til institusjon(er) etter UFDs valg. Standardiserte data om organisatoriske forhold og endringer innhentes fra institusjonene. Standardiserte data om personer og ansettelsesforhold og endringer i disse innhentes fra institusjonene. RESSURSBEHOV FOR NASJONALE REGISTRE Utviklingsarbeidet for publiseringsregistre anslås til 3 årsverk med tillegg for utstyrsog driftsmidler. Til årlig drift av publiseringsregistre anslås 1,5 årsverk med tillegg for utstyrs- og driftsmidler. Utviklingsarbeidet for administrative registre anslås til 3 årsverk med tillegg for utstyrs- og driftsmidler. Til årlig drift av administrative registre anslås 1,5 årsverk med tillegg for utstyrs- og driftsmidler. FOR VIDERE ARBEID Et teknisk utvalg utformer konkrete kravspesifikasjoner for opprettelse av nasjonale registre, som grunnlag for anbudsinnhenting. Et utvalg for implementering av institusjons- og personalregistre opprettes. Arbeidet med en enhet eller et organ som kan være ansvarshavende for arbeidet med publiseringsregistrene og ivareta de nasjonale registre videreføres. UFD kontakter norsk og nordisk bibliotekssamarbeid for å etablere tilsvarende indekseringsordninger som ved ISI-basene. Hvordan kunstneriske uttrykk som vitenskapelig produksjon og publisering kan innpasses, tas opp i en egen utredning. Om og i tilfelle hvordan andre indikatorer, formidling etc. skal inngå i et resultatbasert finansieringssystem tas opp i egne utredninger. Innstillingen er enstemmig. 4

1 Forskningsdokumentasjonssystemer 1.1 Nasjonale behov for forskningsdokumentasjon Det er i dag økende oppmerksomhet rundt forskningens betydning for nærings- og samfunnsutvikling. Dette har medført ønsker om bedre systemer for informasjon om forskning, både nasjonalt og internasjonalt, for å kunne sammenligne, lære og utvikle forskningspolitikk. Et nasjonalt system for forskningsdokumentasjon kan ses på som et bidrag til å utvikle systemer for den referansetesting som nå gjøres i regi av Nærings- og handelsdepartementet (NHD), som et bidrag til Utdannings- og forskningsdepartementet (UFD) og Norges forskningsråds (NFR) forvaltning av forskningsmidler og utvikling av forskningspolitikk og som et bidrag til et framtidig europeisk system for informasjon om forskning. De senere år har fokuset skiftet fra vekt på funksjonalitet for informasjonsformidling til forskningsdokumentasjon som styringsredskap. 1.2 Nåværende system for dokumentasjon I dokumentasjonssystemer som har vært brukt fram til nå (Forskpub i BIBSYS, ForskDok ved UiO, Fdok ved UiB), har en referanse til en vitenskapelig publikasjon foreligget omtrent som den gjør i bibliotekenes referansedatabaser. Men referansene har ikke vært i standardisert form. Gjennom årene har det vært mange forsøk på å samordne og standardisere til et felles system, men det har hittil ikke lyktes. I de nevnte dokumentasjonssystemer har man hatt et system for avgrensning og inndeling av vitenskapelige publikasjoner som langt på vei var utviklet til en nasjonal standard, og som så ut til å kunne inngå i et nasjonalt dokumentasjonssystem. Publikasjonene har vært inndelt i et visst antall kategorier (for eksempel artikkel i internasjonalt vitenskapelig tidsskrift med referee og lærebok utgitt på forlag ). Avgrensningen av vitenskapelig publisering har skjedd ved at et utvalg av disse kategoriene har vært lagt til grunn for rapportering. Problemet med kategoriene er imidlertid at de er valgt subjektivt av den enkelte registrator. Dokumentasjonssystemene er basert på egenrapportering, hvor forskerne selv, eller annet personale, manuelt legger inn all informasjon. Det er veiledning for bruk av de forskjellige kategorier publikasjoner, formidlingsformer etc., men når man går inn i materialet, ser man at det er mange åpenbare feil. Det har vært opp til den enkelte forsker å vurdere under hvilken kategori en publikasjon skal plasseres, og det har ikke vært systemer for sikring av lik behandling av dataene. Det finnes elementer av både overrapportering, ved at noen har lagt inn mye, mens andre ikke har brydd seg med å legge inn data, selv om publikasjonen klart hører med til en streng definering av vitenskapelig publikasjon. Det er heller ikke klare føringer på oppføring av alle medforfattere, særlig hvis de er ved andre institusjoner. De fleste norske universiteter og høyskoler har implementert dokumentasjonssystemer, men det eksisterende datagrunnlaget har store svakheter: Dokumentasjonskravene varierer. Ulike institusjoner, og ulike enheter innen institusjoner, stiller ulike krav til dokumentasjon av forskning. Følgelig er 5

datagrunnlaget ulikt både mht. hva som dokumenteres, hvor mye som dokumenteres, hvilke krav som stilles til de enkelte medarbeidere osv. Innhold og datastrukturer varierer. De ulike systemer som blir brukt, er utviklet med liten grad av overordnet koordinering av innholdselementer, klassifikasjoner, felles datastrukturer etc. Datakvalitet varierer. Ulike institusjoner og ulike dokumentasjonssystemer stiller ulike krav til egenskaper ved data. Alle nåværende systemer er basert på egenrapportering. Denne typen svakheter vil gi tilfeldige utslag i et resultatbasert finansieringssystem. Dessuten er kategoriene neppe tjenlige hvis man vil foreta inndelinger som tar hensyn til publiseringsmønstre i ulike fag. Kategoriene vil også hindre import og verifisering av data i biblioteksystemer, fordi plasseringen av en publikasjon i en kategori i siste instans bygger på forfatterens eget kjennskap til publikasjonen. I 2003 ble de fire universitetene enige om å samarbeide om utvikling av et nytt felles forskningsdokumentasjonssystem kalt FRIDA. Dette utvikles ved USIT-UiO, og prosjektet avventer innspill fra arbeidet med autoritetsregistre, slik at dokumentasjonssystemet kan tilpasses krav for et nasjonalt samarbeid. Høgskolesektorens dokumentasjonssystemer er ivaretatt gjennom Forskpub, her har BIBSYS system- og driftsansvar. 1.3 Behov for nytt system for dokumentasjon Det er flere formål ved etablering av et samlet nasjonalt system for forskningsdokumentasjon. Grovt sett kan disse inndeles i sammenstilling av indikatorer og data til bruk i finansiering av forskning innsamling av grunnlagsdata til bruk i fag- og institusjonsevalueringer enkel tilgang for forskere og studenter til data som de skal bruke i ulike prosjekter levering av data/informasjon til systemer for informasjon om forskning rettet mot allmennheten Innføringen av nasjonale autoritetsregistre vil gi bedre informasjonsverktøy. Datakvaliteten vil bli bedre ved at data er gitt etter felles kriterier og ved at det innhentes data fra eksisterende bibliometriske kilder, noe som kraftig reduserer behovet for en tidkrevende egenrapportering og alle dens feilkilder. Innenfor Database for høgere utdanning (DBH) og ved Norsk institutt for studier av forskning og utdanning (NIFU) er en del av de økonomiske og administrative dataene allerede samlet. NIFU har dessuten erfaring med oppdatering og analyse av data for norske vitenskapelige artikler som indekseres ved Institute for Scientific Information (ISI), samt noe erfaring med patentanalyse. Ved NIFU analyseres de vitenskapelige artiklene pr. institusjon etter forfatteradressene som publiseres i tidsskriftene, men tilknytningen til ansatte og enheter ved institusjonene er ikke kvalitetssikret ved institusjonene. ISI dekker dessuten kun artikler i internasjonale tidsskrifter, ikke annen vitenskapelig publisering. De lokale dokumentasjonssystemene som har vært brukt hittil (Forskpub, Fdok og ForskDok), dekker derimot i prinsippet all vitenskapelig publisering ved de institusjonene som deltar i registreringen. Her har data sikker tilknytning til ansatte og enheter som registrerer dem, men det er på den annen side problemer med kvaliteten på data for publikasjonene, se 1.2 ovenfor. Det som gjenstår er en samordning av dataene, som vil forenkle tilgangen til data for 6

brukerne, samt etablering av et felles registreringssystem for vitenskapelig publisering. I et system for utveksling og analyse av data vil felles autoritetsregistre for ansatte, institusjoner og vitenskapelige publiseringskanaler og publikasjonsformer ha sentral betydning. Temaet var fokus for UHRs konferanse 17.09.02 om forskningsdokumentasjon. Primært er problemene knyttet til mangel på nasjonale standarder og retningslinjer for dokumentasjon og til mangel på virkemidler for å produsere data som tilfredsstiller kvalitetskrav som styringsgrunnlag. Innføring av felles autoritetsregistre er ett av flere nødvendige virkemidler for å muliggjøre sammenlignbare rapporteringsrutiner og regulær statistikkproduksjon for vitenskapelige forskningsdata. Autoritetsregistre yter kvalitetssikrede, strukturerte data innen spesifikke domener, som kan aksesseres og refereres på en enhetlig måte i alle ledd i et komplekst informasjonssystem. 1.4 Utdannings- og forskningsdepartementets oppdrag Utdannings- og forskningsdepartementet har i 2002 satt i gang arbeid med å utvikle et nasjonalt registreringssystem for vitenskapelig forskningsdokumentasjon. Departementet har i dette arbeidet særlig fokus på de behov departementet har i forbindelse med videreutviklingen av forskningskomponenten i finansieringssystemet for universiteter og høgskoler. Som en del av utviklingen av et nasjonalt dokumentasjonssystem for forskning, har departementet i brev av 16.12.02 gitt UHR følgende oppdrag utarbeide et autoritetsregister for registrering av vitenskapelige publikasjoner oppdatere den norske inndelingen av vitenskapsdisipliner foreslå rutiner og ressursbehov for kontinuerlig oppdatering og vedlikehold av registrene Etablering av et nasjonalt system for vitenskapelig forskningsdokumentasjon vil gi grunnlag for en mer gjennomsiktig resultatbasert modul i finansieringsmodellen. Dette vil også kunne gi store kostnadsbesparelser knyttet til fag- og institusjonsevalueringer, hvor det for hver evaluering i dag må gjennomføres relativt omfattende og kostnadskrevende datainnsamlinger. Forutsetningen for at vi skal dra nytte av et slikt system i fagevalueringer, er imidlertid at det omfatter hele den offentlige finansierte forskningssektoren, dvs. universiteter og høyskoler, forskningsinstitutter og sykehus samt offentlig finansierte prosjekter i privat sektor. 1.5 Mandat og målsettinger UHR har på bakgrunn av dette oppdraget i brev av 05.02.03 oppnevnt to arbeidsgrupper; én for autoritetsregistre og én for vitenskapsdisipliner. Det er også oppnevnt en referansegruppe. Arbeidsgruppene hadde frist 01.07.03 til å levere sin rapport. Rapporten fra arbeidsgruppen for autoritetsregistre skal fungere som beslutningsgrunnlag for departementet, som må bestemme omfang av og modell for finansiering, og velge tjenestetilbydere. 7

Arbeidsgruppe I ble oppnevnt med følgende medlemmer: Prorektor Anne-Brit Kolstø, Universitetet i Oslo, leder Seksjonssjef Tove Knutsen, Universitetsbiblioteket i Trondheim, Realfagbiblioteket, Norges teknisk-naturvitenskapelige universitet (NTNU) Prorektor Erik Mønness, Høgskolen i Hedmark Rektor Per Dahl, Høgskolen i Stavanger Rådgiver Bjug Bøyum, Norsk samfunnsvitenskapelig datatjeneste (NSD) Forsker Gunnar Sivertsen, Norsk institutt for studier av forskning og utdanning (NIFU) Spesialrådgiver Erik Strøm, Norges forskningsråd (NFR) Utviklingsleder Rune Brandshaug, BIBSYS Seniorrådgiver Dag Tveit Bråthen, Universitetet i Oslo, sekretær Oppnevningsbrevet sier også at Arbeidsgruppen kan i tillegg foreslå definisjoner av andre relevante indikatorer som kan inngå i et system for forskningsdokumentasjon, og fremme synspunkter på hvordan ulike indikatorer kan vurderes i forhold til hverandre. Autoritetsregistrene skal inngå som integrerte komponenter i et nasjonalt system for vitenskapelig forskningsdokumentasjon, for bl.a. å muliggjøre regulær statistikkproduksjon, tilfredsstille departementets og institusjonenes krav til dokumentasjon av forskningsresultater og aktivitet og brukes mot finansieringsmodellen for universiteter og høgskoler. Institusjonene har selv et dokumentasjonsbehov som spenner fra markedsføring og informasjon til interne og eksterne brukere, til nasjonal dokumentasjon om samfunnsoppdraget og som grunnlag for budsjettildeling. Autoritetsregistre benyttes i større eller mindre grad i alle systemer for vitenskapelig forskningsdokumentasjon som er i drift i dag. Fundamentet er derfor til stede i varierende grad i form av eksisterende data og IT-systemer. Å omforme disse til nasjonale registre som fungerer i et overordnet system, vil likevel innebære mer eller mindre omfattende utviklingsarbeid, og arbeid i forhold til gjennomgang og kvalitetssikring av eksisterende data. Autoritetsregistre for institusjoner og personer har selvfølgelig anvendelse for sektorens totale virksomhet, og bør implementeres i et slikt perspektiv. Autoritetsregistre for vitenskapelige publiseringskanaler har en spesifikk hensikt, men rutiner og struktur kan ha anvendelse for annen faglig virksomhet. Arbeidsgruppen valgte, med den korte tidsfristen som var satt, å definere arbeidet til primært å konsentrere seg om autoritetsregistre for publiseringskanaler og publikasjonsformer autoritetsregistre for institusjoner og ansatte rutiner og ressursbehov Oppnevningsbrevet indikerte at også andre relevante indikatorer, andre publiseringsformer enn vitenskapelig publisering kunne utredes. Arbeidsgruppen var enig om kun å gå inn på dette feltet hvis tiden strakk til. Det har vist at det ikke ble tid til å gjøre dette. Arbeidsgruppen har i vedlegg 2 gitt en oversikt over aktuelle dokumentasjonsbehov. Ved en viderebehandling av andre indikatorer vil arbeidsgruppen påpeke at ikke all aktivitet ved en institusjon kan telles, eller bør telles i forhold til sammenstilling av data på aggregert nivå. Lokalt ved en institusjon kan det være behov for å registrere aktivitet innen samfunnsdebatt, 8

formidling m.m., men det er ikke sikkert at slike data egner seg til sammenfattende oversikter. Kostnadene ved en kvalitetskontroll av data kan langt overstige den nytte dataene har på sentralt nivå. En lang rekke aktiviteter må inngå som aktivitet under en overordnet basisbevilgning og bør ikke skilles ut som eget finansieringsobjekt. Gruppen var enig om at det ikke var mulig å utarbeide fullstendige institusjonsregistre, men at arbeidet måtte konsentreres om å trekke opp prinsippene og systematikken for slike, og legge rammene for utformingen av registrene. Ansvarsforhold for data og dataflyt er viktige elementer her. Oppdragsgiver må så, hvis prinsippene godkjennes, starte et implementeringsog utviklingsprosjekt for utarbeidingen av selve registrene. Det er verken tid eller ressurser i vårt prosjekt til å gjennomføre et slikt arbeid. I tråd med dette må oppdragsgiver også bestemme hvor og hvordan registrere skal etableres og drives. Gruppen har derfor konsentrert seg om å lage følgende analyser og kravspesifikasjoner: formulere kravspesifikasjoner for relevante autoritetsregistre formulere krav til ytelse, tilgjengelighet og sikkerhet for de enkelte registre formulere krav til, og forslag til modeller for, oppdatering og vedlikehold av registrene samle inn og systematisere informasjon om eksisterende registre utarbeide forslag til tekniske løsninger og dataflyt anbefale rutiner for videre vedlikehold av data estimere kostnader og arbeidsomfang knyttet til utvikling og administrasjon av de enkelte registre 9

2 Autoritetsregistre oppbygging og funksjoner 2.1 Definisjon Library of Congress definerer begrepet authority record slik: An authority record is a tool used by librarians to establish forms of names (for persons, places, meetings and organizations), titles and subjects used on bibliographic records. Authority records enable librarians to provide uniform access to materials in library catalogs and to provide clear identification of authors and subject headings... 1 Et autoritetsregister er et register over authority records for en gitt type informasjon. Begrepet er ikke begrenset til bruk i bibliotekssystemer. Autoritetsregistre vedlikeholdes aktivt av fagpersonell, og kan således yte data av høy kvalitet. Registrene skal identifisere unike enheter innen et begrenset felt, dokumentere offisielle stavemåter for navn, klassifisere og gi ekstrainformasjon om enhetene. Med enhet menes her objekter som faller inn under et registers teoretisk definerte dekningsfelt. Autoritetsregistre brukes for å dekke sentral informasjon som går på tvers av flere poster i et større informasjonssystem. Brukere av det større informasjonssystemet, for eksempel en forskningsdatabase, søker og refererer innhold i registrene, snarere enn å skrive tilsvarende verdier inn i fritekstfelt. Brukerne har ingen mulighet til å endre på registerdata direkte. Alternativet er et system basert på egenregistrering av alle data. Da vil ulike brukere skrive inn verdier på nytt hver gang en enhet skal refereres, for eksempel navn på tidsskrifter i en artikkeldatabase. En har da en høy risiko for at ulike brukere vil skrive inn navn på forskjellige måter, og klassifisere enhetene (her: tidsskriftene) ulikt. Ekstrainformasjon om enhetene (for eksempel webadresser, kvalitetsindikatorer) vil være vanskelig å hente inn. I et slikt system blir det derfor umulig å identifisere unike enheter, og aggregere gyldig og rik statistikk, uten et omfattende etterarbeid. Autoritetsregistre sikrer dermed et konsistent og rikt grunnlag for bakgrunnsdata. Dette forbedrer søkefunksjonalitet og registreringsrutiner i informasjonssystemer, og medvirker til å muliggjøre anvendelse av data til rutinemessig statistikkproduksjon. I praksis vil vi skille mellom autoritetsregistre og oppslagstabeller i databaser. Oppslagstabeller benyttes internt i databasesystemer for oppslag, søk og identifikasjon av enheter til bruk som referanser i poster i andre tabeller. Autoritetsregistre kan etableres og anvendes for et enkelt formål, for eksempel et bibliotekssystem. Registeret vil da være en intern, integrert del av systemet. I et integrert system er autoritetsregistre og oppslagstabeller det samme. I et distribuert system vil autoritetsregistrene fungere som sentrale datakilder til flere uavhengige databaser/brukersystemer. Brukersystemene kan kobles opp mot autoritetsregistre på ulike måter: De kan enten lagre data fra autoritetsregistre i egne lokale oppslagstabeller, eller kun lagre pekere i primærdata som refererer direkte til data i sentrale autoritetsregistre. Et system med lokale oppslagstabeller kan omfatte noen eller alle dataelementer og data i autoritetsregistre. Brukere benytter de lokale oppslagstabeller til søke- 1 http://www.loc.gov/today/pr/2002/02-1114.html 10

og registreringsformål. I et system basert på pekere, henter brukersystemene innhold (navn, adresser etc.) dynamisk fra autoritetsregistrene for presentasjonsformål ved hver forespørsel mot brukersystemet. For at det skal være nyttig og lønnsomt å avsette ressurser til kvalitetssikring og bearbeiding av slike registre i et nasjonalt system for forskningsinformasjon, er det viktig at de framstår som delte ressurser, som fungerer på tvers av, og uavhengig av, de enkelte formål data benyttes til. Datakildene må likevel framstå som skjulte for sluttbrukere; sluttbrukere skal oppfatte at data tilhører et lokalt registreringssystem, både ut fra formatet innholdet blir presentert på, og ytelsen til søke- og registreringssystemene.i et distribuert system vil autoritetsregistrene fungere som sentrale datakilder til flere uavhengige databaser/brukersystemer. Brukersystemene kan kobles opp mot autoritetsregistre på ulike måter: De kan enten lagre data fra autoritetsregistre i egne lokale oppslagstabeller, eller kun lagre pekere i primærdata som refererer direkte til data i sentrale autoritetsregistre. Et system med lokale oppslagstabeller kan omfatte noen eller alle dataelementer og data i autoritetsregistre. Brukere benytter de lokale oppslagstabeller til søke- og registreringsformål. I et system basert på pekere, henter brukersystemene innhold (navn, adresser etc.) dynamisk fra autoritetsregistrene for presentasjonsformål ved hver forespørsel mot brukersystemet. For at det skal være nyttig og lønnsomt å avsette ressurser til kvalitetssikring og bearbeiding av slike registre i et nasjonalt system for forskningsinformasjon, er det viktig at de framstår som delte ressurser, som fungerer på tvers av, og uavhengig av, de enkelte formål data benyttes til. Datakildene må likevel framstå som skjulte for sluttbrukere; sluttbrukere skal oppfatte at data tilhører et lokalt registreringssystem, både ut fra formatet innholdet blir presentert på, og ytelsen til søke- og registreringssystemene. Lokale systemer Sentrale datatjenester Primærdata Oppslagstabeller, pekere Autoritets- Autoritets- Autoritets- registre registre registre Behovene for autoritetsregistre er særlig reist i forbindelse med økende kvalitetskrav til data fra forskningsdatabaser ( forskningsdokumentasjons-systemer ). Forskningsdatabaser er verktøy for å samle inn, bearbeide og publisere informasjon om forskningsrelatert aktivitet og produksjon. Grunnen til at disse systemene i dag har behov for bedring av datakvalitet, er særlig at de i forbindelse med kvalitetsreformen vil få administrative funksjoner som de ikke tidligere har vært tilrettelagt for. Midler til institusjonene skal fordeles etter resultater målt i forskningsdatabaser. I dag omfatter institusjonenes virksomme forskningsdatabaser Bibsys Forskdok, samt uavhengige applikasjoner for enkelte universiteter og høgskoler. Høsten 2003/våren 2004 planlegger universitetene å ta i bruk et nyutviklet registrerings- og rapporteringssystem kalt FRIDA (http://www.usit.uio.no/prosjekter/frida/pg/). I tillegg planlegges etablert et eget system for innsamling av data om vitenskapelig publisering i Norge fra bibliotekssystemer og referansedatabaser (Rapport fra NIFU, omtalt andre steder i dette dokumentet). 11

Andre systemer som er aktuelle brukere og tilbydere av autoritetsregistre, omfatter blant annet NIFU/SSBs systemer for forskningsstatistikk, DBH og Nasjonal forskningsinformasjon (NFI) ved NSD og Norart (Nasjonalbibliotekets artikkeldatabase). I tillegg kommer mulighet for publisering av enkelte typer data gjennom internettportaler (for eksempel forskning.no, utdanning.no, google/yahoo etc.) og andre applikasjoner der relevante data kan benyttes. Vedlegg 8 viser de mest sentrale systemene der data fra aktuelle autoritetsregistre vil kunne inngå. 2.2 Oppbygging, virkemåte og dataflyt Oppbygging og virkemåte vil variere mellom de data de ulike registre skal dekke. På et generelt nivå kan systemenes virkemåte avledes av prinsippene skissert innledningsvis og i pkt. 2.1 over. Systemet krever at en bygger strukturer rundt oppgaver knyttet til kvalitetssikring, administrasjon, distribusjon og mottak av data. I det følgende gir vi en kort presentasjon av de mest grunnleggende problemstillingene knyttet til registre. Mer detaljerte skisser av roller, oppgaver og flyt av data knyttet til systemet, finnes i Vedlegg 3. Kvalitetssikring/vedlikehold Ferdig definerte poster i autoritetsregistre skal så langt som mulig representere den offisielle kunnskapen om enheten den skal beskrive. Høy datakvalitet skal sikre at det ikke gjøres gale valg eller slutninger på grunnlag av referanser til registerdata. Registrene skal dekke felter som er i kontinuerlig forandring. Det er derfor nødvendig å ha et system for å kunne fange opp endringer fortløpende, og for å identifisere og korrigere feil og mangler i eksisterende data. Oppgaver knyttet til kvalitetssikring vil vi i det følgende kalle vedlikehold av data. Vedlikehold utføres av personer ( vedlikeholdere ) med faglig ekspertise innen feltet registeret dekker. Konkret innebærer dette at vedlikeholdere agerer på grunnlag av systematisk oppdatert kunnskap om feltet, og behandler et register ved å legge inn nye data, korrigere eksisterende poster for feil, manglende opplysninger eller endringer i status, slette ugyldige poster og identifisere og korrigere eventuelle duplikatverdier. Arbeidet i forhold til oppdatering av et register må baseres på både systematisk innsamling av data, initiert av vedlikeholdere, og på behandling av meldinger fra brukere. Data vil kunne samles inn systematisk på flere måter. For det første vil vedlikeholdere periodisk måtte gå aktivt gjennom registeret og verifisere innholdet på grunnlag av direkte kontakt med enhetene i feltet (for eksempel ved å sende en liste over ISSN med titler og annen informasjon til et forlag, og be om tilbakemelding på om listen dekker forlagets vitenskapelige utgivelser). For det andre vil en systematisk kunne anvende eksterne datakilder kommersielle databaser, administrative systemer etc., for import i systemet. En vil da sammenligne eksisterende data i autoritetsregisteret med postene fra eksterne datakilder, og så vurdere om avvik mellom register og datakilder skyldes mangler ved autoritetsregisteret eller ved datakildene. 12

Forskningsinstitusjoner Sentrale datatjenester Sluttbrukere Forskningsdatabaser Forskningsstatistikk (NIFU, SSB, NSD etc) (Oppslagstabeller, pekere) Autoritets- Autoritetsregistre registre Vedlikeholdere Administrative systemer Eksterne dataleverandører For det tredje må det være system for å fange opp innspill og tilbakemeldinger fra sluttbrukere. Sluttbrukere er personer som benytter data fra autoritetsregistre som referanser under registrering av forskningsdata, eller til annet formål. Som indikert over, skal sluttbrukere ikke ha direkte påvirkning på innholdet i selve registeret. Mange systemer er bygd opp slik at sluttbrukere henter data til referanser fra oppslagstabeller i lokale systemer, og er avhengige av at data eksisterer her for å kunne komplettere en registreringsjobb (for eksempel til forfatterreferanser for en artikkel). For at sluttbrukere skal kunne komplettere en jobb der data ikke finnes i autoritetsregistre, må de kunne gjøre en temporær registrering mot oppslagstabellen (for eksempel legge inn en person). Systemet må da kunne formidle data til autoritetsregistre som forslag til endring i registeret. Vedlikeholder må kontrollere og behandle forslaget, og godta eller forkaste det. Distribusjon og mottak av data Publisering og mottak av data er sentrale funksjoner i distribuerte systemer. Registre skal kunne lese data fra relevante datakilder. Etter sentral behandling og kvalitetssikring skal data publiseres og kunne lastes ned av brukere. Utfordringen er å etablere et system som er mest mulig effektivt og strømlinjeformet, særlig i forbindelse med kommunikasjon med brukersystemene. I første rekke er brukersystemene her definert av forskningsdatabaser og statistikksystemer. Det er sentralt at utveksling av data mellom brukersystemer og autoritetsregistre i så stor utstrekning som mulig skal foregå uten manuelle operasjoner systemene skal kunne kommunisere direkte. For at dette skal være mulig, må en utvikle standard dataformater, og standardmetoder for å lese og skrive data. Standarder må implementeres både i autoritetsregistre og i brukersystemer. Autoritetsregistre må åpne for to alternative former for tilgang til data: For det første skal en kunne gjøre tilfeldige (ad hoc) spørringer mot databasen etter bestemte kriterier (for eksempel søk etter et bestemt forfatternavn). For det andre skal en kunne laste ned data periodisk. Dette tilsvarer to måter brukersystemer kan anvende registrene på: i det første tilfellet vil en i lokale databaser bare laste ned de data som er relevante for sluttbrukerne av systemet. I det andre tilfellet vil en speile hele eller deler av innholdet i autoritetsregistret mot lokale oppslagstabeller, og synkronisere periodisk for å identifisere endringer. Hvilken strategi som er riktig å benytte, avhenger av bruksområdet, klientsystemene og det enkelte register. Det er 13

vesentlig at sluttbrukere ikke skal oppfatte forskjeller i funksjonalitet mellom ulike anvendelsesformer. For sluttbrukere er det også et krav at oppslag skal ha god ytelse/responstid, og dette påvirker også valg av kommunikasjonsstrategi. Selv om et brukersystem implementerer en strategi basert på å laste ned data ved behov, må normalt systemet ha mulighet for å synkronisere de nedlastede dataene mot autoritetsregistrene periodisk. Brukersystemene må kunne fange opp korrigeringer og utfyllinger som blir utført på data etter at de er lastet ned fra autoritetsregistre. Administrasjon, organisering, drift Et register må etableres innen et organisatorisk rammeverk. I tillegg til funksjoner for vedlikehold av data, som beskrevet foran, har systemet behov for ordinære administrative funksjoner og funksjoner for utvikling, drift og overvåkning av systemer. I en etableringsfase vil trolig utviklingsfunksjonene være dominerende. Når et system er etablert vil behovet for slike funksjoner svekkes, men ikke forsvinne. Systemer må oppdateres for feil og mangler, og justeres for påvirkning fra ny teknologi. Videre må systemer overvåkes i en driftsfase for å identifisere svakheter, misbruk og nedetid. Systemet stiller også store krav til dokumentasjonsarbeid, og opplæring av, og samhandling med, brukere og utviklere av tredjepartssystemer (for eksempel forskningsdatabaser). Driftssystemer og tekniske og administrative funksjoner bør organiseres i sentrale enheter. Normalt vil det også være fornuftig å sentralisere funksjoner for vedlikehold av data. For store systemer (for eksempel personregistre) vil dette kunne være problematisk, fordi grundig gjennomgang av store datamengder vil være svært ressurskrevende. I slike tilfeller kan et alternativ være å organisere vedlikeholdsfunksjoner på de enkelte læresteder, der den lokale kjennskapen til enhetene registeret skal dekke, vil være stor. 2.3 Krav til autoritetsregistre Et system for felles autoritetsregistre stiller krav både til sentrale aktører (administrative systemer for nasjonale autoritetsregistre) og til lokale registreringssystemer for forskningsdokumentasjon. Teknologi og metoder for vedlikehold og publisering av autoritetsregistre vil variere fra register til register. Det må utformes konkrete kravspesifikasjoner for hvert register. I det følgende vil vi skissere enkelte generiske krav som kan stilles til alle registre. Standarder Autoritesregistrene må basere seg på åpne internasjonale standarder som gir fleksibel bruk. Datakvalitet Ferdig bearbeidede dataelementer i autoritetsregistre skal så langt som mulig representere den offisielle kunnskapen om elementet. Høy datakvalitet skal sikre at det ikke gjøres gale valg eller slutninger på grunnlag av uttak på register. Autoritetsregister skal omfatte unike, klart definerte enheter. Repetisjon av dataelementer skal ikke forekomme gi korrekt, oppdatert og tilstrekkelig informasjon om enhetene dekke hele feltet (scope) som er definert for et register 14

Postidentifikasjon Poster i autoritetsregistre skal være unike, og må tildeles en unik ID-kode for referanse i systemer som benytter registeret. Datasikkerhet Det må defineres regler for direktetilgang til sentrale registre. Vanlige brukergrupper med autorisasjon for modifisering av registre, kan i hovedsak begrenses til tekniske administratorer og personell for kvalitetssikring. Ellers skal registre være fritt tilgjengelige for søk og anvendelse i eksterne systemer. For enkelte registre må det stilles særskilte krav til datasikkerhet, først og fremst personregistre og andre registre som inneholder personidentifiserbare data. Oppetid/tilgjengelighet Sentrale registre skal være tilgjengelig for brukere til enhver tid. Det stilles derfor høye krav til oppetid. I snitt bør en ha et mål om 99 prosent oppetid. Ytelse I tillegg til oppetid, skal systemene returnere relevante poster for brukere innen en rimelig tidshorisont. Krav til ytelse må variere fra register til register, og fra funksjon til funksjon. Normalt skal systemer kunne returnere enkeltposter i underkant av to sekunder etter en forespørsel. Bruker- og utviklervennlighet Data skal være tilgjengelig på enklest mulig måte for alle definerte brukergrupper. En skal normalt kunne benytte datatjenester gjennom standardiserte grensesnitt (web-skjema o.l.). Datatjenester skal stilles til veie for utviklere av konsument -tjenester (tjenester som benytter sentrale autoritetsregistre) via enkle, veldokumenterte grensesnitt. Vedlikehold, oppdateringer Ulike registre stiller ulike krav til metoder og prinsipper for vedlikehold. Klassifikasjoner blir i regelen sjelden endret. Andre data kan endre status mer eller mindre hyppig. For elementer som representerer overkommelige datamengder vil det i regelen være tjenelig å etablere en sentral organisasjon for oppdatering og vedlikehold. En slik organisering kan være mer økonomisk, og administrasjon av trenet, dedisert personell sikrer stor grad av kvalitet og konsistens i data. I andre sammenhenger (for eksempel institusjonstilknytninger for personer) vil det være tjenelig å knytte validering av data til lokale funksjoner ved hver institusjon. Historikk Autoritetsregister skal gjøre det mulig å ivareta historikk for feltene de dekker. Dette er særlig viktig for statistikkfunksjoner. Data skal kunne uttrykke endringer over tid. For rapporteringsformål til departement o.a. er det tilstrekkelig med et kort tidsperspektiv (2 3 år). For evalueringer og andre analytiske formål, er det viktig å kunne etablere lange tidsserier. Poster i registre for dynamiske data må derfor dateres korrekt med start- og sluttidspunkt for postens gyldighetsperiode. Data i autoritetsregister skal ikke slettes om levetiden for enkeltelementer utløper. Endringer (for eksempel ved instituttsammenslåinger) skal dokumenteres. Økonomi Registrene skal kunne drives innen realistiske økonomiske rammer. 15

Konkrete kravspesifikasjoner må utformes for hver type register det er aktuelt å etablere. 2.4 Typer informasjon og registre Informasjon som kan organiseres i autoritetsregistre, varierer fra dynamiske data som endres hyppig over tid, til statiske referanser og faste inndelinger/klassifikasjoner som kun endres sjelden. Noen av de mest relevante former for autoritetsregistre relevante for forskningsdata er som følger: Periodika (tidsskrift, magasin, aviser etc.): Publikasjonskanaler for vitenskapelig og annen litteratur i artikkelform Publikasjonsserier (instituttserier, forlagsserier etc.): Serier som selvstendige publikasjoner inngår i Forlag/utgivere: Organisasjonsenheter som publiserer litteratur. Omfatter bl.a. forskningsinstitusjoner. Del av større institusjonsregister Institusjoner: lister over institusjonsnavn, m/annotert informasjon (kontaktadresser, hierarki etc.) Personell: Liste over unike personer/personnavn, med institusjonstilknytninger 6. Klassifikasjoner: faste inndelinger som defineres av egne komiteer, eller benytter nasjonale eller internasjonale standarder: a. Produkttyper: inndeling av resultater av akademisk arbeid (her publikasjonstyper) b. Fag/disipliner (ny UHR-inndeling) c. Yrkestitler, stillingstyper (ISCO88) d. Type forskningsarbeide (OECD/frascati-manualen) e. Utdanning/Akademiske grader (norsk standard) f. Språk (ISO-639-1) g. Land (ISO-3166) h. Emneord/thesaurus Et system som skal gi grunnlag for statistikk som er sammenlignbar på tvers av institusjoner, krever at disse elementene blir implementert på en likeartet måte i alle systemer som inngår i rapporteringsrutiner. Arbeidsgruppen har konsentrert arbeidet om registre for dynamiske data (punkt 1 6), og inndeling av produkttyper/publikasjonstyper (pkt. 6a). Pkt. 6b er fokus for et eget utvalg under UHR, og er nevnt videre i teksten. Pkt. 6c g er etablerte klassifikasjonsstandarder som arbeidsgruppen anbefaler implementert, men som vi ikke drøfter nærmere. 2.5 Ressursbehov Nasjonale autoritetsregistre kan i stor grad bygges på videreutvikling av eksisterende tjenester og ressurser. Det finnes flere alternative leverandører for slike systemer, og konkrete kostnadsmodeller er knyttet til teknologi, utviklingsmodeller og kostnadsstrukturer hos den enkelte leverandør. Ressursbehov er sammensatt av flere komponenter: Utviklingskostnader: Etablering av tekniske løsninger krever systemerings- og programmeringskompetanse, prosjektadministrative ressurser, og ressurser til testing og ferdigstilling. Oppgavene består i å etablere løsninger, først og fremst på grunnlag 16

av spesifikasjonene fra arbeidsgruppen, og må regnes som engangskostnader. Disse løsningene omfatter bl.a.: o datalagring/databasetjenester o etablering/oppgradering av systemer for datafangst (registreringssystemer, automatiske rutiner for lesing av data fra andre informasjonssystemer) o meldingssystemer (tilbakemelding på handlinger fra brukere/eksterne systemer) o integrasjon/datautveksling mot brukersystemene (forskningsdokumentasjonssystemer, statistikkdatabaser o.l.). o investeringer i teknisk utstyr o konvertering av eksisterende data fra flere datakilder o dokumentasjon Tekniske driftskostnader: Faste årlige kostnader knyttet til o teknisk vedlikehold o drift og videreutvikling o kontakt med utvikler- og driftsmiljøer på institusjonene, opplæring, teknisk support Vedlikehold av data: Faste årlige kostnader til funksjoner som krever faglig kompetanse. o Gå fortløpende gjennom endringsforslag fra brukere, implementere disse i autoritetsregistre o Gå systematisk gjennom feltet registeret dekker, for korrigeringer, oppdateringer o Forestå opplæring, brukerstøtte og annen kontakt med brukere Kostnadsstrukturen vil være unik for hver type register. 17

3 Vitenskapelig publisering 3.1 Vitenskapelig publikasjon definisjon Arbeidsgruppen har tatt utgangspunkt i og bearbeidet den definisjon på vitenskapelig publisering som ble brukt i rapporten Forskning med tellekanter utarbeidet av Universitetet i Oslo 2. Vi har valgt en streng, kvalitetsorientert definisjon som bygger på fire kriterier. En vitenskapelig publisering må presentere ny innsikt være i en form som gjør resultatene etterprøvbare eller anvendelige i ny forskning være i et språk og ha en distribusjon som gjør publikasjonen tilgjengelig for de fleste forskere som kan ha interesse av den være i en publiseringskanal (tidsskrift, serie, forlag, nettsted) med rutiner for fagfellevurdering Samtlige kriterier må være oppfylt for at en publikasjon kan bli kategorisert som en vitenskapelig publikasjon. Det første to punktene vil for eksempel skille forord i antologier og debattartikler i tidsskrifter fra originalartikler. Disse punktene angår publikasjonsform. Det tredje punktet erstatter vektleggingen av begreper som internasjonalt og forlag i de kategoriene som har vært brukt hittil og fører oppmerksomheten over mot språkformen og publiseringskanalen. Ut fra dette kriteriet er Historisk tidsskrift, som utkommer på norsk, vitenskapelig. Men i fysikk kan tidsskrifter på norsk ikke regnes som vitenskapelige og det utkommer heller ikke vitenskapelige tidsskrifter på norsk i fysikk. Det kan ellers bemerkes at mens engelsk er eneste internasjonale språk i mange fag, er tysk og fransk også internasjonale språk i noen fag. Norsk er et internasjonalt språk i faget nordisk språk og litteratur. Det siste punktet, fagfellevurdering, har fått mye fokus. En definisjon av fagfellevurdering, eller peer review er Peer review: The process used by publishers and editors of academic journals to provide a chance for scholars to examine and critique a paper or monograph before it is published to help ensure its integrity and veracity. 3 Innvendinger mot fagfellevurdering går bl.a. på at praktiseringen av en fagfellevurdering ikke er enhetlig, og at det i en rekke fag ikke er tradisjon for bruk av fagfellevurdering. Arbeidsgruppen mener likevel at et krav om vitenskapelig kvalitetskontroll før publisering må oppfylles, og at man kan ta hensyn til innvendingene ved å presisere at fagfellevurdering kan forekomme i ulike former. I praktisk bruk må fagfellevurdering være romslig og inkludere ulike måter å ivareta vitenskapelig kvalitetskontroll før publisering. Noen kanaler bruker anonyme, andre én eller flere kjente, endog selvforelått referee. Noen kanaler bruker redaksjonen som referee, og ikke 2 Forskning med tellekanter, Universitetet i Oslo, februar 2003. Innstilling med formål å utarbeide skisse til et resultatbasert opplegg for finansiering av forskning, som først og fremst premierer vitenskapelig kvalitet dokumentert gjennom publikasjoner eller andre produkter. 3 The Concise Oxford Dictionary of Archaeology. Timothy Darvill. Oxford University Press, 2002. Oxford Reference Online. Oxford University Press. 30 April 2003 <http://www.oxfordreference.com/views/entry.html?subview=main&entry=t102.003052> 18

nødvendigvis for alle artikler. For et forlag, eller en avdeling ved et forlag, må det undersøkes om de har et utgivelsesprogram for vitenskapelig litteratur og i den forbindelse rutine for å innhente uavhengige konsulentuttalelser. I alle vitenskapelige publiseringskanaler er slik kontroll ikke bare av betydning for kvaliteten på den enkelte publikasjon, men også for den prestisjen eller betydningen forskere tillegger publiseringskanalen. Det vil være en samlet vurdering som avgjør om en publiseringskanal vurderes som vitenskapelig og skal gi uttelling i et finansieringssystem. I vurderingen av om en publikasjonskanal bruker en fagfelleordning må man ha tillit til at de opplysninger som gis fra kanalen på dette punkt er korrekte. I praksis vil dette problem være begrenset ved at de som arbeider med registrene, og forskerne innen fagene, vil kjenne til forlag og tidsskrifter og kan danne seg et helhetlig syn på kanalen. I tvilstilfeller må skjønn og vurdering brukes av en myndighet som har rett til å gjøre vedtak. Over tid vil det skje endringer for både tidsskrifter, serier og forlag. Det vil være nye kanaler som kommer til og tilfredsstiller kravene, og det vil være kanaler som må nedgraderes. Det må derfor foretas løpende vurderinger og justeringer av autoritetsregisteret. 3.1.1 Forskjellige publiseringstradisjoner mellom fag Det er store forskjeller i publikasjonstradisjoner mellom fag, ikke bare mellom medisinsknaturvitenskapelige og humanistisk-samfunnsvitenskapelige fag, men også innen disse fagområder. Forskjellene gjenspeiler på mange måter fagenes utvikling, trender innen forskning og publisering, både nasjonale og internasjonale. Skjematisk kan det sies at hovedtyngden av publisering fra medisinske og naturvitenskapelige fag skjer gjennom artikler i internasjonale tidsskrifter, som gjerne har et stort internasjonalt nedslagsfelt. Det er også vanlig at det er mange forfattere fra forskjellige institusjoner/enheter som samarbeider, og at publikasjonsfrekvensen er høy. Unntak finnes bl.a. ved at matematikere, ikke bare i Norge, men også internasjonalt, publiserer sjeldnere enn forskere i andre fag. For informatikk, hvor utviklingen er meget rask, er hurtig publisering gjennom konferanserrapporter klart anerkjent. Også innen andre fag, spesielt teknologiske fag, er det etablert systemer for kvalitetskontroll av konferanserapporter. Der disse rapportene, eller deler av rapportene, blir akseptert av fagmiljøene på internasjonal basis som kvalitetsrapporter i vår sammenheng, enten de er utgitt i serie eller som enkeltrapporter, bør de inkluderes i registreringene. Det er imidlertid også rapporter som ikke har slik kvalitetskontroll, og det er utgivelser i forbindelse med, eller som supplement til kvalitetsrapportene, som ikke kan telle med. Dette må avklares i det enkelte tilfelle. Andre fag er tilbakeholdne med å sidestille konferanserapporter med ordinære tidsskriftartikler. Mange humanistiske og samfunnsvitenskapelige fag har et nasjonalt fokus på sin forskning, og mye av forskningen har begrenset interesse utenfor landet og en mindre fagkrets. Publiseringen i disse fag er videre preget av at det i større grad er eneforfattere, eller få forfattere, som samarbeider om publikasjonen. Det er dessuten vanlig å publisere i bokform, som monografier eller antologier. Antall publikasjoner er derfor gjennomgående lavere, mens omfanget av den enkelte publikasjon gjerne er større. Men også innen humaniora og samfunnsvitenskap er det fag som i sin publisering har mange aspekter lik medisinsknaturvitenskapelige tradisjoner. Som eksempler kan nevnes økonomi og lingvistikk. 19