Nasjonal strategi for metadata. Midtveisrapport



Like dokumenter
Nasjonal strategi for metadata

Strategi for metadata i offentlig sektor

Anbefalinger til Standardiseringsrådet vedrørende utredning av standarder for informasjonssikkerhet

Difi. Digitalisering av offentlig sektor. Offentlig sektor er ikke en enhet

Digitalisering av offentlig sektor

Utkast til nasjonal strategi for metadata

Sak 3/18 Sluttbehandling av Etablere enhetlig arkitekturrammeverk (ST 2.2) Skate-møtet 21.mars 2018

«Standard for begrepsbeskrivelser»

definisjonsarbeid Anbefalinger til standardiseringsrådet

Tekniske, semantiske og organisatoriske utfordringer for samhandling i offentlig sektor. Endre Grøtnes FINF 4001 høst 2011

DIGITALISERING AV KOMMUNAL SEKTOR

Standardisering og gjenbruk / sambruk av IT-komponenter i offentlig sektor

Nasjonale standardar og felleskomponentar kva er det og korleis påverkar det arkivet?

STANDARDISERINGSRÅDETS ARBEID

Del 1. Infrastruktur. Figur 1.

Veikart Standardiseringsrådet

Standardiseringsarbeidet

Sentrale krav til IKT-anskaffelser. Gardermoen, 16. januar 2014 Kristian Bergem, Difi

Hvordan det offentlige kan få bedre oversikt over og øke verdien av sine data gjennom en helhetlig tilnærming til beskrivelser av data

Dagens forelesning. Regjeringens mål. Ni prinsipper for den digitale forvaltningen

Høring - Hindre for digital verdiskapning - Rapport fra utvalg som har vurdert muligheter og hindringer for digital verdiskapning

Roller og ansvar ved deling av personopplysninger

Strategi for nasjonale felleskomponenter og -løsninger i offentlig sektor. Strategiperiode

Referat fra møtet i Standardiseringsrådet mai 2012

Brukerreiser som metodikk for samhandling Enhetlig tverrsektoriell tilnærming og felles datakatalog

Semantikk og Informasjonsarkitektur. Geir Myrind, SITS Planlegging Arkitektur

Mandat. Ma lbilder og strategier for fellesløsninger i offentlig sektor

Roller og ansvar ved deling av opplysninger

Statlig IKT-politikk en oversikt. Endre Grøtnes Difi, avdeling for digital strategi og samordning

Hvordan kan innsats for å koordinere begrepsbruk i offentlig forvaltning organiseres?

SAKSFRAMLEGG. Forum: Skate Møtedato:

Notat om Norge digitalt og Norvegiana

Digital strategi for HALD Februar 2019

Kulturdepartementets strategi for åpne data vedtatt av Kulturdepartementet Foto: Andrea G. Johns/Scanstockphoto

AVTALE KNYTTET TIL SAMARBEID VEDRØRENDE DIGITALISERING

Elektroniske tjenester i offentlig sektor - Difis rolle. Hans Christian Holte

Referat fra møtet i Standardiseringsrådet mars 2015

Dagens agenda. Det store bildet. Tre hovedelementer i arbeidet med utvikling av IKT i det offentlige

Organisatoriske, semantiske og tekniske utfordringene i offentlig sektor for å få til en god samhandling og utveksling av data

Offentlig digitalisering i siget

Utfordringer for bruk av felles digitale tjenester i det offentlige

Veikart for nasjonale felleskomponenter

e-dialoger Framtidens eforvaltning eller.?

Digitaliseringsstrategi for Buskerud fylkeskommune. Revidert

Kristian Bergem. Direktoratet for forvaltning og IKT

Veikart for nasjonale felleskomponenter

Digitaliseringsstrategi for Buskerud fylkeskommune Buskerud fylkeskommune Vedtatt av administrasjonsutvalget 14.

Smart integrasjon i offentlig sektor

Regelrådets uttalelse. Om: Høring for NOU 2018:7 Ny lov om offisiell statistikk og Statistisk sentralbyrå Ansvarlig: Finansdepartementet

Samordning av IKT i det offentlig. Sesjon A1 på NOKIOS 16. oktober 2008 Jens Nørve (DIFI) og Marianne Andreassen (SSØ) Utvikling gjennom samarbeid

Referat fra det 22. møtet i Standardiseringsrådet

Semicolon II, Seman-sk interoperabilitet og konsekvenser for arkiv.

Felles veikart for nasjonale felleskomponenter i regi av Skate. Digitaliseringskonferansen 2015 vidar.holmane@difi.no

Når en statisk forvaltningskultur møter en dynamisk teknologiutvikling. Arild Haraldsen Partnerforum

Åpne standarder og digitalisering

Målbildet for digitalisering arkitektur

Anbefalinger om videreutvikling av Oppgaveregistret

«Standard for begrepsbeskrivelser»

IKT-STRATEGI


Hva? Disposisjon. Digitalt førstevalg hva hvorfor hvordan?

Helse- og omsorgsdepartementet St.meld. nr Samhandlingsreformen

API katalog: tilbakemeldinger fra Skate

Utkast til nasjonal metadatastrategi

Velkommen til Tegnsett seminar

Standarder for en tjenesteorientert arkitektur

Tiltaksliste Informasjonsforvaltning og -utveksling

Bedre informasjonsforvaltning og -utveksling - hva bør vi gjøre? ODSF

Sak 22/18 Vedlegg - Difis anbefaling til KMD - Nasjonal prioritering og finansiering tverrgående løsninger.

Mandat for arbeidet med Langsiktig strategi for Altinn

Samordning av domenekunnskap i offentlig sektor. Geir Myrind, SITS Planlegging Arkitektur Frokostseminar

Riktig bidrag til rett tid: Råd om fellesføringer for deltakelse i arbeidet med helhetlig vannforvaltning

Statens kommunikasjonspolitikk. Jeg er. Om Difi. og sosiale medier i forvaltningen

DIGITALISERINGSSTRATEGI FOR DDV-SAMARBEIDET

Samordning, samarbeid og samhandling

DigIT DoIT - KommIT. Rune Sandland, Sjefsarkitekt

Brønnøysundregistrene som tilrettelegger for innovasjon og verdiskaping

AVTALE KNYTTET TIL SAMARBEID VEDRØRENDE SAMORDNET REGIONAL DIGITALISERING

Felles datakatalog. David Norheim

Hvordan prosess for utvikling og forvaltning av metadata. Geir Myrind, Semicolon Samhandlingsarena,

for prosjektet Digital kontaktinformasjon og fullmakter for virksomheter planleggingsfasen

Digitaliseringsstrategi

Høringsnotat ny delversjon av Referansekatalog for anbefalte og obligatoriske IT-standarder i offentlig sektor, våren 2015

Innspill til arbeidet med IKT-politikken

Vi prioriterer næringslivet, bekjempelse av svart økonomi og sikker ID-forvaltning

Invitasjon til dialogkonferanse Nytt IKT-verktøy for Justervesenet.

Beste praksis Bergen kommune

Samhandling i offentlig sektor - Hva blir bidraget fra Semicolon II?

Organisering av digitaliseringsarbeid i egen kommune Rådmannsutvalgene i Nord-Norge Bodø 6. september 2017

Organisering av digitaliseringsarbeid i egen kommune. Tromsø 13. oktober 2017

Informasjonsforvaltning som forutsetning for offentlig samhandling

Høringsuttalelse: Ny lov om offisiell statistikk og Statistisk sentralbyrå

Skate-sak 15/2018 Deling av data Konsepter. Knut Bjørgaas Avdelingsdirektør Digital strategi og samordning Oslo, 26. september

SERES og Tjenesteutvikling i Altinn. Geir Jevne Semantiske dager 7.juni 2011

Samarbeid for digital forenkling. Direktør Lars Peder Brekk Brønnøysundregistrene Altinndagen 1. desember 2014

Høringsuttalelse - referansekatalog over anbefalte og obligatoriske IKTstandarder

Fellesmøte GeoForum fornye plan- og byggesaksprossen i kommunene. Oslo den 7. februar 2017 Michael Pande-Rolfsen Prosjektleder Plan, bygg & geodata

Juridiske problemstillinger ved avskaffelsen av papirskjema

Metode for identifikasjon av dokumentasjon. Presentasjon i Skate

Felles arkitekturprinsipper for helse- og velferdsområdet

Transkript:

Nasjonal strategi for metadata Midtveisrapport 15. juni 2010 Alle data det offentlige forvalter skal være beskrevet på en strukturert måte, og beskrivelsene skal være tilgjengelige

Innhold 1 Oppsummering... 1 2 Innledning og bakgrunn... 2 2.1 Innledning... 2 2.2 Bakgrunn... 4 2.3 Mandat... 4 2.4 Oversikt over prosjektdeltakere... 4 2.5 Arbeidsform og tilnærming... 5 3 Visjon og mål... 6 3.1 Prosjektets forståelse og tolkning av mandatet... 6 3.2 Visjon for elektronisk utveksling og metadata... 6 3.3 Mål som skal støttes... 7 3.4 Effekter ved bruk av metadata for elektronisk samhandling... 8 4 Veier mot visjonen og målene... 11 4.1 Kort om dagens situasjon... 11 4.2 Alternative tilnærminger (strategier)... 11 4.3 Ulike dimensjoner som må vurderes... 12 4.3.1 Skal det være pålagt å utarbeide strukturerte beskrivelser?... 12 4.3.2 Hvilke data skal beskrives først?... 12 4.3.3 Nivå på og innhold i de strukturerte beskrivelsene (metadata)... 13 4.3.4 Frihet eller felles teknisk løsning for metadata... 14 4.3.5 Hvordan skal de strukturerte beskrivelser (metadata) tilgjengeliggjøres?... 14 4.3.6 Harmonisering/koordinering av begreper... 14 4.3.7 Eierskap til data... 15 4.3.8 Oppsummering av alternative tilnærminger... 15 4.3.9 Mulige virkemidler... 16 4.4 Eksempler på strategier... 16 4.4.1 Fortsette med dagens system... 16 4.4.2 Frivillig beskrivelse og tilgjengeliggjøring av metadata... 16 4.4.3 Krav til metadata på noen få nivåer for data virksomhetene utveksler 17 4.4.4 Pålegge den enkelte offentlige virksomhet å beskrive og tilgjengeliggjøre sine data på noen nivåer basert på maler... 17 4.4.5 Beskrive registerdata på alle nivåer med en felles struktur og en felles løsning 18 4.4.6 Pålegge den enkelte offentlige virksomhet å beskrive data de kan tilgjengeliggjøre ved bruk av en felles løsning for all nivåer... 18 4.4.7 Løsninger per domene... 19 5 Forslag til tiltak... 20 5.1 Tiltak 1 Vurdere en standard for identifikatorer... 20

5.2 Tiltak 2 - Etablere et system for forvaltning av de dataene det offentlige har 22 5.3 Tiltak 3 Modellere et framtidig persondomene... 22 5.4 Tiltak 4 Beskrive de fire store registrene med felles metoder og verktøy 23 5.5 Tiltak 5 - Støtte etableringen av data.norge.no... 25 5.6 Tiltak 6 Metadata norge... 26 5.7 Tiltak 7- Kartlegge datautveksling... 27 5.8 Tiltak 8 Kodelister... 27 5.9 Tiltak 9 Vurdere sikkerhetsmessige aspekter... 27 5.10 Tiltak 10 Etablere et felles begrepsapparat for metadata... 28 5.11 Tiltak 11 Forslag til metadata som skal tas med i beskrivelsene... 29 5.12 Tiltak 12 Kvalitetskriterier... 30 5.13 Etablere krav til en felles løsning for beskrivelse og publisering av metadata... 30 6 Overordnede problemstillinger for utforming av en strategi for metadata... 31 7 Vedlegg A Om metadata... 32

1 Oppsummering Denne rapporten omtaler prosjektet nasjonal strategi for metadata. Dette er en foreløpig rapport som viser innretningen og status for arbeidet per juni 2010. Rapporten er utarbeidet av en arbeidsgruppe under ledelse av Difi. Kapittel 2 gir en innledning til og bakgrunn for prosjektet. Mandatet og deltakerne presenteres også i dette kapittelet. I kapittel 3 beskrives en visjon og mål knyttet til bruk av metadata i offentlig sektor. Visjonen er uttrykt som følgende: Alle data det offentlige forvalter skal være beskrevet på en strukturert måte, og beskrivelsene skal være tilgjengelige. Visjonen og målene er svar på mandatets punkt om å etablere et målbilde for hvordan metadata kan støtte opp under samhandling i offentlig sektor. Kapittel 4 beskriver ulike problemstillinger som må vurderes ved utformingen av en nasjonal strategi for metadata, og forskjellige tilnærminger (strategier) man kan bruke for å nå visjonen og målene. Dette kapittelet svarer på mandatets punkt om å vurdere ulike strategier for å oppnå målbildet på lang sikt. I kapittel 5 kommer forslag til tiltak som kan gjennomføres for å nå visjonen og målene. Kapittel 6 beskriver gruppas arbeid fram mot desember 2010, mens vedlegg A beskriver gruppas forståelse av begrepene knyttet til metadata. Gruppa vil presisere at hvert strategivalg vil føre til et sett med tiltak. Mange av tiltakene vil inngå i flere strategivalg. Det vil for alle strategiene være en skrittvis tilnærming hvor det må defineres delmål med nære resultater, og det forutsettes at man lærere av erfaringer underveis og justerer kursen ut fra dette. Forslag til strategi og tiltak må sees i sammenheng med andre initiativer, som felleskomponentprogrammet i Difi, konkretisering av arkitekturprisnippene, koordinering av begreper i offentlig sektor og standardiseringsrådets arbeid. Det er et klart mål at arbeidet med en nasjonal strategi for metadata skal støtte opp under det politiske målet om at digitale tjenester skal være den primære kanalen for kontakt mellom det offentlige og borgerne (Digitalt førstevalg). 1

2 Innledning og bakgrunn Denne rapporten omtaler prosjektet nasjonal strategi for metadata. Dette er en foreløpig rapport som viser innretningen og status for arbeidet per juni 2010. 2.1 Innledning Offentlig sektor benytter mye data i sitt arbeid. Dataene hentes inn fra borgere, næringsliv og andre offentlige etater, og er utgangspunkt for de vurderinger og vedtak offentlig sektor gjør. Noen data hentes direkte fra elektroniske kilder (registre, fagsystemer, etc.), mens andre data må fylles inn manuelt av borgere, næringsliv og andre offentlige etater og sendes til mottaker. Det er viktig at dataene innhentes, distribueres og forvaltes på en fornuftig og effektiv måte. Forvaltning og bruk av data har vært den enkelte virksomhets ansvar. Det er den enkelte virksomhet som har hjemler for å hente inn data i sitt regelverk. Dette har ført til at næringsliv og borgere ofte gir fra seg de samme dataene til flere offentlige virksomheter. Det er et mål både i Stortingsmelding nr 17 (2006-2007) og Stortingsmelding nr 19 (2008-2009) at data det offentlige allerede har skal gjenbrukes hvis det er mulig. For å kunne gjenbruke data i det offentlige effektivt, må dataene finnes på en elektronisk form, og vi trenger blant annet en oversikt over hvilke data som finnes, hvem som har disse dataene, hvordan vi kan få tak i dataene og betingelser og forutsetninger knyttet til bruk av dataene. Dette handler om en god og helhetlig forvaltning av de data det offentlige har. I dag finnes det beskrivelser internt i enkelte virksomheter og sektorer, men det mangler en helhetlig plan for hvordan det offentlige skal forvalte og benytte de dataene de har. Forventningen om større utveksling og gjenbruk av data på tvers av offentlige virksomheter og tilgjengeliggjøring av data ut mot borgere og næringsliv skaper nye utfordringer. Med økt utveksling kommer økt kompleksitet, og når kompleksiteten øker vil kostnadene for å lage løsninger også øke. Kompleksiteten kommer primært fra at flere skal utveksle data og at de som skal utveksle data ikke har god nok kjennskap til de dataene som utveksles. Det er spesielt mangelen på oversikt over hvilke data som finnes, betydningen av dataene og hvordan man kan få tak i dataene som skaper problemer og vil være kostnadsdrivende. Utveksling av data har tradisjonelt skjedd på prosjektbasis, uten noen større koordinasjon eller dokumentasjon av utvekslingen. Dette er effektivt når det kun gjelder et begrenset antall utvekslinger og partene har en god forståelse av dataene som skal utveksles. Når antall parter som skal utveksle data øker og forståelsen av dataene som skal utveksles blir mindre øker kompleksiteten betraktelig, og kostnadene for å utveksle data øker dramatisk. Det vil være behov for koordinerende tiltak for å redusere kompleksiteten og derigjennom redusere kostnadene for å få til utveksling av data på en stor skala mellom mange parter. Data som brukes i saksbehandling er i dag definert i det regelverket (lover, forskrifter, forarbeider osv) som styrer de forskjellige virksomhetenes 2

oppgaver. Det er krevende å ha kjennskap til og bruke opplysingene korrekt på tvers av offentlige virksomheter, men også på tvers av fagområder internt i en stor virksomhet. Feil forståelse av data på bakgrunn av manglende beskrivelser kan føre til forsinket utvikling av IT-prosjekter og kan i verste fall føre til uriktig saksbehandling. Flere strukturerte beskrivelser vil minske risikoen for feil tolkning av data i fremtiden. Metadata omtales gjerne som data om data. Metadata kan være et middel for å skape oversikt over de dataene det offentlig har og for å redusere kompleksiteten ved utveksling og tilgjengeliggjøring av data. Ulempen er at det er kostnader forbundet med å etablere metadata, og hvis det ikke er tilstrekkelig utveksling av data vil det være rimeligere å foreta utvekslingen uten bruk av tilrettelagt metadata. Figur 1- Økende antall utvekslinger fører til økende kostnader for å etablere løsninger Figuren over illustrerer poenget med at kostnadene for utveksling vil eksplodere på et gitt punkt hvis det ikke iverksettes tiltak som reduserer kompleksiteten ved utveksling. En forutsetning for denne rapporten er en antakelse om at god forvaltning og beskrivelse av de dataene det offentlige har kan redusere kompleksiteten og derigjennom kostnadene for å utveksle data i stor skala mellom offentlige virksomheter 1 og tilgjengeliggjøre data for borgere og 1 Det er vanskelig å få konkrete data knyttet til besparelsene ved å ha strukturerte beskrivelser av de dataene som utveksles. Det er en antakelse at man må etablere en løsning for hver utveksling hvis det ikke finnes noen strukturert beskrivelse av dataene som utveksles, men at det kan lages en felles løsning hvis det finnes strukturerte beskrivelser. Ved etablering av innrapporteringsløsninger velger man å stille kav til strukturen og formatet på de dataene som skal innrapporteres. Dette er for å redusere antall forskjellige løsninger som må lages. 3

næringsliv. Metadata kan være en metode for å beskrive de dataene det offentlige har og er fokus for denne rapporten. 2.2 Bakgrunn Difi fikk høsten 2009 i oppdrag fra FAD å etablere et prosjekt for å underbygge behovet for en strategi for metadata generelt og behovene i tilknytning til Altinn-området spesielt. Oppgaven og mandatet ble framlagt for, og koordinert med, Departementenes kontaktforum for Altinn som består av representanter fra FAD, FIN, NHD og AID. Prosjektet skulle i første fase vurdere behovet for metadata på Altinnområdet. Deretter skulle prosjektet starte arbeidet med en generell strategi for metadata. I første fase ble det etablert et prosjekt med primærdeltakere fra Difi, Brreg, NAV, Skatt, SSB og KS. KITH var med i deler av første fase. I annen fase ble prosjektet utvidet med deltaker fra kartverket, utdanningssektoren og riksarkivet, samt full deltakelse fra KITH. Deltakerne fra flere av de deltakende virksomhetene ble også endret fra fase en til fase to av prosjektet. Prosjektet har hatt behov for å tolke mandatet og kapittel 3 gir prosjektets tolkning av oppgaven som vi er forelagt i fase to av prosjektet. Nedenfor kommer en oversikt over det formelle mandatet og deltakerne i prosjektet. 2.3 Mandat Prosjektet skal utarbeide et forslag til en nasjonal strategi for metadata som viser og setter i sammenheng de ulike eksisterende initiativene, identifiserer ulike koordineringsbehov og samordningstiltak, skisserer ulike mulige løsninger, foreslår hvordan strukturering, bruk og forvaltning av metadata kan koordineres og samordnes på et nasjonalt nivå og vurdere konsekvensene av forslag på et overordnet nivå. Som et første ledd skal prosjektet gi en kort vurdering av satsningen på metadata på Altinn-området i et nasjonalt perspektiv Mer konkret skal prosjektet: 1. Etablere et målbilde for hvordan metadata kan støtte opp under samhandling i offentlig sektor. Målbildet bør skissere ønsket situasjon 5-10 år framover. 2. Foreslå en strategi for å oppnå målbildet på lang sikt (5-10 år). 3. Vurdere satsningen på metadata på Altinnområdet i et nasjonalt perspektiv Punkt 3 ble gjennomført i fase 1 og ble levert som en rapport til FAD 15. januar 2010. Fokuset for resten av prosjektet er punkt 1 og 2 over. 2.4 Oversikt over prosjektdeltakere Kristian Bergem (Difi) Prosjekteier Endre Grøtnes (Difi) Prosjektleder Steinar Skagemo (Difi) Anne Gro Hustoft (SSB/Difi) Jenny Linnerud (SSB) 4

Terje Kolbu (Skatt) Geir Myrind (Skatt) Kristinn Gudlaugsson (Skatt) Espen Slotvik (Brønnøysundregistrene) Trine Stoveland (Brønnøysundregistrene) Line Richardsen (KS) Espen Seland (KITH) Terje Andre Olsen (NAV) Hans Fredrik Berg (Arkivverket) Fase 2 Andre Løvik (IKT senteret i utdanningen) Fase 2 Morten Borrebæk (Kartverket) Fase 2 Øivind Karlstad (NAV) Fase 2 Hans Erik Sørensen (Skatt) kun fase 1 Camilla Roark (Skatt) kun fase 1 Therese Gill Lian (NAV) kun fase 1 Ståle Rudberg (Brreg) kun fase 1 Ingunn Rødberg (NAV) kun fase 1 Øystein Aanrud (Bærum kommune) kun fase 1 2.5 Arbeidsform og tilnærming Forslag til strategi utarbeides i fellesskap av deltakerne i prosjektet. Difi styrer prosessen og skriver rapporten. Arbeidet skjer gjennom arbeidsmøter i prosjektet hvor ulike problemstillinger diskuteres. En av oppgavene til prosjektet er å lage et målbilde for hvordan metadata kan støtte samhandling i offentlig sektor. Dette målbildet er vanskelig å skissere. For å konkretisere målbildet har prosjektet valgt å foreslå en rekke tiltak hvor metadata er en sentral komponent. Gjennom disse tiltakene vil prosjektet tydeliggjøre hva metadata kan bidra med og hvilke krav som bør stilles til bruk av metadata i offentlig sektor. Forslag til tiltak er utgangspunktet for etableringen av et målbilde for metadata som viser hvordan metadata kan støtte samhandling i offentlig sektor. Prosjektet har også vært nødt til å tolke mandatet bredere enn kun metadata, da problemstillingen etter prosjektets oppfatning også er knyttet til effektiv forvaltning og bruk av offentlige data. Se kapittel 3. 5

3 Visjon og mål Dette kapitelet beskriver prosjektets forståelse og tolkning av oppgaven og fremlegger en visjon som vi ønsker å styre mot. Denne visjonen er forankret i dagens situasjon og de politiske målene som er knyttet til bruk av offentlige data. I hovedsak dreier det seg om at visjonen skal støtte opp under mål som: Digitale tjenester som den primære kanalen for kontakt mellom det offentlige og borgerne (Digitalt førstevalg) Forenkling av næringslivets og borgernes kontakt med det offentlig gjennom større gjenbruk av data det offentlig allerede har. Tilgang til data det offentlig har for borgere og næringsliv på en enkel og effektiv måte Ivaretakelse av grunnleggende verdier som personvern, rett til innsyn, likebehandling, åpenhet, etterprøvbarhet og sikkerhet. Dette har ført til følgende visjon for prosjektet: Alle data det offentlige forvalter skal være beskrevet på en strukturert måte, og beskrivelsene skal være tilgjengelige Visjonen er en ledestjerne for de tiltakene og strategiene som forslås i rapporten. 3.1 Prosjektets forståelse og tolkning av mandatet Prosjektet har tatt som en forutsetning at data det offentlige har må forvaltes og brukes på en effektiv og samfunnsnyttig måte. Vi tror at tilgang til oversiktlige og strukturerte beskrivelser av data det offentlige har vil kunne gjøre det enklere og mer effektivt å utveksle data, gi mulighet for at borgerne kan etterleve sin innsynsrett og bidra til at offentlige data kan åpnes for bruk av tredjeparter i de tilfeller hvor dette er lovlig. Prosjektet mener at det er behov for å se på forvaltning og bruk av data i det offentlige i en større sammenheng. Denne strategien vil dermed peke på tiltak knyttet til både modellering og strukturering av data det offentlige har, styring av eierskap til data, samt beskrivelser av betydningen av og konteksten dataene opptrer i. Dette vil for noen være en utvidet forståelse av begrepet metadata. Se vedlegg A. 3.2 Visjon for elektronisk utveksling og metadata Offentlig sektor baserer sin saksbehandling på data. Lov og regelverk gir føringer for hvilke data den enkelte etat skal benytte i sin saksbehandling. Hvilke data som skal benyttes er ofte regulert, men hvordan den enkelte etat skal få tak i dataene er ikke regulert på samme måte. Ofte er det implisitt antatt at dataene blir framskaffet og gitt av borgerne og næringslivet til den offentlige virksomheten som har behov for det. Dette kan skje manuelt på papir, eller gjennom utfylling av elektroniske skjema. Det er noen unntak for borgere, som selvangivelsen, hvor det offentlige selv sørger for innhentingen av mesteparten 6

av opplysningene. Det er greit å være klar over at opplysningen som benyttes i selvangivelsen er avgitt til det offentlige av andre virksomheter. En offentlig virksomhet vet som regel hvordan de kan få tak i de dataene de trenger. Enten direkte fra borger og næringsliv, eller via andre offentlige virksomheter. Denne kunnskapen er som regel ikke beskrevet, men finnes som en kollektiv kunnskap i virksomheten. Mye av innsamlingen baseres også på gammel vane, man sjekker ikke om det er mulig å skaffe de dataene man trenger på andre måter. En av grunnene til dette er at det ikke finnes noen oversikt over hvilke data den enkelte offentlige virksomhet har. På grunn av manglende oversikt er det vanskelig å hente inn informasjon fra nye kilder, man benytter de kildene som allerede er i bruk. Skal vi få til et paradigmeskifte hvor dataene det offentlige har behov for i sin saksbehandling kommer fra andre offentlige kilder istedenfor fra borgeren og næringslivet, må det være mulig å få en oversikt over hvilke andre virksomheter som har denne typen data. Den elektroniske utvekslingen av data i det offentlige i dag er også i hovedsak basert på direkte forbindelser mellom virksomheter uten at det er klart beskrevet hvilke data som overføres. For utenforstående er det vanskelig å nyttiggjøre seg denne utvekslingen siden de ikke er klar over hva som blir utvekslet og hvordan dataene blir utvekslet. Det er et klart behov for å få beskrevet den informasjonen det offentlig har og hvilken informasjon som blir utvekslet mellom offentlige virksomheter i dag. Det er ikke nok å vite bare navnet på de dataelementene som finnes eller blir utvekslet. Skal vi kunne gjenbruke og utveksle data det offentlige har, må vi ha en felles forståelse av de data som skal utveksles. Vi må vite at det vi ønsker å utveksle er de samme tingene og at informasjonen er relevant for den bruken den er tenkt. Beskrivelsen av dataene må inneholde en definisjon og forklaring på begrepene som benyttes og av konteksten som dataene benyttes i. Dermed blir det mulig for en potensiell mottaker av dataene å vurdere om de kan benytte denne datakilden i sin virksomhet. For å legge til rette for større gjenbruk av data mellom offentlige virksomheter der det er hensiktsmessig og lovlig, må det finnes en strukturert beskrivelse av de data den enkelte offentlige virksomhet har og utveksler med andre. Dette er utgangspunktet for den visjonen som ligger til grunn for tiltakene i rapporten om at alle data det offentlige forvalter skal være beskrevet på en strukturert måte, og beskrivelsene skal være tilgjengelige. 3.3 Mål som skal støttes Etableringen av metadata er ikke et mål i seg selv, men skal støtte opp under andre mål det offentlig har. Overordnet mål 7

Et hovedmål er gode elektroniske tjenester 2 som bidrar til samhandling og ivaretar grunnleggende verdiene i offentlig sektor som likebehandling, etterprøvbarhet, åpenhet, rett til innsyn, sikkerhet og personvern. Strukturerte beskrivelser (metadata) skal støtte opp under dette målet. Andre mål er å skape større åpenhet om hvilke data det offentlige har, slik at dataene kan gjøres tilgjengelige for gjenbruk av tredjeparter og styrke borgernes og medias mulighet for å utøve sin rett til innsyn og kontroll av forvaltningen. Åpenhet er en forutsetning for tilliten mellom borgerne og myndighetene. Politiske mål Tilgangen til strukturerte beskrivelser av data (metadata) bidrar til å støtte politiske mål som digitalt førstevalg, enklere offentlig forvaltning, større gjenbruk av informasjon det offentlige har, tilgang til åpne offentlige data og større demokratisk deltakelse. Eksempler på mål for elektronisk samhandling (ved bruk av metadata) At offentlige virksomheter har tilgang til de data de har behov for i saksbehandlingen på en enkel, effektiv og sikker måtet. Dataene skal hvis mulig komme fra andre offentlige virksomheter, og kunne hentes inn automatisk i det saksbehandlingen begynner. Metadata tilrettelegger for dette. Når borgerne sender søknader til det offentlige, skal så mye av dataene være fylt ut på forhånd. Utfyllingen skal være basert på de dataene det offentlige allerede har. Borgerne skal kun fylle inn data som det offentlige ikke har, og ha en mulighet til å korrigere de dataene som allerede finnes. Denne typen samhandling forutsetter at det finnes metadata. Ved innrapportering fra næringslivet ber offentlige virksomheter bare om data de ikke allerede har, og som ikke kan skaffes fra andre offentlige virksomheter. Så langt som mulig skal de offentlige virksomhetene samordne sine behov for innrapportering. Også her tilrettelegger metadata for denne typen tjenester. Ved utvikling av felles tversgående elektroniske tjenester (e-dialoger) er det behov for en felles forståelse av de dataene tjenesten skal benytte og også en beskrivelse av grensesnitten mellom de virksomhetsspesifikke tjenestene som skal inngå i e-dialogene. Metadata vil kunne beskrive både dataene og tjenestene baserte på dataene. 3.4 Effekter ved bruk av metadata for elektronisk samhandling Hovedmålet fokuserer på enkel, effektiv og sikker tilgang til offentlige data ved utvikling av elektroniske tjenester. Det gjelder ved intern saksbehandling, ved søknader fra borgere og ved innrapportering til det offentlige. Vi forutsetter at grunnleggende verdiene som likebehandling, etterprøvbarhet, åpenhet, rett til innsyn, sikkerhet og personvern ivaretas ved utviklingen av disse tjenestene. 2 Med tjeneste mener vi her en elektronisk løsning som skal understøtte en forvaltningsoppgave som det offentlige har. 8

Strukturerte beskrivelser av alle offentlige data (metadata) kan gi et grunnlag for: 1. Bedre oversikt over, og dermed tilgang til data, slik at de kan benyttes i nye offentlige tjenester. Dette kan også være et startpunkt for borgerne slik at de kan få innsyn i data som omhandler dem selv. 2. Samordning av begreper gjennom analyse av deres beskrivelse, slik at tilhørende data kan gjenbrukes på tvers av offentlige virksomheter. 3. En teknisk beskrivelse av dataene, slik at de kan være et utgangspunkt for å lage gode elektronisk tjenester i offentlig sektor. Figur 2 - Mulige effekter av strukturerte beskrivelser Metadata er en viktig komponent for å nå målet om gode elektroniske tjenester. Metadata kan brukes til å beskrive data som finnes i offentlig sektor, som utgangspunkt for å analysere data i offentlig sektor og som utgangspunkt for å lage gode elektronisk tjenester i offentlig sektor. Se figur over og beskrivelsen nedenfor for litt mer utdyping. Metadata kan brukes til å beskrive data som det offentlige har og som skal gjøres tilgjengelige for andre, både private og offentlig. Metadata kan beskrive hvilke data som finnes, hvilket format det finnes på og hvor man kan finne det. Metadata kan også brukes til å beskrive betingelsene for bruk av dataene og eventuelle begrensninger for bruk av dataene. Ved å analysere metadata kan man finne ut om data som en offentlig virksomhet etterspør allerede finnes hos en annen virksomhet. Dette kan medføre at man ikke trenger å hente informasjonen på nytt fra borgere/næringsliv, men kan hente det fra andre offentlige etater. 9

Ved å analysere metadata kan man også finne begreper som er overlappende eller sammenfallende slik at disse begrepene/dataene på sikt kan samordnes. Metadata kan brukes for å oversette mellom ulike datakilder slik at data kan utveksles mellom ulike tjenester og systemer. Metadata kan brukes som et utgangspunkt for å lage innholdet i tjenestene, og beskrive grensesnittene mot tjenester. Dette inkluderer utviklingen av tversgående tjenester (e-dialoger). Kort sagt beskriver metadata betydningen av data, konteksten de opptrer i, sammenhengen mellom dataene og hvordan dataene er lagret/representert. 10

4 Veier mot visjonen og målene Dette kapittelet vil beskrive ulike tilnærminger for å nå det ønskede målet om at alle data det offentlige forvalter skal være beskrevet på en strukturert måte og tilgjengeliggjort slik at det er enkelt å få oversikt over hvilke data det offentlige har og enkelt å etablere nye tjenester med utgangspunkt i beskrivelsene. 4.1 Kort om dagens situasjon Dagens situasjon er preget av elektronisk samhandling mellom 2 parter og innrapportering til noen felles innrapporteringssentraler. Eksempler på det siste er Altinn, Kostra og Tvinn. Se prosjektets rapport fra 15.01.2010 for mer informasjon. Utvekslingen mellom etatene skjer etter avtale og for hver utveksling må partene bli enige om hva som skal utveksles, betydningen av dataene som skal utveksles og formatet på dataene som skal utveksles. Som nevnt tidligere er dette effektivt ved få avtaler, men med flere avtalepartnere blir det komplekst og vanskelig å håndtere, dvs. lite skalerbart. Endringer i en avtale kan få følger for andre avtaler om utveksling. En mulig løsning er å beskrive de dataene virksomheten har på en strukturert måte slik at det blir enklere å etablere nye avtaler om utveksling og at endringer i betydningen av, eller formatet på, data blir gjort kjent for alle avtalepartene. Ved innrapportering til en felles innrapporteringssentral har som regel mottaker definert hvilke data som skal inn og gjort dette kjent for alle som skal sende inn. Her er det allerede en koordinering. Utfordringen her er at innrapporteringen ofte er per domene og det må etableres flere innrapporteringsløsninger. Dette kan være fornuftig hvis de som skal sende inn har få steder de skal forholde seg til. Hvis antall innrapporteringssteder øker for hver virksomhet vil kompleksiteten øke, og vi får de samme problemene som ved direkte utveksling mellom 2 aktører. Desto flere parter du må utveksle data med, desto større blir behovet for en strukturert beskrivelse av dataene som utveksles, at dataene som ønskes utveksles kan skaffes på en enkel måte og at formatet på dataene er det samme for alle partene du utveksler med. Som nevnt tidligere vil kostnadene for datautveksling øke dramatisk med økende antall parter hvis det ikke finnes noen form for enighet om betydningen av dataene og formatet det skal utveksles på mellom partene som skal utveksle. Strukturerte beskrivelser av data kan redusere kompleksiteten og kostnadene ved utveksling av data mellom mange parter. 4.2 Alternative tilnærminger (strategier) Det er ulike tilnærminger for å nå målet om strukturerte beskrivelser av alle data det offentlige forvalter. Nedenfor kommer noen problemstillinger som må vurderes ved valg av strategi, og noen eksempler på mulige strategier. Foreløpig har prosjektet ikke tatt noen beslutning på hvilken tilnærming som bør velges. 11

Det er flere problemstillinger som må vurderes. Dette er også emner som skal diskuteres utover høsten i prosjektet: A. Skal dataene beskrives på en strukturert måte? a. Hvilke data bør modelleres/beskrives først? b. Hva skal beskrives (ulike nivåer av metadata)? I. Dette er omfanget av metadata c. Skal beskrivelsene følge en felles mal og inneholde de samme metadataene? I. Per domene eller for hele offentlig sektor? d. Skal beskrivelsene benytte et felles verktøy eller standard? I. Per domene eller for hele offentlig sektor? e. Skal beskrivelsene gjøres tilgjengelig på et felles sted? I. Per domene eller for hele offentlig sektor? B. Skal dataene som utveksles gjøres tilgjengelig på en felles måte (metadata for tjenester)? a. Skal det finnes krav til grensesnitt? I. Per domene eller for hele offentlig sektor? b. Skal det finnes krav til utvekslingsformater? I. Per domene eller for hele offentlig sektor? For dette prosjektet vil punkt A over være fokusområdet. Prosjektet vil også kunne peke på mulige tiltak på punkt B, men de enkelte tiltakene vil bli vurdert av felleskomponentprogrammet i Difi og av standardiseringsrådet. I neste kapittel blir de ulike problemområdene/dimensjonene beskrevet og vurdert nærmere. 4.3 Ulike dimensjoner som må vurderes Dette kapittelet beskriver ulike områder som bør vurderes ved valg av en strategi 4.3.1 Skal det være pålagt å utarbeide strukturerte beskrivelser? En grunnleggende vurdering er om offentlige virksomheter skal pålegges å utarbeide strukturerte beskrivelser av dataene de forvalter. Det kan også vurderes om enkelte sektorer eller domener skal pålegges å utarbeide strukturerte beskrivelser. En tilhørende vurdering er hvem som skal utarbeide de strukturerte beskrivelsene. Skal det være den enkelte virksomhet, gjort sentralt, eller per domene/sektor. 4.3.2 Hvilke data skal beskrives først? Det bør også vurderes hvilke data som skal beskrives. De data en virksomhet utveksler elektronisk, de en virksomhet tilbyr elektronisk, de en virksomhet kan tilby elektronisk eller alle data en virksomhet har uavhengig om de kan tilbys elektronisk eller ikke. Det kan også være registerdata og/eller saksbehandlingsdata. 12

Se figur under. Figur 3- Omfanget av dataene som skal beskrives kan variere Det vil være umulig å beskrive alle former for data strukturert på en gang. Vi bør starte med noen typer data og utvide beskrivelsene etter hvert. Det er viktig å vurdere hvilke data vi bør starte med i forbindelse med en strategi. 4.3.3 Nivå på og innhold i de strukturerte beskrivelsene (metadata) Metadata finnes på ulike nivåer, se vedlegg A. De kan være knyttet til beskrivelse av et helt datasett, de enkelte elementene i et datasett og de enkelte instansene av data. Noen metadata er knyttet til betydningen av begreper, noen er knyttet til konteksten til dataene, mens andre er knyttet til tekniske detaljer om dataene eller utforming av tjenester. Skal det finnes metadata på alle disse nivåene? Jo flere nivåer som skal beskrives desto mer omfattende og komplekst blir det. Fordelen er at det blir en helhet i metadataene og det kan bli enklere å etablere elektroniske tjenester. Finnes det bare strukturerte beskrivelser av dataenes betydning kan man finne ut hvilke data det kan være interessant å utveksle, men man vil trenge flere detaljer for å finne ut hvordan det kan gjøres. Det vil også være behov for metadata om kontekst for å finne ut om det er lovlig å utveksle dataene og at betydningen av dataene virkelig er det samme. Jo flere nivåer metadataene omfatter desto mer arbeid blir det å utarbeide strukturerte beskrivelser. Figur 4- Desto flere områder metadata omfatter jo mer komplekse blir beskrivelsene En relatert problemstilling er om beskrivelsen på hvert nivå skal følge en felles mal eller om hver enkel virksomhet skal ha frihet til å utforme beskrivelsene slik de vil. En felles mal vil fortelle hvilke metadata som skal tas med for datasett, dataelementer og instanser av data og også hvordan utformingen av metadataene skal være. Maler vil definere innholdet i beskrivelsene på de ulike 13

nivåene. Fordelene med en felles mal for beskrivelsene er at det blir lettere å finne fram og lettere å utveksle beskrivelsene. Ulempene er at en mal ikke er optimalt for alle virksomheter slik at det blir unødvendig komplekst eller omfattende for noen. Maler kan også gjøre det enklere for små virksomheter som ikke har kjennskap til hvordan man skal utforme strukturerte beskrivelser. For hver type strukturert beskrivelse må det vurderes om det skal lages en mal for innholdet i beskrivelsen, om denne malen skal være obligatorisk eller anbefalt, eller om det skal være full frihet i hva som skal beskrives. Det må vurderes hvilke nivåer som det skal utformes strukturerte beskrivelser for og om det skal stilles krav til innholdet i beskrivelsene på hvert nivå. Som for de fleste dimensjonene kan det hvis ønskelig lages ulike løsninger for ulike domener/ sektorer og virksomheter. 4.3.4 Frihet eller felles teknisk løsning for metadata Nivå og innhold i beskrivelsen er en dimensjon. Hvordan man teknisk skal gjennomføre beskrivelsene er en annen dimensjon. Skal det stilles krav til hvordan man teknisk skal gjennomføre beskrivelsene? Tradisjonelt har det vært frihet i valg av løsninger i offentlig sektor. Dette følger av linjeprinsippet. Virksomhetenes frihet i valg av løsninger har blitt utfordret på grunn av manglende samvirke mellom tekniske løsninger. For å skape bedre samvirke er det blitt stilt krav om bruk av gitte standarder via referansekatalogen for IT-standarder i offentlig sektor og bruk av felles tekniske løsninger som Altinn. Det blir et spenn fra frihet, via standarder til felles tekniske løsninger. Standarder og felle løsninger kan også gjøres obligatorisk eller anbefalt. Også på dette området kan man tenke seg ulike løsninger for ulike domener/ sektorer og virksomheter. 4.3.5 Hvordan skal de strukturerte beskrivelser (metadata) tilgjengeliggjøres? De strukturerte beskrivelsene kan gjøres tilgjengelig på mange måter. De kan blant annet legges ut som tekst på nettsider, i tabeller, som metadatatjenester i databaser eller legges inn i spesialløsninger. Det må også vurderes om beskrivelsene skal presenteres samlet for en sektor, domene eller hele offentlig sektor, eller individuelt for den enkelte virksomhet. Hvilken rolle har nettsteder som data.norge.no i tilgjengeliggjøringen av metadata? 4.3.6 Harmonisering/koordinering av begreper Felles beskrivelser er kun en del av å få til en velfungerende datautveksling i offentlig sektor. For å gjøre datautveksling enklere bør også begrepene harmoniseres/koordineres hvis det er mulig. I dag benyttes ulike navn på de samme begrepene, samme navn på ulike begreper og det finnes mange varianter av nesten like begreper. Over tid bør det skapes en felles forståelse av begrepene og det bør være en felles navngiving av 14

begrepene slik at det blir lettere å utveksle data. Harmonisering av begreper er nær knyttet til harmonisering av regleverk. Felles bruk av begreper starter i lovverket og fortsetter i de tekniske løsningene. Harmonisering av betydningen av data kan enten skje før beskrivelsene og datautveksling gjøres, eller i etterkant når det oppdages at begrepene er ulike eller kan samordnes. Difi jobber med et forslag knyttet til dette i et eget prosjekt. Gruppa vil ikke komme med løsningsforslag knyttet til dette, men peke på mulige tiltak på området. 4.3.7 Eierskap til data Hvem som skal ha ansvar for eller eierskap til de forskjellige dataene kommer ofte opp som en problemstilling. Hvem er den autoritative kilden for ulike data? Her er det snakk om å få et helhetlig system for, eller organisering av, de dataene det offentlige har, dvs. informasjonsforvaltning. Dette er et viktig område, men ligger på utsiden av gruppens mandat. Gruppa vil ikke komme med løsningsforslag knyttet til dette, men peke på mulige tiltak på området. 4.3.8 Oppsummering av alternative tilnærminger Når det gjelder utarbeidelsen av beskrivelsene har vi følgende problemstillinger: Hvilke data skal beskrives først, hvilket nivå av metadata skal beskrivelsene omfatte, hvilket innhold skal beskrivelsene ha og hvilke tekniske løsninger skal benyttes til beskrivelsene. I tillegg har vi problemstillingen knyttet til hvordan de strukturerte beskrivelsene skal gjøres tilgjengelig? Nedenfor er en tabell som viser områdene som må vurderes og noen alternative løsninger. Dette er ikke alle mulige løsninger Vurderingsområder for strategi Hvilke data skal beskrives først Hvilke nivåer av metadata skal beskrivelsen omfatte? (Omfang av metadata) Hvilket innhold skal beskrivelsene ha? Tekniske krav til løsninger for strukturerte beskrivelser. Tilgjengeliggjøring av strukturerte beskrivelser Registerdata Kun beskrivelser Ingen sentrale krav Noen mulige alternativer Data som utveksles Kontekst Sentrale anbefalinger/maler Alle data Tekniske forhold Sentrale krav /maler Ingen krav Krav til standarder Felles løsning Lokalt Per domene Felles Tabell 1- Områder for vurdering ved utforming av en strategi for metadata 15

4.3.9 Mulige virkemidler Det er flere virkemidler som kan tas i bruk for å nå målet om at alle data det offentlige forvalter skal beskrives på en strukturert måte. Pålegg til offentlige virksomheter at de skal beskrives sine data på en strukturert måte. (Frivillighet vs. Pålegg) Bruk av felles maler, standarder eller løsninger for utarbeidelse av beskrivelsene. Bruk av felles maler eller løsninger for publisering av beskrivelsene. I tillegg finnes det generelle virkemidler som: Utarbeidelse av informasjon og veiledningsmateriale. Etablering av møteplasser for erfaringsutveksling. Kartlegginger og utarbeidelse av måle- og resultatindikatorer. 4.4 Eksempler på strategier Her kommer noen eksempler på strategier. De foreslåtte tiltakene vil kunne ha ulik plass i strategiene. Valg av strategi vil utformes basert på diskusjon av punktene beskrevet i avsnitt 4.2 og kapittel 6. Eksemplene vil variere når det gjelder: Hvilke data som skal beskrives og rekkefølgen de skal beskrives. Hvilke nivåer av metadata som skal omfattes. Bruk av maler, standarder eller felles løsninger for beskrivelsene. Tilgjengeliggjøring av de strukturerte beskrivelsene. 4.4.1 Fortsette med dagens system Her stilles det ingen felles krav til bruk av metadata eller at data skal beskrives. Strukturerte beskrivelser gjøres ikke systematisk tilgjengelig. Domenene videreutvikler sine løsninger og det er ikke noen felles koordinering eller harmonisering av begreper, koordinering skjer på prosjektbasis. Metadata beskrives når tjenester tas i bruk i Altinn. Når alle tjenester er i Altinn vil det finnes en beskrivelse av de data som det offentlige utveksler gjennom metadataene som er benyttet i tjenestene. Disse er ikke gjort tilgjengelig for borgere og næringsliv. En fortsettelse av dagens system hvor strukturerte beskrivelser (metadata) ikke gjøres tilgjengelig, vil ikke gi forbedringer knyttet til større åpenhet rundt de data det offentlige har og ikke føre til bedre innsyn eller tilgjengelighet av data. 4.4.2 Frivillig beskrivelse og tilgjengeliggjøring av metadata Alle offentlige virksomheter oppfordres til å tilgjengeliggjøre strukturerte beskrivelser av de data de utveksler. 16

Dette er en strategi hvor man overlater til virksomhetene selv å velge om de skal beskrive sine data. En slik strategi forutsetter at virksomhetene får informasjon om dette og hjelp til å gjennomføre beskrivelsene. Et tiltak her er bruk av kvalitetskriterier på nett for å få til en endring hos virksomhetene. Det bør også finnes maler og veiledningsmateriale for hvordan beskrivelsene skal skje. Vurdering av mulige identifikatorer og modellering av de sentrale registrene kan benyttes for å vise hvordan strukturerte beskrivelser kan gjøres. Det er også viktig å støtte opp under etableringen av data.norge.no for å ha et felles sted hvor man kan publisere sine strukturerte beskrivelser (metadata). 4.4.3 Krav til metadata på noen få nivåer for data virksomhetene utveksler Krav til å beskrive betydningen av alle begreper som utveksles, uten krav til form og innhold på beskrivelsene. Alle virksomheter blir pålagt dette. Dette er en mild form hvor virksomhetene pålegges å beskrive sine data, men hvor det ikke stilles noen konkrete krav til hvordan dataene skal beskrives. En slik strategi bør støttes opp av gode eksempler og maler som den enkelte virksomhet kan velge å bruke. Det kan være naturlig å starte med registerdata og følge opp med krav til nye løsninger som utarbeides. På sikt kan man beskrive eksisterende løsninger som ikke er knyttet til registre. En slik strategi bør suppleres med tiltak som utvikler maler, beskriver viktige områder for utveksling, klargjør forvaltningsansvar for data, identifikasjon av begreper på tvers av virksomheter og etablering av metadata norge. Kriteriene til kvalitet på nett kan også brukes for å få opp omfanget av metadata som beskrives. 4.4.4 Pålegge den enkelte offentlige virksomhet å beskrive og tilgjengeliggjøre sine data på noen nivåer basert på maler Pålegge alle offentlige virksomheter å beskrive alle data de kan tilby elektronisk i henhold til fastsatte maler, men kun for noen nivåer. Dette er et pålegg som gir virksomhetene et merarbeid. Ikke bare må de beskrive de dataene de utveksler i dag, de må også vurdere hvilke andre data de kan gjøre tilgjengelig for andre. Alle dataene må beskrives på en felles måte og gjøres tilgjengelig på en felles måte. Dette betyr at det må finnes maler og standarder for hvordan dette skal gjøres. Virksomhetene velger selv hvilke verktøy de ønsker å benytte for å beskrives sine data, men verktøyene må støtte de malene og standardene som fastsettes. Det kan være naturlig å starte med registerdata og data de utveksler i dag og følge opp med krav til nye løsninger som utarbeides. På sikt kan man beskrive eksisterende data som ikke er knyttet til registre eller til utveksling. En slik strategi bør suppleres med utarbeidelse av standarder og maler for metadata, felles løsninger for tilgjengeliggjøring av data, en prioritert 17

rekkefølge på dataene som skal beskrives siden det er for omfattende å ta alle på en gang, vurdering av sikkerheten ved å publisere så mye strukturerte beskrivelser, systemer for eierskap av data og metadata og støtte for harmonisering av begreper. 4.4.5 Beskrive registerdata på alle nivåer med en felles struktur og en felles løsning Alle registre som benyttes av flere enn en virksomhet blir pålagt å beskrive sine data på alle nivåer, med krav om bruk av felles verktøy og maler. Dette er et omfattende pålegg som vil ramme mange virksomheter. De fleste offentlige virksomheter har registre. Mange av disse benyttes også av andre eller kan bli benyttet av andre. Fokuset er på å tilgjengeliggjøre registerdata for bruk i det offentlige og ut mot borgere og virksomheter. Her begrenses hvilke data som skal beskrives til registerdata. For å få en samordnet effekt benyttes den samme løsningen for å beskrive registrene og omfanget av metadata er det samme for alle registre. En slik strategi bør suppleres med en modellering av noen registre for å teste ut løsningen som skal benyttes. Det må også stilles krav til hvilke metadata som skal være med i beskrivelsene, en oversikt over kodelister, en oversikt over definisjon av begrepene som benyttes og krav til eierskap av dataene. Metadataene for registrene må også samordnes med utviklingen av data.norge.no. Det bør gjennomføres en harmonisering av felles begreper som benyttes i mange registre, vurdering av sikkerheten ved å tilgjengeliggjøre strukturerte beskrivelser og identifikatorer for de sentrale begrepene. 4.4.6 Pålegge den enkelte offentlige virksomhet å beskrive data de kan tilgjengeliggjøre ved bruk av en felles løsning for all nivåer Alle offentlige virksomheter blir pålagt å beskrive de data de kan tilgjengeliggjøre ved bruk av en felles løsning. Beskrivelsene skal omfatte alt fra definisjoner til tekniske forhold. Denne løsningen vil ligne på krav om bruk av SERES, men en SERES med utvidet funksjonalitet i forhold til dagens løsning. Dette er et omfattende pålegg. Virksomhetene blir pålagt å benytte en felles løsning og beskrive alle data de kan tilby. Dette krever en teknisk integrasjon hos virksomheter hvis dataene skal benyttes til å utvikle egne tjenester eller beskrivelsene skal ta utgangspunkt i egne systemer. Skal bruk av en felles løsning pålegges må løsningen tilfredsstille de kravene som utarbeides til styring og organisering av felleskomponenter i regi av felleskomponentprogrammet i Difi. En slik strategi bør suppleres med utarbeidelse av et felles rammeverk for modellering og beskrivelse av data, en felles løsning, felles identifikatorer, en vurdering av sikkerheten ved å tilgjengeliggjøre strukturerte beskrivelser harmonisering av begreper og eierskap til data. 18

4.4.7 Løsninger per domene Hvert domene beskriver de data de har tilgjengelig med den løsningen og med det innhold de finner hensiktsmessig. Det stilles krav om at beskrivelsene gjøres tilgjengelig på en standardisert struktur og i et bestemt format. Her overlates den strukturerte beskrivelsen til det enkelte domene / den enkelte sektor. Det som kreves er at beskrivelsene skal være tilgjengelig på en bestemt måte. Dette vil lette forståelsen av begreper mellom sektorer. Det kan være utfordrende for domenene å tilgjengeliggjøre sine beskrivelser på en bestemt måte hvis de benytter verktøy og løsninger som ikke støtter dette. Domenene bør starte med å beskrive de data de utveksler internt og deretter fortsette med data de utveksler med andre domener. En slik strategi bør suppleres med maler og standarder for tilgjengeliggjøring av metadata. Det bør også vurderes felles identifikatorer, sikkerhet og harmonisering av sentrale begreper. 19

5 Forslag til tiltak Uansett valg av strategi vil det være et langsiktig arbeid å få fram strukturerte beskrivelser av alle data det offentlige forvalter. Det mest fornuftige er en skrittvis tilnærming og gjennomføring av enkeltvise tiltak. Tiltakene beskrevet i dette kapittelet er ideer som er foreslått av gruppa i løpet av prosjektet. Dette er eksempler på mulige tiltak. Disse tiltakene er foreløpig ikke vurdert opp mot ulike strategier eller satt i system. Under det videre arbeidet vil det dukke opp forslag til flere tiltak og noen tiltak vil forsvinne. Diskusjonene rundt tiltak er brukt for å konkretisere arbeidet, gjennom å få fram de ulike dimensjonene som må vurderes ved utforming av en strategi. 5.1 Tiltak 1 Vurdere en standard for identifikatorer Navn på tiltaket Vurdere en standard for identifikatorer Kort omtale av tiltaket Utrede og beslutte en standard for identifikatorer som skal brukes til å identifisere hva offentlige data beskriver, hva dataene handler om. Det anbefales at standarden for identifikatorer baserer seg på Uniform Resource Identifier (URI) og følger beste praksis for utforming av identifikatorene og oppførsel. Tiltaket tilsvarer tiltaket foreslått i Utredning standarder for definisjonsarbeid. Det er vanligvis 4 generelle krav for identifikatorer: Unike (uniqueness,) Persistente (persistence) Sporbarhet (traceability) Anvendelse (feasibility) En standard for identifikatorer bør tilfredstille disse generelle kravene Hva ønsker vi å løse/oppnå med tiltaket? Målet er å sikre at metadataene i seg selv ikke kan forveksles med hverandre. Begrepet inntekt i en kontekst/en betydning skal ha en annen identifikator i en annen betydning. Istedenfor følgende tvetydige tabell: ID Inntekt 03077512345 33.333 991825827 77.777 vil dette tiltaket bidra til å sikre entydighet gjennom bruk av unike merkelapper, slik at opplysningene over kan fordeles i en tabell for persondata: 20

http://skatteetaten.no/vokabula http://skatteetaten.no/vokabular/personi r/fnr nntekt 03077512345 33.333,- Og en tabell for opplysninger om organisasjonen 3 : https://ws.brreg.no:443/lod/voc https://ws.brreg.no:443/lod/vocab/drifts ab/orgnr overskudd 991825827 77.777,- Hvilken rolle vil metadata ha i tiltaket? For dette tiltaket er spørsmålsstillingen egentlig motsatt; hvilken rolle vil dette tiltaket ha for metadata? Svaret er at tiltaket er nødvendig for å få så gode og anvendelige metadata som mulig. Detaljene for hvordan identifikatorer skal utformes og brukes bør utredes nærmere, men et forslag er å bruke Uniform Resource Identifier (URIer) i tråd med beste praksis, definert bl.a. i Cool URIs for the Semantic Web 4 og Cool URIs don t change 5 Hvilke effekter kan tiltaket medføre? Entydige referanser til begrep. Data som tilgjengeliggjøres kan knyttes sammen med andre data, publisert andre steder Linked Data. 6 Forholdet til andre tiltak (Spesielt SERES) Dette tiltaket harmonerer godt med SERES, som nylig har etablert et grensesnitt for å gjøre innholdet i SERES tilgjengelig som Linked Open Data, hvilket bl.a. innebærer at alle elementer i datamodellene i SERES nå kan refereres til vha en URI. Det bør vurderes om identifikatoren skal ha en struktur hvor den tillater mapping av eksisterende domenespesifikke identifikatorer? Forutsetninger for tiltaket Det er ingen forutsetninger for tiltaket. 3 URIene i tabellen for persondata er eksempler på mulige URIer, funnet på i farten. URIene i tabellen for organisasjonsdata er derimot de som brukes av Brønnøysundregistrene i forbindelse med deres forsøk på å tilgjengeliggjøre data fra enhetsregisteret ved hjelp av semantiske teknologier, jfr side med oppslag på Difis organisasjonsnummer: https://ws.brreg.no/lod/enhet/991825827 [sist besøkt: 2010-06-07]. For mer informasjon om dette forsøksprosjektet, se: http://www.brreg.no/nyheter/2010/05/semicolon_tilgang_data.html [sist besøkt: 2010-06-07] 4 Se: http://www.w3.org/tr/cooluris/ [sist besøkt 2010-06-07] 5 Se: http://www.w3.org/provider/style/uri [sist besøkt 2010-06-07 ] 6 For en kort, god og oppdatert oversikt over Linked Data, se Topic Report No. 7: Linked Data and Government http://www.epsiplatform.eu/topic_reports/topic_report_no_7_linked_data_and_government 21

5.2 Tiltak 2 - Etablere et system for forvaltning av de dataene det offentlige har Dette er et område som er viktig for en god forvaltning av de data det offentlige har. Det ligger litt på siden av en metadatastrategi, men gruppa vurderer det som viktig å peke på at noe bør gjøres på området. Etablere et system for forvaltning av de dataene det offentlige har. Dette kan innebære at man definerer eiere av ulike datasett som blir ansett som den autoritative kilden for denne typen data. På mange områder er det slik at en etat har ansvar, men dette kommer ikke alltid tydelig fram i dag. Hvis ansvaret ble klart definert ville dette kunne gi bedre kvalitet på dataene siden man vet hvem som skal ha oppdatert informasjon og det kunne hjelpe på gjenbruk siden man vet hvor man skal henvendes seg for ulike type data. Metadata vil inkludere en beskrivelse av eierskapet eller mangelen av et tydelig eierskap. Men metadata i seg selv kan ikke løse de utfordringer uklar forvaltning av data skaper (dubletter, skyggeregistre, dårlig datakvalitet osv). Oppnevne en Chief Information Officer (CIO) for offentlig sektor som har ansvaret for at alle data er beskrevet og har en eier. 5.3 Tiltak 3 Modellere et framtidig persondomene Navn på tiltaket Modellere, beskrive og lage et persondomene som inneholder den mest brukte personinformasjonen i offentlig sektor. Kort omtale av tiltaket Tilgang til informasjon om enkeltpersoner er en forutsetning for størstedelen av tjenesteproduksjonen i offentlig sektor. For å nå målbildet om at all data det offentlige forvalter skal være strukturert beskrevet, vil det være fornuftig å starte med å kartlegge og modellere felles data knyttet til person, og deretter beskrive betydningen av dataene. Fokuset bør ligge på legaldefinisjoner, eierskap (hvilken etat har produsert opplysingen), hvem er registerfører, osv. Modellen bør beskrive behovet til det offentlige og ikke ta utgangspunkt i eksisterende registre. Tiltaket inkluderer etableringen av en felles forståelse av hva som er felles grunndata på personinformasjonsområdet. Hva ønsker vi å løse/oppnå med tiltaket? Gevinster for offentlig sektor: Muliggjøre og effektiviserer elektroisk samhandling i offentlig sektor Muliggjør flere og mer helhetlige elektroniske selvbetjeningsløsninger(f eks www.endreadresse.no) Forenkler utreding, analyse- og designfasen i systemutviklingsprosjekter. 22

Gir mulighet til å foreslå regelverksendringer som gir høy automatiseringsgrad. Hindrer feil bruk av data/tjenester i fremtidige systemer Grunnlaget for god informasjonsforvaltning for persondomenet (master data management). Hvem har eierskapet til opplysingen og dermed et ansvar for ajourhold og datakvalitet. Det kommer tydeligere fram hvilket register som er master. Færre registre med samme type informasjon kan gi bedre datakvalitet. Grunnlaget for etableringen av et fremtidig personregister eller modernisering av det sentrale folkeregisteret (DSF). Hvilken rolle vil metadata ha i tiltaket? Gruppa mener at det er viktig å ha fokus på noen typer av fellesoffentlige grunndata bl.a.: Opplysinger som følger av en autorativ avgjørelse, dvs at informasjonen er produsert av et kompetent organ. Eksempler på slike opplysinger er gift/skilt, oppholdstillatelse, verge, pensjonist. Opplysinger med ulik definisjoner og eierskap til ulike sektorer/regelverk, eller internt i regelverk, eks inntekt, samboer. Informasjonselementer som det offentlige har behov for der det er uklart eierskap og ulik praksis. Eksempelvis adresser. NAV og andre har behov for adresser som i per i dag ikke er tilgjengelig i DSF og registrerer derfor tilleggsadresser i egne systemer. Posten vedlikeholder sine egne postadresser, da ajourholdet på postadressene i DSF ikke er godt nok. Forholdet til andre tiltak (Spesielt SERES) Tiltaket er avhengig av et felles rammeverk for beskrivelse av informasjon og det er nærliggende å bruke SERES som et utgangspunkt for tiltaket. Tiltaket vil evaluere egnetheten av SERES til denne type modellering. Forutsetninger for tiltaket Tiltaket forutsetter at det etableres et felles offentlig rammeverk for å beskrive og strukturere metadata på et semantisk og juridisk nivå. 5.4 Tiltak 4 Beskrive de fire store registrene med felles metoder og verktøy Beskrive de 4 store registrene, A/A-registeret, enhetsregisteret, matrikkelen og det sentrale personregisteret, på en felles måte og relatere informasjonen som finnes i disse registrene. Bruke felles metoder og eventuelt verktøy. Skal gi grunnlag for å lage systemer slik at alle som har behov for det i offentlig sektor skal kunne hente ut informasjon fra disse registrene på en ensartet måte. Dette er en test på om felles modellering er hensiktsmessig. Navn på tiltaket 23

Beskrive de 4 store registrene, A/A-registeret, enhetsregisteret, matrikkel og det sentrale folkeregisteret på en felles måte og relatere beskrivelsene av informasjonen som finnes i disse registrene. Kort omtale av tiltaket Det er viktig for samhandlingen og informasjonsutvekslingen i og med offentlig sektor at data er beskrevet på ensartet måte. Omforente og standardiserte beskrivelser av data sikrer forståelse for både menneske og maskin på tvers av fagområder. For å kunne lage standardiserte og omforente nasjonale informasjonsmodeller over ulike områder (for eksempel personområdet) er det en rekke faktorer som må på plass. Essensielt er omforent begrepsbruk og standardiserte språk, teknikker, retningslinjer og rammeverk. Hva ønsker vi å løse/oppnå med tiltaket? Få erfaringsgrunnlag i forhold til en felles måte for beskrivelse av data i offentlig sektor og avdekke behov og krav til en felles løsning. En felles løsning gir også muligheter for samordning og gjenbruk av begreper og informasjonsstrukturer på tvers av fagområder. Det er viktig å finne metodikker og prosedyrer for hvordan beskrivelse av metadata i den sammenheng kan og skal samordnes. I tillegg er tiltaket en nyttig konkretisering av temaet som vil skape forståelse og erfaring knyttet til viktigheten av omforente informasjonsmodeller (beskrivelser). Hvilken rolle vil metadata ha i tiltaket? Tiltaket vil resultere i strukturelle metadata som beskriver innholdet (informasjonsmodeller) i de fire store registrene, uavhengig av de systemene som implementerer registrene. Metadatene må beskrives med et standardisert språk (for eksempel UML) på en omforent måte, det vil si i henhold til felles retningslinjer. Metadataene må på sikt være lett tilgjengelig for menneske og maskin på data.norge.no, det vil si i form av tekstlig beskrivelse for personer og standardiserte formater for maskiner. Hvilke effekter kan tiltaket medføre? Felles forståelse for informasjonsmodellering i offentlig sektor. Omforent begrepsbruk i forhold til samordning av begreper og informasjonsstrukturer. Eksempler til etterfølgelse. Evaluering av eksisterende løsninger for beskrivelse av informasjon. Forholdet til andre tiltak (Spesielt SERES) Tiltaket er avhengig av et felles rammeverk for beskrivelse av informasjon og det er nærliggende å bruke SERES som et utgangspunkt for tiltaket. Tiltaket vil evaluere egnetheten av SERES til denne type modellering. Forutsetninger for tiltaket Tiltaket fordrer tilgang til en metadataløsning der alle fire registrene kan beskrives. Tillegg A Tekniske forutsetninger for rammeverk for felles beskrivelse av informasjon: 24

En omforent og standardisert måte å definere, knytte sammen og forvalte begreper innenfor ulike fagområder (begrepsmodeller) En omforent og standardisert måte å definere strukturerte beskrivelser av informasjon ved hjelp av kjente begreper (informasjonsmodeller) Standardiserte teknikker for å realisere (bruke) beskrivelser av data for ulike formål og realiseringer Et rammeverk som kan håndtere spesifikasjon, tilgjengeliggjøring og forvaltning av de ulike modellene og koblinger mellom disse. Retningslinjer for utarbeidelse av de ulike modellene Fora som kan harmonisere begrepsbruk på tvers av områder Prosedyrer og mekanismer for innmelding og håndtering av endringer og nye behov I en enda mer teknisk versjon trenger man å: Bestemme hvordan man ønsker å beskrive data, det vil si språk typisk UML, eventuelt OWL for begrepsmodeller Bestemme seg for hvordan man vil bruke modelleringsspråket Definere en felles objekt-/datamodell (metamodell) som sier hvordan dataenen skal og kan struktureres Retningslinjer for hvordan metamodellen kan brukes for å lage omforente, standardiserte og utvetydige begreps- og informasjonsmodeller 5.5 Tiltak 5 - Støtte etableringen av data.norge.no Navn på tiltak: Støtte etableringen av data.norge.no Kort omtale av tiltaket: En viktig del av den nasjonale metadatastrategien vil være å støtte opp under data.norge.no gjennom å sørge for god kvalitet og helhetlig profil på metadata som kan brukes til å formidle, forstå, finne og/eller gjenbruke dataene som legges ut der. Hva ønsker en å løse/oppnå med tiltaket: Økt gjenbruk av data Hvilken rolle vil metadata ha i tiltaket Data uten metadata har ingen informasjonsverdi. Det vil være helt nødvendig å etablere god forståelse for og god tilgang til metadata for at ambisjonene til data.norge.no skal lykkes. Hvilke effekter kan tiltaket medføre: Å støtte etableringen av data.norge.no vil bidra til kvalitetsheving av innholdet, noe som igjen vil bidra til økt bruk og dermed støtte effektmålene til data.norge.no. 25

Forholdet til andre tiltak (spesielt SERES): Metadataene i SERES vil være én kilde til metadata for noen av dataene som legges ut i data.norge.no. Forutsetning for tiltaket: Dette tiltaket er avhengig av tiltaket: Lage et forslag på hvilke metadata som skal tas med for de dataene som skal beskrives. 5.6 Tiltak 6 Metadata norge Navn på tiltak: Etablere metadata.norge.no for å skape en oversikt over metadata i offentlig sektor Kort omtale av tiltaket: Formålet med websiden er å gjøre det offentlige Norges metadata lettere tilgjengelige og enklere å bruke. Via denne siden skal du kunne søke etter informasjon knyttet til begreper, definisjoner, kodeverk, lovverk etc. Etter hvert kan en også legge inn lenker til lenker til tilhørende offentlige data og relevante internasjonal metadatakilder i portalen. Hva ønsker en å løse/oppnå med tiltaket: Viser og setter i sammenheng de ulike eksisterende initiativene innenfor metadataportaler Koordinering av begreper slik at offentlige sektor framstår mer enhetlig f.eks. gjennom gjenbruk av hverandres begreper og definisjoner der hvor det er relevant. Det vil gi en effektiviseringsgevinst og økt transparens innen offentlig sektor ved at metadata gjøres lettere tilgjengelige. Økt forståelsen for metadataområdet. Være en felles ressurs for samhandling i offentlig sektor. Hvilken rolle vil metadata ha i tiltaket Metadata vil være essensen i tiltaket. De viktigste metadatatypene skal beskrives på en omforent måte, og resultatet skal publiseres på Internett. Hvilke effekter kan tiltaket medføre: Metadataportalen kan bidra til å redusere oppgavebyrden nasjonalt siden metadata er nøkkelen til samhandling mellom ulike etater (f.eks. gjennom SERES) og samvirkende systemer. Se også effekter under Hva ønsker en å løse/oppnå med tiltaket. Forholdet til andre tiltak (spesielt SERES): Det finnes etatsspesifikke metadataportaler i dag for eksempel SSB: http://www.ssb.no/metadata/, KITH: http://www.volven.no/, SERES ordbok wiki-løsningen, SKV: http://www.statkart.no/ips/filestore/cd2003/std/sosi34/del2.htm. Det finnes også privat aktører som har etablert metadatasider som f.eks Lovdata: http://www.lovdata.no/info/fakta.html Forutsetning for tiltaket: De ansvarlige etatene må dokumentere sine metadata (trinnvis) og gjøre dem tilgjengelige på Internett på en omforent måte. Det vil også være en fordel at metadataportalen knyttes opp til data.norge.no. I 26

tillegg er det viktig at det foreligger et felles begrepsapparat på metadataområdet. 5.7 Tiltak 7- Kartlegge datautveksling Det er et klart behov for å få beskrevet hvilke data som blir utvekslet mellom offentlige virksomheter i dag. Vi kan begynne med å kartlegge faktisk datautveksling på enkelte områder i offentlig sektor. Vi kan ta utgangspunkt i noen store etater som skatt og NAV og se hvem som bruker deres data eller starte med de fires store registrene, se tiltak 4. 5.8 Tiltak 8 Kodelister Lage en felles oversikt over kodelister som benyttes i offentlig sektor slik at andre kan gjenbruke disse, eller bruke det samme systemet i sine løsninger. Dette vil støtte tiltak 6. men krever et særskilt tiltak på grunn av den store mengden og variasjonen av kodelister i offentlig sektor. 5.9 Tiltak 9 Vurdere sikkerhetsmessige aspekter Navn på tiltak: Vurdere de sikkerhetsmessige sidene ved å publisere informasjon om hvilke data det offentlige har. Kort omtale av tiltaket: Det skal lages en utredning av de sikkerhetsmessige sidene ved å offentliggjøre (detaljerte ) opplysninger/metadata om hvilke data(sett) det offentlige har. En må f.eks. vurdere om totaloversikter over hvilke data som finnes hos hvilke etater og på hvilket format, kan gjøre det enklere for folk med uærlige hensikter å hacke seg inn til selve dataene. En må også se på om tilgjengeliggjøringen av metadata stiller større krav til konfidensialitet i de underliggende dataene, f.eks. fordi opplysningene om datasettene gjør det lettere for brukere å identifisere datasett som sammenstilt f.eks. vil kunne identifisere personer. Det er en problemstilling at det finnes enkelte datasett som hver for seg ikke er sensitive, men som sannsynligvis kan sammenstilles på en måte som gjør at kravene til konfidensialitet brytes. Hva ønsker en å løse/oppnå med tiltaket: En ønsker å oppnå at de sikkerhetsmessige sidene er vurdert, og at eventuelle forholdsregler tas slik at ikke tilgjengeliggjøringen av metadata blir en trussel i forhold til sensitive data og personvern. Hvilken rolle vil metadata ha i tiltaket Metadata er hovedfokuset i tiltaket, men må ses i sammenheng med de tilhørende data. Hvilke effekter kan tiltaket medføre: Tiltaket vil medføre at de sikkerhetsmessige sider er vurdert, og kan legge føringer på måten metadata skal presenteres på. Utredningen kan også ha konsekvenser i forhold til de underliggende data og måten de skal presenteres på (bl.a. detaljeringsnivå), f.eks. for å ivareta konfidensialitet. 27

Forholdet til andre tiltak (spesielt SERES): En må inkludere alle typer metadata (der sannsynligvis SERES vil være en viktig kilde) i de sikkerhetsmessige vurderingene. Forutsetning for tiltaket: Det må nedsettes en gruppe med kompetanse innenfor datasikkerhet, metadata og konfidensialitet (spesielt i forhold til sammenstilling av ulike datakilder). Dette arbeidet bør også ha kontakt med data.norge.no siden betraktninger rundt konfidensialitet og sammenstilling av data er høyst aktuell også for dem. 5.10 Tiltak 10 Etablere et felles begrepsapparat for metadata Navn på tiltak: Etablere et felles begrepsapparat på metadataområdet Kort omtale av tiltaket: Det bør lages et kort notat som tar for seg de viktigste begrepene innenfor metadataområdet (må identifiseres som en del av tiltaket) og definerer disse. En bør ta utgangspunkt i internasjonale definisjoner der disse finnes, og bruke eksempler for å illustrere bruken av begrepene. I tilfeller der sentrale begreper brukes ulikt innenfor ulike fagområder/domener(for eksempel basert på internasjonale regler) skal forskjellene dokumenteres. Hva ønsker en å løse/oppnå med tiltaket: Hovedhensikten med tiltaket er å oppnå en felles forståelse innenfor metadataområdet og dermed lette kommunikasjonen og unngå misforståelser i det videre arbeidet. En felles terminologi (med dokumentasjon av eventuelle avvik fagområdene imellom) vil være nyttig både internt i gruppen(e) som skal arbeide aktivt med metadata, og i kommunikasjon med eksterne interessenter, for eksempel relevante departement. Hvilken rolle vil metadata ha i tiltaket Dette tiltaket er et metametadataprosjekt dvs. et tiltak som beskriver metadataene (data om metadata). Hva som skal beskrives og hvordan er tatt med under kort omtale av tiltaket. Notatet bør publiseres både i papirform og elektronisk. På web bør det presenteres på et passende sted hos Difi der arbeidet rundt nasjonal metadatastrategi formidles. Presentasjoner av andre prosjekter i forvaltningen der metadata er en viktig del (både eid av Difi og andre etater/organer) bør også ha en lenke til denne publikasjonen. Hvilke effekter kan tiltaket medføre: Diskusjonen for å identifisere begrep og definere dem vil ha en bevisstgjørende og klargjørende effekt for deltakerne (de ulike etatene/organene). En vil få uklarheter og ulike forståelser av begreper på bordet, og kan søke å diskutere seg fram til en felles forståelse. I tilfeller der dette ikke er mulig, skal de ulike forståelsene dokumenteres. Både omforente og avvikende definisjoner skal illustreres ved eksempler på bruk av begrepet. Generelt vil tiltaket (som nevnt under hva en ønsker å oppnå med tiltaket), lette kommunikasjonen og bidra til å unngå misforståelser. Det vil forhåpentligvis også bidra til å konkretisere et område som mange vil oppfatte som litt diffust. 28

Forholdet til andre tiltak (spesielt SERES): Det blir viktig å ha kontakt med andre tiltak for å identifisere hvilke metadatabegreper som er sentrale og trengs å defineres, og å få med brukerne av de ulike begrepene i diskusjonen rundt definisjonene. Forutsetning for tiltaket: Det må nedsettes en kjernegruppe som kan arbeide aktivt med notatet. De berørte etatene/tiltakene må også bidra til høring av notatet. 5.11 Tiltak 11 Forslag til metadata som skal tas med i beskrivelsene Dette tiltaket vil diskuteres videre i gruppen og legge grunnlag for et forslag som sier hvilke metadata som bør være med i de strukturerte beskrivelsene. Navn på tiltak: Lage et forslag på hvilke metadata som skal tas med for de dataene som skal beskrives. Kort omtale av tiltaket: For at data skal kunne gjenbrukes, må de beskrives på en tilstrekkelig måte. Hva som er tilstrekkelige metadata, er avhengig blant annet av bruk, brukere og datatyper, eksempelvis filmsnutt, statistikktabell eller datafil. Det må etableres/tas i bruk et felles begrepsapparat på dataområdet. Hver datatype vil ha forskjellige behov for metadata. Det må tas hensyn til hyppighet av bruk, tilgang til data, dataformat, forventet kunnskapsnivå hos brukere osv. Forskjellige brukstyper og brukere bør vurderes; for eksempel datautveksling mellom etater og forskere som laster ned data fra data.norge.no. Det kan bl.a. tenkes at det lages et forslag til standard avtale for metadataleveranser i forbindelse med datautveksling mellom etater. Det kan også lages et forslag til minimums mengde av metadata som må lages før data kan legges ut på data.norge.no. Hva ønsker en å løse/oppnå med tiltaket: Data er en verdifull ressurs som det koster mye å framskaffe, og som er underbrukt. Målet er mest mulig gjenbruk av data. Hvilken rolle vil metadata ha i tiltaket? Metadata vil være essensen i tiltaket. Data uten metadata er ikke informative. Metadata må være lett tilgjengelige og forståelige for de som skal ta dataene i bruk. Hvis data er publisert på data.norge.no kan metadata publiseres på metadata.norge.no og lenkes opp til dataene. Hvis data utveksles mellom etatene, kan metadata sendes kun en gang for hyppige leveranser (inntil data endres og metadataene må oppdateres) eller samtidig med dataene for sjeldnere leveranser. Hvilke effekter kan tiltaket medføre: Mest mulig gjenbruk av data for å effektivisere offentlig sektor. Vil redusere privatpersoner og næringslivets rapporteringsbyrde overfor offentlig sektor. Kvalitetsheving på data som utleveres. Økt kunnskap og nyskaping gjennom økt (gjen)bruk av data. 29

Forholdet til andre tiltak (spesielt SERES): Når data leveres gjennom AltInn bør SERES fungerer som metadatakilde. Dette tiltaket vil bidra til tiltaket data.norge.no og være viktig for gjennomføringen av metadata.norge.no. Forutsetning for tiltaket: Dette tiltaket er avhengig av tiltaket: Etablere et felles begrepsapparat på metadataområdet. 5.12 Tiltak 12 Kvalitetskriterier Bruke kvalitetskriteriene i kvalitet på nett til å fremme tilgjengeliggjøring av strukturerte beskrivelser. 5.13 Etablere krav til en felles løsning for beskrivelse og publisering av metadata Erfaringene med SERES er begrenset til Brønnøysundregistrene, og er knyttet opp til modellering av metadata for Altinn. Det har dermed ikke vært mulig å trekke noen konkrete konklusjoner knyttet til den generelle anvendeligheten til løsningen. Under gruppas arbeid har det kommet fram at SSD, Skattetaten og NAV er i en prosess hvor de skal se på muligheten for å bruke SERES i sine egne virksomheter på andre områder en de som er direkte knyttet til Altinn. Det foreslås dermed å hente inn de erfaringens om gjøres i disse virksomhetene og se hvilke krav som disse virksomhetene har til et felles verktøy for utforming av metadata. Dette er et forslag som skal vurdere hvilke krav som skal stilles til en felles løsning for å lage metadata. På bakgrunn av erfaringene i virksomhetene kan det vurderes om SERES dekker alle krav som virksomhetene har til en generell løsning for beskrivelse og tilgjengeliggjøring av metadata. Kort omtale av tiltaket: Bruke SERES som et utgangspunkt for vurdering av krav til et felles offentlig rammeverk/verktøy for beskrivelse av metadata. Innhente erfaring ved bruk av SERES. Stille funksjonelle krav til et rammeverk for metadata basert på erfaringene med SERES. Vurdere gap mellom krav og eksisterende SERES løsning Vurdere behov for videreutvikling av SERES 30

6 Overordnede problemstillinger for utforming av en strategi for metadata Utforming av en strategi vil kreve vurderinger av problemstillingene beskrevet i kapittel 3. Dette er temaer som vil bli diskutert i de første møtene i prosjektet utover høsten. A. Skal virksomhetene pålegges å beskrives sine data på en strukturert måte? B. Hvilke data bør modelleres/beskrives først? C. Hva skal beskrives (ulike nivåer av metadata)? Dette er omfanget av metadata D. Skal beskrivelsene følge en felles mal og inneholde de samme metadataene? E. Skal beskrivelsene benytte en felles løsning eller standard? F. Skal beskrivelsene gjøres tilgjengelig på et felles sted? I høst vil gruppa diskutere problemstillingene over. På bakgrunn av diskusjonene vil det utarbeides 3-4 konkrete strategier som benytter de tiltakene som blir utarbeidet. I alle strategiene vil det være en skrittvis tilnærming. I hver av strategiene vil det bli spesifisert hvilke tiltak som skal gjøres og i hvilken rekkefølge de bør gjennomføres. Det vil også utarbeides kostnadsestimater for de ulike tiltakene og effektene av de ulike tiltakene vil bli utdypet. 31

7 Vedlegg A Om metadata Denne rapporten benytter en rekke begreper knyttet til data og metadata. Begrepene benyttes gjerne litt om hverandre i dagligtalen, og folk forstår begrepene ulikt. For å skape en felles forståelse av begrepene, vil vi her forklare og utdype hva vi legger i de ulike begrepene. Dette er det samme som vi ønsker å oppnå for hele forvaltningen, at folk har en felles forståelse av hva de forskjellige begrepene og tilhørende dataene betyr. Vi vil også illustrere bruken av begrepene med noen eksempler. Hva legges i begrepene? Metadata er data om data. Metadata er et vidt begrep og brukes samlende om alt som sier noe om annen informasjon eller data. Det vil si at metadata kan være informasjon om en datamengde (eller datasett) som for eksempel hvem samlet informasjonen, hvor kom den fra, hvem eier den og når ble den til, eller endret. Metadata kan også beskrive hvordan data er strukturert, hvordan de representeres, hva de betyr (definisjon), hvilke prosesser de inngår i og hvem som forvalter de. Begrep Data /Informasjon Forklaring Data, i sin opprinnelige betydning, er «informasjonsbiter» som brukes som grunnlag for å danne informasjon. I sin abstrakte (filosofiske) betydning kan det defineres som: Meningsnøytrale forekomster av tekst, tall eller lignende bærere av verdier som kan inngå i eller bidra til å forme informasjon. Denne definisjonen tar inn over seg vesensforskjellen mellom informasjon og data. Nemlig det faktum at data er meningsnøytrale mens informasjon må ha mening 7. Definisjon i databehandling: formalisert representasjon av kjensgjerninger, forestillinger eller instruksjoner i en form egnet for overføring, tolking eller bearbeiding utført av mennesker eller automatiske hjelpemidler Metadata Datasett Dataelement Instans/forekomst Informasjonsmodell Informasjon er den forståelsen eller fortolkningen et menneske trekker ut av data på grunnlag av beskrivelser av dataene og konteksten dataene forekommer i. Data om data. I denne rapporten er metadata alle beskrivelser av data i et system for å gjøre dataene forståelige og gi en mening for mennesker eller andre systemer. Dette omfatter alle beskrivelser av datasett, dataelementer og forekomster av data. Et datasett er en identifiserbar samling av beslektede data. Et datasett består av flere dataelementer som hører sammen. Et dataelement er et navngitt element i et datasett. I vår sammenheng er dataelementer en første beskrivelse av dataene i et datasett, og vil være metadata. En forekomst er data i et datasett En beskrivelse av de datasettene og dataelementene som finnes og sammenhengen mellom dem. Hvis informasjonsmodellen inneholder 7 Hentet fra Wikipedia 32

en beskrivelse av eller opplysninger om dataelementene og datasettene kan dette også betegnes som metadata. Dette er ikke vanlig alle steder, men i denne sammenhengen vil også beskrivelser og definisjoner i en informasjonsmodell være metadata. Nedenfor er et eksempel på hvordan de ulike begrepene benyttes. Eksempel 1 Datasett: Adresseregister for studentsamskipnader (Hentet fra den trykte studiehåndboka) Dataelementer: Navn, adresse 1, adresse 2, tlf, fax Data: Innholdet (Forekomstene) Navn Adresse 1 Adresse 2 Tlf Fax Oslo- og Akershushøgskolenes studentsamskipnad (OAS) Studentsamskipnaden i Bergen (SiB) Studentsamskipnaden i Oslo (SiO) Studentsamskipnaden i Stavanger (SiS) Studentsamskipnaden i Trondheim (SiT) Studentsamskipnaden i Tromsø (SiTø) Studentsamskipnaden i Ås (SiÅs) PB 8178, Dep 0034 OSLO Villaveien 10 5007 Bergen Postboks 94 Blindern 0314 Oslo Besøksadresse: Velhavensgt. 9 Besøksadresse: Kitty Kiellands hus 4036 Stavanger Besøksadresse: Kolbjørn Hejesv. 4 (Gamle kjemi) 7465 Trondheim 22 46 39 90 55 54 50 00 22 59 68 00 51 83 33 00 73 59 32 50 Terminalgt. 38 77 60 77 9037 Tromsø 00 1432 Ås 64 94 98 60 22 46 80 25 55 54 52 40 22 59 68 80 51 83 33 50 73 59 54 74 77 67 56 80 64 94 98 73 Beskrivelsen av et datasett vil inneholde en oversikt over og en forklaring av de dataelementene som inngår i datasettet. Dette vil i dagligtalen ofte omtales som et register (se over). Beskrivelsen av datasettet, oversikt over dataelementene i datasettet og en beskrivelse av betydningen av de enkelte dataelementer vil ofte gi et menneske en indikasjon på hva dette registeret inneholder 8. Vi vil kunne tenke oss hva dette kan brukes til. Uklarheter i navngivingen av dataelementene kan avhjelpes av en beskrivelse eller en definisjon av betydningen av det enkelte dataelement. Vi skjønner at dataelementene adresse 1 og adresse2 handler om postadressen og gateadressen til de forskjellige studentsamskipnadene. Vi skjønner også at for mange av studentskipnadene er postadressen og gateadressen den samme. For en datamaskin er ikke dette klart. De trenger en entydig beskrivelse av dataelementene for å kunne vurdere om disse kan benyttes i en annen sammenheng. Det er her metadata spiller en rolle. 8 Alle disse beskrivelsene vil i denne rapporten inkluderes i begrepet metadata. 33

Bildet under viser hva vi betegnelsen på de ulike delene. Figur 5 - Eksempler på begrepene datasett, dataelement, forekomst og metadata En informasjonsmodell er en konseptuel beskrivelse av en rekke datasett, hvor datasettene og dataelementene er satt i sammenheng og det er knyttet beskrivelser til datasettene og dataelementene. Vi benytter gjerne informasjonsmodeller for å kommunisere sammenhengene og betydningen av de data vi har til andre mennesker. Ulike former og nivåer av metadata Det finnes en rekke forskjellige språk og teknikker for å uttrykke metadata. Eksempler er registre, kataloger, repositories, informasjonsmodeller, begrepsmodeller, ordbøker, ontologier, terminologimodeller, etc. Tilsvarende fins det en rekke bruksområder for metadata og like mange måter å se metadata på. Følger man standarder som Dublin Core, ISO/IEC 11179 Metadata registries og ISO 19115 Geograhic Information - Metadata får man helt klare spesifikasjoner på hva metadata er. Av den grunn er det nyttig å kategorisere metadata og beskrive de ulike typene slik at man få en felles forståelse av hva man snakker om. En rekke forsøk på inndeling i metadatatyper er gjort. NISO (National information standards organization, USA) definerer følgende inndeling 9 : 9 http://www.niso.org/publications/press/understandingmetadata.pdf 34