Norsk standard for beskrivelse av datasett og datakataloger Møte i Standardiseringsrådet 17.03.15
Bakgrunn for arbeidet - DCAT (Data Catalog Vocabulary) ble tidlig i 2014 anbefalt av W3C, og EU-kommisjonen utarbeidet senere på våren en applikasjonsprofil av DCAT tilpasset europeiske forhold (DCAT-AP). - Difi ønsker å gå fra dagens situasjon der etatene definerer metadata manuelt i data.norge.no, til å aggregere/høste data fra etatenes publiserte kataloger
- data.norge.no er blitt nasjonal node for EUs portal for metadata => Difi må levere metadata ihht. DCAT-AP - Det er identifisert et behov for kataloger («Inventarlister») som viser hvilke datasett etatene forvalter - Erfaringer med åpne data har vist at det er behov for felles tilnærming til kartlegging og beskrivelse av datasett for at arbeidet med åpne data skal bli en integrert del av informasjonsforvaltningsarbeidet i virksomhetene.
Behov - «Regjeringen ønsker å stimulere til at mest mulig offentlige data blir gjort tilgjengelige for viderebruk» - Difi-rapport 2013:10 Informasjonsforvaltning: «verksemda har oversikt over data ho handsamar» - Internasjonalt behov som førte til utvikling av DCAT og DCAT-AP (2014)
Behovskartlegging - Unison enighet om at det eksisterer behov for standard - Behov for en felles framgangsmåte for beskrivelse av datasett og kataloger. - Behov for å kunne sammenlikne på tvers av etater og kilder, og gjenbruke/viderebruke data -Arbeidet som nå foregår vedrørende informasjonsforvaltning i offentlig sektor, viser behov for en standard. - Bevisstgjøring av etatene som dataeiere
Andre standarder - Asset Description Metadata Schema (ADMS) - CERIF for datasett - DKAN Dataset Schema - ISO 19115- Geographical Information Metadata - INSPIRE Metadata - SDMX - Project Open Data Metadata Schema
Arbeidsmåte - Arbeidsgruppe bestående av representanter for CHRIStin, Kartverket, KS, Meteorologisk institutt, NAV, Oslo kommune, Riksarkivaren, SSB, Statens vegvesen og Difi -Tre møter i arbeidsgruppen, behovskartlegging med representanter for Arkivverket, BR, Hdir, KS/KommIT, Kartverket, Skatteetaten, Kommunal rapport, Acando og Computas. - Høring
Spørsmål behovskartlegging - Behov for standard? - Hvilken informasjon trengs om datasett? - Hvilken informasjon trengs om datakataloger? - Hvor lette er feltene i DCAT-AP å fylle ut? - Andre standardiseringsbehov?
Tilbakemeldinger behovskartlegging - Vokabularer/nøkkelord - Viktig å si noe om tilgang/lovhjemmel - Tidsserier og versjonering - Vedlikeholds- og forvaltningsinformasjon - Formater - Tidsperiode og geografisk dekning - Sammenheng mellom datasett og begreper/kodelister/ informasjonsmodeller - Kvalitet - Brukere - Relasjoner mellom datasett - Prosesshistorie for datasett
Andre standardiseringsbehov -Standardisert beskrivelse av webtjenester- og tjenestekataloger -Katalog for informasjonsmodeller -Standardisering av tekniske formater -Kjøreregler knyttet til lenkede åpne data (LOD) -Standarder/felles maler for dokumentasjon (produktark etc.) -Viktig med klageinstans som har nok teknisk kompetanse til å etterprøve avslag når innsynskrav avslås.
Forslag til standard (avvik fra DCAT-AP) - Nasjonale tillegg for å utvide bruksområde også til ikke-åpne data ( tilgangsnivå, skjermingshjemmel) - Koblingen mellom datasett og feltbeskrivelser - Datasettets formål - Særnorske anbefaleringer (endringer for status jfr. obligatorisk, anbefalt, valgfritt)
Høringsspørsmål 1.Er identifisert behov korrekt? 2.Er de rette standardene identifisert og er du enig i vurderingen av dem? 3.Er du enig i den profilen som foreslås, de norske tilleggene som er foreslått i kapittel 6? 4.Har du innspill til brukspraksis/ bruksbeskrivelser for felter i forslaget? 5.Har du innspill til aktuelle vokabularer i kapittel 6.14 "Kontrollerte vokabular" med utgangspunkt i kriteriene som er foreslått i kapittel 6.14.1 "Krav til kontrollerte vokabular"? 6.Støtter du konklusjonen? 7.Synes du at standardene burde vært gjort obligatorisk? 8.Tror du en beslutning av disse standardene vil betydelige økonomiske konsekvenser?
Oppsummering av innspillhøring Behovet er korrekt identifisert DCAT/DCAT-AP er korrekt standard Bred støtte for å utvide virkeområde Bred støtte for norske tillegg Konklusjonen støttes med noen forbehold
Oppsummering av innspill (2) Dokumentet bør deles i to: utredning + forslag til standard For datasett med geografisk informasjon vil ISO19115 være de facto standard tydeliggjøre hvordan samspillet med DCAT-AP(-NO) er tenkt Standardens virkeområde er alle offentlige datasett. Hvordan beskrive data i et fagsystem? Anbefaling av publiseringsformat for selve katalogen (RDF/XML) er ikke tilfredsstillende Angivelse av dekningsområde er ikke tilfredsstillende «Kodeverket» har en del begrensninger
Oppsummering av innspill (3) Gruppering av datasett bør løses Hvem som bruker datatasettene er viktig for offentlig sektor Noen formelle feil i de norske tilleggene
Andre forhold som påvirker oss Revisjon av DCAT-AP klar i juni 2015. De norske tilleggene kan komme i konflikt med «DCAT-AP 1.1» Det arbeides også med utvidelser for geodata og statistikk: GeoDCAT-AP og StatDCAT-AP
Norske utvidelser som potensielt kan påvirkes av revisjonen Koblingen mellom datasett og dataordbok (feltbeskrivelser) Datasettets formål (fare for duplisering av dct:rights) Særnorske anbefaleringer (endringer for status jf obligatorisk, anbefalt valgfritt)
Norske utvidelser som trolig ikke vil påvirkes Vurdering av offentlighet (tilgangsnivå) Skjermingshjemmel
Grunner til ikke å utsette standard - Dekker behovet for beskrivelse av åpne data nå - Versjon 1.0 av standarden vil være et godt utgangspunkt for å publisere beskrivelser av alle datasett i virksomhetene - Foreslåtte norske tillegg sannsynligvis lite berørt av revisjonen - Det begynner å haste å få på plass en standard for publisering av datasett
Anbefaling fra arbeidsgruppen Vi forslår en norsk standard nå: DCAT-AP-NO 1.0 Vi avgrenser særnorske endringer til et minimum: Tilgangsnivå som anbefalt norsk tillegg for klassen datasett Skjermingshjemmel som anbefalt norsk tillegg for klassen datasett JSON-LD er lagt til som anbefalt publiseringsformat i tillegg til RDF/XML Alle øvrige særnorske tillegg legges på is til revisjonen av DCAT-AP er ferdig Vi signaliserer allerede nå en revisjon i november Vi spiller våre behov inn til revisjonsarbeidet i EU som medlem i revisjonsgruppen