Standard for beskrivelse av datakataloger og datasett Anne Gro Hustoft Teknologiforum, 11. november
Åpne data (Open Knowledge Foundation)
Bakgrunn Fra manuell registrering av åpne datasett til aggregering Data.norge.no nasjonalt metadata repository for http://open-data.europa.eu/ i CEF DCAT-AP etablert som europeisk metadatamodell Idenfisiert behov for «inventarlister» over alle offentlige data Direktoratet for forvaltning og IKT
open-data.europa.eu (Anna vidarebruk) Manuelle registreringar Data.norge.no Automatisert innhausting og harmonisering SSB Geonorge (andre)
W3C recommendation 2014 Data Catalog Vocabulary (DCAT) - RDF-vokabular designet for å legge til rette for samhandling mellom publiserte datakataloger - Gjør datasett mer synlige - Gjør det enklere for applikasjoner å bruke metadata fra flere kataloger - Legger til rette for desentralisert publisering av kataloger - Legger til rette for samlede ( federerte) datasett-søk
EU-kommisjonen: Much of the public sector information that would benefit from interoperability is published as datasets in data portals. Therefore, an agreement on a common format for data exchange would support the sharing, discovery and re-use of these data.
DCAT AP for dataportals in Europe Feltene i datamodellen er gruppert i fire ulike klasser: Katalog* Katalogpost (valgfri) Datasett* Distribusjon*
Obligatoriske * og anbefalte felt Datasett: Tittel* Beskrivelse* Kontaktpunkt Distribusjon(er) Utgiver Tema Oppdateringsfrekvens Landingsside Språk Publiseringsdato Identifikator «er i samsvar med» Alternativ identifikator Dekningsområde Tidsperiode Versjon Versjonsnote Distribusjon: «TilgangsURL»* Beskrivelse Format Lisens Tittel Nedlastingslenke Publiseringsdato Filstørrelse Mediatype Rettigheter Status
Obligatoriske* og anbefalte felt Katalog - Datasett* - Beskrivelse* - Utgiver* - Tittel* - Hjemmeside - Språk - Lisens - Tema - Publiseringsdato - Oppdateringsdato Valgfrie - Katalogpost - Rettigheter - Geografisk område
Standard for beskrivelse av datasett og datakatalogar «Den aktuelle utredningen vil se på standarder knyttet til beskrivelse av datasett og datakataloger. Vi vil imidlertid ikke begrense oss kun til åpne data, men se generelt på behov knyttet til beskrivelse av datasett i det offentlige» Arbeidsgruppe: NAV, Statens vegvesen, SSB, Oslo kommune, KS, MI, Kartverket, Riksantikvaren, CRIStin Dato Direktoratet for forvaltning og IKT
Behov som ikke dekkes av DCAT-AP - Dataelementer/definisjoner er ikke dekket - DCAT-AP sier ikke noe om hvilken type et datasett er klassifisert som - DCAT-AP sier ikke noe om årsaken til at data er klassifisert som de er (lover e.l.) - DCAT-AP sier ikke noe om distribusjonen/tjenestegrensesnittet datasettet er tilgjengelig via (fil, API..)
Common Core Metadata Schema - Public Access Level - Access Level Comment - Endpoint/webservice
Behovskartlegging - Foreslåtte metadata lite kontroversielle, kun obligatoriske felter er for lite - Vi mangler en nasjonal standard for tema - Viktig å si noe om geografisk dekningsområde og oppdateringshyppighet - Hva er et datasett? - Må kunne si noe om sikkerhetsnivå - Interessant å si om data er «masterdata» eller kopi fra andre - Kan en si noe om datakvalitet? - Hva med standard for tjenester /tjenestekataloger?
DCAT-AP attributter på data.norge.no pr i dag Obligatoriske Tittel Beskrivelse av datasettet Navn på kontaktperson Epost til kontaktperson Organisasjon(utgiver) Lenke til datasett Format Lisens Tema Valfrie Språk Tidsperiode Oppdateringsfrekvens Nedlastingslenke Beskrivelse av distribusjonen Hjemmeside for datasett Andre relevante lenker
Difi rapport 2013:10 Prinsipp: Verksemda har oversikt over data ho handsamar Krav 1: Data i verksemda er beskrivne Krav 2: Oversikta er publisert Krav 3: Tilgang til data er vurdert Krav 4: Dataelement er definerte Krav 5: Beskrivingane (metadata) er strukturerte og maskinlesbare Dato Direktoratet for forvaltning og IKT