Felles URI-er for geografiske objekt i Norge Fagdag - Riksarkivet 19 mars Morten Borrebæk, Kartverket
Agenda 1. Eksisterende standarder for ID er for geografiske objekter. 2. Nye krav gjennom geodataloven 3. Påvirkning på arbeidet (Nasjonalt, Europeisk (og verden for øvrig) 4. Forslag til standardisering og implementasjon av ID er i form av URI (http) i SOSI v 5. 5. Sammenligning med hva som skjer i våre naboland.
SOSI_Objekt i dagens SOSI v4.5 class SOSI_ObjektFull «featuretype» Kartblad::Kartbladkant + grense :Kurve + karttype :Karttype [0..1] «featuretype» Av grensningslinjer:: Dataav grensning + grense :Kurve +kartbladkantavgrensning «Topo» +dataavgrensning «Topo» «featuretype» SOSI_Objekt +kobling + identifikasjon :Identifikasjon [0..1] + datafangstdato :DateTime [0..1] + førstedatafangstdato :DateTime [0..1] + førstedigitaliseringsdato :DateTime [0..1] + verifiseringsdato :DateTime [0..1] + oppdateringsdato :DateTime [0..1] + sluttdato :DateTime [0..1] + gyldigfra :DateTime [0..1] + gyldigtil :DateTime [0..1] + datauttaksdato :DateTime [0..1] + endringsflagg :Endringsflagg [0..1] + kvalitet :Posisjonskvalitet [0..1] + status :Status [0..1] + medium :Medium [0..1] + opphav :CharacterString [0..1] + nøyaktighetsklasse :Nøyaktighetsklasse [0..1] + stedfestingverifisert :Boolean [0..1] + digitaliseringsmålestokk :Integer [0..1] + prosesshistorie :CharacterString [] + kopidata :Kopidata [0..1] + kommune :Kommunenummer [] + informasjon :CharacterString [] + registreringsversjon :Registreringsversjon [0..1] + link :Link [] +avgrenser +fiktivdelelinjeavgrensning «Topo» +temakartavgrensning «Topo» «Topo» «featuretype» Av grensningslinjer::fiktiv Delelinje +kantutsnittavgrensning + grense :Kurve «featuretype» Av grensningslinjer:: Temakartav grensning + grense :Kurve «featuretype» Av grensningslinjer::kantutsnitt + grense :Kurve constraints {krav til egenskapen identifikasjon} {krav til egenskapen sluttdato} «datatype» Identifikasjon + lokalid :CharacterString + navnerom :CharacterString + versjonid :CharacterString [0..1] sluttdato skal benyttes dersom en tilbyr oppdateringsdata.spesielt viktig å merke slettede data som slettet, dvs med sluttdato identifikasjon er påkrevet der spesifikasjonen omhandler data som er utgangspunkt for leveranser i henhold til harmoniserte data jfr Geodataloven, Anneks I og II, samt Annex III der identifikasjon er påkrevet. I tillegg anbefales identifikasjon som påkrevd for alle objekttyper med med mindre det er klalt at det ikke vil finnes krav til identifikasjon eller referanser fra andre objekter
COMMISSION REGULATION (EU) No 1089/2010
Hva krever egentlig Geodataloven? I Geodataloven paragraf 6 er det bare et krav om å få tilgang til geografiske objekter i form av et datasett, ikke nødvendigvis via http (For eksempel vil ftp også være tillatt). Kravet til identifikatorer i henhold til Geodataloven er persistent unik identifikasjon innenfor et navnerom, med utgangspunkt i: Varighet (persistency) Sporbarhet (traceability). Entydighet (uniqueness). Geodataloven har ingen krav om tilgang til individuelle objekttyper i et datasett. For at den nasjonale geografiske infrastrukturen skal støtte disse prinsippene må infrastrukturen støtte tilgang via http til instanser av objekttyper. Dette kommer da som et tillegg til Geodataloven, og fordrer at identifikatorene implementeres som URI er (http).
Videre arbeid med INSPIRE i Europa! Diederik Tirry, Michael Lutz & Andrea Perego Linking Geospatial Data Workshop, London, 5-6 March 2014
Videre arbeid med RDF i Europa! Diederik Tirry, Michael Lutz & Andrea Perego Linking Geospatial Data Workshop, London, 5-6 March 2014
The Geosemantic Marriage
SOSI v.5 Strukturering av geografiske identifikatorer for geografiske objekter Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC
D7.1.3 - Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC
Namespace INSPIRE URI mønster - eksempel http://{subdomain}.{domain}/{type}/{metadata}/{authority}/{localid}/{version} A spatial object URI {subdomain}, {domain} {type} of resource INSPIRE {metadata} {authority} http://location.data.gov.uk/so/ef/samplingpoint/bwsp.eaew/36800 http://location.data.gov.uk UK established a domain data.gov.uk for all public sector data and the UK Location Programme who coordinate INSPIRE in the UK established a sub-domain of location. /so This denotes that the resource is a spatial object /ef/samplingpoint /bwsp.eaew This segment shows that the data is sourced from the Environment Agency and since the EA use similar identifiers across several datasets a sub-namespace extension bwsp. is added to denote the source dataset. This represents a key part of the namespace of the INSPIRE unique object identifier. In practice, the namespace will typically be the URI up to and including the authority information. {localid} /36800 This represents the local identifier part of the INSPIRE unique object identifier. {version} The resource may also be versioned.
Namespace Forslag til URI i SOSI v.5 Geografisk objekt URI {domene}.{domain} {subdomene}. {subdomene} {type} ressurs {lokalid} {versjon} http://www.kartverket/matr/so/1b28ec00-03ca-11e2- a21f-0800200c9a66/4_1 http://www.kartverket.no IANA domene for Kartverket med eksempel på subdomene. Opsjonelt. Eksempel /Matr Kan spesifiseres /so (spatial object) LokalId angitt som en UUID, her angitt som 1b28ec00-03ca-11e2-a21f-0800200c9a66 Versjonen av det geografisk objektet. Her 4.1 URI dereferencing making use of a URI in order to retrieve a representation of its associated resource [IETF RFC 3986] Dereferensiering av en URI som identifiserer et geografisk objekt returnerer objektet kodet, f.eks i GML, RDF, GeoJSON, SHP, TIFF, PDF or HTML.
Forslag : Krav til URI er i SOSI Krav:identifikasjon Dersom brukstilfellene tilser at det er behov for å knytte informasjon direkte til geografiske objekter skal disse ha identifikasjon i henhold til strukturen i figur 1 Krav:navnerom Navnerommet skal angis som http-uri'en til den etat/organisasjon som eier dataene i henhold til IANA * registeret, med tillegg av et subdomene (opsjonelt) (f.eks /matrikkel) samt /so (påkrevd) for å angi at ressursen er et geografisk objekt (spatial object) class Datatyper og kodelister «datatype» Identifikasjon + lokalid :CharacterString + navnerom :CharacterString + versjonid :CharacterString [0..1] constraints {Tillatte karakterer for lokaid og navnerom} Krav:navneromKarakterer Tillatte karakterer for navnerom er de begrensninger som er lagt inn i figur 1 samt de restriksjoner som ligger i NCName. Anbefaling:identifikasjonUUID I de tilfeller det ikke allerede finnes persistente unike ID'er innenfor navnerommet anbefales det å angi lokalid som en UUID. Dette vil alltid sikre unikhet innenfor navnerommet, og vil for alle praktiske formål samtidig være globalt unik Naturlig språk: for egenskapene lokalid og navnerom skal bare bruke følgende sett av karakterer benyttes:: {"A" "Z", "a" "z","0" "9", "_", ".", "-"}, dvs bare bokstaver fra det latinske alfabetet samt tall, understreking, punktum og bindestrek er tillatt. OCL: inv: let allowedchar : Set {'A'..'Z', 'a'..'z', '0'..'9', '_', '.', '-'} in ( namespace.element->forall ( char allowedchar->exists( char ) and localid.element->forall( char allowedchar-> exists( char ) )) Figur 1 Krav:versjon VersjonId er påkrevd dersom datasettet skiller mellom ulike versjoner av geografiske objekter. [1] Den praktiske restriksjonen av NCName er at den ikke kan inneholde en rekke symbolkarakterer slik som :, @, $, %, &, /, +,,, ;, whitespace karakterer eller forskjellige paranteser. Videre, et NCName kan ikke starte med et nummer, dot eller minus karakter (men disse kan inngå videre i et NCName).
Sammenligning mellom nordiske land
Danmark Eksempel: http://data.gov.dk/{skemakode/}objekttype/uuid
Finland Heading towards a non-semantic and centralized URI-pattern for all spatial data (inspire and beyond inspire) using a single domain paikkatiedot.fi (= spatialdata.fi ) as mainstream, with still some discussion on inspire theme specific subdomains like inspire-hy However if individual organizations i.e. larger municipalities desire to manage URI-service for their own data, they are allowed to do it and also to include inspire theme and class as they which. My proposal was that their domains would be registered in the centralized URI management to enable queries through it besides their own URI service assuming that two or multiple URI s to a single instance of a spatial data object is not a problem eventually as this is a daily situation in www. This approach is feasible also to avoid that a data producer should mint URI s to different domains, i.e. Inspire theme specific, within a single dataset. It probably leads, as well, that UUID is recommended as local id so that data producers are able to mint URI s independently. Basically a non-semantic URI has the advantage that it functions like a surrogate (key) and thus effective for anonymous use, facilitating data protection and security. Accordingly the mainstream URI pattern would be: http://paikkatiedot.fi/so/{namespace}/{localid}[/{versionid}] namespace is always the dataset identifier in the national spatial data metadata repository.
Sammenligning i Norden Namespace: Sentralt domene: Lokalt domene: Danmark <data.gov.dk> Norge <IANA> for dataeier Finland <paikkatiedot.fi> Angivelse av ressurs Danmark: Informasjonstypekode (ikke vedtatt, ingen instruks eller eksempler så langt) Finland: so/ Spatial object Norge: so/ Spatial object Angivelse av domene/dataset/objekttype Danmark: <Skjemakode> som gjenspeiler pakkestrukturen i UML modellene. Eks Pakken for adresser i INSPIRE settes lik ad.) <Objekttype> som er navnet på den klassen som et objekt er instans av Finland: <Namespace> dataset identifier in our national spatial data metadata repository Norge: <subdomene> Kan angi temaområde, dataset og evt. objekttype
Modell - infrastruktur GML skjema (ISO 19136) xls XML (ISO 19139) OWL/ RDF OWL/ RDF Shape Change Plug-in Dokumentasjon Kontroller Solid ground? ISO tool SOSI modellregister Dokumentasjon EAtool GisTools mapping TKN GML Skjema? Replikering Eksempel generator SOSI Plug-in WEB innsyn Objkat. database SOSI syntaks SOSI DOT Format SOSI.kontr. Parameterfiler XML 19110+ ESRI data base Auto matisk ESRI UML modell Postgis Geoserver FME Excelmappingfiler Andre systemer STU/2013-11-19
Eksempel på arkitektur for LoD
Takk for oppmerksomheten!