Die DCAT-AP.de SHACL-Validation wird aktuell mit Blick auf die DCAT-AP.de 3.0 Spezifikation weiterentwickelt. Wenn Sie Fehler entdecken, dann freuen wir uns über Ihr Feedback! |
Basiert auf dem Profil DCAT-AP 3.0 - Übersetzungen und Einschränkungen
und ergänzt es um folgende Aspekte:
- Deprecated-Meldungen für Eigenschaften und Codelisten (
dcat-ap-de-deprecated.ttl
) - <> Deutsche Eigenschaften
- <> Deutsche Änderungen an Eigenschaften
- <> Verwendung der verlangten kontrollierten Vokabulare
Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.
Dieses Validierungsprofil basiert auf de SEMIC Datei (https://github.com/SEMICeu/DCAT-AP/blob/master/releases/3.0.0/shacl/dcat-ap-SHACL.ttl
) erweitert um die Datei https://github.com/GovDataOfficial/DCAT-AP.de-SHACL-Validation/blob/master/validator/resources/v3.0/shapes/dcat-ap-SHACL-DE.ttl
. Die deutschen Erweiterungen verändern die Validierung wie folgt:
- Hinzufügen deutschsprachiger Fehlermeldungen
- Deaktivierung von Shapes, die eine nicht sinnvolle Range prüfen
Betroffen sind die Klassen dcterms:Frequency
, dcterms:LicenseDocument
, dcterms:LinguisticSystem
, dcterms:MediaType
, dcterms:MediaTypeOrExtent
, dcterms:ProvenanceStatement
, dcterms:RightsStatement
, dcterms:Standard
, eli:LegalResource
, foaf:Document
, locn:Geometry
, odrl:Policy
, prov:Activity
, prov:Attribution
, rdfs:Resource
, skos:Concept
, skos:ConceptScheme
und spdx:ChecksumAlgorithm
.
Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.
Der deutsche Validator verwendet die verpflichtenden Regeln der SEMIC und reichert sie mit deutschen Fehlernachrichten an. Dazu werden folgende Dateien verwendet:
- https://github.com/init-dcat-ap-de/DCAT-AP/blob/2.1.1-draft/releases/2.1.1/dcat-ap_2.1.1_shacl_shapes.ttl
- https://github.com/GovDataOfficial/DCAT-AP.de-SHACL-Validation/blob/master/validator/resources/v2.0/shapes/dcat-ap-spec-german-messages.ttl
Die folgende Datei fügt zu den DCAT-AP-SHACL-Shapes deutsche Regeln hinzu, so dass DCAT-AP.de 2.0 geprüft wird. Dafür werden zum Teil auch widersprüchliche DCAT-AP-SHACL-Shapes deaktiviert:
Weitere externe Quellen, wie Ontologien, deren Kontext relevant sind oder kontrollierte Vokabulare, werden durch diese Datei importiert:
- Verwendung aller Pflichteigenschaften
- Min- und Max-Kardinalitäten
- Verwendung (getypter) Literals, wenn zutreffend
- Verwendung von URIs, wenn als Ziel eine Klasse erwartet wird
- Verwendung von URIs, wenn als Ziel eine beliebige Webadresse erwartet wird
- Verwendung der korrekten kontrollierten Vokabulare
- Warnung bei der Verwendung von
deprecated
-Eigenschaften
Ob das Objekt einer Eigenschaft die von DCAT-AP(.de) vorgegebene Klasse hat, wird geprüft, wenn der Aufbau des Objekts für den Anwendungsfall "Anlieferung an ein Metadatenportal" entscheidend ist.
Dies betrifft die DCAT-AP-Kernklassen und Eigenschaften dcat:catalog
, dcat:dataset
, dcat:service
, dcat:record
und dcat:distribution
sowie die Eigenschaften, die auf z.B. foaf:Agent
, dct:PeriodOfTime
oder dct:Location
verweisen.
Für die Eigenschaften adms:sample
, dct:source
, dct:hasVersion
, dct:isVersionOf
, dct:hasPart
und dct:isPartOf
wird davon ausgegangen, dass deren Objekte nicht im Kern der Validierung stehen. Daher wird lediglich gewarnt, wenn sie nicht die korrekte Klasse haben.
- Kategorie (da kontrolliertes Vokabular genutzt werden muss)
- Kategorienschema (da kontrolliertes Vokabular genutzt werden muss)
- Lizenzdokument (da kontrolliertes Vokabular genutzt werden muss)
Dieses Profil prüft alles, was DCAT-AP.de SHACL-Validation prüft. Zusätzlich:
K01: dcat:contactPoint
: Kontaktinformationen MÜSSEN mindestens Angaben zur Email (vcard:hasEmail) oder einen Link zum Kontaktformular oder Chatbot (vcard:hasURL) enthalten.K12&13: dcat:Dataset
:dcatde:contributorID
MUSS verwendet werden und DARF nur genau einmal eine IRI aus http://dcat-ap.de/def/contributors/ verwenden.K36: dcat:Dataset
:dct:publisher
MUSS verwendet werden.K30: dcat:Dataset
:dcat:theme
: Zur Steigerung der Metadatenqualität wird die Angabe von Kategorien empfohlen.K31: dcat:Distribution
:dct:license
MUSS eine IRI aus http://dcat-ap.de/def/licenses/ verwenden.K32: dcat:Distribution
:dct:format
MUSS eine IRI aus dem EU Vokabular 'File Type' verwenden.
dcat:Dataset
:dcat:distribution
: Es wird empfohlen, dass jedes Dataset über eine Distribution verfügt.dcat:Dataset
:dcat:keyword
: Zur Steigerung der Metadatenqualität wird die Angabe von Schlagworten empfohlen.dcat:Dataset
:dcat:landingPage
: Zur Steigerung der Metadatenqualität wird die Angabe der ursprünglichen Webseite empfohlen.dcat:Dataset
:dct:issued
: Zur Steigerung der Metadatenqualität wird die Angabe des Veröffentlichungsdatums empfohlen.dcat:Distribution
:dct:title
: Es wird empfohlen, dass jede Distribution über einen dct:title verfügt.
dcat:Dataset
: Ggf. MUSSdct:identifier
zur Dublettenprüfung verwendet werden.dcat:Dataset
: Ggf. MUSSdct:modified
zur Dublettenprüfung verwendet werden.
Die Auswahl erfolgte mit Blick auf die Verarbeitung im GovData-Frontend.
dcat:Dataset
: IRIorLiteral:dct:conformsTo
,dct:accessRights
,dct:provenance
dcat:Dataset
: IRI:prov:wasGeneratedBy
,dcat:landingPage
,foaf:page
dcat:Catalog
: IRIorLiteral:dct:rights
dcat:Catalog
: IRI:foaf:homepage
dcat:DataService
: IRIorLiteral:dct:accessRights
dcat:Distribution
: IRIorLiteral:dct:conformsTo
,dct:rights
dcat:Distribution
: IRI:foaf:page
,odrl:hasPolicy
dcat:CatalogRecord
: IRIorLiteral:dct:conformsTo
Diese Profile prüfen Eigenschaften, die auch im GovData-Dashboard zur Metadatenqualität angezeigt werden.
Feedback gerne als GitHub Issue oder per E-Mail an [email protected].
Bisherige Inhalte wurden in die Datei README_v1X.md verschoben.
© CC BY 4.0 ']init[ AG für GovData'