Datenvalidierung mit der Blockchain
Spätestens seit dem Höhenflug des Bitcoins ist die Blockchain in aller Munde. Die Möglichkeit, absolut transparente und dezentrale Systeme zur gemeinsamen Kontrolle von Transaktionen aufzubauen, schürt viele Hoffnungen mit Blick auf die Echtheit und Aktualität von Dateien. Die Ideen, wie ein solches demokratisches System, welches hohe Transparenz und einen umfassenden Schutz vor Manipulation bietet, eingesetzt werden kann, sind dabei vielfältig.
Blockchain und Open Data haben drei Prinzipien gemeinsam:
- Die Förderung von Transparenz
- Die Förderung eines gleichberechtigten Zugangs zu Informationen
- Die Förderung eines offenen Austauschs von Daten zwischen verschiedenen Parteien
Warum also nicht auch über Anwendungsmöglichkeiten im Open Data-Bereich nachdenken?
Gerade bei offenen Datensätzen, die dem Zweck der Allgemeinheit dienen sollen, muss stets nachvollziehbar sein, woher sie kommen, ob sie korrekt, vollständig und konsistent sind. Ansonsten besteht immer die Unsicherheit, dass eine Datei gegebenenfalls veraltet ist oder sogar böswillig manipuliert wurde. Ob die Datei tatsächlich integer bzw. valide ist, lässt sich mithilfe der Blockchain überprüfen. Denn: Eine zentrale Eigenschaft der Blockchain-Technologie ist die Unveränderbarkeit von Informationen. Dateien erhalten mit dem Hash-Wert eine Art „Siegel“, mit dem die Echtheit und der Schutz vor Veränderungen überprüft werden kann.
Open.NRW hat nun einen Service entwickelt, der diese Prinzipien für den Open Data-Kontext nutzbar macht. Alle Dateien, die auf Open.NRW zur Verfügung stehen, bekommen – soweit technisch möglich – einen Hash-Wert, über den die Integrität der Daten ermittelt werden kann. Langfristig stärkt dies die Transparenz und Qualitätssicherung bei der Nutzung der Daten.
Auf Open.NRW wird der Datei-Hashwert mittels der Hashfunktion SHA256 erstellt. Bei Aufruf eines Metadatensatzes auf Open.NRW werden die ermittelten Datei-Hashwerte direkt online angezeigt. In bestimmten Abständen wird aus all diesen Datei-Hashwerten ein Ethereum-Hashwert erzeugt, der wiederum in einem öffentlich zugänglichen dezentralen Open-Source-Blockchain-System abgelegt wird. Daher zeigen die Metadatensätze ab sofort an, ob die darin hinterlegten Dateien validiert und wann sie notarisiert wurden.
Wann sind Daten integer und warum ist Datenvalidierung wichtig?
Der Begriff Datenintegrität beschreibt die Korrektheit, Vollständigkeit und Konsistenz von Daten über ihre gesamte Lebensdauer. Das bedeutet, dass Daten nicht unerkannt verändert werden können und die Nachvollziehbarkeit von Datenänderung im Mittelpunkt steht. Datenintegrität als Zustand bestätigt die Validität und Richtigkeit eines Datensatzes. Daten, die aktuell und vertrauenswürdig sind, werden demnach als „integer“, „konsistent“ oder „valide“ bezeichnet.
Vorteile für Sie als Bereitstellerin bzw. Bereitsteller von Open Data
- Sie können bei Ihrer Suche nach Datensätzen nun filtern, ob die Dateien mit der Blockchain validiert sein sollen.
- Über den Hash-Wert können Sie prüfen, ob die Datei tatsächlich aktuell und offiziell validiert ist.
- Sie können Ihre eigenen Datensätze beim Bereitstellen mit einem Hash-Wert versehen und somit die Integrität Ihrer Daten sicherstellen und nachweisen.
Prüfen Sie den Hash-Wert einer Datei
Zusätzlich zur automatischen Systemüberprüfung eines Datensatzes bei der Datenbereitstellung können Sie nun vorhandene Hash-Werte manuell prüfen oder den Hash-Wert einer Datei anzeigen lassen und prüfen. Diese Prüfung bezieht sich nur auf Dateien, bzw. deren Hash-Werte, welche im Open.NRW Portal zur Verfügung stehen. Bei neuen Dateien kann es bis zu einer Woche dauern, bis diese notarisiert wurden und die Prüfung korrekt funktioniert.
Wenn Ihnen kein Hash-Wert vorliegt, können Sie den Hash-Wert einer Datei anzeigen lassen und dann prüfen. Klicken Sie hierzu auf „Datei auswählen“ und wählen Sie die Datei aus (max. 10 Megabyte). Das System zeigt dann den Hash-Wert der Datei an. Klicken Sie anschließend auf „Hash-Wert prüfen“. alternativ können Sie auch einen existierenden Hash-Wert unten im Feld „Hash-Wert der Datei“ einfügen und anschließend auf „Hash-Wert prüfen“ klicken.