Her mit den Daten

Stefan Wehrmeyer hat den Bundestag „gehackt“. Dabei ging es dem 22 Jahre alten Studenten am Hasso-Plattner-Institut in Potsdam aber keineswegs darum, geheime Daten zu stehlen, sondern er hatte vielmehr Gutes im Sinn. „Ich wollte nicht auf die offiziellen Stellen warten, sondern selbst etwas für mehr Transparenz tun“, sagt er und zeigt mit seinem Projekt, wie man mit ein wenig Programmierarbeit und einer großen Portion Engagement aus Daten der öffentlichen Verwaltung einen Nutzwert ziehen kann. „Bundestagger“ hat er sein Portal genannt. Dabei steht die zweite Silbe „Tag“ für das Wort „Schlagwort“ im Englischen. Der Berliner Web-Entwickler hat einen Zugang zu den im – für Maschinen schlecht lesbaren – PDF-Format abgelegten Protokollen der Plenarsitzungen des Deutschen Bundestags geschaffen. Diese können nun auf seiner Webseite www.bundestagger.de von jedermann verschlagwortet und kommentiert werden. Dabei geht es nicht um eine politische Meinungsäußerung, sondern vielmehr um Ergänzungen, die die Verständlichkeit erhöhen sollen.
Stefan Wehrmeyer hat einfach gehandelt – ganz nach dem Motto: „Öffnet Euch, sonst werdet ihr geöffnet!“ Was wie eine Drohung klingt, soll nur eine höflich gemeinte Erinnerung der Verfechter der Open-Data-Philosophie sein, aktiv zu werden. Adressaten dieses Satzes sind Regierungen und die öffentliche Verwaltung. Gegenstand sind die zahlreichen Daten, die diese Stellen erheben und sammeln und die nun, mehr oder weniger versteckt, in elektronischer oder anderer Form gespeichert oder einfach abgeheftet sind. Die Forderung der Open-Data-Anhänger klingt dabei ganz einfach: Die Erhebung der Daten wurde oder wird mit Steuergeldern finanziert, also gehören sie auch dem Steuerzahler – die Regierungen sollen daher eventuell vorhandene Zugangsbeschränkungen so schnell wie möglich aufheben.  

Partizipation auf die Agenda

Was steckt genau hinter dem Begriff Open Data? Daniel Dietrich, dem Vorsitzenden des Vereins Open Data Network, geht die etwas sperrige Definition leicht über die Lippen: „Open Data meint die grundlegende Forderung, alle Daten aus Politik, öffentlicher Verwaltung und Wissenschaft, die nicht einer berechtigten Datenschutz- oder Sicherheitsbeschränkung unterliegen, allen Bürgern, in vollem Umfang, zeitnah, in offenen Formaten, über offene Schnittstellen, maschinenlesbar und ohne Einschränkungen kostenfrei zur Verfügung zu stellen.“ Gemeinsam mit über 20 Vertretern aus Parteien, Netzwerken und Unternehmen hat sich der IT-Berater im Oktober vergangenen Jahres zusammengeschlossen, um die Themen Open Data, Open Access, Open Government, Transparenz und Partizipation auf die politische Agenda zu bringen.
Genau dort stehen diese Themen in anderen Ländern schon seit längerem. Vorbild war  einmal mehr der amerikanische Präsident Barack Obama. Schon am ersten Tag im Amt unterzeichnete er mit der Open-Government-Direktive ein Memorandum an alle US-Bundesbehörden mit der Anweisung, Barrieren abzubauen, um die Transparenz, Partizipation und Zusammenarbeit zwischen der Regierung und der Bevölkerung zu verbessern. Rund 100 Tage später startete dann mit data.gov ein Angebot, das den Zugriff auf alle öffentlichen Daten der US-Bundesorgane ermöglichen soll. Bisher findet man dort rund 1000 Datensätze von Energieverbrauchsdaten bis hin zu Wetteraufzeichnungen, und die Zahl der verfügbaren Datenbanken steigt stetig. Alle Faktensammlungen wurden in maschinenlesbaren Formaten veröffentlicht und sollen so für die verschiedensten Anwendungen nutzbar sein. Die Verwaltung verspricht sich davon nicht nur eine größere Transparenz für die Bürger, sondern erwartet auch Vorteile für die eigenen Abläufe. Denn auch die Behörden selbst tun sich manchmal schwer, an die Daten anderer Regierungsorganisationen zu gelangen.
Überholt wurde Obamas data.gov mittlerweile vom gleichnamigen Projekt des britischen Premierministers Gordon Brown. Dieser fragte den WWW-Begründer Tim Berners-Lee, wie Großbritannien am besten mit dem Internet umgehen solle und  erhielt die Antwort: „Stellen Sie einfach alle Regierungsdaten online!“ Sehr zum Erstaunen von Berners-Lee antwortete Brown: „Okay, machen wir.“ So berichtet zumindest die Zeitung „The Guardian“ über das Gespräch mit weit reichenden Folgen. Denn mittlerweile stellt die britische Regierung unter data.gov.uk rund 3000 Dokumente in maschinenlesbarer Form zur freien Verfügung.
Im Unterschied zum amerikanischen Webauftritt, der den Zugang zu politisch eher harmlosem Material bietet, gehen die Briten einen Schritt weiter. Ein Beispiel aus dem traditionell kritischen Bereich der Außen- und Sicherheitspolitik: Gelangt man auf der Suche nach brisanten Studien auf data.gov vor allem an Verweise zu Podcasts der US-Army, so kann man auf data.gov.uk unter dem Schlagwort „military“ sofort auf Berichte wie „Deaths in the UK Regular Armed Forces“ oder auf einen Report über die Entwicklung der Suizid-Quote in den britischen Streitkräften zugreifen. Über die Verschlagwortung geht es sogar weiter zum vierteljährlichen „Psychiatric Morbidity Report“, der im Januar veröffentlicht wurde.
Tim Berners-Lee glaubt, mit dem Projekt einen Stein ins Rollen gebracht zu haben und sagte auf der Pressekonferenz zum Start der Webseite: „Als das Netz startete, wollte zunächst keine Buchhandlung ihre Kataloge öffentlich machen, sondern nur die eigene Adresse. Als dann ein Laden begann, zogen alle anderen nach. Zuerst ohne die Preise, bis einer auch damit anfing. Noch wollte niemand seine Lagerbestände offen legen, bis das auch jemand getan hat. Es gibt also einen Wettbewerb um die Offenlegung von Daten, sobald sich die Leute einmal daran gewöhnt haben.“

Ideenreichtum gefragt

Es geht den Verfechtern der Open-Data-Philosophie nicht nur um die Offenlegung der Rohdaten. Diese können vielmehr als Basis für innovative Verknüpfungen von Daten dienen, aus denen darüber hinaus dann neue, informative Applikationen entstehen können. Hier ist dann der Nutzer mit seinem Ideenreichtum gefragt. Wie einfach das gehen könnte, möchte das deutsche Open-Data-Network Mitte April auf dem „Opendata-Hackday“ beweisen. Die Veranstaltung soll zeigen, dass sich schnell und mit wenig Aufwand viele kreative und innovative Anwendungen programmieren lassen, die Daten der öffentlichen Verwaltung sichtbar und zugänglich machen und so einen Nutzen für den Bürger darstellen können. Dabei geht es nicht um einen Angriff auf sensible Regierungsdaten, auch wenn das Wort „hacken“ damit leicht in Zusammenhang gebracht werden könnte. „Wir wollen beweisen, dass es auch in Deutschland möglich ist, aus der Kombination von bereits offenen Regierungsdaten neue Informationen zu gewinnen“, so der Vereinsvorsitzende des Open-Data-Network, Daniel Dietrich. Vorbild für den Open-Data-Hackday seien so genannte „Hack-the-Government“-Veranstaltungen, die unter anderen in den Niederlanden, Australien und den USA ausgerichtet wurden.
Wichtig ist für die Open-Data-Anhänger das Datenformat. Sie  legen keinen Wert auf schön gestaltete Webseiten oder ordentlich strukturierte Excel-Tabellen. Für sie und ihre Programme ist es vielmehr optimal, wenn die auszulesenden Daten als maschinenlesbare, verlinkbare Daten vorliegen. Diese Art der Datenaufbereitung unterscheidet sich erheblich von Datendarstellungen, die für den Zugriff durch das menschliche Auge aufbereitet werden. Webentwickler können somit problemlos auf große Datens unterschiedlicher Urheber und deren Verknüpfungen zugreifen. Erst dadurch werden vielfältige neue Werkzeuge und Umgangsweisen mit diesen Daten nutzbar.
Dass das noch lange nicht selbstverständlich ist, musste nun auch Stefan Wehrmeyer bei der Arbeit am „Bundestagger“ feststellen: Die Bundestagsverwaltung hatte neulich kleine Veränderungen am PDF-Format der Sitzungsprotokolle vorgenommen, die beim einfachen Lesen wahrscheinlich gar nicht auffallen. Wehrmeyers Programm allerdings, das die Daten automatisch ausliest, musste vor diesem neuen Format kapitulieren. Der „Hack“ beginnt nun also wieder von vorne.

Dieser Beitrag erschien zuerst in der gedruckten Ausgabe Nerven Sie nicht! – Der Knigge für den politischen Alltag. Das Heft können Sie hier bestellen.