1. Heimische Open Government Data – Initiative gestartet
WOZU OPEN DATA GOVERNMENT?
Wien, 8. April 2010 - Die Experten Andreas Blumauer und Andreas Langegger
im Interview mit Marion Fugléwicz-Bren *) anlässlich der Pressekonferenz.
Sie wollen eine Open Data Government Initiative in Österreich starten. Was
ist Open Data Government?
Langegger: Es geht eigentlich nicht um “Government” sondern um “Open Government
Data” (anders herum), also um öffentliche Daten, die die österreichische Verwaltung
sammelt - wie zum Beispiel alle Daten der Volkszählung, Mikrozensus, Daten zur
Wirtschaftsleistung, Kriminalität, Gesundheitsversorung, etc. Es handelt sich keinesfalls
um personenbezogene Daten welche unter den Datenschutz fallen, sondern vielmehr um
Daten, die zum Teil ohnehin schon publiziert werden, aber oft in bereits verdichteter Form
oder in Form von Textdokumenten. Unser Ziel ist es, dass diese Daten in Zukunft auch in
standardisierter Rohform der Bevölkerung zur Verfügung gestellt werden, die ja ohnehin
dafür durch Steuern bezahlt und somit ein Recht auf deren Weiterverwendung hat.
Blumauer: Open Government Data ist die Idee von "Open Data" auf die Öffentliche Ver-
waltung angewandt. Obwohl bereits viele Daten aus der Verwaltung zwar "online" sind,
heißt das noch nicht, dass sie den 8 Grundprinzipien ("Open Government Data Principles
") folgen. Einerseits ist es sehr schwer möglich und kostenintensiv, die eigentlichen Daten
aus PDFs herauszufiltern, leider werden sehr unterschiedliche Formate zur Publikation
von Daten verwendet. Dort setzt unsere Initiative an: Wir wollen den Vorteil interopera-
bler Daten aufzeigen, also demonstrieren, welcher Nutzen bei gleichbleibend hohen
Kosten entsteht, wenn auf RDF als Austauschformat gesetzt wird.
Warum sind Sie hier engagiert, wer steht da noch dahinter, was ist die „Vi-
sion“ dahinter?
Blumauer: Die Vision dahinter ist, aus den riesigen Datenmengen, die speziell in der Öf-
fentlichen Verwaltung täglich produziert werden, besseren Nutzen zu ziehen, neue Erken-
ntnisse zu gewinnen und Handlungen davon ableiten zu können. Zur Zeit sind viele Daten
in Silos und proprietären Formaten und Strukturen "versteckt". Man kann sie zwar herun-
terladen, aber niemand kann damit etwas anfangen, man kann sie nur schwer weiterverar-
beiten. Wir als Semantic Web Company haben hier ein konkretes Angebot: Wir unter-
stützen Institutionen dabei, ihre Daten in einer Art und Weise zu veröffentlichen, dass sich
darum eine Community bilden kann, die aus den Rohdaten veredelte Informationen und
schließlich Mehrwert-Services aufbauen können. Das führt zu mehr Transparenz, was die
Verwaltungsabläufe, z.B. Förderungen anbelangt, aber auch dazu, dass die Verwaltung
Geld sparen kann, weil viele Anwendungen, die rund um die Datenpools entstehen,
sozusagen zum Bürger hin ausgelagert werden.
2. Langegger: Es gibt viele Gründe, die für eine derartige Initiative sprechen, was sich
durch unterschiedliche Interessensgruppen bemerkbar macht. Da gibt es unter anderem
politische Motive wie mehr Transparenz und Effizienz (z.B. Verhindern von mehrfacher
Erfassung/Aufbereitung derselben Daten von unterschiedlichen Stellen), aber auch
wirtschaftliche Interessen sowie auch das Interesse, neueste Forschungsergebnisse aus
dem Bereich Semantic Web anzuwenden.
Was politische Interessen betrifft, ist die Initiative nichts völlig Neues. Im November 2005
wurde in Österreich die EU Direktive 2003/98/EC (“on the re-use of public sector
information”) durch das Informationsweiterverwendungsgesetz (IWG) umgesetzt. Ziel des
Gesetzes ist “die Erleichterung der Weiterverwendung von Dokumenten öffentlicher
Stellen, insbesondere, um dadurch die Erstellung neuer Informationsprodukte und
-dienste zu fördern.” Es handelt sich dabei um keine Verpflichtung zur Freigabe
öffentlicher Daten, sondern um eine klare rechtliche Regelung und einen transparenten,
allgemeinen Zugang. In vielen EU-Ländern (UK, Finnland, Niederlande, Dänemark, etc.)
sowie auch in den USA und Kanada haben Regierungen dieses Potential bereits erkannt
und vorbildliche Initiativen unterstützt bzw. selbst initiiert.
EU-weit gibt es derzeit Initiativen, die auf diesem Grundgedanken aufbauen und den
Zugang durch standardisierte Beschreibung der zugrundeliegenden Daten erheblich
verbessern und effizienter machen. Die Verwendung und Verknüpfung der Informationen
aus aufbereiteteden Textdokumenten erfordert erheblichen Aufwand, welcher von jedem
Nutzer mehrfach manuell unternommen werden muss, weil die Informationen nicht
maschinenlesbar sind. Würde man diese Informationen bereits in standardisierter Form
zur Verfügung stellen, würde man die Weiterverwendung erheblich erleichtern und den
Zugang vereinfachen. Durch sinkende Kosten und mehr Effizienz würden sich außerdem
ganz neue Möglichkeiten der Nutzung ergeben (Web services, Mashups, etc.).
Können Sie 2, 3 Anwendungsbeispiele nennen?
Langegger: Steht erst einmal die Infrastruktur zur Verfügung, gibt es jede Menge
denkbare Anwendungsbeispiele. Durch den Einsatz offener Standards können öffentliche
Informationen in alle möglichen bestehenden Anwendungen, Internetseiten und -dienste
eingebunden werden. Es werden aber sicher auch völlig neue dezidierte Dienste von
öffentl. Stellen, Medien, Unternehmen, Vereinen und Einzelpersonen entstehen.
Zum Beispiel:
1. Bürgerservices (können von verschiedenen “Dritten” angeboten werden, die Daten
stammen jeweils von der öffentlichen Verwaltung): Visualisierung von Daten über
die Gesundheitsversorung, Familienunterstützung & Bildungsmöglichkeiten in
versch. Gemeinden oder Informationen zur Verkehrsversorgung/-planung in der
Region. Bessere Information der Bevölkerung über politische Vorgänge im
Parlament, Landtagen, Gemeinden durch Integration von aktuellen Daten ins
Webangebot verschiedener Medien usw.
2. Marketingabteilungen von Unternehmen würden vom leichteren und effizienteren
Zugang zu demografischen Informationen durch automatisierte Integration in
eigene Berechnungsmodelle profitieren.
3. Geografische Informationssysteme verschiedener Art und für unterschiedliche
Zwecke könnten sehr einfach demografische Informationen einblenden (Mashups).
3. Wie hängen die Interessen unterschiedlicher Stakeholder (Medien, Un-
ternehmen, Verwaltung, Bürger, Konsumenten) zusammen?
Blumauer: Nutznießer einer Open Data Politik wären vor allem Unternehmen, Verwal-
tung und die Bürger. Einerseits könnten die Unternehmen zum Beispiel auf hochwertiges
demographisches Datenmaterial zugreifen und könnten dieses mittels "Mashups" mit
ihren eigenen Daten im Sinne einer verbesserten "Market Intelligence" vernetzen. Bürger
würden langfristig durch den Transparenzierungsschritt profitieren, da z.B. Mißbrauch
von Fördergeldern undurchführbarer würden und natürlich würde die Verwaltung selbst
einen Nutzen ziehen: Die Glaubwürdigkeit würde steigen, das Vertrauen der Bürger in die
Verwaltung würde wieder wachsen und das Bürger-Service würde verbessert. Ein Beispiel:
Waren in UK die Katasterkarten zunächst kostenpflichtig, so wurden diese schrittweise als
Open Data der Öffentlichkeit "übergeben" (siehe:
http://www.communities.gov.uk/news/corporate/1385429 ). Seither sind zwar direkte
Einnahmen über Gebühren beim UK Government zurückgegangen, aber es sind neue,
kreative Dienste und Unternehmen rund um dieses Datenmaterial entstanden, die natür-
lich wieder Steuern an die Verwaltung zurückführen, welche höher sind als die Einnahmen
zuvor - ganz zu schweigen vom Mehrwert, den die Bürger davon haben.
Langegger: Es handelt sich ganz klar um eine “win-win Situation”, weshalb sich Medien,
Unternehmen, Verwaltung und Bürger formieren und eine gemeinsame Initiative starten
sollten. Das ist das Ziel des Meetups im April.
Welche Rolle spielt hier die Politik?
Blumauer: Die Politik kann bei einem "Open Data" Prozess natürlich erheblichen Ein-
fluss nehmen, kann diesen verhindern oder fördern. Gefragt sind Politiker, die Mut zu
mehr Transparenz haben, die neue Medien und das Internet der Partizipation als Kraft
verstehen, die unsere Gesellschaft rund um erneuern kann. Dazu gehört eine koordinierte
Wissengesellschaft, die freien Zugang zu Wissen garantiert. Wikipedia war erst der erste
Schritt dorthin.
Langegger: Durch das IWG wurden bereits die rechtlichen Rahmenbedingungen
geschaffen, das heisst staatliche Stellen können bereits jetzt aktiv werden und
Informationen in standardisierter Form bereitstellen. Langfristig sollte allerdings eine
nationale Strategie in Kooperation mit verschiedenen Stakeholdern entwickelt werden, die
zum Teil auch die Veröffentlichung bestimmter grundlegender Daten vorschreibt und
somit langfristig gewährleistet. Auf europäischer Ebene sind wir über die Open Knowledge
Foundation http://www.opendefinition.org/okd/ (Open Knowledge Definition1) bereits
gut vernetzt. Von technischer Seite her, ist es außerordentlich wichtig, dass überall die
gleichen Standards verwendet werden und Interoperabilität gewährleistet werden kann.
Welche Rolle die Öffentlichkeit?
1 Die Unterscheidung zw. Daten und Wissen ist hier irrelevant, in der Informationstheorie gibt es allerdings eine klare
Hierarchie: Daten/Information/Wissen/Weisheit; Wissen wird aus Informationen generiert, Informationen werden
durch Daten repräsentiert
4. Blumauer: Die Öffentlichkeit ist die "Triebfeder" von Open Data Initiativen schlechthin.
Viele Ideen stammen von der "Internet-Öffentlichkeit", von Communities, die sich seit
Jahren mit Themen wie Science Commons, Open Access, Open Source oder Semantic Web
auseinandersetzen. Um das Thema einer breiteren Öffentlichkeit zugänglich zu machen
gilt nun eines: Klarstellen, was Open (Government) Data tatsächlich ist, was damit
bezweckt wird und was nicht. Open Data hat etwa gar nichts damit zu tun, dass private
Daten veröffentlicht werden sollen - aber Verwechslungen entstehen oft schneller als man
will.
Langegger: Grundsätzlich betrifft es ja alle Bürger, also jede/n, der/die Interesse an
dieser Thematik hat, sollte sich über Vereine bzw. Interessensgruppen aktiv einbringen.
Welche Daten gibt es überhaupt und wem gehören sie?
Langegger: Zum Beispiel Daten zur Gesundheitsversorung, Beschäftigung, Soziales,
Bildung, Forschung, Kriminalität, Öffentl. Verkehr, KFZ-Registrierungen, Straßenbau,
Wirtschaftsleistung, VGR, Staatshaushalt, offizielles Firmenverzeichnis, Katasterdaten,
Bauwesen, Informationen zu Gebäuden/Anlagen/Landwirtschaftsflächen, geologische
Daten, Energie & Umwelt, Tourismus, etc.
Viele dieser Daten werden von staatlichen Organisationen gesammelt und verwaltet und
gehören demnach dem Staat, also den Österreichern und sollten daher auch öffentlich
zugänglich sein (“open”). Je nach rechtlicher Lage kann es aber sein, dass sie nicht so
einfach veröffentlicht werden können. Allerdings haben bereits viele Staaten erkannt,
welchen Nutzen sie daraus ziehen, wenn sie auch Daten die z.B. von externen Firmen im
Auftrag des Staates erstellt werden, an die Bevölkerung weitergeben.
Wie hängt "Open Data" mit "Linked Data" zusammen? Bitte definieren Sie
(kurz) die Unterschiede: Open Data, Linked Open Data, Open Government
Data
Blumauer: "Open Data" sind zunächst Datenquellen, die den 8 Grundprinzipien folgen,
u.a. also Maschinenverarbeitbarkeit. Werden nun 2 oder mehrere Quellen mit Hilfe von
RDF, also der Basistechnologie des Semantic Web, verlinkt, so spricht man von Linked
Data. Linked Data Mechanismen können grundsätzlich auf alle Daten (auch Enterprise
Daten) angewandt werden; passiert dies aber mit Open Data, so spricht man von Linked
Open Data. Dieser Bereich ist in den letzten beiden Jahren enorm gewachsen, es ist die so
genannte Linked Open Data Cloud (LOD Cloud) entstanden (siehe: http://blog.semantic-
web.at/wp-content/uploads/2009/05/lod_cloud_growth_2009.jpg ). Open Government
Data sind also Daten der Öffentlichen Verwaltung, die den 8 Grundprinzipien folgen.
Langegger: Unter “open data” verstehe ich genau das, was die Open Knowledge
Foundation definiert hat:
http://www.opendefinition.org/okd/ (Open Knowledge Definition2)
Also barrierefreier und nicht diskriminierender Zugang (Kosten nur als Grenzkosten für
die Reproduktion, im Internet deshalb kostenfrei), Möglichkeit zur Wiederverwendung
und auch Redistribution mit gleichzeitiger Kennzeichnung (Attribution).
2 Die Unterscheidung zw. Daten und Wissen ist hier irrelevant, in der Informationstheorie gibt es allerdings eine klare
Hierarchie: Daten/Information/Wissen/Weisheit; Wissen wird aus Informationen generiert, Informationen werden
durch Daten repräsentiert
5. “Open Government Data” sind öffentliche Daten, die vom Staat für die
jeweiligen Verwaltungsaufgaben gesammelt werden (ausgenommen davon
sind ZMR-Daten bzw. Personenbezogene Daten – diese sind ja nicht
öffentlich/open).
“Linked Data” ist eine im Semantic Web angewandte Methode, mit der geografisch
verteilte Informationen auf Basis des WWW systematisch organisiert und verknüpft
werden können. Alle Vorteile eines Hypertextsystems, (z.B. WWW) das Dokumente mit
Hyperlinks verbindet, können dann auf verteilte Datenbestände angewendet werden.
Wenn Daten miteinander verknüpft werden, wem obliegt die Interpretation
der Daten?
Langegger: Nach Verknüpfung von Daten aus verschiedenen Quellen ist die
Kennzeichnung dieser natürlich sehr wichtig (siehe Open Knowledge Definition:
Attribution). Bei der Anwendung der Linked Data Prinzipien ist die Quelle grundsätzlich
immer sofort ersichtlich (Datenelemente werden stets über URIs identifiziert, wobei der
Domainname die Herkunft eindeutig belegt). Wenn Daten weiterverarbeitet werden (z.B.
Zahlen zu Summen verdichtet werden), entstehen grundsätzlich immer neue Datensätze,
die wiederum über URIs identifiziert werden können. Die zugrundeliegenden Basisdaten
bleiben durch korrekte Attribution zurückverfolgbar (vgl. Statistiken in Zeitungen).
Eine Technologie zu haben ist noch kein Garant für ihre „politisch korrekte
Umsetzung“ – wie stehen Sie dazu, welche Mechanismen gibt es hier, bzw.
welche Maßnahmen sollten hier gesetzt werden, um sicherzustellen, dass hier
bestmöglich im Sinne des Bürgers gearbeitet wird?
Blumauer: Einiges kann man sich von ähnlichen Initiativen abschauen, die zur Zeit in
UK, USA, Australien, Kanada und einigen skandinavischen Ländern hochgefahren werden.
Der OpenGovData-Prozess selbst ist ebenfalls äußerst transparent. Daten und Anwendun-
gen werden in einer Plattform gesammelt. Jeder kann sich einbringen im Sinne einer Web
2.0 Plattform.
Langegger: Ich denke der Begriff “politisch korrekt” wird teilweise etwas überstrapaziert.
Nur ein Beispiel: ist es politisch korrekt, Kriminalitätsstatistiken eines Bezirkes öffentlich
zugänglich zu machen? Gegner mögen einwenden, damit können Bezirke abgewertet
werden und es kommt zur Konzentration oder Ghettobildung. Man kann es auch genauso
umgekehrt sehen. Langfristig kommt es auch ohne Veröffentlichung der Daten zur
Ghettobildung, weil die hohe Kriminalität ja ein Fakt ist und sich auf die Lebensqualität
unmittelbar auswirken wird. Ist die Öffentlichkeit allerdings informiert, wird die
Verwaltung zum Handeln gezwungen und es kann dagegen etwas unternommen werden.
Ich glaube, “Offenheit” und Transparenz ist ein ganz wichtigter Motor in einer
entwickelten Gesellschaft.
6. Was passiert mit den gesammelten Daten?
Blumauer: Was mit den gesammelten und publizierten Daten passiert, weiß man am An-
fang nicht - das ist auch ein Grundprinzip des Semantic Web. Daten werden hier nach den
Linked Data Prinzipien Applikations-agnostisch veröffentlicht. Die Daten können so nach
dem Gutdünken des Anwenders weiterverlinkt werden. Dabei sollten die Verwaltungen
den Bürgern und Unternehmen ruhig zutrauen, dass auch diese imstande sind, wertvolle
Datenbestände in interessante Anwendungen ummünzen zu können. Wichtigster Prozess-
Schritt ist jedoch die Interpretation der neu vernetzten Datenbestände - hier ist bislang
noch zuwenig diskutiert worden, wie das "funktionieren" könnte. Die Wissenschaft ist also
gefordert, da dieser immens wichtige letzte Schritt in dieser Wertschöpfungskette nicht
alleine der Politik überlassen werden sollte. Die Politik ist schließlich zum Handeln aufge-
fordert!
Langegger: Wie bereits bei den Anwendungsbeispielen beschrieben. Sie werden
wiederverwendet und zwar transparent, barrierefrei und ohne Wettbewerbsverzerrungen –
auch von staatlichen Stellen selbst. Es sollte ja auch die Weitergabe von Daten unter
verschiedenen Verwaltungseinheiten bestmöglich gewährleistet sein.
Welche Gruppen könnten Sie bei Ihrer Arbeit unterstützen, durch welche
Maßnahmen?
Blumauer: An Open Data mangelt es nicht, wir benötigen daher gar nicht so sehr die Un-
terstützung der Data-Provider, sondern vielmehr von den Kreisen, die den Nutzen von
Linked Open Data auch verstehen und einsetzen wollen. Das sind neben Politik auch Un-
ternehmen, die aus Datenfluten neue Erkenntnisse gewinnen wollen und daher in diese
Entwicklung auch investieren wollen.
Langegger: Erst einmal wollen wir mit 1-2 Beispielen, die wir in Kooperation mit einer
Verwaltungsstelle erarbeiten, zeigen was möglich ist. Dazu brauchen wir interessierte
Kollegen aus der Verwaltung, die wir ja zum Teil schon haben.
Eine andere – eher langfristige Aufgabe – wird es sein, Überzeugungskraft zu leisten und
ggf. die rechtlichen Rahmenbedingungen anzupassen. Dazu brauchen wir alle möglichen
Stakeholder an unserer Seite, sowie auch Politiker und Juristen.
Parallel dazu werden wir gemeinsam mit der Open Knowledge Foundation auf
europäischer Ebene guidelines erarbeiten und “best practice” Lösungen austauschen. Wir
haben den Vorteil, dass es bereits einige Länder wie GB, Finnland, Holland, Dänemark,
Deutschland gibt, die uns ein paar Schritte voraus sind. Somit profitieren wir natürlich
von Erfahrungen in diesen Ländern.
Was soll sich wünschenswerterweise – etwa in einem Jahr – durch die öster-
reichische Initiative verändert haben? In fünf Jahren?
Blumauer: Das Thema (Linked) Open Government Data sollte in einem Jahr in Österre-
ich öffentlich diskutiert und weitgehend verstanden und angenommen sein. Neben einigen
organisatorischen Maßnahmen, sollten vor allem erste konkrete Projekte gestartet sein.
Man möchte ja schließlich nicht der letzte sein, der auf den fahrenden Zug aufspringt -
7. Österreich hat einen guten Ruf als Vorreiter im Bereich e-Government zu verlieren! Klares
Ziel in 5 Jahren also: Österreich ist Spitzenreiter im Bereich Open Government Data, was
sich dann vor allem anhand florierender, neuer Anwendungen für den Bürger, aber auch
für Unternehmen und die Verwaltung selbst ablesen lässt.
Langegger: Ich denke innerhalb dieses Jahres werden wir es mit Hilfe der Open
Knowledge Foundation noch schaffen, ein relativ komplettes zentrales Verzeichnis
zumindest mit Links zu allen bereits jetzt öffentlichen Datenbeständen aufzubauen (Bsp.
http://www.ckan.net/). Parallel dazu werden wir 1-2 “sichtbare” Demoprojekte erarbeiten,
um zu zeigen, was am Ende möglich sein wird.
In 5 Jahren wird es einen internationalen Standard für Open Government Data geben, der
auf Linked Data basieren wird und der innerhalb der EU, in den USA, Kanada, Neuseeland
und vielen weiteren Ländern Anwendung finden wird. Möglicherweise wird es eine
aktualisierte EU PSI-Direktive geben, welche sich nicht mehr bloß auf Dokumente bezieht,
sondern auch auf Linked Data.
Während wir bei eGov-Bürgerserviceleistungen Spitzenreiter in Europa sind, belegen wir
punkto Transparenz bezüglich Zugang zu öffentlichen Informationen innerhalb der EU die
hinteren Plätze (siehe MEPSIR-Studie3 von 2006). Es gibt zwar bereits Ansätze wie z.B.
das Informationsweiterverwendungsregister www.help.gv.at/iwr/, allerdings fehlen hier
wirkliche Initiativen, um das hohe Potential zu nutzen.
---
*) Mag. Andreas Blumauer ist Dozent an den Wiener Fachhochschulen FHWien und
FH Technikum Wien sowie am Campus02, einer Fachhochschule in Graz sowie Geschäfts-
führer der Semantic Web Company http://www.semantic-web.at/35.team.htm
Mag. Andreas Langegger ist Semantic Web Researcher, FH-Dozent, wissenschaftl. Mit-
arbeiter an der Universität Linz (Wissensverarbeitung)
http://www.sembase.at/index.php/Andreas_Langegger
Marion Fugléwicz-Bren ist freie Journalistin und Communications Managerin der Se-
mantic Web Company www.semantic-web.at. www.marions.at
3 http://ec.europa.eu/information_society/policy/psi/mepsir/index_en.htm