Feature »

Nationaler Aktionsplan Open Data: Bericht vom Meilenstein-Workshop

1. Februar 2015 – 13:31 | Kein Kommentar | 12.259 Aufrufe

Die Bundesregierung hat im Juni 2013 die Open Data Charta der G8 unterzeichnet und sich damit zu konkreten Handlungsschritten verpflichtet. Mit einiger Verspätung wurde nun ein Aktionsplan Open Data unter Federführung des BMI entworfen, der diese …

Weiterlesen »
Interviews

Interviews mit Protagonisten aus den Bereichen Open Government, Open Data, Transparenz, Partizipation, Verwaltungsmodernisierung…

Gastbeiträge

Gastbeiträge von Autoren aus der Verwaltung, Wissenschaft, Wirtschaft und Community

Debatte

Kontroverses und Aktuelles – Debattenbeiträge zu den Themen Open Government, Open Data, Transparenz und Partizipation

Veranstaltungen

Terminhinweise zu und Berichte von Veranstaltungen, Kongressen, Hackdays, BarCamps…

Praxis

Bürgerhaushalte, Konsultationen oder Datenvisualisierung – gute Beispiele zeigen, wie es funktionieren kann

Start » Debatte, Praxis

Open Data – Vielleicht schon näher als man denkt? Teil 2 – DFG


Diesmal bin ich über die Angebote „GEPRIS“ und den „Research Explorer (Rex)“ der Deutschen Forschungsgemeinschaft DFG gestolpert, bei denen sich mal wieder ein Abgleich gegen die OpenData Kriterien lohnt.

GEPRIS steht für das „Geförderte Projekte Informationssystem“.

Mit GEPRIS stellt die DFG seit mehr als zehn Jahren ein Informationssystem bereit, welches über aktuelle DFG-geförderte Forschungsvorhaben informiert. GEPRIS gibt dabei Auskunft über den Inhalt und das Forschungsziel eines Projektes, sowie über die an einem Projekt beteiligten Personen und Forschungsstätten. Dabei werden sowohl Projekte in der Einzelförderung als auch Teilprojekte zu Sonderforschungsbereichen, Schwerpunktprogramme, Forschergruppen, sowie mit weiteren DFG-Instrumenten geförderte Forschungsarbeiten nachgewiesen.

Der RESEARCH EXPLORER, den die DFG zusammen mit dem Deutschen Akademischen Ausstauschdienst DAAD anbietet,

erschließt über 17.000 Institute an deutschen Hochschulen und außeruniversitären Forschungseinrichtungen nach geografischen, fachlichen und strukturellen Kriterien.

Dann mal los und ran an die Kriterien…

1. Vollständigkeit

Wie immer, von Außen schwer zu beurteilen. Ein paar Indizien:

Sucht man bei GEPRIS über die „erweiterte Suche“ ohne einschränkende Kriterien, findet man im Moment immerhin 76.758 Projektförderungen mit 45.644 Personen bei 18.366 Institutionen. Bei Stichproben in den Ergebnissen habe ich Vorhaben aus 1963 gefunden.

Der „Datenmonitor“ nennt in der Übersicht 76.768 Projekte, 46.154 Personen und 20.194 Institutionen,  auch nochmal aufgeschlüsselt nach Wissenschaftsbereichen.

Kleinere Unschärfen also zwischen Suchergebnis und Datenmonitor, sind aber marginal und vom Fachmann bestimmt schnell weg zu erklären 😉

REX umfasst, wie er selbst verkündet, über 17.000 Institute.

Ob das nun vollständig ist? Keine Ahnung, in der Breite sind es auf jeden Fall viele Daten.

In der Tiefe fällt mir zumindest bei GEPRIS in den Details zu den Projekten schnell ein fehlendes Datum auf: Es fehlt die Angabe über das Fördervolumen, was ich für eine sehr spannende Information in einer Datenbank zu Fördervorhaben halten würde. Ansonsten sind Projektname, fachliche Zuordnung, Förderzeitraum, Projektbeschreibung, Kategorisierung nach DFG-Verfahren, Teilprojekte, Ansprechpartner, Institution(en) sowie verfahrenstechnische und fachliche DFG-Ansprechpartner aufgeführt.

Die Suche nach Personen liefert die vollständigen Kontaktdaten sowie eine Auflistung alle Projekte, bei denen die Person in ihren jeweiligen Rollen beteiligt ist oder war. (Esoteriker könnten hier jetzt anmerken, dass personenbezogene Daten nicht zur Definitionsmenge „Open Data“ gehören… aber das ist ja noch sparsam und der Erschließung des Sachverhalts dienlich. Und in der wissenschaftlichen Welt gibt’s ja eh kaum Wichtigeres, als den möglichst oft und überall referenzierten Namen)

Sucht man nach Institutionen, erhält man die Adressdaten sowie eine kategorisierte und verlinkte Auflistung aller Projekte, die bei dieser Institution gefördert wurden.

(Das Vollständigkeitskriterium gehört ja eh’ nicht zu meinen Lieblingen, ich bin eher der Meinung, einfach mal anzufangen mit Open Data, ruhig auch mit Teilbeständen.)

Ich sage mal: Kriterium gut erfüllt, Fördervolumen bei den Projekten in GEPRIS als essentielle Information wäre aber noch deutlich besser.

2. Primärdaten

Die Daten sowohl von GEPRIS also auch REX kommen aus den operativen Fachverfahren der DFG und können daher als Primärdaten betrachtet werden. Gut – die Adressen in REX kommen eher von den Instituten und sind dort primär… so what, REX liefert die erforderliche Aggregation, ohne die man sonst keine Übersicht hätte.

Kriterium erfüllt.

3. Zeitnah

Letzter Aktualisierungsstand GEPRIS laut Datenmonitor: 28.01.2011

Rex:

Alle verzeichneten Institutionen werden mit ihrer Postanschrift und Webadresse in laufend aktualisierter Form präsentiert.

Da kann man nicht meckern, Kriterium erfüllt.

4. Zugänglich

Beide Auskunftsysteme sind auf der DFG Homepage auf hoher Ebene auffindbar und verlinkt, mit 2 Klicks ist man bei GEPRIS und REX über den Menüpunkt „Informationssysteme“ im Hauptpunkt „Geförderte Projekte“. Besser geht’s kaum.

Die Daten in GEPRIS und REX stehen über vielfältige Such- und Filtermechanismen in Listen und Detailansichten zur Verfügung und sind querverlinkt. Bei GEPRIS können Detailergebnisse zusätzlich als PDF und in der Druckversion angezeigt werden, bei Listenergebnissen geht das nicht.

Kriterium erfüllt.

5. Maschinenlesbar

Die Daten auf GEPRIS und REX liegen nicht innerhalb von Bilddateien oder PDFs vor (es sei denn, man möchte sie bei GEPRIS in der Detailansicht als PDF exportieren). Sie sind strukturiert, die Struktur und die Semantik der Daten sind beschrieben – bei GEPRIS unter dem Menüpunkt „Über GESPRIS – Hilfe, Tipps und Hinweise – Darstellung Suchergebnisse“, bei REX unter dem Menüpunkt „Tipps und Hinweise – Aufbau der Ergebnislisten und Detailansicht“. Im weitesten Sinne also „maschinenlesbar“, da die Daten aus den HTML-Seiten extrahiert werden könnten… aber der Aufwand ist natürlich erheblich höher, als wenn die Daten z.B. über XML oder CSV Dateien angeboten würden. Das wäre wahrscheinlich mit Minimalaufwand schnell umsetzbar.

Kriterium teilweise erfüllt.

6. Nicht diskriminierend

Weder für GEPRIS noch REX gibt es Registrierungsprozeduren oder Anmeldeformulare. Alle Daten stehen ohne Hürde zur Verfügung.

Kriterium erfüllt.

7. Nicht proprietär

Wiedermal gilt: die Daten liegen in HTML-Text-Tabellen vor, sind also auch nicht proprietär. Einzige Exportoption für Detaildaten aus GEPRIS ist PDF, auch ok. Dieses Kriterium kann man aber erst dann wirklich sinnvoll anwenden und bewerten, wenn Datensätze in wirklich maschinenlesbarer Form zum Export oder Download angeboten werden, siehe Kriterium 5.

Kriterium nicht bewertbar.

8. Lizenzfrei

Hier findet sich an mehreren Stellen etwas:

Auf der Hauptseite im Impressum der Copyright Hinweis:

Für die Internet-Seiten der Deutschen Forschungsgemeinschaft unter http://www.dfg.de (http://www.dfg.eu) liegen Copyright und alle weiteren Rechte bei der Deutschen Forschungsgemeinschaft. Die Weiterverbreitung, auch in Auszügen, für pädagogische, wissenschaftliche oder private Zwecke ist unter Angabe der Quelle gestattet (sofern nichts anderes an der entsprechenden Stelle ausdrücklich angegeben ist). Eine Verwendung im gewerblichen Bereich bedarf der Genehmigung durch die Deutsche Forschungsgemeinschaft.

GEPRIS übernimmt dies im eigenen Impressum ebenso wie REX.

Würde ich mal als Nicht-Jurist mit dem Creative Commons Lizenztyp CC BY-NC vergleichen, also Auflage der Namensnennung und Ausschluss der kommerziellen Nutzung.

Unklar bleiben Auflagen und Ausschlüsse bei Bearbeitung/Änderung, was aber nicht wundert, da das Angebot in der jetzigen Form wohl nicht für eine Weiterverarbeitung konzipiert ist. Hier müsste also mehr Klarheit geschaffen werden, insbesondere, wenn Exporte und Downloads in wirklich maschinenlesbaren Formaten angeboten werden sollten.

Wieder mein Hinweis: Hilfreich und eine einfache Lösung wäre eine Lizenz analog zur Open Government Licence für Public Sector Information, die ich ja schon an anderer Stelle diskutiert habe.

Richtig „lizenzfrei“ im absoluten Sinne ist das Angebot gegenwärtig also nicht und in Bezug auf neue Nutzungsarten bei der Bereitstellung von Export- oder Download-Funktionalität in einem undefinierten Zustand. Für nicht-gewerbliche Nutzung ist die Lizenz aber sicher ausreichend großzügig.

Kriterium nicht (richtig) erfüllt.

9. Nachhaltig

Nach eigener Beschreibung steht GEPRIS schon mehr als 10 Jahre zur Verfügung. Wenn das nicht nachhaltig ist… Im Impressum findet sich unter „Haftungsausschluss“ zwar

Alle kostenfreien Angebote sind unverbindlich. Die DFG behält es sich vor, jederzeit ohne vorherige Ankündigung das Angebot zu verändern, zu ergänzen, zu löschen oder die Veröffentlichung einzustellen.

Aber das ja nicht unüblich und gegenwärtig ist nicht erkennbar, dass das Angebot entfallen könnte.

Kriterium erfüllt.

10. Kostenfrei

Nirgendwo in den Angeboten GEPRIS und Rex der DFG bin ich auf Gebühren oder andere Kosten gestoßen. Der Genehmigungsvorbehalt für die kommerzielle Nutzung im Impressum lässt hier natürlich eine Tür für die kostenpflichtige Abgabe von Daten offen.

Im Moment also: Kriterium erfüllt.

Fazit:

Hat Spaß gemacht, die Angebote der DFG einer Open Data Prüfung zu unterziehen und dabei festzustellen, wie nah man auch hier eigentlich schon dem Ziel Open Data ist – wenn man sich denn dieses Ziels bewusst wäre…

Ein paar Maßnahmen, die wirklich wohl nur minimalen Aufwand bedeuten würden, und die DFG könnte sich guten Gewissens als einer der Open Data Vorreiter bezeichnen:

  • Ergänzung der Angabe des Fördervolumens in den Detaildaten der geförderten Projekte (hier kann ich mir gut vorstellen, dass es erheblichen –  nicht-technischen – Diskussionsbedarf gibt, was diese Angabe wohl auslöst und ob man sie wirklich bereitstellen will… aber so ist das eben, wenn man es mit der Transparenz ernst meint)
  • Aufbereitung und Angebot aller vorhandenen Daten neben der Präsentation als HTML-Tabelle auch in anderen, nicht proprietären Formaten, z.B. CSV oder XML, zum Export oder Download.
  • Adaption und Veröffentlichung einer DFG Open Government Licence for Public Sector Information
  • Ein bisschen Marketing der Angebote in den einschlägigen nationalen und internationalen Open Government / Open Data Communities

Netter Nebeneffekt: Beim Stöbern in der geförderten Projekten stößt man auch auf wirklich interessante Forschungsvorhaben:

Die Verteidigung kultureller Identität als Folge wahrgenommener Kontrolldeprivation: Eine Reinterpretation von Effekten der Sterblichkeitssalienz

Cool, oder? Würde ich auch fördern 😉

Eingereicht von auf 2. Februar 20112 Kommentare | 7.051 Aufrufe

2 Kommentare »

  • Chris Kojak sagt:

    Wunderbar. Das Thema nimmt Fahrt auf.
    Wenn in Deutschland die Websites auch noch optisch attraktiver werden, dann steht einer weiteren Verbreitung nichts mehr im Weg.

  • dr0ide sagt:

    Um nicht mehr „Closed data“ zu sein bedarf es also lediglich zweier Nachbesserungen:

    1. Lizenz
    ———
    Die hier besprochenen einfachen (gleichwohl nicht uninteressanten) Daten können z.B. unter CC0 gestellt werden.

    2. Form des Zugangs
    ——————-
    Ich möchte die Daten ehrlich lesen können. Dazu, wie hier angesprochen, eignet sich auch csv, es eignet sich auch rdf sehr gut.

    @Chris Kojak: In die Optik der Webseits und anderer Medien wird viel zu viel Energie investiert, genau davon *müssen* wir ja dringend weg. Es geht bei Open Data um das „model“ und genau *nicht* um den „view“. Wenn das model stimmt können beliebige views generiert werden, und diese models lassen sich dann miteinander verbinden und übereinander legen – und dann wird es richtig spannend für Informationsvisualisierungstechniker. Siehe z.B. ein Video von Tim Berners-Lee: „The year open data went worldwide“ auf http://www.youtube.com/watch?v=3YcZ3Zqk0a8

Schreibe einen Kommentar!

Schreibe deinen Kommentar unten oder sende einen Trackback von deiner Website. Du kannst auch diese Kommentare abonnieren per RSS.

Sei nett und freundlich. Bleibe beim Thema. Bitte kein Spam.

Du kannst diese Tags zur Formatierung verwenden:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Dieses Weblog nutzt Gravatare, um seinen Lesern ein Gesicht zu geben. Gravatar.