Eigene Daten im Google Data Explorer

21 Mar 2011 20:46

google-data-explorer.png Der Google Data Explorer steht nun der Allgemeinheit offen. Grund genug für ein paar Schlaglichter auf ein kaum bekanntes Tool.
[[span class="legend"]](eigentlich veröffentlicht am: 17.02.2011)

Der Google Data Explorer visualisiert statistische Daten in dynamisch aufbereiteten, interaktiven Grafiken. Die Grafiken sind direkt im Browser aufrufbar, lassen sich aber auch in Webseiten in Form von embedded Frames (IFrames) einbetten oder einfach verlinken. Damit der Data Explorer die Input-Daten verarbeiten kann, müssen diese in ein bestimmtes, XML-basiertes Dateiformat gebracht werden: die Dataset Publishing Language (DSPL). Gedacht ist der Data Explorer für wirtschaftliche, wissenschaftliche, demografische und demoskopische Daten aller Art.

Beispiele für Daten im Google Data Explorer

Verbraucherpreisindex in europäischen Ländern:
(im Google Data Explorer aufrufen)

google-data-explorer-1.png

Saisonbereinigte Arbeitslosenquoten in europäischen Ländern:
(im Google Data Explorer aufrufen)

google-data-explorer-2.png

Beide Beispiele zeigen aufbereitete Daten aus dem Datenbestand von Eurostat. Der Benutzer kann in diesem Fall einzelne Länder an- und abklicken, um deren Datenvisualisierung ein- oder auszublenden. Neben Liniengrafiken stehen auch Balken- und Blasengrafiken zur Verfügung. Durch die interaktive, gezielte Visualisierbarkeit eignen sich Daten des Data Explorers auch als begleitendes Projektionsmaterial für Präsentationen oder Diskussionen.

Die oben gezeigten und verlinkten Beispiele sind eigentlich nichts Neues, sondern wie zahlreiche andere Daten in dieser Form bereits seit Monaten abrufbar, denn der Google Data Explorer an sich wurde bereits im März 2010 im Rahmen der Google Labs veröffentlicht. Die bislang verfügbaren Daten stammen aus namhaften Quellen wie Eurostat, dem US Census Bureau, dem US Bureau of Labor Statistics, der Weltbank oder der OECD. Was jetzt neu ist, ist die Möglichkeit, selbst eigene Daten im Google Data Explorer zu veröffentlichen. Wie das GoogleWatchBlog berichtet, kann jeder Benutzer mit gültigem Google-Account über eine Upload-Seite eigenes Datenmaterial zur Aufbereitung hochladen. Das Ganze funktioniert jedoch nur, wenn die Daten in der Dataset Publishing Language (DSPL) vorliegen.

Die Dataset Publishing Language (DSPL)

Die DSPL ist eine XML-Sprache zum Strukturieren statistischer Daten. Mit Hilfe eines XML-Editors oder eines einfachen Texteditors lassen sich solche Dateien erstellen. Google selbst bietet auf der Projektseite zu DSPL ein anschauliches DSPL-Tutorial an, mit dessen Hilfe interessierte und Benutzer in der Lage sein sollten, eigene Daten in das Format der Markupsprache zu bringen. Ein DSPL-Dokument definiert neben einigen anfänglichen Metadaten, z.B. zur Datenherkunft, im wesentlichen mehrere concepts und slices.

Concepts sind die Parameter der Daten. Angenommen, eine Schule möchte Schülerzahlen und statistische Daten zu den Schülern veröffentlichen. Concepts könnten dann beispielsweise Schuljahr, (Anzahl) Schüler, Geschlecht und Wohnort sein. Slices sind Tabellen oder genauer gesagt Views, die sich aus diesen Parametern und zugehörigen Zahlen ableiten lassen. Beispielsweise eine zweispaltige Tabelle mit den Überschriften Schuljahr und Schüler, welche die Entwicklung der Schülerzahlen im Laufe der Jahre zeigt. Oder eine Tabelle, die für ein bestimmtes Schuljahr die Spalten Wohnort und Schüler enthält, um anzuzeigen, aus welchen umliegenden Orten wie viele Schüler im betreffenden Schuljahr kommen.

Anwendungsbereiche

Das Beispiel einer Schule, die statistische, nichtpersönliche Daten zu ihren Schülern veröffentlicht, ist nur einer von vielen denkbaren Anwendungsfällen für eigene Daten im Google Data Explorer. Unternehmen können Daten zur Unternehmensentwicklung oder zur Produktverbreitung veröffentlichen, Sportler können Trainings- und Leistungsdaten veröffentlichen, Hobby-Metereologen können ortsspezifische, eigene Witterungsmessdaten veröffentlichen, Fußballfans können Spielstatistiken veröffentlichen, Doktoranden können begleitend zur Doktorarbeit angefallene, selbst ermittelte empirische Daten veröffentlichen. Der Phantasie sind kaum Grenzen gesetzt. Wer systematische, tabellarisch darstellbare und skalierbare (also vor allem nummerische) Daten hat, die auch für andere Benutzer interessant sein könnten, kann den Google Data Explorer dazu nutzen, seine Daten anschaulich im Web zu veröffentlichen.

Weniger geeignet ist der Google Data Explorer für nicht skalierbare Daten. In diesem Fall lohnt stattdessen ein Blick auf einen ähnlich unbekannten Google-Service, nämlich Google Fusion Tables (siehe dazu auch der Webkompetenz-Artikel Fusion Tables - die Cloud-Datenbank von Google). Beide Services ziehen indes insofern an einem Strang, als sie es ermöglichen, reine Daten an einem separaten, unabhängigen und hochverfügbaren Ort im Web zu veröffentlichen, wo sie sich von einer leistungsfähigen Webanwendung flexibel aufbereiten lassen.

Last but not least sind der Google Data Explorer und seine DSPL-Sprache übrigens auch ein weiteres Praxisbeispiel für den sinnvollen Einsatz von XML im Web.

Kommentare

Neuen Kommentar hinzufügen
oder Anmelden als Wikidot User
(wird nicht veröffentlicht)
- +
Sofern nicht anders angegeben, steht der Inhalt dieser Seite unter Lizenz Creative Commons Attribution-ShareAlike 3.0 License