Daten, Daten, Daten – ein Thema auf internationalen Konferenzen wie der EGU 2013

Das Thema “Daten und Metadaten” nimmt bei der jährlich stattfindenden Konferenz der European Geosciences Union (EGU General Assembly) von Jahr zu Jahr einen stärkeren Raum ein.

Auf dieser Veranstaltung trafen 2013 vom 07. bis 12. April in Wien mehr als 11000 Wissenschaftler verschiedenster Bereiche der Geowissenschaften aus fast 100 Ländern zusammen.

In den disziplinspezifisch ausgerichteten Sitzungen wie Atmospheric, Cryospheric, Ocean, Soil System oder Hydrological Sciences als auch in den disziplinübergreifenden Sitzungen wie Natural Hazards oder Energy, Resources and the Environment stehen häufig Forschungsergebnisse mehr oder weniger basierend auf Daten unterschiedlichster Herkunft und Art im Vordergrund.

Behandelt werden auf der EGU aber zunehmend auch Themen, die unabhängig von der geowissenschaftlichen Fachrichtung sämtliche Problematiken rund um das Thema Forschungsdaten an sich benennen, ohne die Auswertung dieser Daten oder die daraus abgeleiteten Schlussfolgerungen in den Vordergrund zu stellen.

Die entsprechenden Vorträge und Poster sind im Wesentlichen in den Sitzungen Earth & Space Science Informatics oder Geosciences Instrumentation & Data Systems angesiedelt.

Viele Beiträge behandeln in diesen Themenbereichen die Möglichkeiten, Daten mit anderen Forschergruppen zu teilen oder zu visualisieren zur Vereinfachung der Interpretation.

So geht es um Big Earth Data Analytics im Beitrag “Climate Data Service in the FP7 EarthServer Project, EGU2013-12849″ oder um Online Access im Beitrag “US National Geothermal Data System: Web feature services and system operations, EGU2013-10668″.

Mit zunehmender Datenmenge und -vielfalt, die dem Nutzer eine breitere Auswahl an Datensätzen bietet, stellt sich die Frage nach der Qualität, dem sich Projekte wie GeoViQua (QUAlity aware VIsualization for the Global Earth Observation System of systems, EGU2013-8160) widmen.

Das Management von festen aber auch dynamisch veränderlichen Datensätzen wird am Beispiel des Forschungsdatenarchivs des NCAR mit Hilfe des aus der Publikation von Texten bekannten Systems der DOIs vorgestellt (“Managing Dataset DOIs and Versions in a Changing Archive, EGU2013-1679″). Das vorgestellte System bietet sich zum Beispiel bei regelmäßiger, z.B. täglicher oder monatlicher, Erweiterung von Zeitreihen an. Kontinuierliche meteorologische Messungen führen zu solchen Datensätzen.

Meteorologisch orientiert ist auch der Beitrag “Metadata and data models in the WMO Information System, EGU2013-8130″, in dem es neben der Wetter-und Klimainformation der einzelnen nationalen Zentren vor allem um Metadaten und damit die Auffindung der jeweils interessierenden Daten geht.

Eine Zusammenführung nationaler Datensätze bzw. ein koordinierter, interaktiver Zugang zumindest zu den entsprechenden Metadaten wird auch bei einer  globalen Plattform für hydrologische Informationen angestrebt. Erlauben nationale Vorgaben eine Datenveröffentlichung, so ermöglicht die Plattform direkten Zugang z.B. zu Abflussdaten, Ganglinien oder anderen abgeleiteten Produkten (“World Water Online (WWO) Status and Prospects, EGU2013-13684″).

Ausgerichtet auf Fragestellungen zur festen Erde arbeitet man in dem Projekt European Plate Observing System (EPOS)an der Koordinierung regionaler geophysikalischer Beobachtungsnetze, lokaler Observatorien und der Integration von Satellitendaten („The EPOS Integrated Core Services, EGU2013-5537“). Ebenso europäisch orientiert ist das Projekt pan-European Geological Data Infrastructure (EGDI), bei dem eine gemeinsame geologische Wissensbasis für Europa aufgebaut werden soll („Working towards a European Geological Data Infrastructure, EGU2013-11577“).

Ähnliche Ansätze verfolgt das EU-Projekt PAGE21, in dem es aber um eine Kontinent übergreifende zentrale Datenbasis für Permafrost Daten geht, inklusive sämtlicher Metadaten basierend auf internationalen Standards, einer technisch einfachen und mit wenig persönlichem Aufwand durchführbaren Dateneingabe als auch Datenabfrage sowie Verknüpfung und Visualisierung interessierender Datensätze („The GTN-P Data Management System: A central database for permafrost monitoring parameters of the Global Terrestrial Network for Permafrost (GTN-P) and beyond, EGU2013-7808“).

Visualisierung von Datensätzen, die an Menge ständig zunehmen, mehrdimensional, zeitlich variierend sind und von verschiedenen Quellen stammen und immer mehr zur Herausforderung bei deren Analyse werden, wird u.a. im Beitrag „Innovative Visualization Techniques applied to a Flood Scenario, EGU2013-12720“) mit fortschrittlichen Techniken vorgestellt.

Auch zu diesem Themenbereich lassen sich meteorologische Beispiele finden, so beim European Centre for Medium-Range Weather Forecasts (ECMWF), Reading, wo es in erster Linie um dort erstellte Vorhersageprodukte geht („Making large amounts of meteorological data accessible through Visualisation, EGU2013-10749“).

Interdisziplinäre Ansätze des Datenaustauschs zeigen die Beiträge „Helix Nebula – the Science Cloud: a public-private partnership to build a multidisciplinary cloud platform for data intensive science, EGU2013-1510-2”, wo es um die Einbindung kommerziell angebotener Cloud Services geht, „Data discovery and data processing for environmental research infrastructures, EGU2013-6030”), hier richtet sich das EU-Projekt ENVRI an Wissenschaftler, die fachübergreifend Daten suchen, die sich nicht nur im Format sondern in vielen weiteren Aspekten formeller als auch inhaltlicher Art unterscheiden, oder „EUDAT: A New Cross-Disciplinary Data Infrastructure For Science, EGU2013-7240“, bei dem neben Geowissenschaften auch Sprachwissenschaften oder die Medizin einbezogen werden.

Beispiele zur Zusammenführung, Beschreibung, Visualisierung oder Bereitstellung von Datensätzen werden zahlreich in den Sitzungen präsentiert, wenige Beiträge befassen sich aber mit der Frage nach der Dauerhaftigkeit der Daten.

Langzeitarchivierung, d.h. der Erhalt von Daten bzw. die Zugänglichkeit zu Daten über Jahre hinweg ohne Behinderung durch technische Veränderungen, steht bei vielen Projekten nicht an erster Stelle im Fokus und wird nur am Rande berücksichtigt. Im Beitrag „SCIDIP-ES – A science data e-infrastructure for preservation of earth science data, EGU2013-5660“ steht eines der wenigen diesbezüglich vorgestellten Projekte im Vordergrund. Hierbei handelt es sich um ein EU-Projekt mit Länder übergeordneter Ausrichtung .

Ein weiteres ist das von DFG geförderte Projekt EWIG (Entwicklung von Workflowkomponenten zur Langzeitarchivierung von Forschungsdaten in den Geowissenschaften), in dem die Problematik „von unten her“ angegangen wird.

Bereits auf institutioneller Basis sollen Policies dafür sorgen, dass Daten ausgehend von ihrer Erhebung mit dem Ziel einer Langzeitarchivierung behandelt werden. Dazu zählen Dokumentation, Qualitätsprüfung als auch Zugänglichkeit und Präsentation. Die Datenerhebung erfolgt in diesem Fall ständig im Rahmen eines meteorologischen Messnetzes. Dieser Workflow bis hin zur Langzeitarchivierung soll beispielhaft für meteorologische Forschungsinstitute aber auch andere geowissenschaftliche Institutionen, in denen Daten kontinuierlich erzeugt werden, stehen. Hervorzuheben ist auch die angestrebte Ausbildung zukünftiger Wissenschaftlergenerationen, die in diesem Projekt einen hohen Stellenwert bekommt. („The Implementation of Policies Regulating Institutional Data Management, EGU2013-8170“).

This entry was posted in ohne Kategorie. Bookmark the permalink.

Comments are closed.