EWIG-Projekt nach dreijähriger Laufzeit beendet

Im Oktober 2014 endete das dreijährige Projekt EWIG. Das Projekt basierte auf der Herausforderung, vormals fehlende oder unzureichende Workflowkomponenten zu entwicklen, die den Übergabeprozess von Forschungsdaten an ein Langzeitarchiv optimal unterstützen. Im Projektverlauf hat sich der Fokus von Software-Lösungen verschoben in Richtung auf nicht-technische Komponenten wie Policies, Konzepte zur Datenorganisation und Lehr- und Weiterbildungsmodule, die auf das „Enabling“ von Forschern zielen.
Wesentliche Ergebnisse der Projektarbeiten sind die Broschüre “Einstieg ins Forschungsdatenmanagement in den Geowissenschaften”, eine Mustervorlage für Übernahmevereinbarungen und eine Beispielpolicy für institutionelles Datenamangement (s. Materialien & Weblinks).
Die Vermittlung von Kenntnissen zum Forschungsdatenmanagement an Studierende, Postgraduierte und auch erfahrene Wissenschaftler ist aus Sicht der Projektpartner in Deutschland noch vergleichsweise wenig verbreitet. Die Sicherung der nachhaltigen Zugänglichkeit von Forschungsergebnissen sollte als Teil des Forschungsprozesses verstanden und zukünftig bereits in der universitären Ausbildung vermittelt werden. Entsprechende Aktivitäten wie die Entwicklung von Lehrkomponenten, Publikation von Lehrmaterialien und der Aufbau von Beratungsstellen auf institutioneller (z.B. universitärer) Ebene wird von den Projektpartnern als wichtige zukünftige Aufgabe gesehen. Die Projektpartner werden die Erkenntnisse aus EWIG unmittelbar in ihre weitere Arbeit zum Forschungsdatenmanagement einfließen lassen – sowohl disziplinspezifisch als auch generisch und fächerübergreifend.

Posted in ohne Kategorie | Comments Off

Broschüre »Einstieg ins Forschungsdatenmanagement in den Geowissenschaften« erschienen

Ein wesentliches Ergebnis des EWIG-Projekts ist jetzt in Form einer kurzen Handreichung für Studierende, Lehrende und Forscher in den Geowissenschaften erschienen. Die Broschüre »Einstieg ins Forschungsdatenmanagement in den Geowissenschaften« soll den Zugang ebnen und einen Vermittlungsansatz zu Methoden und Werkzeugen des Datenmanagements bieten. Auf 24 Seiten stellen wir darin kurz und knapp grundsätzliche Fragen des Umgangs mit Forschungsdaten vor.

Nicht nur das EWIG-Team war an der Erstellung beteiligt, sondern eine Redaktion aus Vertretern und Vertreterinnen verschiedener Disziplinen und Infrastruktureinrichtungen. Die Broschüre ist unter einer freien Creative-Commons-Lizenz erschienen (Namensnennung, Version 3.0 Deutschland; CC BY 3.0 de).

Neben der Online Version, die über das Open Access Repository des GFZ verfügbar ist (http://doi.org/10.2312/lis.14.01) wird ab Januar 2015 die gedruckte Auflage von 1.000 Exemplaren an geowissenschaftliche Institutionen in Deutschland versendet.

Posted in Forschungsdaten, Veröffentlichungen | Comments Off

EWIG-Workshop „Wege in die Köpfe“ am 3./4. Juli in Berlin

Am 3. und 4. Juli haben wir vom EWIG-Team einen Workshop zum Thema Qualifizierung von Nachwuchswissenschaftlern in den Geowissenschaften durchgeführt. Der Titel war gleichzeitig Programm und Ziel des Workshops. Es ging um die Vorbereitung einer Broschüre für die Ausbildung, die das Thema Forschungsdatenmanagement von verschiedenen Punkten aus beleuchtet. In Deutschland mangelt es bislang an kompakten Infos zum Forschungsdatenmanagement, die nicht der Qualifizierung von Infrastrukturbetreibern dienen sondern sich unmittelbar an die datenproduzierenden Fachwissenschaftler wenden.

Der entstehende Leitfaden soll in erster Linie junge Wissenschaftlerinnen und Wissenschaftler der Geowissenschaften an das Thema heranführen, aber auch als roter Faden für ein Lehrmodul zum Forschungsdatenmanagement dienen können. Er soll als praktische Broschüre Lernenden den Umgang mit eigenen Forschungsdaten erleichtern und den Lehrenden Anregungen für die Vermittlung geben.

Continue reading

Posted in ohne Kategorie, Veranstaltungen, Veröffentlichungen | Comments Off

Cebit-Thema Big Data – Ansätze für Forschungsdaten?

BIG DATA – das diesjährige Motto der Cebit in Hannover ließ vermuten, dass neben dem Thema Hardware, d.h. Systeme, die die zunehmenden Datenmengen speichern, vor allem der kompetente Umgang mit großen Datenmengen im Vordergrund steht.

Im Fokus stehen dabei Dienstleistungen: zur Unterstützung bei der Datenerfassung, Verknüpfung von Daten unterschiedlicher Art und Herkunft, deren Auswertung aber auch Visualisierung, Datensicherheit, also Schutz vor unberechtigtem Zugriff, ebenso wie Datensicherung, im Sinne von Aufheben, wobei die Dauer meist nur darauf ausgelegt ist, gesetzliche Vorgaben einzuhalten und nicht wie im DFG-Projekt EWIG auf Langzeitspeicherung abzielt.

Neben auf den kommerziellen Bereich ausgerichteten Anwendungen wie z.B. Bankensoftware sind Dienste für den  Verwaltungssektor vertreten, wobei die Rationalisierung von Arbeitsabläufen in erster Linie zur Verschlankung des Personals beitragen soll. Dabei nehmen zunehmend Ämter und Behörden einen großen Teil der Aussteller ein. So werden mit dem am IT-Dienstleistungszentrum Berlin (ITDZ Berlin) bearbeiteten Projekt goBerlin behördliche und kommerzielle Fachdienste verknüpft. Der Einwohner kann bei einem Umzug sämtliche erforderlichen Schritte durch die Eingabe seiner alten und neuen Adressen erledigen: Terminvereinbarung mit dem Bürgeramt, Ummeldung bei den Energieversorgern, Postnachsendeantrag usw..

Kooperationen gibt es dabei u.a. mit Universitäten, wie der TU Berlin. Stichworte sind hier z.B. „linked data“ zur Datenbereitstellung in einheitlichen Formaten, um Innovationen zu ermöglichen, oder die elektronische Umlaufmappe „e-Umlauf“, die dem Einstieg in die elektronische, papierlose Verwaltung und der Prozessoptimierung dient.

Forschungsverbünde und Großforschungseinrichtungen  beteiligen sich auch an Schulungsprogrammen, wie in der Fraunhofer-Allianz Big Data, während Bund, Länder und Kommunen eher an dem Aufbau von Infrastrukturen arbeiten. Die Zusammenführung von Geodaten ist eine solche Aufgabe der Initiative Geoportal.de, die Bereitstellung solcher Daten mit Metadaten ebenso wie die Archivierung bleibt meist in der Verantwortung der die Daten erhebenden Institution. Wenige Initiativen bieten aber auch die vereinte Speicherung von Inhaltsdaten und Metainformationen in Hochsicherheitszentren an, wie z.B. der Infrastrukturdienst Langzeitspeicherung des Landesbetriebs IT.Niedersachsen. Dieser kostenpflichtige Dienst deckt die Archivierung im Rahmen der gesetzlich vorgeschriebenen Aufbewahrungsfristen ab, die für Forschungsdaten noch nicht festgelegt sind und eventuell auch gar nicht festlegbar sein sollten.

Posted in Forschungsdaten, Langzeitarchivierung, ohne Kategorie, Projekte, Veranstaltungen | Comments Off

Vernetzung – Austausch – Nachnutzung

Unter diesem Titel trafen sich am 16. und 17. Dezember 2013 Wissenschaftler auf einem Workshop in Bonn zur Präsentation ihrer im Bereich “Informationsmanagement” der DFG geförderten Projekte. Die Einladung durch die DFG zielte auf eine Gesprächsrunde fachlich übergeordneter Natur ab, denn die Themen Informationsaustausch, Forschungsdatenmanagement, Langzeitarchivierung sind in fast jeder Fachrichtung immens wichtig. Auf die Vernetzung der in diesen Themenbereichen aktiven Wissenschaftler war auch das Format der Veranstaltung ausgerichtet, mit Vorträgen zur Übersicht und Einführung, Diskussionsrunden zur Vertiefung ausgewählter Fragestellungen und einer ausgedehnte Postersession mit der Möglichkeit zum direkten Gespräch.

Im Rahmen des Projektes “EWIG” konnten diverse Kontakte geknüpft, bzw. vertieft werden, auch hinsichtlich des weiteren Projektverlaufs. Im Vordergrund stand hier das Thema “Lehre und Ausbildung”, was die Punkte “Vernetzung” und “Austausch”, aber eben auch wesentlich den Punkt “Nachnutzung” berührt. In diesem Fall nicht im Sinne der Nachnutzung von Forschungsdaten und -ergebnissen, sondern der nachhaltigen Nutzung von Wissen, was im Projekt erarbeitet wurde und noch wird, um zukünftigen Wissenschaftlern den Einstieg in ein persönliches als auch ein übergeordnetes Forschungsdatenmanagement zu erleichtern.

Posted in Data Management Plan, Forschungsdaten, Langzeitarchivierung, ohne Kategorie, Projekte, Veranstaltungen | Comments Off

Man muss auch loslassen können …

Ein etwas ketzerischer Titel in einem Blog, wo es um Langzeitarchivierung geht, aber ich stolperte gerade über einen Artikel, in dem das Verschwinden von sogenannten sozialen Inhalten aus dem Netz beklagt wird (http://ws-dl.blogspot.co.uk/2012/02/2012-02-11-losing-my-revolution-year.html).

In diesem Fall ging es um die ägytische Revolution und das spezielle Problem der ‘reposts’ auf aggregator Webseiten, aber ich sehe gerade die endlosen Twitter Prozessionen vor mir. Wenn wir mal das Bild des ‘globalen Dorfes’ bemühen, dann sind diese Instant Messaging Dienste doch wohl sowas wie Gespräche auf dem Wochenmarkt. Continue reading

Posted in Langzeitarchivierung, ohne Kategorie | Comments Off

Services für 40.000 exabytes

Man hätte die Einheiten auch umrechnen können aber es handelt sich hier um ein Zitat. Gesprochen hat der Chef des e-Infratrukturprogramms der EU, Kostas Glinos und Anlass war die zweite EUDAT Konferenz (http://eudat.eu/2nd-conference/) vom 28. bis zum 30. Oktober. Er spielte damit auf die Entwicklung der Menge an zu handhabenden Daten an (http://eudat.eu/blog/eudat-2nd-conference-%E2%80%93-tuesday-29th-october-2013).

EUDAT ist ein Infrastrukturprojekt der EU und hat sich zur Aufgabe gemacht, eine flexible Plattform für Forscher sowohl grenz- als auch disziplinübergreifend zu entwickeln. Aus den ursprünglich vier Kerndiensten (Replication http://www.eudat.eu/b2safe, Data Staging http://www.eudat.eu/b2stage, Simple Store http://www.eudat.eu/b2share und Metadaten http://www.eudat.eu/b2find) sind mit einer AAI http://www.eudat.eu/authentication-and-authorization-infrastructure-aai inzwischen fünf geworden.

Nach zwei Dritteln der Laufzeit von 10.2011 bis 10.2014 wurde der Stand der 5 Kerndienste vorgestellt, verschiedene Adaptionen der Services in disziplinspezifischen Anwendungen gezeigt, sowie neue Erweiterungen diskutiert und teilweise in Workshops weiterentwickelt.

Der rote Faden der Konferenz waren allerdings nicht so sehr die schieren Mengen, sondern eher die Art damit umzugehen. WIE bekomme ich die Forscher dazu Daten zu teilen, WIE erhält man möglichst gute Metadatensätze und WIE können die entwickelten Infrastrukturen und Dienste auch nachhaltig genutzt werden.

Continue reading

Posted in Data Management Plan, Forschungsdaten, Veranstaltungen | Tagged , , , , | Comments Off

Vorschrift oder Thunfisch? – Zur Langzeitverfügbarkeit von Forschungsdaten

Abstract: „Ich mache ihm ein Angebot, das er nicht ablehnen kann.” Diese Aussage aus einem gänzlich anderen Kontext lässt sich recht treffend übertragen als Wunsch von Dienstleistern und Zweck von Dienstleistungen für Datenproduzenten im Forschungsdatenmanagement. Zwar wirkt Druck zur Datenübergabe nicht förderlich, die Eröffnung einer Option aber sehr wohl. Im vorliegenden Artikel geht es um das Verständnis der Nachhaltigkeit von Forschung und ihren Daten anhand der Erkenntnisse und Erfahrungen aus der ersten Phase des DFG-Projekts EWIG. Eine Auswahl von Fallstricken beim Forschungsdatenmanagement wird anhand der Erkenntnisse aus Expertengesprächen und eigenen Erfahrungen beim Aufbau von LZA-Workflows vorgestellt. Erste Konzepte in EWIG zur Datenübertragung aus unterschiedlich strukturierten Datenquellen in die „Langfristige Domäne” werden beschrieben.

Dies ist der Abstract eines Beitrags von EWIG in der Zeitschrift LIBREAS. Library Ideas

Nachzulesen online unter: http://libreas.eu/ausgabe23/08hasler/

Posted in Data Management Plan, Forschungsdaten, Veröffentlichungen | Comments Off

Archivierung von Webseiten

Die Wayback Machine von archive.org ist zur Ansicht von alten Versionen einer Webseite ganz praktisch. Beispielsweise ist dort eine Kopie des Internetauftritts des Heise Verlags aus dem November 1996 abrufbar – d.h. es ist HTML konserviert, das vor fast 17 Jahren erstellt wurde. Relativ gut kann man dort auch das eigentliche Problem bei der Archivierung von Internetseiten beobachten: Webseiten sind praktisch nie in sich geschlossen, sondern verweisen auf Bilder, andere Webseiten und externe Daten. Eine automatisierte Auswahl von Inhalten zu treffen und – wie vom OAIS-Modell gefordert – in sich geschlossene Einheiten festzulegen ist da oftmals schwierig. Sind Bilder innerhalb eines Links nun wichtig? Wie verfährt man mit serverseitig generierten dynamischen Inhalten und sind diese überhaupt als solche erkennbar? In den 90ern waren z.B. Besucherzähler üblich, die als CGI-Skripte realisiert waren und Bilder zurücklieferten. Für einen Harvester wäre zwar am IMG-Tag erkennbar, dass ein Bild erzeugt wird. Ob es sinnvoll ist dieses Bild zu speichern, kann er aber nicht erkennen. Ganz neue Herausforderungen an die Archivierung stellen die Webseiten der aktuellen Generation. Heute werden clientseitig Inhalte per AJAX dynamisch in den DOM-Baum der Webseiten nachgeladen. Solche Techniken beschleunigen für den Benutzer den Seitenaufbau – für eine Maschine wird es aber ungleich schwieriger einen definierten Zustand einer Website zu benennen.

Doch was hat das alles mit EWIG zu tun, wo es uns Forschungsdaten in den Geowissenschaften geht? Continue reading

Posted in Langzeitarchivierung | Comments Off

Daten, Daten, Daten – ein Thema auf internationalen Konferenzen wie der EGU 2013

Das Thema “Daten und Metadaten” nimmt bei der jährlich stattfindenden Konferenz der European Geosciences Union (EGU General Assembly) von Jahr zu Jahr einen stärkeren Raum ein.

Auf dieser Veranstaltung trafen 2013 vom 07. bis 12. April in Wien mehr als 11000 Wissenschaftler verschiedenster Bereiche der Geowissenschaften aus fast 100 Ländern zusammen.

In den disziplinspezifisch ausgerichteten Sitzungen wie Atmospheric, Cryospheric, Ocean, Soil System oder Hydrological Sciences als auch in den disziplinübergreifenden Sitzungen wie Natural Hazards oder Energy, Resources and the Environment stehen häufig Forschungsergebnisse mehr oder weniger basierend auf Daten unterschiedlichster Herkunft und Art im Vordergrund.

Behandelt werden auf der EGU aber zunehmend auch Themen, die unabhängig von der geowissenschaftlichen Fachrichtung sämtliche Problematiken rund um das Thema Forschungsdaten an sich benennen, ohne die Auswertung dieser Daten oder die daraus abgeleiteten Schlussfolgerungen in den Vordergrund zu stellen.

Die entsprechenden Vorträge und Poster sind im Wesentlichen in den Sitzungen Earth & Space Science Informatics oder Geosciences Instrumentation & Data Systems angesiedelt.

Continue reading

Posted in ohne Kategorie | Comments Off