Sie befinden sich hier

Inhalt

Open Science und Forschungsdatenmanagement

"Der Begriff Open Science bündelt in diesem Zusammenhang Strategien und Verfahren, die allesamt darauf abzielen, die Chancen der Digitalisierung konsequent zu nutzen, um alle Bestandteile des wissenschaftlichen Prozesses über das Internet offen zugänglich und nachnutzbar zu machen. Damit sollen Wissenschaft, Gesellschaft und Wirtschaft neue Möglichkeiten im Umgang mit wissenschaftlichen Erkenntnissen eröffnet werden. Open Science basiert auf sechs Prinzipien." Aus dem Mission Statement der deutschsprachigen Open Science AG von 2014 www.ag-openscience.de/mission-statement

Die 6 Prinzipien von Open Science

Offene Wissenschaft basiert auf sechs Prinzipien, um Teilschritte und -ergebnisse eines wissenschaftlichen Prozesses zu öffnen. Die ersten vier Prinzipien basieren auf dem Paper "The Case for an Open Science in Technology Enhanced Learning" (Kraker 2011). Open Peer Review und Open Educational Resources sind zwei weitere wichtige Aspekte von Wissenschaft. Die "Open Definition" erklärt, was "offen" in diesem Kontext bedeutet.

  • Open Access: "In einer offenen Art publizieren und für jeden kostenlos nutzbar und zugänglich machen."
  • Open Data: "Erstellte Daten frei zur Verfügung stellen."
  • Open Methodology: "Das Anwenden von Methoden sowie den gesamten Prozess dahinter soweit praktikabel und relevant dokumentieren."
  • Open Source: "Quelloffene Technologie (Soft- und Hardware) verwenden und eigene Technologien öffnen."
  • Open Peer Review: "Qualitätssicherung durch offene Peer-Review-Verfahren transparent und nachvollziehbar machen."
  • Open Educational Resources: "Freie und offene Materialien für Bildung und in der universitären Lehre verwenden."

Ausführlich zum Nachlesen unter www.openscienceasap.org/open-science/

Open Data

"Open Data bzw. offene Daten sind Daten, die von jedermann frei benutzt, weiterverwendet und geteilt werden können. Die einzige Einschränkung betrifft die Verpflichtung zur Nennung des Urhebers." http://opendatahandbook.org/guide/de/what-is-open-data/

Dazu müssen die Daten folgende Kriterien erfüllen:

  • Verfügbarkeit und freier Zugang: "Die Daten müssen als Ganzes verfügbar sein und zu nicht mehr als zumutbaren Vervielfältigungsunkosten, idealerweise als Download im Internet. Die Daten müssen weiterhin in einem zweckmäßigen und editierbaren Format vorliegen."
  • Wiederverwendung und Weitergabe: "Die Daten müssen unter Bedingungen zur Verfügung gestellt werden, die eine Wiederverwendung und Weitergabe ermöglichen, inklusive einer Verwendung der Daten zusammen mit Datensätzen aus anderen Quellen."
  • Universelle Beteiligung: "Jeder muss in der Lage sein, die Daten zu nutzen, zu verarbeiten und weiterzuverteilen - es darf keine Benachteiligung von einzelnen Personen, Gruppen, oder Anwendungszwecken geben."

Forschungsdaten als Bestandteil von Open Data

Was genau sind Forschungsdaten?

"Forschungsdaten sind nicht allein die (End-)Ergebnisse von Forschung. Es handelt sich vielmehr um jegliche Daten, die im Zuge wissenschaftlichen Arbeitens entstehen, z.B. durch Beobachtungen, Experimente, Simulationsrechnungen, Erhebungen, Befragungen, Quellenforschungen, Aufzeichnungen, Digitalisierung, Auswertungen." Schlüsselbegriffe>Forschungsdaten Rat für Informationsinfrastrukturen, 2017

Da Forschungsdaten notwendig sind, um die darauf aufbauenden Forschungsergebnisse verifizieren zu können, ist deren Erhalt ein anerkannter Bestandteil der guten wissenschaftlichen Praxis (siehe z.B. Kodex DFG (PDF-Datei) und forschungsdaten.org).

Was genau bedeutet Forschungsdatenmanagement?

"Das Forschungsdatenmanagement umfasst alle – über das Forscherhandeln im engeren Sinne hinaus auch organisationsbezogenen – Maßnahmen, die getroffen werden müssen, um qualitätsvolle Daten zu gewinnen, um die gute wissenschaftliche Praxis im Datenlebenszyklus einzuhalten, um Ergebnisse reproduzierbar zu machen und um ggf. bestehenden Dokumentationsverpflichtungen Rechnung zu tragen (z.B. im Gesundheitswesen). Auch ist die (ggf. domänenübergreifende) Verfügbarkeit von Daten zur Nachnutzung ein wichtiger Punkt." Schlüsselbegriffe >Forschungsdatenmanagement Rat für Informationsinfrastruktur, 2017

Warum Forschungsdatenmanagement?

Es gibt viele gute Gründe, sich mit dem Thema Forschungsdatenmanagement zu beschäftigen:

  • Erhöhung der Sichtbarkeit der Forschungsergebnisse: Die Sichtbarkeit der Forschung und damit die Zitierhäufigkeit und Reputation wird verbessert, da eine Datenpublikation als eigenständige Publikation gilt und von Datenbanken erfasst wird.
  • Gute Wissenschaftliche Praxis: Den Umgang mit Forschungsdaten hat die DFG in ihre Leitlinien zur Sicherung guter wissenschaftlicher Praxis aufgenommen.
  • Forschungsförderung: Mit einem guten Forschungsdatenmanagementplan erhöhen sich die Chancen gefördert zu werden. Viele Fördermittelgeber erwarten schon bei der Antragstellung eine Stellungnahme zum geplanten Umgang mit Daten (z.B. Guidelines on FAIR Data Management in Horizon 2020). Damit soll sichergestellt werden, dass die während des Projekts gewonnenen Daten nach Möglichkeit auch noch lange nach Projektende in geeigneter Form zur Nachnutzung zur Verfügung stehen.
  • Transparenz der erbrachten Forschungsleistung: Auch Verlage beziehungsweise Fachzeitschriften fordern zunehmend die Verfügbarmachung der Daten, auf denen eine Publikation beruht, um die Transparenz der erbrachten Forschungsleistung zu gewährleisten. Durch diese Qualitätssicherungsmaßnahme steigern die Fachzeitschriften ihre Reputation, wovon die Autoren:innen ebenfalls profitieren. In einigen Fällen bestehen bereits Kooperationen zwischen Verlagen, Fachzeitschriften und Datenrepositorien, um die Verlinkung von Forschungsdaten mit den zugehörigen Forschungsartikeln zu erleichtern.
  • Nachnutzbarkeit der Daten: Durch effizientes Forschungsdatenmanagement bleiben Daten langfristig und nachvollziehbar erhalten und können noch lange nach der ursprünglichen Forschung zum Beispiel für vergleichende Forschung nachgenutzt werden.
  • Forschungsdaten sind wertvoll: Die Erhebung von Forschungsdaten ist zeit- und kostenintensiv sowie in vielen Fällen nicht wiederholbar. Das macht Forschungsdaten wertvoll - nicht nur für die Überprüfung von Forschungsergebnissen, sondern besonders auch für weitere Forschungsfragen.
  • Minimierung des Datenverlusts: Wissenschaftler:innen können mit den Daten ohne Einschränkung über einen langen Zeitraum arbeiten, da das Risiko von Datenverlust minimiert wird und sie in einem zukunftssicheren Dateiformat gespeichert werden.

Was bedeutet das FAIR-Data-Prinzip?

Forschungsdaten sollen laut der GO-FAIR-Initiative für Mensch und Maschine im Rahmen des Möglichen auffindbar, zugreifbar, interoperabel und wiederverwendbar sein.

Die "FAIR-Data-Prinzipien" werden von vielen wissenschaftspolitischen Akteuren, darunter Forschungsförderer, unterstützt. Diese Grundsätze sind beim Aufbau von Services bzw. Forschungsdateninfrastrukturen zu berücksichtigen: Anforderungsprofil zum Umgang von Forschungsdaten, mit denen sich ein Datenmanagement leicht aufbauen lässt:

  • Auffindbar (Findable): "Daten und ihre Metadaten sollten durch Menschen und Maschinen über eine eindeutige und reichhaltige Beschreibung einfach zu finden sein."
  • Zugänglich (Accessible): "Die Angaben zu Zugangsbedingungen von Forschungsobjekten sollten sowohl für Menschen als auch Maschinen eindeutig sein."
  • Interoperabel (Interoperable): "Computer sollten Daten und ihre Metadaten automatisiert interpretieren können. Dadurch wird der Austausch mit anderen Anwendungen gewährleistet."
  • Wiederverwendbar (Reusable): "Die Daten und Metadaten sollten nach eindeutigen Standards dokumentiert werden, so dass sie für die weitere Forschung nachnutzbar sind."

Weitere Informationen zu den FAIR Data Prinzipien finden Sie unter: publisso/fair-prinzipien, der FORCE 11-Community und FAIRe Daten

Kompetenzzentrum Forschungsdaten (KFD) der Universität Heidelberg

Das Kompetenzzentrum Forschungsdaten (KFD) bietet Wissenschaftler:innen der Universität Heidelberg gemäß der Research Data Policy der Universität zentrale Dienste zur Archivierung und Veröffentlichung von Forschungsdaten an und betreut heiDATA. Das KFD ist eine gemeinsame Serviceeinrichtung der Universitätsbibliothek und des Universitätsrechenzentrums Heidelberg (URZ).

Das KFD leistet in allen Phasen des Forschungsprozesses Unterstützung:

Projektplanung und Antragsphase: Beratung und Datenmanagementpläne

Was ist ein Datenmanagementplan?

Schon vor Beginn eines Forschungsvorhabens ist es wichtig und hilfreich, den Umgang mit anfallenden Daten und Ergebnissen für die kommende Arbeitsphase vorauszuplanen. Ein geeignetes Werkzeug hierfür ist der Datenmanagementplan (DMP), in dem Rahmenbedingungen und konkrete Strategien zu Erstellung und Verarbeitung, zu Umfang und Sicherung sowie ggf. späterer Veröffentlichung der anfallenden Forschungsdaten definiert und dokumentiert werden.

Die Universität Heidelberg hat in ihrer im Juli 2014 verabschiedeten Research Data Policy Richtlinien für das Management von Forschungsdaten erlassen. Darin werden alle Projektverantwortlichen dazu aufgefordert, Datenmanagementpläne für ihre Forschungsprojekte zu erstellen, die den Zugriff und die Nutzung von Forschungsdaten unter Einhaltung von ethischen und Open Access-Prinzipien unter geeigneten Sicherheitsmaßnahmen gewährleisten.

Das Kompetenzzentrum Forschungsdaten unterstützt gemäß ihrer Policy die Projektverantwortlichen bei der Erstellung und Umsetzung ihrer Datenmanagementpläne.

Hinweis: Ein DMP kann bei einigen Fördermittelgebern eine Voraussetzung für die Bewilligung von Drittmitteln sein und wird zusammen mit dem Projektantrag begutachtet.

Weitere hilfreiche Informationen bieten der Leitfaden und die Checkliste (PDF-Datei, S. 83ff) des WissGrid-Projekts, und der Praxisleitfaden zur Internationalen Ausrichtung des Forschungsdatenmanagements von Science Europe Practical Guide to the International Alignment of Research Data Management [English].

Datenmanagement-Tools

Es gibt einige webbasierte Tools, die beim Aufbau eines Datenmanagementplans helfen können. Das KFD empfiehlt:

  • Der Research Data Management Organiser, kurz RDMO, wurde konzipiert als Werkzeug, welches neben der Erstellung von DMP die strukturierte Planung, Umsetzung und Verwaltung des Forschungsdatenmanagements unterstützt.   

  • Vom britischen Digital Curation Center (DCC) wird die Anwendung DMPonline betrieben. Mit ihr können kollaborativ DMP erstellt und bearbeitet werden, jedoch ist die Anwendung auf die Situation im Vereinigten Königreich mit seinen Research Councils ausgerichtet. Für den deutschsprachigen Raum hat die Humboldt-Universität zu Berlin eine Handreichung zur Benutzung von DMPonline für Horizon 2020 erarbeitet.

Mit Hilfe der Tools können Wissenschaftler:innen schrittweise einen auf ihre Bedürfnisse und die Anforderungen verschiedener Fördereinrichtungen abgestimmten Datenmanagementplan erstellen. Die Nutzung ist kostenfrei. Die erstellten Pläne können in verschiedenen Formaten exportiert werden, um sie beispielsweise in Projektanträge zu integrieren.

Projektphase: Datenbearbeitung

Über das Universitätsrechenzentrum stehen Wissenschaftlern:innen der Universität u.a. folgende Dienste zur Bearbeitung und zum Management ihrer aktuellen Daten zur Verfügung:

heiBOX ist ein Dateiablagedienst des Universitätsrechenzentrums (URZ). In der heiBOX können Forschungsdaten zentral am URZ gespeichert, mit mehreren Geräten wie beispielsweise Workstations, Desktop-Computern und Laptops synchronisiert und mit anderen Nutzern geteilt werden.

heiCLOUD ist eine Infrastructure-as-a-Service (IaaS), die virtuelle Ressourcen in Form von Speicher, Servern, Netzwerken zur Verfügung stellt. Nutzer:innen sind in der Lage, die virtualisierten Server in Eigenverantwortung zu administrieren, und besitzen dadurch eine hohe Flexibilität in der Nutzung vergleichbar mit einem lokalen Server im Institut. Die heiCLOUD steht allen Nutzer:innen der Universität Heidelberg zur Verfügung.

SDS@hd ist ein zentraler Dienst zur sicheren Speicherung von wissenschaftlichen Daten (Scientific Data Storage). Der Service steht den Forscher:innen der baden-württembergischen Hochschulen im Sinne eines Landesdienstes zur Verfügung. Im Vordergrund stehen Daten, auf die häufig Zugriffe erfolgen ('hot data').

Das Universitätsrechenzentrum bietet den Beschäftigten und Studierenden der Universität Heidelberg die Zugangsmöglichkeiten für verschiedene Hochleistungsrechnern in Heidelberg und im Land.

Der F*EX-Service ist ein HTTP-basierter Dienst von BelWü, dem Landeshochschulnetz Baden-Württembergs, zum Versenden großer Dateien.

Projektende: Veröffentlichung, Archivierung und Nachweis

Das KFD bietet mit heiDATA, dem Forschungsdatenrepositorium der Universität Heidelberg, allen Wissenschaftler:innen die Möglichkeit zur dauerhaften Archivierung und Publikation ihrer Daten. Wenn Sie heiDATA nutzen möchten, beachten Sie bitte die Anleitung zur Datenveröffentlichung.

Veröffentlichte Forschungsdaten von Angehörigen der Universität werden, unabhängig davon, ob diese Daten in Heidelberg oder bei externen Anbietern liegen, über das universitäre Forschungsdatenverzeichnis nachgewiesen.

heiARCHIVE ist der zentrale Archivierungsdienst der Universität Heidelberg für die Langzeitarchivierung von Forschungsdaten. Der Dienst befindet sich derzeit noch im Pilotbetrieb, daher sind nicht alle Funktionalitäten bereits nutzbar. Details hierzu finden Sie in den Informationen zum Pilotbetrieb. Bei Interesse an einer Nutzung finden Sie die entsprechenden Informationen zur Teilnahme am Pilotbetrieb.

Informationen zu den Vorgaben der Förderinstitutionen in Bezug auf Forschungsdatenmanagement

Die meisten Forschungsförderer haben Richtlinien für das Forschungsdatenmanagement eingeführt. Die allgemeine Erwartung ist, dass Forschungsdaten aus mit öffentlichen Mitteln geförderten Projekten ein öffentliches Gut sind, das mit so wenigen Einschränkungen wie möglich offen zur Verfügung gestellt werden sollte. Hier finden Sie einige wichtige Informationen dazu:

Bundesministerium für Bildung und Forschung (BMBF)

Deutsche Forschungsgemeinschaft (DFG)

Horizon Europe

European Research Council (ERC)

Forschungsdaten sichern und archivieren

Die Beachtung guter wissenschaftlicher Praxis ist Grundlage jeder Forschung. Hierzu gehört auch die Speicherung und Aufbewahrung von Forschungsdaten. Bereits zu Beginn der Forschungsarbeit sollte eine regelmäßige Sicherung und Speicherung erfolgen. Idealerweise geschieht dies nicht nur auf lokalen Speichermedien, sondern auch auf hochschulinternen Servern, damit die Daten in einem regulären Backup gesichert und im Verlustfall wiederhergestellt werden können.

Wichtiger Hinweis: Die DFG betrachtet die Aufbewahrung von Primärdaten für mindestens 10 Jahre als Bestandteil guter wissenschaftlicher Praxis. Verankert hat sie das in einem Kodex zur wissenschaftlichen Integrität und dort auch die Leitlinien zur Sicherung guter wissenschaftlicher Praxis eingebracht. Ziel des Kodex ist die Verankerung einer Kultur der wissenschaftlichen Integrität in der deutschen Wissenschaftslandschaft. Darin heißt es beispielsweise in Empfehlung 7: „Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufbewahrt werden.“ Damit ist gemeint, dass die Daten physisch für mindestens diesen Zeitraum sicher bewahrt und zugänglich sind. Auch die Satzung zur Sicherung guter wissenschaftlicher Praxis der Universität Heidelberg (PDF-Datei, Stand 13.10.2021) fordert die Aufbewahrung von Forschungsdaten für mindestens 10 Jahre. Eine Archivierung oder Aufbewahrung für diesen Zeitraum ist nicht gleichbedeutend mit einer Langzeitarchivierung, denn dafür sind weitergehende Maßnahmen notwendig.

Alle Leitlinien und Grundsätze der Universität Heidelberg finden Sie hier.

Langzeitarchivierung

Langzeitarchivierung bedeutet mehr als die physische Sicherung von Daten. Durch stetige technische Weiterentwicklung veralten Soft- und Hardware sehr schnell. Das kann zur Folge haben, dass für Datenträger keine passenden Schnittstellen mehr vorhanden sind oder dass Daten nicht korrekt dargestellt oder interpretiert werden können. Außerdem können Dateiformate und Software mit der Zeit technisch obsolet werden und außer Gebrauch geraten. Die LZA muss sicherstellen, dass die Dateiinhalte trotzdem auch in ferner Zukunft noch ausgelesen werden können. Das kann erreicht werden, indem Dateien regelmäßig in aktuelle Dateiformate konvertiert werden, oder indem von vornherein Dateiformate verwendet werden, die offen und gut dokumentiert sind. Neben der physischen Verfügbarkeit ist ein zentrales Ziel von Langzeitarchivierung der Erhalt der Interpretierbarkeit. Dafür braucht es gut dokumentierte Metadaten. Metadaten beschreiben den Inhalt der Forschungsdaten und liefern Informationen über verwendete Erhebungsmethoden, Soft-und Hardware, Codierungen etc. Die Metadaten werden zusammen mit den eigentlichen Forschungsdaten gespeichert.
Eine weitere wichtige Aufgabe der Langzeitarchivierung besteht in der Sicherstellung, dass die Daten nicht verändert werden (weder aus Versehen noch absichtlich). Außerdem erfüllt sie die Forderung der Drittmittelgeber nach einer sicheren Datenaufbewahrung von Forschungsdaten.
Langzeitarchivierung von Forschungsdaten auf institutioneller Ebene ist oft schwierig, da innerhalb der Institution in der Regel unterschiedliche Fachgebiete vertreten sind mit entsprechend unterschiedlichen Arten von Daten. Es besteht jedoch die Möglichkeit, Daten in fachlichen Archiven (auch Repositorien genannt) zu publizieren. Diese gewährleisten, dass die Daten ordnungsgemäß gesichert und im Zweifelsfall in ein neues Format überführt werden. Darüber hinaus bieten sie ein entsprechendes Rechte- und Lizenzmanagement an, welches unterschiedliche Nutzungsszenarien ermöglicht. Ausführliche Informationen finden Sie auf Veröffentlichen und Archivieren unter www.forschungsdaten.info und https://www.publisso.de/forschungsdatenmanagement/fd-archivieren/

Wo finde ich Forschungsdaten?

Die beste Quelle für veröffentlichte Forschungsdaten sind in der Regel Datenzentren und Datenrepositorien. Repositorien sind Speicherorte für digitale Objekte. Da Repositorien meistens öffentlich oder einem eingeschränkten Nutzerkreis zugänglich sind, ist dieser Begriff eng mit Open Access verknüpft. Weitere Informationen zu Repositorien unter www.forschungsdaten.info/repositorien.

Die Auswahl eines passenden Repositoriums sollte sich nach den Gepflogenheiten der jeweiligen Fachdisziplin oder den Vorgaben von Förderinstitutionen bzw. Verlagen richten. Sofern keine Vorgaben existieren, sollten fachliche oder institutionelle Repositorien zuerst als Speicherorte in Betracht gezogen werden. Es existieren mehrere Verzeichnisse, die die Suche nach einem passenden Repositorium erleichtern.

heiDATA ist das Forschungsdatenrepositorium der Universität Heidelberg. Es bietet allen Wissenschaftlern:innen die Möglichkeit zur dauerhaften Archivierung und Publikation ihrer Daten.

Das Heidelberger Forschungsdatenverzeichnis weist veröffentlichte Forschungsdaten von Angehörigen der Universität nach - unabhängig davon, ob die Daten auf universitären oder externen Repositorien liegen. Das Forschungsdatenverzeichnis ist ein Teilkatalog der Hochschulbibliographie heiBIB.

re3data.org - Registry of Research Data Repositories ist ein Verzeichnis für Repositorien, die wissenschaftliche Forschungsdaten frei zur Verfügung stellen.

DataCite Search ist eine internationale Suchmaschine für Forschungsergebnisse, in der eine Suche nach registrierten Datensätzen möglich ist. Über das DataCite Portal können Forschende ihre Daten teilen sowie ihre gesamten Forschungsoutputs, inklusive Publikationen, Software und Förderdaten abspeichern.

Google Dataset Search ist die Datensuchmaschine von Google. Sie durchsucht das Internet nach Datensätze, die auf öffentlich zugänglichen Webseiten mit dem Standard schema.org als solche beschrieben sind.

DINI-Übersicht deutscher Repositorien ist eine Liste der Repositorien mit Kennzeichnung derjenigen mit einem DINI-Zertifikat.

Weitere Informationen finden Sie unter https://open-access.network/informieren/publizieren/repositorien

Ethik, Datenschutz, andere rechtliche Bestimmungen

Rechtliche und ethische Fragen beeinflussen unmittelbar die Arbeit mit Forschungsdaten im Bereich der Lebenswissenschaften, auch wenn diese Fragen nicht Gegenstand der Forschung sind. Forschungsdaten bewegen sich sowohl im rechtlichen Rahmen des Persönlichkeits-, Datenschutz- und Urheberrechts als auch der ethischen Prinzipien. Grundsätzlich gilt im FDM der Leitspruch:“ so offen wie möglich, so geschlossen wie nötig“. Am besten wenden Sie sich bei rechtlichen Fragen an die Kollegen:innen des Kompetenzzentrum Forschungsdaten der UB Heidelberg. Weitere Informationen finden Sie auch unter Ethische Aspekte im FDM.

Weitere Informationen zu Open Science und Forschungsdaten

Umfassende Informationen zum Thema Open Science und Forschungsdatenmanagement finden Sie auf:

Kontextspalte