19.06.2023 Meilenstein für data_UMR erreicht
Das Forschungsdatenrepositorium der Philipps-Universität verzeichnet den 100. veröffentlichten Datensatz
In einer zunehmend vernetzten und datengetriebenen Welt findet auch Forschung in hohem Maße digital statt. Dabei stehen Forschende vor zahlreichen Herausforderungen, wie der korrekten Verwaltung, Aufbewahrung und Veröffentlichung ihrer wertvollen Forschungsdaten.
Die Universitätsbibliothek (UB) und das Hochschulrechenzentrum (HRZ) der Philipps-Universität stellen hierfür das Marburger Forschungsdatenrepositorium „data_UMR“ zur Verfügung. Darüber hinaus bieten UB und HRZ gemeinsam mit der Stabsstelle Forschungsdatenmanagement im „Servicezentrum für digital gestützte Forschung“ Schulungen sowie eine umfassende Unterstützung – unter anderem zu den Themen FAIR Data (Findable, Accessible, Interoperable, Reusable) und Open Data.
Nun konnte ein bedeutender Meilenstein erreicht werden: Unter dem Titel „Uncertainty of treatment efficacy enhances placebo effects on reinforcement learning“ wurde der 100. Datensatz in data_UMR veröffentlicht und Forschenden weltweit zugänglich gemacht. Mit dem Verantwortlichen, Nick Augustat, der derzeit am Fachbereich Psychologie promoviert, sprachen Dr. Lydia Riedl und Dr. Diana Müller von der UB.
Diana Müller: Herr Augustat, Sie arbeiten an der Schnittstelle von Psychologie und Theoretischer Kognitionswissenschaft und hatten nun das Glück, mit Ihrer Datenveröffentlichung den 100. Datensatz auf data_UMR einzureichen. Wir gratulieren Ihnen! Vielen Dank, dass Sie sich die Zeit nehmen, mit uns über Ihre Forschung und über das Veröffentlichen von Forschungsdaten zu sprechen! Herr Augustat, können Sie uns dazu zunächst einen kurzen Einblick in Ihr Forschungsprojekt geben?
Nick Augustat: Die Studie entstand im Rahmen des Sonderforschungsbereichs (SFB/TRR) 289 „Treatment Expectation“, bei dem es um Behandlungserwartungen, also um die Erforschung von Placebo- und Nocebo-Effekten geht. Es ist bekannt, dass Erwartungen von Patient*innen die Wirksamkeit einer Behandlung beeinflussen können. Das kann zum Beispiel bei der Behandlung von Patient*innen mit chronischen Schmerzen oder Depressionen eine wichtige Rolle spielen. Allerdings ist noch nicht vollständig verstanden, wie genau diese Erwartungseffekte das neurobiologische Verstärkungslernen im Gehirn beeinflussen und damit ggf. auch den Behandlungserfolg. Unsere Studie, an der neben mir auch Prof. Dr. Erik Müller und Prof. Dr. Dominik Endres beteiligt waren, zielte darauf ab, diese Zusammenhänge genauer zu untersuchen.
Lydia Riedl: Sie haben sich entschieden, die Forschungsdaten zur Studie auf unserem Repositorium data_UMR zu publizieren. Können Sie uns erläutern, was das für Daten sind und warum Sie sich für eine Veröffentlichung in unserem Repositorium entschieden haben?
Nick Augustat: Den Anstoß dafür gab der Co-Supervisor meiner Doktorarbeit, Prof. Dominik Endres. Ein wichtiger Punkt war für uns dabei die institutionelle Anbindung. Da data_UMR von der Philipps-Universität selbst gehostet wird, sehen wir die Langzeitverfügbarkeit unserer Daten hier besser gewährleistet als bei anderen Datenrepositorien, die nicht von der öffentlichen Hand finanziert werden. Zu den Daten, die wir veröffentlicht haben, zählen zum einen die Skripte zur Durchführung des Experiments selbst. Mittels dieser Skripte können interessierte Kolleg*innen das Experiment beispielsweise mit anderen Versuchspersonen wiederholen und so unsere Ergebnisse überprüfen. Zum anderen sind die Skripte mit dem Programmcode für die Analyse der Daten enthalten und natürlich die erhobenen Daten selbst, mit denen die Analyse auch repliziert werden kann. Durch die Analyseskripte kann die Statistik, die wir gerechnet haben, mit unseren originalen Daten 1:1 wiederholt werden. In der Psychologie wie auch anderen Zweigen der Forschung ist es aus meiner Sicht sehr wichtig, Forschungsergebnisse replizieren zu können. Es kann nicht immer gänzlich ausgeschlossen werden, dass Ergebnisse aufgrund statistischen Zufalls oder aus anderen Gründen nicht haltbar sind, oder beispielsweise nur auf eine bestimmte Stichprobe zutreffen. Um eine Studie replizieren zu können, müssen die Daten und die dazugehörigen Analysemethoden transparent beschrieben und anderen Forschenden zugänglich gemacht werden. Einerseits fördert dies selbstverständlich den eigenen Forschungszweig, andererseits kann dadurch vorgebeugt werden, dass nicht haltbare Ergebnisse die Grundlage für weitere Forschung bilden, welche wiederum ins Leere läuft. Das große Plus an data_UMR ist für mich deshalb auch die Kuration der Daten. Das heißt, die eingereichten Datensätze werden vor der Veröffentlichung überprüft. Durch die Hinweise und Überarbeitungsempfehlungen von Frau Riedl in ihrer Rolle als Datenkuratorin habe ich noch einmal viel dazugelernt, wie man Daten so aufbereitet und beschreibt, dass sie von Dritten gut verstanden und nachgenutzt werden können.
Lydia Riedl: Es freut mich zu hören, dass Sie mit unserem Kurationsprozess zufrieden sind! So ist ein besonders „FAIRer“ Datensatz entstanden. Ihre Daten können auf data_UMR einfach gefunden, abgerufen und wiederverwendet werden. Eine besonders wichtige Komponente in Ihrem Datensatz ist darüber hinaus die Verknüpfung der Daten untereinander, zum Beispiel zwischen den Datentabellen und den Analyseskripten. Dadurch wird Ihre Forschung detailliert nachvollziehbar und somit, wie Sie sagen, replizierbar. Wie Sie ebenfalls bereits erwähnten stellen wir in data_UMR dann auch sicher, dass Ihr Datensatz dauerhaft gespeichert wird und dass alle erforderlichen Metadaten bereitgestellt werden, um auch eine langfristige Verfügbarkeit zu gewährleisten.
Diana Müller: Mit der Reproduzierbarkeit und Überprüfbarkeit von Forschungsergebnissen haben Sie, Herr Augustat, wichtige Aspekte von Open Science angesprochen. Aspekte, die die wissenschaftliche Integrität stärken und den offenen Dialog zwischen Forscher*innen fördern sollen. Gibt es auch Vorteile, die Sie für sich als Wissenschaftler ganz individuell sehen?
Nick August: Forschungsdaten zu veröffentlichen bedeutet, die Daten aufzubereiten und zu beschreiben. Das ist mit sehr viel Arbeit verbunden. Von Ihnen, Frau Riedl, weiß ich allerdings auch, dass Datenpublikationen den Textpublikationen zunehmend gleichgestellt werden. Durch die standardmäßige Zuweisung einer neuen DOI zum Datensatz kann ich also meine Datenpublikation auf meiner Publikationsliste neben dem Artikel zur Studie als zusätzliche Veröffentlichung angegeben. Das ist gerade für mich als Nachwuchswissenschaftler von großem Vorteil.
Diana Müller: Ich nehme daraus mit, dass sich die Veröffentlichung von Forschungsdaten für alle Beteiligten lohnt – für die wissenschaftliche Gemeinschaft, aber auch für die einzelnen Forschenden! Vielen Dank für das Gespräch!
Kontakt
Dr. Lydia Riedl