Hauptinhalt

Daten nutzen & auswerten

High-Performance-Computing: MarRC3a, MaRC2
Interactive-Computing: JupyterHub
Storage: MaSC
Versionierung: GitLab
Strukturierte Datenerfassung: RedCap
Software und Lizenzen

Das Hochschulrechenzentrum (HRZ) stellt für Angehörige der Philipps-Universität Marburg eine Reihe an Diensten und Werkzeugen zur Datennutzung und -auswertung zur Verfügung. Perspektivisch wird durch den so genannten Data Hub eine umfassende Weiterentwicklung im aktiven Datenmanagement an der Philipps-Universität erfolgen.

High Performance-Computing: MaRC3a, MaRC2

Neben einem breiten Software- und Lizenzangebot stellt das HRZ auch Ressourcen für High Performance Computing (HPC) zur Verfügung. Der HPC-Cluster MaRC2 verfügt über eine maximalen Rechenleistung von 56,5 Tflop/s. Um nicht nur den aktuellen Erfordernissen gerecht zu werden, sondern um auch Spitzenforschung im Bereich BigData und KI bestmöglich zu unterstützen, wird MaRC2 voraussichtlich im Dezember diesen Jahres vom MaRC3a abgelöst und später durch weitere Ausbaustufen ergänzt. Vorbereitungen für MaRC3b (MaRCQuant) mit Fokus auf quantenphysikalischen Berechnungen und MaRC3c mit Fokus auf medizinisch-psychologisch Berechnungen sind bereits in Arbeit. Die Rechencluster stehen grundsätzlich allen Forschenden der Philipps-Universität kostenfrei zur Verfügung. Wenn Sie Bedarf an den Rechenleistungen haben, wenden Sie sich gerne an das Team Hochleistungsrechnen des HRZ.

Der MaRC3a befindet sich aktuell im Probebetrieb. Das Cluster ist im Zentrum für Synthetische Mikrobiologie (Synmikro) lokalisiert und wurde in Kooperation mit verschiedenen weiteren Forschergruppen der Philipps-Universität ermöglicht. Aktuell besteht das Cluster aus 26 Compute Nodes, die zusammen 1.664 Prozessor-Kerne zur Verfügung stellen und zwischen 256 und 1024 GB RAM verfügen. Zusätzlich stehen 28 GPU-Beschleuniger (NVIDIA V100S und A100) für massiv parallele Anwendungen wie KI, Image Processing und phsikalische Simulationen zur Verfügung. Als Datenspeicher verfügt MaRC3a über ein paralleles Dateisystem mit 266 TB und hat zudem direkten Zugriff auf das Speichercluster MaSC.

Die Philipps-Universität verfolgt mit den MaRC3 und MaSC (s.u.) einen Konsolidierungsansatz für High Performance-Computing und compute-nahen Storage. Zum einen wird ein übergreifendes Interface für die Nutzung alle Systeme implementiert, zum anderen besteht für einzelne Arbeitsgruppen die Möglichkeit, eigene Nodes oder GPUs beizusteuern. Dadurch entfallen administrative Arbeiten für die Arbeitsgruppe. Über die geteilte Nutzung können die verfügbaren Kapazitäten zudem optimal ausgeschöpft werden. Wenn Sie Fragen hierzu haben, wenden Sie sich gerne an das Team Hochleistungsrechnen des HRZ.

Interactive-Computing: JupyterHub

JupyterHub wird von der Philipps-Universität Marburg zentral als Dienst bereitgestellt. Er ermöglicht die Web-basierte Nutzung von JupyterLab und damit insbesondere auch interaktives Coding, interaktives Computing sowie die interaktive Prozessierung, Analyse, Visualisierung und Ausgabe von Forschungsdaten. Die Berechnungen erfolgen je nach Anwendungsszenario auf verschiedenen Plattformen. Für Forschung aktuell auf der in Marburg für Hochleistungsrechnen konzipierten MaRC3-High-Performance-Computing-Plattform. Weitere Informationen und wie Sie Jupyter-Interactive-Computing nutzen können, finden Sie auf der Webseite des Dienstes.

Storage: MaSC

Ergänzt wird das Hochleistungsrechnen durch ein compute-nahes, Hochverfügbarkeits-Storage Cluster, das so genannten MaSC, welches den effizienten Umgang mit großen Daten ermöglicht. Neben der Speicherung zum Zweck der Prozessierung großer Daten steht MaSC auch ausdrücklich als „Hot“ und „Cold“ Storage für Arbeitsgruppen der Philipps-Universität zur Verfügung. So können dort beispielsweise Imaging- und Omicsdaten direkt von den Messgeräten abgelegt werden. Durch die gemeinsame Nutzung des Storage Clusters können die verfügbaren Kapazitäten optimal ausgeschöpft werden. Aufwand für Pflege und Wartung individuelle Storage-Systeme für einzelne Arbeitsgruppen entfällt.

Der MaSC wird kontinuierlich ausgebaut. Aktuell besteht das System aus 9 CEPH-Servern mit je 384 TB Kapazität. Die Daten werden üblicher Weise über Erasure Coding vor Ausfall einzelner Hardwarekomponenten oder Server geschützt, wodurch eine real nutzbare Kapazität von 2 PB zur Verfügung steht. Regelmäßig angefertigte Snapshots schützen zudem vor versehentlichem Löschen oder Überschreiben von Daten. MaSC ist mit 10 Gbit/s an das UMRnet angebunden und kann damit theoretisch 100 TB pro Tag schreiben. Die direkte Anbindung an MaRC3a erfolgt mit 100 Gbit/s.

Mit diesen Ressourcen im Hochleistungsrechnen ist die Philipps-Universität herausragend aufgestellt, um auch in den Folgejahren ihre Spitzenforschung mit bestmöglicher Speicher- und Rechenkapazität zu versorgen. Für alle Fragen rund um das Storage- und HPC-Cluster wenden Sie sich bitte an .

Versionierung: GitLab

Die GitLab-Versionsverwaltung wird von der Philipps-Universität Marburg zentral als Dienst bereitgestellt. Sie ermöglicht auf Basis des verteilten Versionsverwaltungswerkzeugs Git eine versionierte Speicherung und Verwaltung von Daten und eignet sich ideal zur Softwareentwicklung und zur Arbeit an Forschungsdaten (aktives Datenmanagement). Insbesondere bei der kollaborativen Zusammenarbeit kann GitLab einen Mehrwert für jedes Team generieren. Denn GitLab unterstützt darüber hinaus das Arbeiten in Gruppen und in Projekten, z. B. durch projekt-spezifische Wikis, Issue-Tracking (Ticketing-Systeme) oder Kanban-Boards. Zudem bietet GitLab Werkzeuge zur Qualitätssicherung von Code und Daten (Continuous Integration). Auch die ansprechende Präsentation von Projekten und ihrer Ergebnisse ist über GitLab Pages direkt möglich.

Sie erreichen den GitLab-Versionsverwaltungs-Dienst der Philipps-Universität Marburg direkt unter https://gitlab.uni-marburg.de

Bei Fragen rund um die GitLab-Versionsverwaltung können Sie sich gerne an wenden.

Strukturierte Datenerfassung: RedCap

Sie möchten Ihre digitalen Daten bei Umfragen oder anderen Forschungsprozessen nachvollziehbar, strukturiert und sicher erfassen? Dafür stellt die UMR in Kooperation mit dem KKS ein einfaches und intuitiv bedienbares System zur Datenerhebung zur Verfügung: REDCap . Das Tool kann für alle Projekte genutzt werden, die NICHT einem regulierten Umfeld z.B. nach ICH-GCP, AMG oder MPG unterliegen.

REDCap ist eine sichere, internetbasierte Lösung, die zielgerichtet für die akademische Forschung entwickelt wurde. Das Tool ermöglicht die Erstellung und das Management von Online-Datenbanken. RedCap bietet viele Funktionalitäten:

  • Sie können Ihre Datenbank über einen beliebigen Browser selbst gestalten
  • Für die Auswertung können die Daten in das gewünschte Format exportiert werden (Excel, SAS, R, Stata, SPSS)
  • Sie können sowohl einfache Umfragen erstellen als auch umfangreiche Fragebögen mit mehreren Erhebungszeitpunkten zur Online-Eingabe entwickeln
  • Für die Generierung von Berichten (Echtzeit-Reports) können individuelle Abfragemasken angelegt werden
  • Alle Dateneingabeformulare lassen sich als PDF speichern und drucken
  • Ein integrierter Projektkalender und das Zeitplanungsmodul unterstützen die Projektorganisation

Die grundsätzliche Möglichkeit der strukturierten Datenerfassung macht RedCap für viele Fachdisziplinen interessant. Jedoch sind hier keine fachspezifischen Workflows vordefiniert.

Für klinische Studien betreibt das KKS Marburg das Studienmanagementsystem MACRO. Bei Fragen hierzu wenden Sie sich an

Bei Interesse an der Nutzung von RedCap .  

Dieses Einstiegsvideo hilft Ihnen bei den ersten Schritten mit RedCap.

Wir bieten RedCap derzeit im eingeschränkten Regelbetrieb, d.h. Nutzungsvereinbarungen und Verbesserungen im Nutzermanagement sind noch in Arbeit. 

Software & Lizenzen

Für alle Fragen rund um Software- und Lizenzangebote wenden Sie sich bitte an

Sie interessieren sich für weitere Services und Tools aus dem Bereich Forschungsdatenmanagement? Erfahren Sie mehr unter Services und Tools.