Hauptinhalt

High Performance Computing

interne Computerchips — Foto Modell: Colourbox.de

Aufgrund der stetig wachsenden Anforderungen im Bereich Big Data und KI ist eine leistungsstarke HPC-Infrastruktur erforderlich. Aus diesem Grund wurde das Marburger Rechencluster (MaRC3) ins Leben gerufen. Das Rechencluster wurde in Kooperation mit verschiedenen Forschergruppen der Philipps-Universität Marburg aufgebaut, um die Hardwareressourcen kooperativ und effizient nutzen zu können.
In diesem Zusammenhang hat der Fachbereich Mathematik und Informatik eine große Anzahl an performanten Grafikprozessoren (GPUs) beigesteuert, um die extrem gestiegenen Anforderungen sowohl von maschinellem Lernen und Deep Learning als auch von klassischen HPC Aufgaben erfüllen zu können. Insbesondere im Bereich Deep Learning gehen die Entwicklungen hin zu immer tieferen und rechenintensiveren Netzwerkarchitekturen sowie immer größeren Datensätzen. Durch die Nutzung der in MaRC3 integrierten GPUs lassen sich die Trainingszeiten aktueller Netzwerkarchitekturen von mehreren Wochen auf wenige Tage oder Stunden senken und auch die Inferenz bzw. die Analyse großer Datenmengen lässt sich drastisch beschleunigen.

Aktuell verfügt der Fachbereich über 68 Nvidia-Grafikprozessoren für Rechenzentren:

16 NVIDIA A100 Tensor Core GPUs mit 40 GB GPU-Speicher
52 NVIDIA A100 Tensor Core GPUs mit 80 GB GPU-Speicher

Der Zugriff auf die Hardware-Ressourcen wird über den sogenannten SLURM Workload Manager (Simple Linux Utility for Resource Management) geregelt.
Hierbei haben die WissenschaftlerInnen und ForscherInnen des Fachbereichs Mathematik und Informatik über sogenannte „Owner-Queues“ priorisierten Zugriff auf die GPU-Hardwareressourcen des Fachbereichs.
Weitere Informationen über MaRC3.