Exascale-Supercomputing kommt nach Stuttgart

Gruppenfoto
Bei einer Veranstaltung am HLRS am 19. Dezember unterschrieben Prof. Michael Resch (Direktor, HLRS), Anna Steiger (Kanzlerin, Universität Stuttgart) und Heiko Meyer (Chief Sales Officer, HPE) den Vertrag zum Ausbau von Hunter und Herder.

Die Universität Stuttgart und Hewlett Packard Enterprise haben die Installation von zwei neuen Supercomputern am HLRS angekündigt: Hunter und Herder.

Im ersten Schritt wird im Jahr 2025 ein Übergangssupercomputer namens Hunter in Betrieb genommen. Im Jahr 2027 folgt dann Herder, ein Exascale-System, das die deutschen Kapazitäten im Bereich des Höchstleistungsrechnens (HPC) erheblich erweitern wird. Hunter und Herder werden Infrastrukturen für Simulationen, künstliche Intelligenz (KI) und Höchstleistungsdatenanalyse bieten und Spitzenforschung in der rechnergestützten Ingenieurwissenschaft und angewandten Wissenschaft ermöglichen.

Die Gesamtkosten für Hunter und Herder belaufen sich auf 115 Millionen Euro. Die Finanzierung erfolgt über das Gauss Centre for Supercomputing (GCS), den Zusammenschluss der drei Bundeshöchstleistungsrechenzentren Deutschlands. Die Hälfte dieser Mittel wird vom Bundesministerium für Bildung und Forschung (BMBF) und die andere Hälfte vom Ministerium für Wissenschaft, Forschung und Kunst des Landes Baden-Württemberg bereitgestellt.

Von Hunter zu Herder: ein zweistufiger Weg zu Exascale

Hunter wird den derzeitigen Flaggschiff-Supercomputer des HLRS, Hawk, ersetzen. Es ist als Übergangssystem zu Herder konzipiert, um die Nutzergemeinschaft des HLRS zur Programmierung der massiv parallelen, GPU-beschleunigten Architektur des Exascale-Rechners vorzubereiten.

Hunter wird auf einem HPE Cray EX4000-Supercomputer basieren. Die Plattform ist für Exascale-Leistung ausgelegt und unterstützt groß angelegte Workloads für Modellierung, Simulation, KI und Höchstleistungsdatenanalyse. Jeder der 136 HPE Cray EX4000-Knoten wird mit vier HPE Slingshot Interconnects ausgestattet sein. Hunter wird auch die nächste Generation von Cray ClusterStor nutzen, ein Speichersystem, das speziell für die anspruchsvollen Input/Output-Anforderungen von Supercomputern entwickelt wurde. Darüber hinaus wird Hunter eine HPE Cray Programmierungsumgebung verwenden, die Programmierer:innen ein umfassendes Set von Tools für die Entwicklung, Portierung, Fehlersuche und Optimierung von Anwendungen bietet.

Hunter wird die Spitzenleistung des HLRS auf 39 PetaFLOPS (39*1015 Gleitkommaoperationen pro Sekunde) erhöhen – eine enorme Steigerung der aktuellen Spitzenleistung von Hawk (26 PetaFLOPS). Bei diesem neuen System liegt der Schwerpunkt nicht mehr wie bei Hawk auf CPU-Prozessoren, sondern auf energieeffizienteren GPU-Beschleunigern.

Hunter wird auf der AMD Instinct™ MI300A APU (Accelerated Processing Unit) basieren, die CPUs und Beschleuniger sowie Speicher mit hoher Bandbreite in einem einzigen Paket vereint. Durch die Verringerung des physischen Abstands zwischen den verschiedenen Prozessortypen und die Schaffung eines einheitlichen Speichers ermöglicht die APU eine schnelle Datenübertragungsgeschwindigkeit, beeindruckende Leistung, einfache Programmierbarkeit und sehr gute Energieeffizienz. Der Energiebedarf für den Betrieb von Hunter wird auch im Vergleich zu Hawk bei Spitzenleistung etwa 80 Prozent niedriger liegen.

Der Exascale-Supercomputer Herder wird in der Lage sein, Geschwindigkeiten in der Größenordnung von einer Trillion (1018) Gleitkommaoperationen pro Sekunde zu erreichen – ein gewaltiger Leistungssprung, der den Nutzer:innen der Rechnerinfrastruktur am HLRS einige neue Anwendungsfelder eröffnen wird. Die endgültige Konfiguration des auf beschleunigten Chips basierenden Rechners wird bis Ende 2025 festgelegt werden.

Aufgrund des Schwerpunkts auf der Kombination aus CPUs und GPUs in den Systemen Hunter und Herder wird die derzeitige Nutzergemeinschaft des HLRS bestehende Codes anpassen müssen, damit sie effizient auf der neuen Technologie laufen können. Daher wird HPE auch mit dem HLRS zusammenarbeiten, um Nutzer:innen des HLRS bei notwendigen Softwareverbesserungen zu helfen.

Unterstützung von Spitzenforschung in Stuttgart und darüber hinaus

Der Sprung des HLRS zu Exascale ist Teil der nationalen Strategie des Gauss Centre for Supercomputing zur Weiterentwicklung der drei GCS-Zentren: Der nächste Supercomputer am Jülich Supercomputing Centre, JUPITER, wird auf maximale Leistung ausgelegt und wird im Jahr 2025 das erste Exascale-System in Europa sein. Das Leibniz-Rechenzentrum plant ein System für den breiten Einsatz im Jahr 2026. Der Schwerpunkt der Supercomputer Hunter und Herder des HLRS liegt auf Ingenieurwissenschaften und industriellen Anwendungen. Gemeinsam sollen diese Systeme sicherstellen, dass das GCS optimierte Ressourcen der höchsten Leistungsklasse für das gesamte Spektrum der Spitzencomputerforschung in Deutschland bereitstellt.

Hunter und Herder werden einige Forschungsanwendungen in den Ingenieur- und angewandten Wissenschaften unterstützen: Sie werden beispielsweise die Entwicklung von Fahrzeugen mit geringerem Kraftstoffverbrauch, produktiveren Windturbinen, neuen Materialien für die Elektronik und vieles mehr ermöglichen. Mithilfe der KI-Fähigkeiten lassen sich neue Lösungen für die Fertigung finden und innovative Ansätze entwickeln, um groß angelegte Simulationen schneller und energieeffizienter zu gestalten. Darüber hinaus werden die Systeme die Forschung zur Bewältigung globaler Herausforderungen wie des Klimawandels unterstützen und Ressourcen für Datenanalysen bereitstellen, die Behörden bei der Vorbereitung auf Krisensituationen helfen könnten. Hunter und Herder werden auch der baden-württembergischen Hightech-Ingenieurslandschaft zur Verfügung stehen, u.a. kleinen und mittelständischen Unternehmen, die das Rückgrat der regionalen Wirtschaft bilden.

Zitate

Mario Brandenburg (Parlamentarischer Staatssekretär bei der Bundesministerin für Bildung und Forschung)
„Der durch das BMBF und das Land Baden-Württemberg geförderte Ausbau der Recheninfrastruktur des Gauss Centre for Supercomputing am Standort Stuttgart ist ein wichtiger Schritt auf dem Weg zu mehr Rechenpower für die deutsche Forschungs- und Innovationslandschaft. Die besondere Ausrichtung der Rechenarchitektur am HLRS wird dafür sorgen, dass sowohl Wissenschaft als auch Industrie, KMU und Start-ups erstklassige Bedingungen für Innovationen vorfinden. Mit dem Ausbau werden zudem die Rechenkapazitäten für die Entwicklung von KI erhöht und damit die KI-Infrastruktur in Deutschland gestärkt, wie es im KI-Aktionsplan des Bundesforschungsministeriums vorgesehen ist.“

Petra Olschowski, Ministerin für Wissenschaft, Forschung und Kunst Baden-Württemberg
„Das Thema Höchstleistungsrechnen steht für rasante Entwicklungen. So schnell, wie sich die Spitzenleistungen der Supercomputer erhöhen, so entscheidend sind sie sowohl für Spitzenforschung als auch für innovative Produkte und Prozesse in den Schlüsselbereichen der Wirtschaft“, sagt Wissenschaftsministerin Petra Olschowski. „Baden-Württemberg ist in Sachen Supercomputing und Künstliche Intelligenz europaweit führend und international konkurrenzfähig. Dem HLRS als Teil der Universität Stuttgart kommt hierbei eine Schlüsselrolle zu – es ist nicht nur die beeindruckende Leistung des Superrechners, sondern auch das geballte Methodenwissen vor Ort, das unserer computergestützten Spitzenforschung zu atemberaubenden Ergebnissen etwa beim Klimaschutz oder bei umweltverträglicher Mobilität verhilft.“

Prof. Dr. Wolfram Ressel (Rektor der Universität Stuttgart)
„Mit den Systemen Hunter und Herder führt die Universität ihre Exzellenzstrategie fort, für die das Höchstleistungsrechnen eine Grundlage ist. Insbesondere die herausragende Position Stuttgarts in der Computersimulation und in der Forschung rund um künstliche Intelligenz wird mithilfe des Ausbaus gestärkt.“

Anna Steiger (Kanzlerin der Universität Stuttgart)
„Energieeffizienz bei optimaler Unterstützung der Spitzenwissenschaft ist für uns als Universität Stuttgart ein zentrales Thema. Mit Hunter und Herder reagieren wir konsequent auf die Herausforderungen der CO2-Einsparung und können sowohl höhere Rechenleistungen als auch eine hervorragende Energieleistung ermöglichen.“

Prof. Dr. Michael Resch (Direktor des Höchstleistungsrechenzentrums Stuttgart)
„Mit HPE haben wir seit 2019 einen zuverlässigen Partner, mit dem wir nun auch den Schritt in die nächste Leistungsstufe des ExaFLOP machen werden. Basierend auf der GPU 3 Technologie von AMD sind wir für die Herausforderungen der Zukunft gerüstet.“

Justin Hotard (Executive Vice President and General Manager, High Performance Computing & Artificial Intelligence von HPE)
„Das HLRS hat eindrucksvoll gezeigt, was mit Supercomputing in Forschung und angewandter Wissenschaft möglich ist, und es war uns eine Ehre, sie auf dieser Reise zu begleiten. Wir freuen uns auf die Fortsetzung unserer Zusammenarbeit, um mit dem Supercomputer HPE Cray EX den Weg in Richtung Exascale zu ebnen. Das neue System wird wissenschaftliche und technische Innovationen ermöglichen, die das Wirtschaftswachstum beschleunigen.“

Mario Silveira (Corporate Vice President OEM Sales von AMD)
„Wir von AMD freuen uns, die Zusammenarbeit mit dem HLRS in Stuttgart und HPE weiter auszubauen. Für Hunter stellen wir unseren hochmodernen AMD MI300A AMD Instinct™ Beschleuniger zur Verfügung, um die Leistung, Effizienz und Datenübertragungsgeschwindigkeiten zu verbessern. Diese Initiative wird eine hochmoderne Infrastruktur schaffen, die auf Forschung, KI-Workloads und Simulationen zugeschnitten ist. Hunter soll bis 2025 fertiggestellt werden und steht im Einklang mit den ehrgeizigen Exascale-Plänen des HLRS für Deutschland. Damit unterstreichen wir unser Engagement, in den kommenden Jahren gemeinsam mit unseren Partnern technologische Fähigkeiten zu verbessern und Innovationen zu fördern.“

Dr. Bastian Koller (Geschäftsführer des HLRS)
„Zunehmend ist nicht die Hardware, sondern die optimale Nutzung der Systeme der größte Leistungsfaktor in Simulation und künstlicher Intelligenz. Wir freuen uns daher besonders, mit HPE einen weltweit führenden Partner für diese Themen gefunden zu haben, der gemeinsam mit AMD unseren Kunden neue Leistungshorizonte eröffnen wird.“

Anmerkung der Redaktion: In einer früheren Version dieses Artikels wurde 1018 aus dem Englischen fälschlicherweise als Quintillion übersetzt. Auf Deutsch heißt diese Größenordnung eine Trillion.