17.11.2022

EECliPs: Energieeffiziente Klimasimulationen

Die computergestützte Klimaforschung soll zu einem besseren Verständnis des Klimawandels und seiner Auswirkungen sowie zunehmend zur Bewertung von Anpassungsstrategien beitragen. Dazu werden modernste Hochleistungsrechner eingesetzt, deren Betrieb sehr energieintensiv ist. Im Projekt EECliPs wird untersucht, wie durch ein geeignetes Co-Design von HPC-Hardware und -Software eine energieeffiziente Ausführung von Klimasimulationen erreicht werden kann.

Am 15. November 2022 besprachen die Partner während ihres Kickoff-Treffens erste konkrete Schritte zur Evaluierung und Realisierung der verschiedenen Ansätze. Als Verbundführer wird das DKRZ die Integration in dessen Infrastruktur und die Durchführung der Klimasimulationen übernehmen. Das ZIH der TU Dresden trägt dazu die notwendige Expertise in Werkzeugen zur Analyse und Energiemessung von HPC-Anwendungen bei und ParTec übernimmt gemeinsam mit Atos die hardwareseitigen Untersuchungen. Ziel ist eine optimale Lastverteilung des Klima- und Wettermodells ICON auf ein heterogenes Proof-of-Concept-System bestehend aus verschiedenen aktuellen Architekturen. Dabei wird der Trend zu spezialisierten Architekturen im HPC-Umfeld ausgenutzt, so dass der Energieverbrauch einer Simulation gesenkt wird, ohne die Ausführungszeit erheblich zu verlängern.

EE-HPC: Energieoptimierung von Rechenzentren

Das Projekt „Quelloffene Lösungsansätze für Monitoring und Systemeinstellungen für energieoptimierte Rechenzentren“ (EE-HPC) wird vom BMBF gefördert. Zu den Partnern gehören neben der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) als Koordinator das DKRZ, die RWTH Aachen, das HLRS, sowie als Industriepartner Hewlett-Packard und Intel Germany. Diese trafen sich vom 27. bis 28. Oktober 2022 in Erlangen zu einem Kickoff-Treffen.

Ziel des Vorhabens ist die automatisierte Optimierung der Energieeffizienz von HPC-Systemen. Durch eine jobspezifische Steuerung und Optimierung der Hardwarekonfiguration sowie der Laufzeitumgebungen (OpenMP und MPI) sollen Cluster mittels reduzierter Leistungsaufnahme bei gleichzeitiger Durchsatzmaximierung eine effizientere Energienutzung erreichen. Als Basis dient ein systemweites jobspezifisches Framework zum Performance- und Energiemonitoring, das auf ClusterCockpit basiert. Zur Ermittlung der Parameter werden analytische Modellierung, maschinelles Lernen und empirische Methoden kombiniert. Die Gesamtlösung soll für unterschiedlichste Anwendungen nutzbar sein und wird auf den Produktivsystemen aller Projektpartner getestet. Am DKRZ wird die Umgebung exemplarisch eingesetzt, um Anwendungen auf dem Gebiet der Klimaforschung auf unterschiedlichen HPC-Architekturen zu testen und die energieeffizienteste Lösung zu ermitteln.