03.11.2025
Mit dem Eintritt moderner Hochleistungsrechnersysteme in die Exascale-Ära werden Simulationen im Kilometermaßstab bald die Hauptarbeit in der Klimaforschung leisten. Diese Modelle erzeugen pro Simulation Datenmengen in der Größenordnung von mehreren Petabytes. Die Kuratierung und Bereitstellung solch großer Datensätze für Nutzende auf der ganzen Welt stellt eine Herausforderung dar. Um diese Datenmengen effizient handhabbar zu machen, setzen Erdsystemmodelle (ESM) wie ICON zunehmend auf Cloud-native Formate wie „Zarr“ zur Speicherung der Modellausgaben sowie STAC-Kataloge für die FAIR-Verbreitung (Findable, Accessible, Interoperable, Reusable) der Datensätze.
Das DKRZ, vertreten durch Florian Ziemen, Fabian Wachsmann und Kameswar Rao Modali, nahm vom 14. bis 17. Oktober 2025 am „STAC Community Sprint” und am „Zarr Adopter Summit” teil, die parallel bei der ESA ESRIN und in Rom stattfanden.
Im Rahmen dieser Treffen beteiligten sie sich aktiv an Brainstormings und der Ausarbeitung von Spezifikationen, um eine Synergisierung von STAC (SpatioTemporal Asset Catalog) und Zarr zu erreichen ‑ insbesondere aus der Perspektive der Erdsystemmodellierung.
Diese Arbeit bildet einen wichtigen Schritt für die zukünftige Anpassung von modernen Datenstandards wie STAC und Zarr in der Geowissenschaftsgemeinschaft und den Weg für eine effiziente, interoperable und zukunftsfähige Nutzung von Exascale-Klimadaten ebnet.
