MiKlip - bringt Forschung zu mittelfristigen Klimaprognosen vorwärts

Der Bedarf an verlässlichen Aussagen zu Klimaentwicklungen im Bereich von Jahren bis hin zu Dekaden wächst ständig, da Planungshorizonte vor allem in der Wirtschaft, aber auch in Politik und Gesellschaft, in der Regel in der Größenordnung von 10 Jahren angesiedelt sind. Sie sind wesentliche Voraussetzung für eine Verbesserung der Anpassungsfähigkeit von Industrie und Gesellschaft an das zukünftige Klima. Um für diesen Zeitraum verlässliche Aussagen zur Klimaentwicklung und den zu erwartenden Klimaänderungen zu gewinnen, sind insbesondere aktuelle Beobachtungsdaten für den Ozean erforderlich, anhand derer das verwendete Modellsystem initialisiert wird.

Ein Großteil der Forschung innerhalb von MiKlip, vom zentralen Vorhersage- und Evaluierungssystem bis zur Forschung innerhalb eines der MiKlip-Forschungsmodule zur Initialisierung, Prozessverständnis, Regionalisierung oder Evaluierung, ist auf die Ressourcen am DKRZ angewiesen. MiKlip nutzt den Hochleistungsrechner des DKRZ für rechenzeitintensive Simulationen. Zusätzlich steht für die datenintensiven Analysen ein Projekt-eigenes System, der MiKlip-Server mit 11 Rechnerknoten und einer Festplattenkapazität von 1 Petabyte zur Verfügung. Der Server wird vom DKRZ betrieben und von der MiKlip-Gemeinschaft als zentraler Datenspeicher, für den Datenaustausch sowie für die Evaluierung des Vorhersagesystems eingesetzt.

Das zentrale Vorhersage- und Evaluierungssystem

Das Vorhersagesystem basiert auf dem Erdsystemmodell des Max-Planck-Instituts für Meteorologie (MPI-ESM) in seiner niedrigen (LR) und gemischten (MR) Auflösung sowie einer Initialisierungs-Prozedur, über welche die Simulationen von beobachteten Zuständen aus gestartet werden können. Das System kann für retrospektive Vorhersagen, sogenannte "Hindcasts", und für Vorhersagen eingesetzt werden. Durch den Vergleich von Hindcasts mit der entsprechenden beobachteten Vergangenheit kann die Vorhersagegüte des Systems eingeschätzt werden. Diese Experimente stellen die zentralen Rechnungen dar, die von allen Projektpartnern benutzt und analysiert werden. Bis heute wurden bereits Hindcasts von drei Generationen des Vorhersagesystems erstellt (CMIP-5 oder Baseline 0, Baseline 1 und Prototyp). Diese unterscheiden sich vor allem in der verwendeten Initialisierungs-Prozedur sowie der Anzahl an Ensemble-Mitgliedern (3, 10 und 30), die berechnet wurden. Auf Grund der hohen Anzahl an Ensemblemitgliedern für das Prototyp-System haben die Simulationen fast 4 Millionen CPU-Stunden auf dem HLRE-II-System Blizzard benötigt. Für die nächste Produktionsphase ist eine Erhöhung der horizontalen Modellauflösung geplant, was den Bedarf an Rechenzeit noch einmal signifikant erhöhen wird.

Das Vorhersagesystem hat nicht nur einen hohen Bedarf an Rechenzeit; es erzeugt auch, in Abhängigkeit von der Modellauflösung und der Anzahl der Ensemble-Mitglieder, sehr umfangreiche Ergebnisdaten. Die Hindcasts, weitere unterstützende Simulationen sowie Beobachtungsdatensätze für die Evaluierung der Hindcasts sind als standardisierte CMOR-NetCDF-Dateien auf dem MiKlip-Server gespeichert.

Der MiKlip-Server ist auch das Zuhause des "Zentralen Evaluierungssystems" (CES). Das CES kann für die Datensuche oder für die Analyse der Hindcasts genutzt werden. Hierfür steht eine große Auswahl an zentral oder von Projektpartnern hinzugefügter Software zur Verfügung. Eine Erkundung des CES ist unter www-miklip.dkrz.de mit dem Gastzugang (in der oberen rechten Ecke auf “Guest?” anklicken) möglich.

Evaluierung des Systems

Um Aussagen über die Güte eines Vorhersagesystems treffen zu können, muss es anhand bekannter Daten getestet werden. Dazu werden berechnete retrospektive Vorhersagen (Hindcasts) mit Beobachtungsdaten und Referenzvorhersagen (wie etwa nicht initialisierte Läufe des CMIP5-Projektes, anderen Hindcasts, der Klimatologie oder Persistenz) auf Basis verschiedener Metriken für die Vorhersagegüte verglichen. Zwei dieser im CES implementierten Metriken sind der "mean square error skill score" (MSESS) und der "ranked probability skill score" (RPSS).

Abb. 1: Die zwei Qualitäts-Metriken MSESS (links) und RPSS (rechts) für die Systeme Baseline 1 (b1) verglichen mit Baseline 0 (b0) am Beispiel der Fähigkeit des Systems, den Index der südlichen Oszillation (SOI) vorherzusagen. Für verschiedene Jahreszeiten und Vorhersagejahre ist durch die rote Farbe gekennzeichnet, wo das Baseline-1-System besser ist als Baseline 0. (aus: Projekt VADY)

Grundsätzlich können dekadische Vorhersagesysteme allerdings nicht so detaillierte Informationen liefern wie etwa Wettervorhersagemodelle. Stattdessen wird hier angestrebt, zusammengefasste Werte und statistische Eigenschaften für Teilmengen der Daten, sogenannte aggregierte Werte, vorherzusagen. Entsprechend wird bei der Evaluation des Modellsystems verfahren und dessen Güte für verschiedene aggregierte Kenngrößen bestimmt.

Abbildung 1 zeigt einen Vergleich der Analyse verschiedener aggregierter Größen auf Basis von Ergebnissen des VADY-Projektes. Man kann z.B. über verschieden Zeiträume aggregieren, wie etwa ein Mittel über Jahreszeiten oder das ganze Jahr (obere Achse), oder über einen Zeitraum nach der Initialisierung, etwa nur das erste oder das zweite Vorhersagejahr, oder sogar für Mittel über mehrere Jahre, so wie die Jahre 2 bis 5 oder 6 bis 9 der Vorhersage (linke Achse).

Eine andere Art der Aggregation (räumlich sowie etwa die Reduktion auf bestimmte Klimamoden) besteht darin, Klimaindizes statt prognostischer Größen zu analysieren. Im Projekt VADY wurden einige viel verwendete Indizes untersucht; zur Illustration ist in der Abbildung eine Analyse für den Index der Südlichen Oszillation (SOI) zu sehen. Der MSESS deutet darauf hin, dass das Baseline-1-System bessere Ergebnisse liefert als Baseline 0 - unabhängig davon, welche Aggregation genutzt wird, und insbesondere dann, wenn man sich auf die ersten beiden Vorhersagejahre beschränkt.

Die RPSS-Metrik zeigt ein anderes Bild: ab dem dritten Vorhersagejahr ist kaum ein Unterschied zwischen den Systemen zu finden. Der Grund hierfür ist vor allem, dass der RPSS die vollständige Verteilung des Ensembles berücksichtigt und die Anzahl an Ensemblemitgliedern (3 für b0 und 10 für b1) justiert, wohingegen die MSESS nur den Mittelwert berücksichtigt. Dieses Ergebnis unterstreicht, wie wichtig es ist, mehrere Metriken in Betracht zu ziehen, da damit unterschiedliche Aspekte des Systems bewertet werden.

Das Testen neuer Initialisierungs- und Ensemble-Erzeugungsmethoden

Der Unterschied zwischen einem Klimavorhersagesystem und Klimaprojektionen liegt vor allem darin, dass ersteres von einem beobachtetem Zustand aus initialisiert werden muss, während der genaue Anfangszustand bei Klimaprojektionen eine nur nachgelagerte Rolle spielt. Für mittelfristige Klimaprognosen ist es daher notwendig, einen "angemessenen" Anfangszustand zu erzeugen, sowie geeignete Methoden für die Initialisierung und Ensemble-Erzeugung des Modellsystems zu finden. Beide Aspekte erfordern aufwändige Berechnungen und lagen im Fokus mehrerer MiKlip-Projekte. Ein Beispiel dafür ist die Arbeit, die im Projekt MODINI durchgeführt wurde. Dort wird eine Initialisierungsmethode vorgeschlagen, in der beobachtete Impulsfluss-Anomalien zur saisonal variablen Klimatologie des gekoppelten Modells hinzugefügt werden, um den sogenannten Initialschock, der manchmal am Anfang der Vorhersage zu sehen ist, zu reduzieren. In Hindcast-Experimenten, die für einen reduzierten Zeitrahmen durchgeführt wurden, zeigt diese Methode vielversprechende Ergebnisse mit verbesserter Vorhersagegüte im tropischen Pazifik (Abbildung 2).

Abb. 2. Die drei Generationen des Vorhersagesystems sowie eine weitere im Rahmen von MODINI entwickelte Alternative im Vergleich mit einer Referenzvorhersage (HadCRUT4 Median) für mittlere Oberflächentemperaturen der 2 bis 5 Jahre nach der Initialisierung. Dargestellt ist der MSESS: Rote Werte zeigen an, dass das System besser ist als die Referenz. Bei blauen Werten ist es umgekehrt. Die Kreuze zeigen Werte, die sich signifikant von 0 unterscheiden (95% Signifikanzniveau). Grau kennzeichnet sind fehlende beobachteten Daten. (Abb. Adaptiert von Thoma et al., 2015). Die Abbildung wurde mit Daten vom CES erzeugt.

Prozess-Verständnis für mittelfristige Vorhersagen

Die Berücksichtigung von Prozessen, die noch nicht oder nur zum Teil im Vorhersagesystem dargestellt sind, könnten potentiell zur besseren Vorhersagbarkeit führen. Mehrere solcher Prozesse wurden im Rahmen von MiKlip-Projekten untersucht. Da das Vorhersagesystem jetzt schon sehr rechenzeitintensiv ist, ist es aber notwendig sicherzustellen, dass zusätzliche Prozesse tatsächlich positiv zur Vorhersagegüte beitragen. Das Projekt ALARM beispielsweise untersucht die Rolle von Vulkanausbrüchen in mittelfristigen Vorhersagen und hat unter anderem Baseline-0-Hindcasts mit und ohne Vulkaneinfluss untersucht. Die Projektergebnisse zeigen, dass für das erste Vorhersagejahr die Vorhersagegüte insbesondere dann für Eurasien verbessert wird, wenn Vulkanausbrüche berücksichtigt werden. ALARM hat zu diesem Zweck ein Vulkan-Modul für das zentrale Vorhersagesystem entwickelt, welches zugeschaltet werden kann, sollte die Vorhersage auf Grund eines Vulkanausbruches wiederholt werden müssen.

Abb. 3. Unterschied der Vorhersagegüte (MSSS) der Oberflächentemperatur im ersten Vorhersagejahr zwischen Baseline0-LR mit und ohne Vulkane: Rote Werte zeigen, wo die Hindcasts mit Berücksichtigung von Vulkanen die ohne übertreffen. Quadrate zeigen Anomalien, die signifikant sind (95% Signifikanzniveau). Grau kennzeichnet sind fehlende beobachteten Daten. Die Abbildung wurde mit dem CES erzeugt.

In Hinblick auf Nutzerrelevanz

In allen oben gezeigten Beispielen wurde mit relativ grob aufgelösten globalen Modellen gearbeitet. Damit Vorhersagen für eine Anwendung potentiell nützlich sein können, müssen diese aber auf relativ kleinen räumlichen Skalen vorliegen. Eine Möglichkeit wäre, diese Information direkt aus einem globalen Modell statistisch zu extrahieren. Eine andere Variante besteht darin, mit einem regionalen Modell die Vorhersageinformationen dynamisch herunterzubrechen. Um dies umzusetzen, wurden für die Zielregion Europa viele Hindcasts der Baseline 0 und 1 Systeme als Randbedingung für regionale Klimamodelle eingesetzt und auf regionaler Skala neue Hindcast gerechnet und ausgewertet. Es konnte gezeigt werden, dass beispielsweise für die Oberflächentemperatur die regionalen Hindcasts die Vorhersagegüte des globalen Modells gut erhalten, für Niederschlag kann das regionale Modell hingegen sogar zu einem Mehrwert führen, in dem es beispielsweise extreme Niederschlagswerte besser wiedergibt.

Momentan startet die zweite MiKlip-Phase. Während dieser zweiten Phase stehen Fragen der Nutzer-Relevanz deutlicher im Mittelpunkt als in der ersten Phase, wie zum Beispiel die Operationalisierung des dekadischen Vorhersage- und Evaluierungssystems und die direkte Einbeziehung von potentiellen Nutzern von mittelfristigen Vorhersagen.

Weitere Informationen über die erste MiKlip-Phase:

www.fona-miklip.de

Komplette Liste aller MiKlip-Publikationen

Kontakt (Autoren):

Freja Vamborg, MiKlip-Office, Max-Planck-Institut für Meteorologie

freja.vamborg[at]mpimet.mpg.de

Literatur:

Thoma, Malte, R.J. Greatbatch, C. Kadow and R. Gerdes, 2015: Decadal hindcasts initialized using observed surface wind stress: Evaluation and prediction out to 2024, Geophysical Research Letters 42.15, 6454-6461.