Wettervorhersagen sind grundsätzlich unsicher. Traditionell beruhen Wettervorhersagen auf der numerischen Wettervorhersage (NWP), die auf physikalischen Simulationen der Atmosphäre beruht. Jüngste Fortschritte im Bereich des maschinellen Lernens (ML) haben ML-basierte Wettervorhersagemodelle hervorgebracht, die weniger Vorhersagefehler aufweisen als einzelne NWP-Simulationen, berichtet Springer Nature Limited.

GenCast ist ein probabilistisches Wettermodell, das globale 15-Tage-Ensemble-Vorhersagen mit einer Auflösung von 0,25 °C erstellt, die genauer sind als das beste operationelle Ensemblesystem. Die Erstellung einer einzelnen 15-Tage-Vorhersage von GenCast dauere etwa 8 Minuten auf einem Cloud TPUv5-Gerät, und ein Ensemble von Vorhersagen kann parallel erstellt werden. GenCast modelliere die bedingte Wahrscheinlichkeitsverteilung des zukünftigen Wetterzustands in Abhängigkeit von den aktuellen und vorherigen Wetterzuständen.

IgorZh_AdobeStock_211524227

Image: IgorZh/AdobeStock

Die Darstellung des globalen Wetterzustandes bestehe aus sechs Oberflächenvariablen und sechs atmosphärischen Variablen auf 13 vertikalen Druckniveaus auf einem gleichwinkligen 0,25 °C Breitengrad-Längengrad-Gitter. Der Vorhersagehorizont beträgt 15 Tage, mit zwölf Stunden zwischen den aufeinanderfolgenden Schritten. GenCast wird mit Hilfe einer Analyse für den Wetterzustand trainiert, die die beste Schätzung des Wetterzustandes darstellt, die aus Beobachtungen abgeleitet wird.

GenCast sei als bedingtes Diffusionsmodell implementiert, das die Wahrscheinlichkeitsverteilung komplexer Daten modellieren und neue Stichproben erzeugen kann. Diffusionsmodelle bilden die Grundlage für viele der jüngsten Fortschritte bei der Modellierung natürlicher Bilder, Töne und Videos unter dem Dach der generativen KI.

In jeder Phase des iterativen Verfeinerungsprozesses verwende GenCast ein neuronales Denoiser-Netz, das so trainiert ist, dass es das künstlich zu den atmosphärischen Zuständen hinzugefügte Rauschen anhand der in den Methoden beschriebenen Verlustfunktion entfernt. Die Architektur des Denoisers besteht aus einem Encoder, einem Prozessor und einem Decoder.

GenCast wird auf der Grundlage von 40 Jahren bester Schätzungen von 1979 bis 2018 trainiert, die aus dem öffentlich zugänglichen ERA5-Reanalysedatensatz (fünfte Generation der ECMWF-Reanalyse) stammen. Die Reanalyse biete eine Rekonstruktion des vergangenen Wetters durch die Berechnung von Analysen für historische Daten und Zeiten.