You are here: University of Vienna PHAIDRA Detail o:1399342
Title (eng)
Vertical localisation for convective-scale data assimilation using a 1000-member ensemble
Parallel title (deu)
Vertikale Lokalisierung für Datenassimilation auf konvektiver Skala, unter Verwendung eines 1000-Member Ensemble
Author
David Hinger
Adviser
Martin Weißmann
Co-Advisor
Tobias Necker
Assessor
Martin Weißmann
Abstract (deu)

Die Verwendung kleiner Ensemblegrößen, aufgrund begrenzter Rechenkapazitäten, in der operatio-
nellen Datenassimilation führt zu einer Reihe von Ungenauigkeiten, die hauptsächlich auf zufälli-
ge Korrelationen zurückzuführen sind. Um dieses Problem zu lösen, wurden in den letzten zwanzig
Jahren verschiedene Lokalisierungsmethoden entwickelt. In dieser Arbeit wird versucht, optimierte
Lokalisierungsmethoden für vertikale Korrelationen zu finden. Dazu wird ein convective-scale 1000-
Member Ensemble als näherungsweise wahre Darstellung der Vorhersagefehlerkorrelationen ange-
nommen. Dieses wird mit Lokalisierungen verglichen die auf 40-Member Ensembles, gezogen aus
dem 1000er-Ensemble angewendet werden. Die Gaspari-Cohn-Funktion (Gaspari and Cohn, 1999)
wird durch die Verwendung eines variablenabhängigen Ansatzes und durch die Kombination mit der
Sampling Error Correction von Anderson (2012) optimiert. Darüber hinaus wird eine Methode zur
Berechnung der optimalen Gewichtungsfunktion entwickelt, um zu erkennnen, wo die Schwachstel-
len der derzeit verwendeten Funktionen liegen, und um diese direkt zur Lokalisierung zu nutzen.
Schließlich wird die Möglichkeit des Einsatzes von Machine Learning für Lokalisierung mit Hilfe ei-
nes Random Forest getestet.
Alle entwickelten Methoden bringen verbesserte Ergebnisse im Vergleich zur Lokalisierung des Deut-
schen Wetterdienstes (DWD). Die größte Verbesserung wird durch die optimale Gewichtungsfunktion
erreicht. Es zeigt sich auch, dass sich die Lokalisierungsfunktion für Eigen- und Kreuzkorrelationen
unterschiedliche Formen annimmt. Der Random Forest erziehlt ebenfalls eine deutliche Verbesse-
rung, zeigt aber auch die vielen verschiedenen Aspekte, die berücksichtigt werden müssen, um ein
stabiles und gut funktionierendes Machine Learning Tool zu entwickeln. Die Verwendung einer va-
riablenabhängigen Gaspari-Cohn-Funktion bringt eine halb so große Verbesserung wie die beiden
anderen Methoden, zeigt aber den Unterschied bei der Lokalisierung verschiedener Parameter.

Abstract (eng)

The use of small ensemble sizes, due to computational restrictions in operational data assimilation,
causes several inaccuracies, mainly because of spurious correlations. To mitigate sampling errors, dif-
ferent localisation methods have been developed over the last twenty years. This thesis seeks to find
optimal localisation methods for vertical correlations of convective-scale forecast errors. This is done
by using a convective-scale 1000-member ensemble as an assumed true depiction of the forecast
error correlations and comparing it with localisations applied to 40-member ensembles randomly
drawn from the 1000-member ensemble. The method of using the Gaspari Cohn function (Gaspari
and Cohn, 1999) is optimised by using a variable dependent approach and also combining it with the
statistical sampling error correction by Anderson (2012). Furthermore, a way to calculate the opti-
mal weighting function is developed, to learn where the flaws of the currently used functions are and
to use it directly for localisation. Lastly, the possibility of using machine learning for localisation is
tested by using a random forest.
All developed methods bring improved results compared to the localisation of the Deutscher Wetter-
dienst (DWD). The best improvement is achieved by the optimal weighting function. It also shows
that the shape of an optimal localisation function differs between self- and crosscorrelations. The
random forest achieves clear improvement but shows many aspects which have to be considered
building a stable and well-working machine learning tool. Using a variable dependent Gaspari Cohn
function brings half as much improvement as the other two methods, but it shows the difference in
the localisation of different parameters.

Keywords (eng)
localisationdata assimilation
Keywords (deu)
LokalisierungDatenassimilation
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1399342
rdau:P60550 (deu)
54 Seiten : Illustrationen
Number of pages
56
Study plan
Masterstudium Meteorologie
[UA]
[066]
[614]
Members (1)
Title (eng)
Vertical localisation for convective-scale data assimilation using a 1000-member ensemble
Parallel title (deu)
Vertikale Lokalisierung für Datenassimilation auf konvektiver Skala, unter Verwendung eines 1000-Member Ensemble
Author
David Hinger
Abstract (deu)

Die Verwendung kleiner Ensemblegrößen, aufgrund begrenzter Rechenkapazitäten, in der operatio-
nellen Datenassimilation führt zu einer Reihe von Ungenauigkeiten, die hauptsächlich auf zufälli-
ge Korrelationen zurückzuführen sind. Um dieses Problem zu lösen, wurden in den letzten zwanzig
Jahren verschiedene Lokalisierungsmethoden entwickelt. In dieser Arbeit wird versucht, optimierte
Lokalisierungsmethoden für vertikale Korrelationen zu finden. Dazu wird ein convective-scale 1000-
Member Ensemble als näherungsweise wahre Darstellung der Vorhersagefehlerkorrelationen ange-
nommen. Dieses wird mit Lokalisierungen verglichen die auf 40-Member Ensembles, gezogen aus
dem 1000er-Ensemble angewendet werden. Die Gaspari-Cohn-Funktion (Gaspari and Cohn, 1999)
wird durch die Verwendung eines variablenabhängigen Ansatzes und durch die Kombination mit der
Sampling Error Correction von Anderson (2012) optimiert. Darüber hinaus wird eine Methode zur
Berechnung der optimalen Gewichtungsfunktion entwickelt, um zu erkennnen, wo die Schwachstel-
len der derzeit verwendeten Funktionen liegen, und um diese direkt zur Lokalisierung zu nutzen.
Schließlich wird die Möglichkeit des Einsatzes von Machine Learning für Lokalisierung mit Hilfe ei-
nes Random Forest getestet.
Alle entwickelten Methoden bringen verbesserte Ergebnisse im Vergleich zur Lokalisierung des Deut-
schen Wetterdienstes (DWD). Die größte Verbesserung wird durch die optimale Gewichtungsfunktion
erreicht. Es zeigt sich auch, dass sich die Lokalisierungsfunktion für Eigen- und Kreuzkorrelationen
unterschiedliche Formen annimmt. Der Random Forest erziehlt ebenfalls eine deutliche Verbesse-
rung, zeigt aber auch die vielen verschiedenen Aspekte, die berücksichtigt werden müssen, um ein
stabiles und gut funktionierendes Machine Learning Tool zu entwickeln. Die Verwendung einer va-
riablenabhängigen Gaspari-Cohn-Funktion bringt eine halb so große Verbesserung wie die beiden
anderen Methoden, zeigt aber den Unterschied bei der Lokalisierung verschiedener Parameter.

Abstract (eng)

The use of small ensemble sizes, due to computational restrictions in operational data assimilation,
causes several inaccuracies, mainly because of spurious correlations. To mitigate sampling errors, dif-
ferent localisation methods have been developed over the last twenty years. This thesis seeks to find
optimal localisation methods for vertical correlations of convective-scale forecast errors. This is done
by using a convective-scale 1000-member ensemble as an assumed true depiction of the forecast
error correlations and comparing it with localisations applied to 40-member ensembles randomly
drawn from the 1000-member ensemble. The method of using the Gaspari Cohn function (Gaspari
and Cohn, 1999) is optimised by using a variable dependent approach and also combining it with the
statistical sampling error correction by Anderson (2012). Furthermore, a way to calculate the opti-
mal weighting function is developed, to learn where the flaws of the currently used functions are and
to use it directly for localisation. Lastly, the possibility of using machine learning for localisation is
tested by using a random forest.
All developed methods bring improved results compared to the localisation of the Deutscher Wetter-
dienst (DWD). The best improvement is achieved by the optimal weighting function. It also shows
that the shape of an optimal localisation function differs between self- and crosscorrelations. The
random forest achieves clear improvement but shows many aspects which have to be considered
building a stable and well-working machine learning tool. Using a variable dependent Gaspari Cohn
function brings half as much improvement as the other two methods, but it shows the difference in
the localisation of different parameters.

Keywords (eng)
localisationdata assimilation
Keywords (deu)
LokalisierungDatenassimilation
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1399343
Number of pages
56