Title (eng)
Exploring nonlinearities in stock performance
Author
Kirill Tsatkhlanov
Advisor
Günter Strobl
Assessor
Günter Strobl
Abstract (deu)
Das Ziel dieser Masterarbeit ist, zu untersuchen, ob Algorithmen des maschinellen Lernens im Vergleich zu traditionellen finanzwirtschaftlichen Modellen genauere Schätzungen der Aktienrenditen liefern können, da lineare Modelle potenzielle Nichtlinearitäten möglicherweise übersehen. Der Schwerpunkt liegt auf dem Vergleich zwischen den klassischen Regressionsimplementierungen des Capital Asset Pricing Models (CAPM) und des Fama-French-Fünf-Faktoren-Modells einerseits sowie nichtlinearen Methoden des maschinellen Lernens wie „Random Forests“ und „extreme Gradient Boosting“ andererseits. Die Analyse basiert auf Daten aus der Kenneth-R.-French-Datenbank, die monatliche Renditen von fünfundzwanzig US-Portfolios enthält. Die Portfolien sind nach Unternehmensgröße und Buch-zu-Markt-Verhältnis sortiert. Beide Modelltypen werden anhand eines fünfjährigen Rollfensters evaluiert, wobei die Quadratwurzel des mittleren quadratischen Fehlers (Root Mean Squared Error) als primäre Bewertungskennzahl dient. Zusätzlich werden Gibbons-Ross-Shanken-Test (GRS) und Diebold-Mariano-Test (DM) angewendet. Die Ergebnisse zeigen, dass die eingesetzten Modelle des maschinellen Lernens in der gewählten Konfiguration die linearen Vergleichsmodelle nicht regelmäßig übertreffen. Das zeigt, dass ausgewählte maschinelle Methoden zwar grundsätzlich das Potenzial besitzen, komplexe Zusammenhänge abzubilden, möglicherweise aber nicht ausreichend sind. Die Ergebnisse erhöhen die Bedeutung einer sorgfältigen Modell- und Parameterauswahl. Sie deuten auch darauf hin, dass fortgeschrittenere oder spezialisierte Methoden des maschinellen Lernens erforderlich sein könnten, um signifikante Verbesserungen der Prognosegenauigkeit im Kontext der finanzwirtschaftlichen Modelle zu ermöglichen.
Abstract (eng)
The goal of this thesis is to investigate if machine learning algorithms can provide better predictions of stock returns by capturing nonlinearities that might be overlooked by the traditional asset pricing models. The main emphasis of this study lies on the comparison of traditional linear regression implementations of the Capital Asset Pricing Model and the Fama-French Five-Factor model with nonlinear machine learning techniques, including Random Forests and extreme Gradient Boosting. Using the Kenneth R. French library, which offers monthly return data from twenty-five U.S. portfolios sorted by size and book-to-market characteristics, both types of models are evaluated using a five-year rolling window and Root Mean Squared Error (RMSE) as the primary metric. A Gibbons-Ross-Shanken test (GRS) and Diebold-Mariano test (DM) are also applied. The results show that in the chosen setting the machine learning models do not regularly outperform linear benchmarks. This finding suggests that while machine learning has the potential to model complex relationships, the specific algorithms applied here, together with the chosen parameters, may be insufficient. These results tell us the importance of model and parameter selection together with the correct choice of advanced or specialized machine learning methods to realize significant improvements in predictive accuracy within the asset pricing context.
Keywords (deu)
maschinelles LernenNichtlinearitätenSchätzung von Renditen
Keywords (eng)
extreme Gradient BoostingRandom Forestk-Nearest NeighborsFama-FrenchCAPMCapital Asset Pricing ModelNonlinearities
Subject (deu)
Type (deu)
Persistent identifier
Extent (deu)
55 Seiten
Number of pages
55
Study plan
Masterstudium Banking and Finance
[UA]
[066]
[974]
Association (deu)
Title (eng)
Exploring nonlinearities in stock performance
Author
Kirill Tsatkhlanov
Abstract (deu)
Das Ziel dieser Masterarbeit ist, zu untersuchen, ob Algorithmen des maschinellen Lernens im Vergleich zu traditionellen finanzwirtschaftlichen Modellen genauere Schätzungen der Aktienrenditen liefern können, da lineare Modelle potenzielle Nichtlinearitäten möglicherweise übersehen. Der Schwerpunkt liegt auf dem Vergleich zwischen den klassischen Regressionsimplementierungen des Capital Asset Pricing Models (CAPM) und des Fama-French-Fünf-Faktoren-Modells einerseits sowie nichtlinearen Methoden des maschinellen Lernens wie „Random Forests“ und „extreme Gradient Boosting“ andererseits. Die Analyse basiert auf Daten aus der Kenneth-R.-French-Datenbank, die monatliche Renditen von fünfundzwanzig US-Portfolios enthält. Die Portfolien sind nach Unternehmensgröße und Buch-zu-Markt-Verhältnis sortiert. Beide Modelltypen werden anhand eines fünfjährigen Rollfensters evaluiert, wobei die Quadratwurzel des mittleren quadratischen Fehlers (Root Mean Squared Error) als primäre Bewertungskennzahl dient. Zusätzlich werden Gibbons-Ross-Shanken-Test (GRS) und Diebold-Mariano-Test (DM) angewendet. Die Ergebnisse zeigen, dass die eingesetzten Modelle des maschinellen Lernens in der gewählten Konfiguration die linearen Vergleichsmodelle nicht regelmäßig übertreffen. Das zeigt, dass ausgewählte maschinelle Methoden zwar grundsätzlich das Potenzial besitzen, komplexe Zusammenhänge abzubilden, möglicherweise aber nicht ausreichend sind. Die Ergebnisse erhöhen die Bedeutung einer sorgfältigen Modell- und Parameterauswahl. Sie deuten auch darauf hin, dass fortgeschrittenere oder spezialisierte Methoden des maschinellen Lernens erforderlich sein könnten, um signifikante Verbesserungen der Prognosegenauigkeit im Kontext der finanzwirtschaftlichen Modelle zu ermöglichen.
Abstract (eng)
The goal of this thesis is to investigate if machine learning algorithms can provide better predictions of stock returns by capturing nonlinearities that might be overlooked by the traditional asset pricing models. The main emphasis of this study lies on the comparison of traditional linear regression implementations of the Capital Asset Pricing Model and the Fama-French Five-Factor model with nonlinear machine learning techniques, including Random Forests and extreme Gradient Boosting. Using the Kenneth R. French library, which offers monthly return data from twenty-five U.S. portfolios sorted by size and book-to-market characteristics, both types of models are evaluated using a five-year rolling window and Root Mean Squared Error (RMSE) as the primary metric. A Gibbons-Ross-Shanken test (GRS) and Diebold-Mariano test (DM) are also applied. The results show that in the chosen setting the machine learning models do not regularly outperform linear benchmarks. This finding suggests that while machine learning has the potential to model complex relationships, the specific algorithms applied here, together with the chosen parameters, may be insufficient. These results tell us the importance of model and parameter selection together with the correct choice of advanced or specialized machine learning methods to realize significant improvements in predictive accuracy within the asset pricing context.
Keywords (deu)
maschinelles LernenNichtlinearitätenSchätzung von Renditen
Keywords (eng)
extreme Gradient BoostingRandom Forestk-Nearest NeighborsFama-FrenchCAPMCapital Asset Pricing ModelNonlinearities
Subject (deu)
Type (deu)
Persistent identifier
Number of pages
55
Association (deu)
License
- Citable links
- Other links
- Managed by
- DetailsObject typeContainerCreated19.09.2025 12:45:09 UTC
- Usage statistics-
- Metadata
- Export formats
