Künstliche Intelligenz

Maschinelles Lernen – Chancen und Fallstricke

Redaktion -

Künstliche Intelligenz wird zunehmend auch in der Vermögensverwaltung eingesetzt. Worin unterscheidet sich dieses Anwendungsfeld von anderen? Was ist bei KI anders als bei klassischen statistischen Modellen? Was sind die Stärken, was die Schwächen von KI? Wo lauern Fallstricke für Anwender am Finanzmarkt? Auskunft darüber gibt das vom CFA Institute herausgegebene und online zugängliche „Handbook of Artificial Intelligence and Big Data Applications in Investments“ in vier Kapiteln (siehe Studienseite dieser PB-Ausgabe). Wir beschränken uns im Folgenden auf Maschinelles Lernen (ML) und den ersten Artikel dieses Handbuchs („On Machine Learning Applications in Investments“; Link ganz unten). Dieser von Mike Chen und Weili Zhou (beide Robeco) verfasste Beitrag präsentiert grundlegende Einsichten zum maschinellen Lernen in der Vermögensverwaltung. Ergänzend hinzu ziehen wir den Artikel „Can Machines ‚Learn‘ Finance?“ von Ronen Israel, Bryan T. Kelly und Tobias J. Koskowitz (AQR Capital Management; Link ganz unten). 

  1. Unterschiede zu herkömmlichen Methoden

Zwar gibt es keine klare Grenzlinie zwischen herkömmlichen statistischen Verfahren und Konzepten des maschinellen Lernens. Dennoch bestehen Unterschiede in der Geeignetheit für bestimmte Aufgaben. Drei häufig genannte wesentliche Vorteile von ML gegenüber dem „klassischen“ linearen Modell sind: Die Möglichkeit, umfassend Interaktionen zwischen Variablen sowie nichtlineare Abhängigkeiten zu erfassen und die Fähigkeit zur Entdeckung neuer Zusammenhänge durch Analyse großer Datenmengen.

Interaktionseffekte

Klassische lineare Modelle setzen eine gewisse Unabhängigkeit der erklärenden Faktoren einer Größe (z.B. Rendite) untereinander voraus. Das ist bei Vorliegen eines Interaktionseffekts anders. In diesem Fall ist die Wirkung eines erklärenden Faktors A z.B. auf die Rendite vom Verhalten eines anderen erklärenden Faktors B abhängig. Zwar können Interaktionseffekte auch mit dem „klassischen“ Regressionsmodell abgebildet werden, aber geeignete ML-Ansätze tun dies aufgrund ihrer Flexibilität automatisch und in Bezug auf eine größere Zahl von Inputs.

Nichtlineare Effekte

Klassische statistische Verfahren modellieren lineare Zusammenhänge. Häufig sind Zusammenhänge in der Finanzwelt aber nichtlinear. Viele ML-Algorithmen, etwa neuronale Netze, können jedoch auch nichtlineare Zusammenhänge abbilden.

Studien finden, dass ein großer Teil der Outperformance von ML gegenüber klassischen Verfahren auf Interaktionseffekte zurückzuführen ist. Demnach ist ML besonders darin gut, komplexe Interaktionen abzubilden. Studien berichten auch von positiven Performance-Beiträgen nichtlinearer Effekte, jedoch wird dieser Befund nicht von allen geteilt.

Neue Zusammenhänge durch Daten-Mining

Mit hohen Erwartungen verbunden ist Data-Mining zur Entdeckung neuer, bisher unbekannter Zusammenhänge auf der Basis sehr großer Datenmengen. Das gilt vor allem für die Erschließung neuer qualitativer Datentypen (Texte usw.) und neuer Datenquellen (Soziale Medien) für die quantitative Analyse im Finanzbereich, weil hier oft noch keine feste Vorstellung darüber herrscht, welche Zusammenhänge für die Performance von Bedeutung sind. Allerdings kann Data-Mining zu Problemen (Reproduzierbarkeit / Overfitting) führen, worauf wir weiter unten eingehen.

  1. Herausforderungen der Anwendung von ML im Finanzbereich

Finanzmärkte unterscheiden sich von den meisten ursprünglichen Anwendungsdomänen der Künstlichen Intelligenz in mancherlei Hinsicht. Das könne sich, so Chen und Zhou, auf die KI-Anwendung im Finanzbereich effizienzmindern auswirken. Sie sprechen in diesem Kontext drei Herausforderungen an: Erstens: hohe Unbestimmtheit und Komplexität von Finanzdaten; zweitens ein Finanzmarkt-Datenvolumen weit unter dem „üblichen“ Big-Data-Niveau; drittens die adaptiv-reflexive, historische Natur der Finanzmärkte.

 

Die Frontpage der Private Banker Ausgabe 02/2023. Links die Frontpage mit niedrigem Signal-Rausch-Verhältnis. Das entspricht vielleicht den Verhältnissen auf manchen Finanzmärkten. Rechts die Frontpage mit hohem Signal-Rausch-Verhältnis, wie es für viele ML-Anwendungs-Domänen typisch ist, aber nicht für Finanzmärkte.

Geringes Signal-Rausch-Verhältnis

Finanzdaten haben ein deutlich niedrigeres Signal-Rausch-Verhältnis (signal-to-noise-ratio) als in den meisten anderen Domänen, in denen KI eingesetzt wird. Chen und Zhou geben allerdings keine formale Definition dieses nachrichtentechnischen Begriffs an. In der Finanzliteratur findet sich aber der Vorschlag, die signal-to-noise-ratio als Sharpe Ratio zu deuten (Signal: Mehrrendite über dem sicheren Zins; Noise: Volatilität). Was besagt nun ein geringes Signal-Rausch-Verhältnis? Gemeint ist damit die im Vergleich zu anderen KI-Anwendungen geringe Prognostizierbarkeit der Zielgrößen, hier der zukünftigen Renditen. Das erschwere es bei gleichzeitig sehr hoher Komplexität der Finanzmärkte auch für ML-Ansätze, die Zusammenhänge der Renditetreiber richtig zu „entziffern“.

Small Data vs. Big Data

ML ist vor allem in Domänen mit riesige Datenmengen überlegen. Von einem komplexen Finanzmarkt mit geringem Signal-Rausch-Verhältnis würde man Big-Data-Mengen erwarten. Das sei aber, so Chen und Zhou, nicht der Fall. Die Anzahl der quantitativen Beobachtungen sei im Finanzbereich in der Regel vergleichsweise gering. Chen und Zhou schätzen die Anzahl der monatlichen Datenpunkte für Wertpapiere auf vielleicht etwas über 1000. In anderen Bereichen verarbeite KI aber Milliarden oder Billionen von Datenpunkten. Insofern sei der Finanzmarkt eher ein „Small Data“-Bereich. Das ändere sich auch nicht massiv durch neue Datenquellen wie soziale Medien. Weil die Leistungsfähigkeit von ML entscheidend von Big Data abhänge, sei aufgrund der relativ geringen Datenmenge an Finanzmärkten auch eher mit Problemen etwa im Zusammenhang mit Overfitting (s.u.) zu rechnen. Daran könne auch ein elaborierter Algorithmus wenig ändern.

Stationäre Systeme vs. adaptive Märkte

In den angestammten ML-Domänen werden in der Regel statische Systeme betrachtet, die sich in ihren wesentlichen Eigenschaften nicht ändern. Finanzmärkte sind aber keine statischen Gleichgewichtssysteme, vielmehr wandeln sie sich in der Zeit und passen sich veränderten Bedingungen und Möglichkeiten an. Regeln und Strukturen am Markt verändern sich auch im Hinblick auf die Ertrags-Faktoren. Das kann aber schnell dazu führen, dass Marktausschnitte, an denen KI trainiert werden, keine ausreichend lange Geschichte haben oder strukturelle Neuerungen nicht erfassen können.

  1. Probleme und Fallen bei ML

Die eben genannten Herausforderungen verschärfen eine Reihe von Problemen, die bei AI- bzw. ML-Anwendungen regelmäßig auftreten. Chen und Zhou benennen fünf weit verbreitete „Fallen“, die Anwender von ML im Finanzbereich kennen sollten: Overfitting; Nicht-Replizierbarkeit; Vorausschau-Bias u. (ML-)Datenleck; Implementierungslücke; Zurechnungsprobleme.  

Overfitting

Die Small-Data-Konstellation und die häufig relativ kurzen Zeitreihen von Finanzdaten führen gerade bei vielen Input-Merkmalen schnell zu „Overfitting“. Overfitting entsteht, wenn das generierte Modell (z.B. Kurvenverlauf) zu stark an die Daten eines bestimmten Samples (zugrunde gelegter Datenausschnitt) angepasst wird. Wendet man das Modell dann auf ein anderes Sample an, erweist es sich relativ zu diesem als sehr schlecht angepasst. Um dem entgegenzuwirken gibt es verschiedene Strategien. Eine ist Anwendung von menschlicher Intuition und ökonomischer Sachkenntnis, indem Experten prüfen, ob die ML-Ergebnisse ökonomisch überhaupt Sinn machen.

Replizierbarkeit

Ein Problem der Wissenschaft, der Finanzwissenschaft, aber besonders eben auch von ML ist die Replizierbarkeit von Ergebnissen (vgl. unsere Studienseite in dieser Ausgabe zur Replikationskrise in der Finanzmarktforschung). Nicht-Replizierbarkeit – Ergebnisse können durch Andere (Forscher, Anwender usw.) nicht bestätigt werden – ist bei ML-Anwendungen gerade im Finanzbereich häufig zu beobachten. Gründe sind u.a.: die Vielzahl der berücksichtigen Variablen; Verwendung von online verfügbaren Fertig-Algorithmen ohne Kenntnis der Versionen; Implementierung ein und desselben Algorithmus in verschiedener Weise.

Auch für Replikationsprobleme wurden Gegenmittel ersonnen, die sind aber mit erheblichem zusätzlichem Aufwand der Spezifizierung, der Explikation und auch der Dokumentation verbunden.

Verzerrte Vorausschau, ML-Datenleck

Ein weiteres Problem sind Informationen, die in einer Anwendung vordatiert werden. Von einem Lookahead Bias spricht man, wenn eine Information auf einen Zeitpunkt vorverlegt wird, zu dem sie noch gar nicht verfügbar war. Wenn z.B. Quartalszahlen erst 40 Tage nach Quartalsende veröffentlicht wurden, dürfen sie in einer Zeitreihe nicht schon dem Quartalsende zugeordnet werden. Bei einem ML-„Datenleck“ (Data Leakage) werden Daten oder Merkmale für das Training eines ML-Algorithmus verwendet, die erst noch prognostiziert werden sollen. Das hat zur Folge, dass die Prognosegüte eines Modells überschätzt wird. Auch hier gibt es Techniken, um dem gegenzusteuern.

Implementierungslücke

Eine Implementierungslücke (implementation gap) ergibt sich, wenn ML im Backtest eine Investition selektiert, die sich aber in der Praxis nicht umsetzten lässt. Ein Beispiel wäre, dass sich im Backtest die Investition in Small und Micro Stocks als profitabel erweist, während in der Anlagerealität die Transaktionskosten zu hoch sind oder nicht ausreichend viele Aktien zur Verfügung stehen.

Erklärbarkeit und Performance-Zurechnung.

Ein Einwand gegen ML im Finanzbereich ist der Black-Box-Charakter. Der beschränkt das Verständnis für die komplexen Zusammenhänge im „Inneren“ der KI. Wenn nun Anleger wissen wollen, was den Erfolg/Misserfolg der KI-gesteuerten Geldanlage ausmacht, können Vermögensverwalter oft keine befriedigende Antwort geben. Eine mögliche Abhilfe sind erklärbare ML-Anwendungen, die für größere Transparenz sorgen.

  1. Anwendungsbeispiel Aktienkursprognose

Chen und Zhou präsentieren drei Anwendungsbeispiele für ML im Finanzbereich: Die Vorhersage von a) Aktienrenditen; b) Aktiencrashs; c) fundamentalen Variablen im Kontext der Sprachanalyse. Wir beschränken uns auf Fall a.

Studien zur Prognose des Aktienkurses durch ML erbrachten fünf Ergebnisse.

Erstens: ML-Algorithmen performen deutlich besser als traditionelle lineare Ansätze. Eine Studie errechnete für die Aktienprognose durch Neuronale Netze annualisiert eine (out of sample) Sharpe Ratio von 1,35 (Marktkapitalisierung-Gewichtung) bzw. 2,45 (gleichgewichtet). Im linearen Modell (OLS) waren es 0,61 bzw. 0,83.

Zweitens: Treiber der Outperformance sind neben den klassischen linearen Faktoren auch Abhängigkeiten höherer Ordnung wie vor allem Interaktion, aber auch Nichtlinearität.

Drittens: Merkmale mit guter Prognosequalität sind im Wesentlichen invariant gegenüber Änderung des ML-Algorithmus. Faktoren, die nach Untersuchungen von Robeco meist dominieren, sind: „Short-Term Reversals“, „Stock and Sector Return Momentum“, „Return Volatility“; „Size.“

Viertens: Einfache ML-Algorithmen outperformen kompliziertere ML Algorithmen. Denn aufgrund der kleinen Datenbasis im Finanzbereich ist bei einfachen ML-Algorithmen die Gefahr des Overfittings geringer.

Fünftens: Je mehr Daten verfügbar sind, umso besser performt ML.

Schluss

Zwei wesentliche Einsichten auf Basis der zugrunde gelegten Artikel möchten wir zum Schluss nochmals hervorheben.

Erstens: Künstliche Intelligenz und maschinelles Lernen auf dem Finanzmarkt unterscheiden sich von anderen Anwendungsbereichen teilweise deutlich. Eine Differenz ist Chen und Zhou zufolge, dass Finanzmärkte eher „Small-Data“- als „Big-Data“-Domänen sind. Erschwerend kommt die ungeheure Komplexität der sich wandelnden Finanzmärkte hinzu. Beides stellt eine Herausforderung für KI und ML dar.

Daraus folgt zweitens: Die KI des Maschinellen Lernens erfordert gerade im Finanzbereich eine betreuende menschliche (Experten-)Intelligenz (MI). KI bringt nur als KIMI-Hybrid maximale Leistung.

Damit stellt sich perspektivisch die spekulative Frage: wird MI im Bereich der Finanzmärkte für KI immer erforderlich sein, oder wird auch der bislang erforderliche MI-Anteil durch KI ersetzt (KIKI)?

Wie auch immer die Antwort auf diese Frage ausfällt, in einer Hinsicht dürfte sie ohne Bedeutung sein. Finanzmärkte sind Interaktionssysteme mit taktisch-strategischen Akteuren. Dabei kommt es nicht auf die absolute an, sondern auf die relative Intelligenz an. Auch reine KIKI-Anleger würden sich taktisch-strategisch zu den anderen KIKI-Anlegern verhalten. Dass es in der Welt der Halbgötter (KIKI) nicht unbedingt anders hergeht als in der Menschenwelt (MI), wussten bereits die alten Griechen.

Link zur Studie: On Machine Learning Applications in Investments

Link zur Studie: Can Machines „Learn“ Finance?

 

Zurück