Trends der Forschung

Märkte, Märchen & Maschinen - Teil 2(3): Journalisten sagen Inflation überraschend gut voraus

Redaktion -

Aber meist ohne ihr Wissen, im Kollektiv und mit Hilfe von lernenden Maschinen. Zweiter Teil einer Serie in drei Teilen: Märkte, Märchen & Maschinen – Teil 2(3): Narrative und Inflationsprognose.

Erstausgabe 1889 Wall Street Journal

Das Jahr 2022 war das zweite Jahr in Folge, in dem Profiprognostiker und Zentralbank-Ökonomen die Inflationsentwicklung krass unterschätzten. Man könnte milde-phrasenhaft sagen: Experten dürfen auch mal irren. Aber die Mehrheit zwei Jahre hintereinander? Experten könnten daraufhin in die Offensive gehen und sagen: Experten müssen sich manchmal zwingend irren; in diesen Fällen ist eine richtige Vorhersage Privileg und Zeichen des Laienstandes. War es 2021 und 2022 so? Wir können auf die Gründe der jüngsten Inflationsprognose-Fehlschläge hier nicht näher eingehen. Dennoch kann man sich des Eindrucks nicht erwehren, dass neben einer Minderheit des Faches nicht wenige Journalisten den realen Inflations-Trend besser antizipierten als die Mehrheit der Berufs-Prognostiker. Der Haupteinwand lautet hier jedoch: Wer beim Prognosespiel Jahr für Jahr auf eine durch die Decke gehende Inflation setzt, hat eine durch die Decke gehende Inflation garantiert nicht „kommen sehen“, wenn sie einmal durch die Decke geht. Es wäre also „objektiv“ zu prüfen, ob beispielsweise journalistische Produkte die Inflation gar nicht so übel oder sogar besser vorhersagen als etablierte Vorhersageinstrumente. Allerdings haben wir mit diesem letzten Satz einen Sprung vollzogen, eine Verrückung, die eine wesentliche Differenz zu den vorherigen Sätzen der Einleitung markiert. Spätestens am Ende dieses Artikels wird klar geworden sein, was wir mit Verrückung meinen. Wir aber fragen zunächst: Eignen sich ökonomische Narrative für die Inflationsprognose?
 
Narrativ und Inflationsprognose
Diese Frage wurde in einer jüngst erschienen Studie untersucht. Konkreter fragten Y. Hong, F. Jiang, L. Meng und B. Xue, ob Narrative der Finanzpresse bessere Inflationsprognosen erlauben als einige gängige Vorhersage-Instrumente. Zu diesem Zweck unterzogen die Wissenschaftler 880.000 Artikel – das sind die Narrative – des Wall Street Journal (WSJ) im Zeitraum von Januar 1984 bis Mai 2021 der Analyse. Sie prüften dann, ob sich die WSJ-Artikel und -Nachrichtentexte für die Prognose der Inflation in Zeiträumen von 3, von 6, von 9 und von 12 Monaten eignen. Sie verwendeten dazu sieben Ansätze des maschinellen Lernens (ML), also fortgeschrittene statistische Verfahren, mit denen sich Texte analysieren und Bedeutungsunterschiede quantifizieren lassen.
Die Studienautoren erstellten dann Inflationsprognosen auf Basis der WSJ-Artikel bzw. Narrative und verglichen diese mit einer Benchmark-Prognose und mit vier gängigen Prognoseverfahren. Als Benchmark diente ein Random-Walk-Modell (RW-Modell). Die vier verbreiteten Prognose-Instrumente lassen sich in drei Kategorien einteilen: Erstens das sogenannte Autoregressive-(AR)-Modell (Beobachtungen über der Zeit korrelieren mit sich selber), wovon zwei Varianten zum Vergleich herangezogen wurden. Zweitens eine monatliche Haushaltsbefragung, der Survey „University of Michigan: Inflation Expectation“ (MICH). Drittens ein Makro-Schätzmodell, das auf einer Vielzahl von makroökonomischen Faktoren und riesigen Datenmengen beruht, die mit einem Maschinenlernansatz (Lasso-Regression) verarbeitet werden.
 
WSJ-Narrative: gute Inflations-Prognostiker
Was erbrachte die Analyse der vier Wissenschaftler?
Zunächst zu den verwendeten Maschinenlern-Ansätzen. Von den sieben für die Analyse der WSJ-Artikel verwendeten ML-Modellen schnitt das Verfahren „Random Forest (RF)“ bei der Inflationsprognose am besten ab.
Sowohl die Inflationsprognosen auf Basis der WSJ-Artikel wie auch die konventionellen Vorhersagemethoden schlugen die Benchmark (das Random-Walk-Modell).
Beim Vergleich mit den gängigen Vorhersage-Ansätzen waren die Narrativ-Prognosen bei der Schätzung der Inflation in 6, in 9 und in 12 Monaten besser. Die Inflation in 3 Monaten prognostizierte hingegen das Makro-Schätzverfahren am besten. Dieses war insgesamt der Haushaltsbefragung MICH und den beiden Autoregressive-(AR)-Modellen überlegen. Offenbar profitiert der Makroansatz von der riesigen Datenmenge, den vielen Faktoren und dem ML-Verfahren zur Analyse der Informationen. Umso mehr erstaunt, dass Narrative für Zeithorizonte zwischen 6 und 12 Monaten Prognosesieger waren. Die Inflationsschätzungen auf Narrativ-Basis waren umso besser, je länger der Prognosehorizont war. Das werten die Autoren als starkes Indiz dafür, dass die Artikel im WSJ vor allem längerfristige Trendfaktoren der Inflation sehr gut abbilden. Schließlich förderte die Studie zu Tage, dass in den beiden Rezessionsphasen 2008 ff (Weltfinanzkrise) und 2020 (Corona-Schock) die Inflationsprognosen auf Narrativ-Basis deutlich besser waren als in den anderen Zeitabschnitten. Insbesondere diese beiden Prognosephasen trugen entscheidend zum insgesamt vorteilhaften Abschneiden der Narrative im Vergleich bei.
 
Mehr-Information und Themenfelder der Prognose
In einer zusätzlichen statistischen Auswertung zeigte die Forschergruppe um Hong, dass Narrative die Nutzung von Informationen ermöglichen, für die andere Prognoseverfahren blind sind. Aber auch die sieben verwendeten ML-Ansätze waren unterschiedlich gute Informationsverwerter, wenn sie auf identische Texte angewandt wurden: Der ML-Ansatz „Random Forest“ extrahierte aus Artikeln die größte Menge inflationsrelevanter Information. Schließlich enthielt auch die emotionale Tönung der journalistischen Texte zusätzliche Information zur Inflation. Allerdings war das nur bei Prognosen der Inflation in 3 Monaten der Fall, nicht bei längeren Vorhersagezeiträumen. Die vier Wissenschaftler schließen daraus, dass die emotionale Signatur der WSJ-Artikel die kurzfristigen und schnellen Veränderungen der Makroumwelt abbildet.
Sachlich wurden die Artikel in Themenfelder zerlegt. Ein Themenfeld wurde über die 10 häufigsten einschlägigen Schlüsselbegriffe identifiziert. Im Themenfeld „Immobilienmarkt“ waren das zum Beispiel: Haus, Schlafzimmer, Miete usw. Generell hatten Themenfelder wie Energie, Immobilien oder Mittlerer Osten die größte Relevanz für die Güte der Inflationsprognose. Allerdings hing dies auch von der Wahl des Prognosezeitraums ab. Im Prognosezeitraum zwischen den nächsten 1 und 3 Monaten sowie zwischen 4 und 6 Monaten stand als Sachthema „Energie“ an Top-Position; bei 7 bis 9 Monaten waren es Blue Chips; bei 10 bis 12 Monaten stand der Immobilienmarkt an der Spitze. Die Studienautoren erklären diese Unterschiede damit, dass Energiepreise auch in kurzen Zeiträumen stark schwanken können, so dass sie vor allem kurzfristige Erwartungen abbilden. Demgegenüber bewegen sich Immobilienpreise langsamer und sind weniger volatil. Sie enthalten daher mehr Informationen, die für eine längerfristige Inflationsprognose von Bedeutung sind.
Schließlich zeigt die Untersuchung, dass sowohl Preissteigerungen einzelner Gütergruppen wie auch in den Texten enthaltene Aussagen zu Inflationserwartungen prognoserelevant waren. Nachrichten zu Preissteigerungen von Gütern verbesserten vor allem im Immobiliensektor die Prognosen.
 
Schluss
„Narrative“ in Gestalt von journalistischen Artikeln und Nachrichten des Wall Street Journal sind, wenn sie mit Hilfe von Ansätzen des Maschinenlernens analysiert werden, als Basis für Inflationsprognosen laut Studie vor allem in Rezessionsphasen sehr gut geeignet. Unter den getesteten ML-Modellen erwies sich der Random-Forest-Ansatz für die Vorhersage als überlegen. Narrative in Kombination mit ML schlugen im Wettbewerb der Inflationsvorhersagen ein Random-Walk-Modell sowie in den Prognosezeiträumen über 6, 9 und 12 Monate vier gängige Verfahren der Inflationsschätzung. Über 3 Monate gewann ein ML-Ansatz, der eine Vielzahl von Daten und Parametern erfasste.
Damit kommen wir zur „Verrückung“, zum Sprung, den wir in der Einleitung praktizierend erwähnten. Eingangs spielten wir auf Journalisten an, die ihre eigenen Inflationserwartungen formulieren. Dann fragten wir gegen Ende der Einleitung, ob journalistische Produkte die Inflation vielleicht ganz passabel vorhersagen können. Zwischen beiden Aussagen besteht eine Bedeutungsdifferenz, weshalb wir in der Einleitung einen kleinen semantischen Sprung machten. Im ersten Fall ist eine Inflationsprognose von Journalisten intendiert, sie formulieren sie explizit in ihrem Text. Im zweiten Fall ist das nicht erforderlich. Diesem Fall entsprechen auch die von der Studie untersuchten Narrative. Die Artikel decken das gesamte Themenspektrum des WSJ ab. Es ging also in der Studie nicht darum, die Prognosegüte von Texten zu testen, in denen Journalisten explizit eine Inflationsvorhersage wagen. Vielmehr ging es darum, aus einem Ensemble von (WSJ-)Artikeln über Wirtschaft, Finanzen, Politik etc. Informationen zu extrahieren, die eine gute Inflationsprognose erlauben. Hierzu sind aber Ansätze des Maschinenlernens erforderlich, um die in den Texten / Narrativen enthaltenden inflationsrelevanten Informationen überhaupt analytisch ans Tageslicht zu befördern. Insofern geht es um die Hebung von verborgenem Inflations-Wissen in WSJ-Artikeln mit Hilfe des maschinellen Lernens.
 
 

Zurück