Large Language Models zur Bilanzanalyse
Large Language Models (LLMs) können bei der Auswertung von Bilanzdaten und Prognose fundamentaler Unternehmensdaten effizienter als menschliche Analysten sein, zeigt ein Research Paper von Alex Kim, Maximilian Muhn und Valeri Nikolaev von der University of Chicago. Die Autoren haben standardisierte und anonymisierte Jahresabschlüsse durch GPT4 analysieren und Prognosen zur Entwicklung der künftigen Gewinne erstellen lassen, wobei jegliche textliche Erläuterungen wegfallen.
Die Komplexität für LLMs erwächst daraus, dass es sich um numerische Auswertungen handelt, bei denen die Modelle selbst Berechnungen durchführen und interpretieren müssen, um am Ende zu einem komplexen Urteil zu kommen. Im Regelfall erwächst das Verständnis von Zahlen aus dem qualitativen Kontext und ihnen fehlt das numerische Verständnis bzw. die Flexibilität eines menschlichen Geistes.
GPT Processing Details

Quelle: Kim, Muhn, Nikolaev, 2024
Das Sample umfasst die Jahresabschlüsse von insgesamt 15.401 Unternehmen über den Zeitraum 1968 bis 2021. Im ersten Schritt vergleichen die Autoren die Treffergenauigkeit bei der Prognose der direktionalen Gewinnveränderung zwischen dem LLM und menschlichen Analysten (Konsensprognose). Das von den Autoren mit entsprechenden Prompts geführte GPT erzielt selbst ohne zusätzliche qualitative oder branchenspezifische Informationen eine höhere Treffergenauigkeit als die Finanzanalysten. Im Vergleich mit speziell trainierten Machine-Learning-Ansätzen ist die Prognosegüte von GPT auf einem vergleichbaren Niveau, teilweise auch leicht besser. Insbesondere bei kleinen oder defizitären Unternehmen profitiert GTP von seiner menschenähnlicheren Denkweise und dem umfassenderen Wissen.
GPT vs. Human Analysts

Quelle: Kim, Muhn, Nikolaev, 2024
Zuletzt wird die ökonomische Nutzbarkeit untersucht, indem die Autoren die Fähigkeiten des LLM bei der Prognose des Aktienkurses testen. Es zeigt sich, dass ein auf den GPT-Ergebnissen basierender Long/Short-Ansatz erhebliche Alphas und höhere Share Ratios als der Gesamtmarkt generiert. Das Alpha im Fama-French-Drei-Faktormodell liegt beispielsweise bei über 12 % p.a.
Absolut Research unterstützt institutionelle Investoren bei der Bewertung eigener und der Selektion neuer Asset Managern mit der monatlich erscheinenden Publikationsreihe Absolut|ranking und den 360-Grad-Analysen (Peer-/ Benchmark-/ Factor-/ Asset-Flow-Analysen).
Insgesamt analysiert Absolut|ranking mehr als 16.000 aktive und passive Strategien von 2.000 Asset Managern, aufgeteilt auf 36 Asset-Klassen und Marktsegmente sowie mehr als 200 Universen. Individuelle Mandate und Spezialfonds können ebenfalls untersucht werden.