INSIGHTS Research

Von Gavin Cheung, 03/08/2021

Das letzte Jahrzehnt hat eine Revolution im Bereich der KI erlebt, die auf Fortschritte im maschinellen Lernen (ML), Deep Learning und Computerarchitektur zurückzuführen ist.

Die jüngsten Entwicklungen wurden auf eine Vielzahl von Gebieten wie Computer Vision, Verarbeitung natürlicher Sprache, Wirkstoffforschung, Bioinformatik, autonomes Fahren und Weiterempfehlungssysteme angewandt.

Noch beeindruckender ist, dass einige dieser Systeme auf Ihrem privaten Laptop betrieben werden können. Die Abbildung unten zeigt zum Beispiel eine Demonstration von YOLOv3, das für die Objekterkennung in Echtzeit entwickelt wurde. Dieses System wird von einem komplexen Deep-Learning-Modell angetrieben, das auf seine Bedürfnisse zugeschnitten wurde, aber auf Ihrem Laptop ausgeführt werden kann.

Abbildung 1: Demonstration des Einsatzes von KI zur Objekterkennung.
Quelle: https://www.youtube.com/watch?v=BNHJRRUKMa4

Wenn man an die Schwierigkeiten denkt, die mit den Anwendungen in anderen Bereichen verbunden sind, stellt sich die Frage, was KI im Finanzbereich mit seiner erheblichen Komplexität und dem wirtschaftlichen Risiko, etwas falsch zu machen, leisten kann. Unser Ziel bei Arabesque AI ist es, KI für maßgeschneiderte, nachhaltige Investitionen zu nutzen. Wir implementieren KI in unserer Engine, die die Kursentwicklung von Aktien für einen bestimmten Zeitpunkt in der Zukunft prognostiziert.

In diesem Artikel gehen wir auf einige der Schwierigkeiten ein, mit denen wir bei der Anwendung des maschinellen Lernens im Finanzbereich konfrontiert sind.

Datenqualität

Das erste zu diskutierende Thema ist die Frage der Datenqualität. In der Finanzwelt ist die Fülle an Daten kein Problem. Daten können problemlos jede Sekunde aus einer Vielzahl von Quellen gesammelt werden, z. B. aus Instrumentenpreisen, Nachrichtenartikeln, Fundamentaldaten von Aktien, Social-Media-Beiträgen, makroökonomischen Daten, Satellitenbildern, ESG-Daten, Kreditkartentransaktionen, Besucherzahlen usw. Einige dieser Daten werden als strukturiert klassifiziert und haben typischerweise eine numerische Menge und eine klar definierte Struktur (z. B. Aktienkurse). Strukturierte Daten lassen sich relativ leicht in ein ML-Modell einspeisen. Andere, unstrukturierte Daten, weisen keine vordefinierte Struktur auf und erfordern häufig eine zusätzliche Verarbeitung, um aussagekräftige Informationen zu extrahieren (z. B. Nachrichtenartikel, Social-Media-Beiträge oder Bilder). Die Schwierigkeit der Informationsextraktion wird deutlich, wenn wir einen Nachrichtenartikel als Beispiel nehmen, in dem es um „Äpfel“ geht. Während ein Mensch relativ leicht erkennen würde, dass es in dem Artikel nicht um Apple (NYSE:AAPL), sondern um die Frucht „Äpfel“ geht, ist es nicht trivial, ein intelligentes System zu entwickeln, das diese Leistung nachbilden kann.

Die größere Sorge gilt nicht der Menge der Daten, sondern ihrer Qualität und ihrem Nutzen, insbesondere dem Signal-Rausch-Verhältnis des Datensatzes. In einem so komplexen System wie dem Aktienmarkt wird das Signal in der Realität stark vom Rauschen übertönt. Daher besteht unsere größte Herausforderung darin, ein intelligentes System zu entwickeln, das in diesem Meer aus Rauschen das aussagekräftige Signal extrahieren kann. Wir lösen diese Aufgabe in erster Linie mit mathematischen Werkzeugen und Techniken, um das Signal zuverlässig von stochastischen Schwankungen zu unterscheiden.

Datenqualität ist ein Thema in allen Bereichen der KI. Wie bereits erwähnt (z. B. Amazon), ist KI nur so gut wie die Daten, mit denen sie trainiert wird. Ein eher finanzspezifisches Problem, mit dem wir konfrontiert sind, hängt mit dem Zeitreihencharakter von Finanzdaten zusammen – d. h. Ereignisse am Dienstag müssen mit dem Wissen über andere Ereignisse am Montag analysiert werden.

Nichtstationarität

Der Zeitreihencharakter von Finanzdaten macht die Daten „nicht-stationär“. „Stationär“ bezieht sich auf Daten, die im Laufe der Zeit weitgehend gleich bleiben. Zum Beispiel könnten wir eine KI darauf trainieren, Bilder von Enten zu erkennen. Wenn wir der KI eine Reihe von Bildern von Enten zeigen, lernt sie, dass es sich wahrscheinlich um eine Ente handelt, wenn sie wie eine Ente aussieht, wie eine Ente schwimmt und wie eine Ente quakt. Das Wichtigste ist jedoch, dass die Bilder, egal ob sie aus dem Jahr 1900 oder 2000 stammen, ähnliche Merkmale enthalten, die von einer KI erkannt werden können. Diese Merkmale sind stationär und werden von der KI verwendet, um zu erkennen, was das Bild darstellt.

Vergleichen Sie dies mit Finanzdaten, die ein stark instationäres Verhalten aufweisen. Dieses Phänomen wird oft mit folgendem Mantra bezeichnet: „Die Performance der Vergangenheit ist keine Garantie für zukünftige Ergebnisse“. Es kann viele Muster geben, wie z. B. dass der Aktienkurs eines Unternehmens steigt, wenn die Sojabohnen-Futures fallen und die Anleihen steigen. Es gibt jedoch absolut keine Garantie dafür, dass dies in Zukunft wieder der Fall sein wird. Da KI ihre Entscheidungen meist auf der Grundlage von Ergebnissen aus der Vergangenheit trifft, stellt die sich ständig verändernde Natur des Finanzmarktes ein erhebliches Hindernis für jedes KI-System dar. Obwohl die Nicht-Stationarität ein großes Problem bei der Entwicklung eines KI-Systems darstellt, gibt es viele Möglichkeiten, ihre Auswirkungen zu verstehen und zu beheben. Dem begegnen wir zum Beispiel mit regelmäßigem Neutrainieren unserer Modelle sowie vielen anderen Schutzmaßnahmen.

Abbildung 2: Eine KI, die feststellt, ob es sich bei einem Bild um eine Ente handelt (oben), und eine KI, des Kurses entscheidet, ob eine Aktie gekauft oder verkauft werden soll (unten).

Selbstkorrektur

Wenn man davon ausgeht, dass man diese Probleme bewältigen kann, stellt sich als nächstes die Frage nach dem Zeitrahmen, in dem die KI profitable Ergebnisse erzielen kann. Fakt ist, dass der Finanzmarkt ein komplexes dynamisches System ist, das bei Sättigung alle profitablen Gelegenheiten automatisch korrigiert. Jedes vorhersehbare Muster, das eine KI finden könnte, wird möglicherweise irgendwann verwischt, wenn sich die Preise selbst korrigieren. Die einzige Lösung hierfür ist der Aufbau eines sich ständig weiterentwickelnden Systems, das mit dem dynamischen Markt Schritt halten kann. Bei Arabesque AI nehmen wir dieses Problem mit einem großen Team von Forschern in Angriff, um neue Ideen und modernste Technologien zu entwickeln, um ein KI-System für den Finanzbereich zu schaffen, das dem Test der Zeit standhalten kann.