Wie man Markov-Ketten nutzt, um jeden Trade zu gewinnen (Quant-Framework)

Ich werde erklären, wie Hedgefonds Markov-Ketten nutzen, um konsistent Trades mit hoher Wahrscheinlichkeit zu finden, und das genaue Framework teilen, das du heute aufbauen kannst.

Lass uns direkt loslegen.

Setze ein Lesezeichen – Ich bin Roan, ein Backend-Entwickler, der an Systemdesign, HFT-artiger Ausführung und quantitativen Handelssystemen arbeitet. Meine Arbeit konzentriert sich darauf, wie sich Vorhersagemärkte tatsächlich unter Last verhalten. Für Vorschläge, durchdachte Kooperationen oder Partnerschaften sind DMs offen.

Die meisten Trader sehen auf einem Chart den Preis.

Quants sehen auf demselben Chart etwas völlig anderes. Sie sehen eine Abfolge von Zuständen. Bull. Bear. Seitwärts. Jeder Zustand trägt seine eigene Wahrscheinlichkeit, zu bestehen oder in den nächsten überzugehen. Jeder Übergang wird von einer Mathematik gesteuert, die verwendet wurde, um alles von Kreditausfällen über DNA-Sequenzen bis hin zu Googles ursprünglichem PageRank-Algorithmus zu modellieren.

Das Framework heißt Markov-Kette. Und es ist eines der vielseitigsten und am wenigsten genutzten Werkzeuge im systematischen Handel.

Während die meisten Privatanleger Unterstützungslinien zeichnen und den RSI beobachten, bauen die quantitativen Forschungsteams bei Firmen wie Citadel und Two Sigma Regimewechselmodelle, die nicht nur verstehen, wo der Markt ist, sondern wohin er als Nächstes am wahrscheinlichsten geht, basierend darauf, wo er war. Die Mathematik hinter diesen Modellen beginnt genau hier.

Ich habe bereits das komplette Framework zur Implementierung neuronaler Netze für den Aufbau von Machine-Learning-Trading-Signalen geschrieben. Dieser Artikel ist der logische Begleiter zu diesem hier.

Am Ende dieses Artikels wirst du genau verstehen, was eine Markov-Kette ist und warum sie das Marktverhalten besser abbildet als jeder einzelne Indikator, wie man ein vollständiges Zustandsübergangsmodell aus echten Marktdaten erstellt, wie man die Wahrscheinlichkeit jedes zukünftigen Marktzustands mit nichts weiter als Matrixmultiplikation berechnet, die vollständige Implementierungspipeline von Rohpreisdaten zu Live-Trading-Signalen und die genauen Fehler, die dazu führen, dass die meisten Markov-Ketten-Modelle in Live-Märkten scheitern.

Hinweis: Dieser Artikel ist bewusst lang. Jeder Teil baut auf dem vorherigen auf. Wenn du ernsthaft daran interessiert bist, deinem Trading einen echten quantitativen Vorteil zu verschaffen, lies jedes einzelne Wort. Wenn du nach einer Abkürzung suchst, ist dies nichts für dich.

Teil 1: Warum Unabhängigkeit scheitert und wo Markov-Ketten beginnen

Bevor du etwas mit Markov-Ketten aufbauen kannst, musst du das grundlegende Problem verstehen, das sie lösen sollen.

Die meisten einfachen Wahrscheinlichkeitsmodelle nehmen Unabhängigkeit an. Jedes Ereignis wird so behandelt, als hätte es keine Verbindung zu dem, was davor kam. Würfeln. Das Ergebnis von Wurf 100 hat nichts mit Wurf 99 zu tun. Jeder Wurf ist völlig unabhängig.

Märkte funktionieren nicht so.

Stell dir vor, du modellierst ein Portfolio von Krediten. Jeder Kredit kann zu jedem Zeitpunkt in einem von vier Zuständen sein: aktuell, 30 bis 59 Tage überfällig, 60 bis 89 Tage überfällig oder 90+ Tage überfällig. Du möchtest modellieren, wie sich dieses Portfolio im Laufe der Zeit entwickelt. Also versuchst du den einfachsten Ansatz. Du modellierst jeden Monat unabhängig. Du ziehst aus der historischen Verteilung jedes Zustands.

Einen Monat später sagt dein Modell, dass einige Kredite, die letzten Monat aktuell waren, jetzt 90+ Tage überfällig sind.

Das ist mathematisch unmöglich. Ein Kredit kann in einem einzigen 30-Tage-Zeitraum nicht von aktuell zu 90+ Tage überfällig springen. Die naive Unabhängigkeitsannahme hat ein Modell erzeugt, das die Realität verletzt.

Genau dieses Problem lösen Markov-Ketten. Anstatt anzunehmen, dass jeder Schritt unabhängig von allem ist, was davor kam, führt eine Markov-Kette eine lokale bedingte Abhängigkeit ein. Der nächste Zustand hängt vom aktuellen Zustand ab. Nicht von allem, was vor zehn Schritten passiert ist. Nur davon, wo du dich gerade befindest.

Formal ist eine Folge von Zufallsvariablen X₀, X₁, X₂, ... eine Markov-Kette, wenn sie die Markov-Eigenschaft erfüllt:

P(Xₙ₊₁ = s | X₀, X₁, ..., Xₙ) = P(Xₙ₊₁ = s | Xₙ)

Die Wahrscheinlichkeit des nächsten Zustands hängt nur vom aktuellen Zustand ab, nicht von der gesamten Geschichte. Diese eine Eigenschaft macht Markov-Ketten gleichzeitig handhabbar und leistungsstark. Sie erfassen die wesentliche Abhängigkeitsstruktur eines Prozesses, ohne dass du die gesamte Geschichte verfolgen musst.

Für Finanzmärkte übersetzt sich das direkt. Die Wahrscheinlichkeit, dass sich der Markt nächsten Monat in einem Bullen-Regime befindet, hängt davon ab, ob er sich diesen Monat in einem Bullen-, Bären- oder Seitwärts-Regime befindet. Nicht davon, was vor zwei Jahren passiert ist. Der aktuelle Zustand trägt alle relevanten Informationen, die du benötigst, um den nächsten Zustand vorherzusagen.

Dies ist keine Vereinfachung aus Bequemlichkeit. Es ist eine mathematisch fundierte Annahme, die, wenn sie richtig angewendet wird, Modelle erzeugt, die deutlich genauer sind als naive Unabhängigkeit, während sie rechnerisch handhabbar bleiben.

Teil 2: Aufbau des Zustandsraums und der Übergangsmatrix

Der erste praktische Schritt beim Aufbau eines Markov-Ketten-Handelsmodells ist die Definition deiner Zustände. Das ist wichtiger, als die meisten Praktiker erkennen.

Für Finanzmärkte umfassen gängige Zustandsdefinitionen:

Volatilitätsregime: Niedrige Volatilität, mittlere Volatilität, hohe Volatilität, definiert durch gleitende realisierte Volatilitätsschwellen.

Trendregime: Bull, Bear, Seitwärts, definiert durch die Position des Preises relativ zu gleitenden Durchschnitten oder durch das Vorzeichen und die Größe der jüngsten Renditen.

Liquiditätsregime: Hohe Liquidität, niedrige Liquidität, definiert durch Geld-Brief-Spannen oder Orderbuchtiefe.

Kreditregime: Risk-on, Risk-off, definiert durch Kreditspannen oder assetübergreifende Korrelationen.

Für eine konkrete Startimplementierung eignet sich ein Drei-Zustands-Marktregime-Modell gut. Definiere:

Zustand 0 als Bull: Die 20-Tage-Rendite liegt über einem positiven Schwellenwert. Zustand 1 als Bear: Die 20-Tage-Rendite liegt unter einem negativen Schwellenwert. Zustand 2 als Seitwärts: alles dazwischen.

Die wichtigste Anforderung ist, dass deine Zustände sich gegenseitig ausschließen und gemeinsam erschöpfend sein müssen. Jede Beobachtung muss zu jedem Zeitpunkt genau in einen Zustand fallen. Keine Lücken und keine Überlappungen.

Sobald du deine Zustände definiert hast, musst du die Übergangswahrscheinlichkeiten zwischen ihnen schätzen. Das ist die Übergangsmatrix. Jeder Eintrag P(i,j) repräsentiert die Wahrscheinlichkeit, in einem Zeitschritt von Zustand i zu Zustand j zu wechseln.

Die Übergangsmatrix für ein Drei-Zustands-Modell sieht so aus:

P = | P(0,0) P(0,1) P(0,2) | | P(1,0) P(1,1) P(1,2) | | P(2,0) P(2,1) P(2,2) |

Jede Zeile muss genau 1,0 ergeben, denn von einem gegebenen Zustand aus muss das System im nächsten Schritt in einen Zustand übergehen, einschließlich des Verbleibs im selben Zustand.

Der Maximum-Likelihood-Schätzer für jede Übergangswahrscheinlichkeit ist wunderbar einfach. Zähle, wie oft das System von Zustand i zu Zustand j übergegangen ist. Teile durch die Gesamtzahl der Übergänge aus Zustand i:

P̂(i,j) = Anzahl(i → j) / Anzahl(i → beliebiger Zustand)

Genau so würdest du intuitiv eine Wahrscheinlichkeit schätzen. Es ist auch das, was die vollständige Herleitung des Maximum-Likelihood-Schätzers liefert, wenn du die Log-Likelihood-Funktion für Markov-Ketten-Daten maximierst. Die intuitive Antwort und die mathematisch strenge Antwort sind identisch.

Hier ist die vollständige Python-Implementierung:

Die Übergangsmatrix, die du aus diesem Prozess erhältst, ist die Karte deines Marktes. Jeder Eintrag sagt dir die Wahrscheinlichkeit, zwischen zwei bestimmten Regimen zu wechseln. Sie ist die Grundlage für alles, was folgt.

Teil 3: Berechnung mehrstufiger Übergangswahrscheinlichkeiten

Hier werden Markov-Ketten als Handelswerkzeug wirklich leistungsstark.

Du hast jetzt die einstufige Übergangsmatrix P. Aber was du als Trader wirklich wissen willst, ist nicht nur, was nächsten Monat passiert. Du willst wissen, wie der Markt in drei Monaten, sechs Monaten, zwölf Monaten wahrscheinlich aussehen wird. Du willst die Wahrscheinlichkeit wissen, heute in einem Bullen-Regime zu starten und nach zwölf Übergängen in einem Bären-Regime zu landen.

Hier kommt die Chapman-Kolmogorov-Gleichung ins Spiel. Sie besagt, dass die n-stufige Übergangswahrscheinlichkeit von Zustand i zu Zustand j der (i,j)-Eintrag der Matrix P hoch n ist:

P^(n)(i,j) = [Pⁿ]ᵢⱼ

Das war's. Um die Wahrscheinlichkeit des Übergangs von einem beliebigen Zustand zu einem anderen in n Schritten zu berechnen, multiplizierst du die Übergangsmatrix einfach n-mal mit sich selbst und liest den entsprechenden Eintrag ab.

Das ist ein außergewöhnlich elegantes Ergebnis. Die gesamte mathematische Komplexität der Berechnung von Pfaden durch einen Zustandsraum über mehrere Schritte reduziert sich auf eine einzige Matrixpotenz.

Was dir das als Trader sagt, ist konkret und umsetzbar. Wenn du dich derzeit in einem Bullen-Regime befindest, kannst du jetzt quantifizieren, wie wahrscheinlich es ist, dass du in 12 Monaten immer noch in einem Bullen-Regime bist, im Vergleich zu einem Wechsel zu Bär oder Seitwärts. Diese Wahrscheinlichkeit beeinflusst deine Positionsgrößenbestimmung, deine Absicherungsentscheidungen und deine Strategieallokation.

Es gibt eine weitere kritische Ausgabe aus diesem Framework: die stationäre Verteilung. Wenn n sehr groß wird, konvergiert die Verteilung über die Zustände zu einem festen Vektor π, unabhängig vom Startzustand:

π = π × P

Die stationäre Verteilung sagt dir den langfristigen Anteil der Zeit, den der Markt in jedem Regime verbringt. In der Praxis löst du nach π mit:

Die stationäre Verteilung ist deine langfristige Basislinie. Jede Strategie, die stark auf ein Regime setzt, das die stationäre Verteilung als selten ausweist, geht ein erhebliches Extremrisiko ein. Die Kenntnis der langfristigen Regimeanteile ist für das Strategiedesign unerlässlich.

Teil 4: Vom Regimemodell zum Handelssignal

Ein Regimemodell zu haben, ist keine Handelsstrategie. Es in eine umzuwandeln, erfordert, die Regimewahrscheinlichkeiten mit konkreten Positionsentscheidungen zu verknüpfen.

Die Kernidee ist: Die Markov-Kette liefert dir zu jedem Zeitpunkt eine Wahrscheinlichkeitsverteilung über zukünftige Zustände. Dein Handelssignal ist eine Funktion dieser Verteilung.

Der einfachste Ansatz ist die direkte regimespezifische Allokation. Wenn das Modell sagt, du befindest dich in einem Bullen-Regime, gehe long. Wenn Bär, gehe short oder flach. Wenn Seitwärts, reduziere die Positionsgröße.

Ein anspruchsvollerer Ansatz verwendet den vollständigen Wahrscheinlichkeitsvektor als Eingabe für die Positionsgrößenbestimmung. Der aktuelle Zustandsverteilungsvektor π_t repräsentiert deine Wahrscheinlichkeitsallokation über die Regime zum Zeitpunkt t. Du kannst eine Position konstruieren, die proportional zu deinem Vertrauen in jedes Regime ist:

Die Walk-Forward-Struktur im obigen Backtest ist entscheidend. Du schätzt die Übergangsmatrix bei jedem Schritt neu, wobei du nur die zu diesem Zeitpunkt verfügbaren historischen Daten verwendest. Du verwendest niemals zukünftige Informationen, um vergangene Wahrscheinlichkeiten zu schätzen. Das ist der Unterschied zwischen einem realistischen Backtest und einem, der im Live-Handel garantiert enttäuschen wird.

Teil 5: Die vollständige Implementierungspipeline und kritische Einschränkungen

Dieser Abschnitt setzt alles zu einem produktionsreifen Markov-Ketten-Handelssystem zusammen und behandelt die Annahmen, die darüber entscheiden, ob dein Modell den Kontakt mit Live-Märkten überlebt.

Vollständige Systemimplementierung:

Die drei Annahmen, die du vor dem Einsatz verstehen musst:

Die erste ist die Markov-Eigenschaft selbst. Das Modell nimmt an, dass der nächste Zustand nur vom aktuellen Zustand abhängt, nicht von einer längeren Geschichte. In der Realität weisen Märkte manchmal längerfristige Abhängigkeiten auf. Ein Trend, der seit sechs Monaten läuft, kann andere Übergangswahrscheinlichkeiten haben als einer, der gerade erst begonnen hat. Du kannst dies teilweise adressieren, indem du deinen Zustandsraum um Dauerinformationen erweiterst, was die Komplexität jedoch erheblich erhöht.

Die zweite ist die Zeithomogenität. Das Modell nimmt an, dass die Übergangswahrscheinlichkeiten im Laufe der Zeit konstant sind. Das sind sie nicht. Die Wahrscheinlichkeit, dass ein Bullen-Regime in ein Bären-Regime übergeht, war 2008 ganz anders als 2021. Die Standardmaßnahme ist die Neuschätzung mit gleitendem Fenster, die du bereits im Walk-Forward-Backtest oben gesehen hast. Kürzere Fenster passen sich schneller an, erzeugen aber verrauschtere Schätzungen. Längere Fenster liefern stabilere Schätzungen, hinken aber Regimewechseln hinterher.

Die dritte ist ausreichende Daten für eine zuverlässige Schätzung. Der Maximum-Likelihood-Schätzer konvergiert gegen die wahren Übergangswahrscheinlichkeiten, je mehr Übergänge du beobachtest. Bei wenigen Beobachtungen, insbesondere für seltene Übergänge, werden deine Schätzungen verrauscht und unzuverlässig sein. Überprüfe immer, dass jede Zelle deiner Übergangsmatrix aus mindestens 20 bis 30 beobachteten Übergängen geschätzt wurde. Wenn nicht, erwäge, Zustände zusammenzulegen oder deinen Datenzeitraum zu verlängern.

Teil 6: Hidden-Markov-Modelle – Das Framework weiterentwickeln

Jede Annahme im bisherigen Modell hat eines gemeinsam. Du hast angenommen, dass du das Regime sehen kannst.

Du hast jeden Tag als Bull, Bear oder Seitwärts anhand rollierender Renditen gekennzeichnet. Aber das Regime war nie direkt beobachtbar. Du hast es aus dem Preis rekonstruiert. Das ist nicht dasselbe. Ein Bären-Regime, das sich noch nicht in den Preisen gezeigt hat, weil sich die institutionelle Positionierung leise unter der Oberfläche verschiebt, ist für deine Zustandskennzeichnungen völlig unsichtbar.

Das ist die Kernbeschränkung beobachtbarer Markov-Ketten. Hidden-Markov-Modelle beheben das.

In einem HMM ist das wahre Regime ein verborgener Zustand, den du nicht beobachten kannst. Was du beobachten kannst, ist die Renditesequenz. Jeder verborgene Zustand erzeugt Renditen aus seiner eigenen Verteilung. Das Bullen-Regime erzeugt Renditen mit einem positiven Mittelwert und geringer Varianz. Das Bären-Regime erzeugt Renditen mit einem negativen Mittelwert und hoher Varianz. Das Modell lernt gleichzeitig die Regimeübergänge und die Renditeverteilungen, allein aus Preisdaten, ohne dass du jemals einen Tag von Hand kennzeichnen musst.

Es gibt zwei Algorithmen, die dies ermöglichen.

Der erste ist Baum-Welch. Dies ist der Algorithmus, der alle Modellparameter aus der beobachtbaren Renditesequenz schätzt. Du gibst Renditen ein. Er lernt die Übergangsmatrix, die Renditeverteilung für jedes Regime und die Startwahrscheinlichkeiten, alles ohne gekennzeichnete Daten. Er läuft vorwärts durch die Sequenz, berechnet Wahrscheinlichkeiten, dann rückwärts, um sie zu verfeinern, und wiederholt dies bis zur Konvergenz.

Der zweite ist Viterbi. Sobald du ein angepasstes Modell hast, dekodiert Viterbi die wahrscheinlichste Sequenz verborgener Regime, die deine beobachteten Renditen erzeugt hat. Es gibt dir keine weichen Wahrscheinlichkeiten. Es gibt dir den einzigen besten Pfad durch den verborgenen Zustandsraum.

Die Signalerzeugung ist identisch mit Teil 4. Bei jedem Schritt berechnest du die Wahrscheinlichkeit, sich gerade in jedem Regime zu befinden. Du multiplizierst diesen Vektor mit der Übergangsmatrix, um die Ein-Schritt-Vorhersage zu erhalten. Bull-Wahrscheinlichkeit minus Bear-Wahrscheinlichkeit ergibt deine Position.

Zwei Dinge, die du beachten solltest, bevor du dies einsetzt.

Baum-Welch findet ein lokales Maximum, kein globales. Führe es immer mit mehreren zufälligen Starts aus und behalte das Modell mit der höchsten Log-Likelihood. Die Standardeinstellung mit einer einzigen Initialisierung führt häufig zu suboptimalen Regimezuweisungen.

Die Emissionsvariablen, die du wählst, sind wichtiger als jede andere Designentscheidung. Renditen allein tragen nur begrenzte Informationen über das wahre wirtschaftliche Regime. Renditen kombiniert mit realisierter Volatilität, Kreditspannen und VIX-Terminstruktur geben dem Modell ein viel reichhaltigeres Signal. Die Wahl dessen, was als Beobachtungen eingespeist wird, ist der Punkt, an dem Domänenwissen die Mathematik verstärkt.

Die beobachtbare Markov-Kette hat dir eine Regimekarte gegeben. Das Hidden-Markov-Modell erstellt diese Karte in Echtzeit aus verrauschten Signalen, ohne einen einzigen manuell gekennzeichneten Datenpunkt zu benötigen. In diese Richtung haben sich institutionelle Regimewechselmodelle bewegt. Du hast jetzt das vollständige Framework, um eines zu bauen.

Zusammenfassung

Markov-Ketten sagen nicht die Zukunft voraus. Was sie tun, ist etwas Nützlicheres. Sie quantifizieren die Wahrscheinlichkeit jedes möglichen zukünftigen Zustands, gegeben den aktuellen Zustand. Sie liefern dir eine mathematische Karte der Marktregime und der Wahrscheinlichkeit, zwischen ihnen zu wechseln.

Das Framework ist an einem Wochenende vollständig implementierbar. Die Übergangsmatrix wird aus historischen Daten in einer Handvoll Python-Zeilen geschätzt. Die Chapman-Kolmogorov-Gleichung liefert dir n-Schritt-Vorhersagen durch eine einzige Matrixpotenz. Die stationäre Verteilung sagt dir die langfristige Basislinie. Und der Walk-Forward-Backtest sagt dir, ob dein Modell echte Vorhersagekraft hat oder Rauschen anpasst.

Die Annahmen sind real und sie sind wichtig. Die Zeithomogenität wird verletzt. Die Markov-Eigenschaft ist eine Näherung. Schätzfehler sind immer vorhanden. Aber als erstes Passmodell und als Baustein für anspruchsvollere Hidden-Markov-Modell-Erweiterungen wurde dieses Framework bei echten Firmen in Produktion eingesetzt und hat echten Mehrwert generiert.

Du hast jetzt die vollständige Implementierung. Der Code steht in diesem Artikel. Die Mathematik wird von Grund auf erklärt. Die kritischen Einschränkungen sind dokumentiert, sodass du genau weißt, wo das Modell versagen kann und wie du diese Fehler abmildern kannst.

Hier ist die Frage, mit der ich dich zurücklassen möchte.

Das Markov-Ketten-Modell definiert Regime basierend auf beobachtbarem Preisverhalten. Aber die wichtigsten Marktregime, diejenigen, um die institutionelle Trader tatsächlich handeln, werden oft von latenten Faktoren wie Kreditbedingungen, geldpolitischer Haltung und Risikobereitschaft getrieben, die in Preisdaten allein nicht direkt sichtbar sind. Wenn du ein Hidden-Markov-Modell für Märkte entwerfen würdest, welche beobachtbaren Signale würdest du als deine Emissionsvariablen verwenden und warum?

Gib deine Antwort in den Kommentaren.

Es gibt keine falsche Antwort, aber es gibt sehr aufschlussreiche.