Ich habe den Open-Source-Algorithmus von X analysiert und 7 Variablen gefunden, die Creator beeinflussen können

Ich habe den Empfehlungsalgorithmus von X ausgeführt, der im Mai als Open Source veröffentlicht wurde, und festgestellt, dass der Open-Source-Teil nur 30 % des tatsächlichen Feed-Rankings erklärt. Die restlichen 70 % stecken in serverseitigen Konfigurationen, dem VM Ranker und Betriebsregeln.

Aber diese 30 % öffentlicher Code reichen aus, um eine Frage zu beantworten: Was können Creators tatsächlich kontrollieren?

Ursprüngliches Repository: xai-org/x-algorithm (Stand 15. Mai, hinzugefügt 187 Dateien und 18.263 Zeilen Code)

Dieser Artikel wiederholt nicht die Algorithmenübersicht (die beiden Beiträge von Punk2898 sind bereits sehr vollständig), sondern konzentriert sich auf drei Dinge:

1️⃣ Kontraintuitive Phänomene, die ich beim Ausführen der Pipeline beobachtet habe

2️⃣ Die Mechanismen im Mai-Code-Update, die die größte Auswirkung auf Creators haben

3️⃣ Konkrete Handlungsempfehlungen basierend auf diesen Beobachtungen

Beobachtung 1: Open-Source-Ranking und der echte Feed haben nahezu null Korrelation

Ich habe mit dem Phoenix-Modell einen Korpus von 537.000 Sportbeiträgen ausgeführt. Der vom Modell ausgegebene Bewertungsbereich lag zwischen 0,0000 und 0,0015, extrem flach. Die vorhergesagten Wahrscheinlichkeiten für Fav, Antwort und RT lagen alle nahe null; das Ranking stützte sich hauptsächlich auf Dwell (Verweildauer) als Signal, um eine Lücke zu erzeugen.

Dann scrapete ich den echten „Für dich"-Feed zum Vergleich. Mit Kendalls Tau zur Berechnung der Rangkorrelation ergab sich ein Wert von -0,10.

Diese Zahl bedeutet: Die Verwendung der Demo-Gewichtungen im Open-Source-Code (fav1.0 + reply0.5 + RT0.3 + dwell0.2) zur Vorhersage des tatsächlichen Feed-Rankings, das du siehst, ist etwa so genau wie zufälliges Raten.

Im echten Feed erscheinen Beiträge mit null Interaktion in den Top 7, während Beiträge mit hoher Interaktion auf Platz 9 oder 10 zurückgedrängt werden. Brandneue Beiträge, die innerhalb von 3 Minuten mit null Interaktion veröffentlicht wurden, können ebenfalls in den Feed gelangen.

Was bedeutet das?

Es bedeutet, dass das Open-Source-Phoenix-Modell nur für das „anfängliche Kandidaten-Screening" verantwortlich ist. Was wirklich deine Position im Feed eines anderen bestimmt, sind die nachfolgenden Re-Ranking-Ebenen. Der im Mai als Open Source veröffentlichte Code vervollständigt zufällig die Logik für diese Re-Ranking-Ebenen.

Beobachtung 2: Ein Qualitäts-Score von 0,4 ist die unsichtbare Grenze zwischen Leben und Tod

Das im Mai neu hinzugefügte Grox-Modul ist der wichtigste Teil dieses Updates. Es ersetzt nicht Phoenix; es ist Phoenixs vorgelagerter Lieferant. Nachdem jeder neue Beitrag gesendet wurde, verwendet Grox ein VLM-Großmodell, um 5 Dinge zu tun:

Einen Qualitäts-Score zuweisen (quality_score, 0 bis 1)
7 boolesche Tags generieren (Erwachseneninhalte, Gewalt, Hassrede usw.)
Einen Slop-Score zuweisen (slop_score, Stufen 1-3)
Multimodale Einbettungsvektoren generieren
PTOS-Sicherheitsprüfung durchführen

Der Code besagt klar: quality_score >= 0,4 ist erforderlich, um das anfängliche Screening zu bestehen. Alles unter 0,4 wird als „gering Qualität" gekennzeichnet, und die anschließende Verbreitung wird überall behindert.

Diese 0,4-Grenze wird vom VLM-Modell beurteilt, nicht durch Schlüsselwortabgleich. Es kann die Bedeutung deines Textes, den Inhalt deiner Bilder und Videobilder verstehen. Regelwerke, die zuvor durch „Bilder hinzufügen und Schlüsselwörter stapeln" ausgetrickst werden konnten, funktionieren nicht mehr.

slop_score ist eine weitere neue Waffe: Vorlageninhalte, geringe Informationsdichte und Beiträge mit offensichtlichen KI-generierten Spuren erhalten hohe Bewertungen. Stufe 1 ist normal; Stufen 2-3 bedeuten, dass der Algorithmus denkt, dass du Inhalte „verwässerst".

Beobachtung 3: Wegwischen ist eine aktive Strafe, nicht nur „nicht sehen"

Die Mai-Version hat die Verhaltenssignale von 18 diskreten Heads auf 19 diskrete Heads + 8 kontinuierliche Auxiliary Heads hochgestuft. Die neuen kontinuierlichen Heads sagen feinkörnige Metriken wie „wie lange geblieben" und „Leserate" voraus.

Aber das Signal mit der größten Auswirkung auf Creators ist: not_dwelled.

Früher dachten wir, „keine Benutzerinteraktion" sei neutral, gleichbedeutend mit nicht gesehen werden. Falsch. Ein Benutzer, der schnell an deinem Beitrag vorbeiscrollt, ist ein aktives negatives Signal, und der Algorithmus wird dich dafür bestrafen.

Das bedeutet:

Versagen, die Aufmerksamkeit in der ersten 1 Sekunde eines Videos zu erregen = aktive Strafe
Ein uninteressanter erster Satz in einem langen Beitrag = aktive Strafe
Bilder ohne visuelle Wirkung = aktive Strafe

Während ich den echten Feed beobachtete, bemerkte ich ein Phänomen: Einige Null-Interaktionsbeiträge schafften es in die Top 7, während einige hochinteraktive Beiträge zurückgedrängt wurden. Eine plausible Erklärung ist: Diese Null-Interaktionsbeiträge wurden, obwohl sie nicht geliked wurden, tatsächlich von den Benutzern verweilt (erzeugten ein Dwell-Signal), während einige Beiträge, die gut aussehen, tatsächlich eine große Anzahl schneller Wegwischer hatten.

Beobachtung 4: Wem du folgst, bestimmt, in welchen Kreis der Algorithmus dich einordnet

Der Mai-Code hat mutual_follow_jaccard_hydrator hinzugefügt, der die „Ähnlichkeit des gegenseitigen Follow-Kreises zwischen dir und einem bestimmten Autor" berechnet.

Wenn du und ein Autor vielen der gleichen Personen folgen (hoher Jaccard-Koeffizient), betrachtet der Algorithmus dich als im selben „Informationskreis" und ist eher geneigt, deren Inhalte dir zu pushen.

Dieser Mechanismus ändert eine grundlegende Annahme: Früher galt „Inhaltsqualität bestimmt Verbreitung"; jetzt gilt „Inhaltsqualität + Kreiszugehörigkeit bestimmen gemeinsam die Verbreitung".

Im Einzelnen:

Jedes Konto, dem du folgst, berechnet deine Kreisidentität
Zufälliges Folgen verwässert deine Kreis-Tags
Gegenseitiges Folgen mit KOLs im selben Bereich ist weitaus effektiver als einseitiges Folgen von 100 zufälligen Konten
Hochwertige Kommentare unter großen V-Posts gelangen in die following_replied_users-Signalkette, und dein Avatar könnte im Hinweis „Personen, denen du folgst, haben auch hier kommentiert" erscheinen

Mein eigener „Für dich"-Feed bestätigt dies: Über 60 % der empfohlenen Inhalte stammen von Creators im chinesischen KI-Kreis, weil meine Follow-Liste in diesem Kreis konzentriert ist.

Beobachtung 5: Der Kommentarbereich ist jetzt eine unabhängige Spur

Der Mai-Code offenbarte ein unabhängiges Bewertungssystem für den Kommentarbereich offen. Jeder Kommentar wird von Grok mit 0-3 bewertet:

3 Punkte: Kommentare mit Informationszuwachs, die Diskussionen auslösen können
2 Punkte: Normale Interaktion
1 Punkt: Kurz, aber kein Spam
0 Punkte: Löst den Spam-Tag aus, beeinflusst die Kontoguthaben

Ein 0-Punkte-Kommentar wird nicht nur eingeklappt; er hinterlässt einen Eintrag auf deinem Konto, dass du „einmal einen Spam-Kommentar gepostet hast". Langfristige Ansammlung kann dein gesamtes Kontogewicht beeinträchtigen.

Gleichzeitig beeinflussen Spam-Kommentare unter deinem Beitrag auch das Gewicht des Hauptbeitrags. Kommentare wie „folge für folge", „erster" oder „+1" – der Algorithmus mag sie nicht nur nicht; er senkt die Verbreitung deines Hauptbeitrags wegen ihnen.

Umgekehrt kann der Belichtungswert eines hochwertigen Kommentars größer sein, als selbst 10 gewöhnliche Beiträge zu posten. Einen datengestützten, diskussionsauslösenden Kommentar unter dem Beitrag eines großen V zu hinterlassen, ist gleichbedeutend mit der Ausleihe des Verkehrseingangs des großen V.

Beobachtung 6: Caching-Strategien machen „wann posten" subtiler als „was posten"

Es gibt ein Detail im Code: Wenn die Anzahl der Beiträge im Cache-Pool >= 500 ist, überspringt das System die gesamte Echtzeit-Beitragsabruflogik von Thunder/Phoenix/TweetMixer und gibt direkt gecachte Inhalte zurück.

Das bedeutet: Für Vielnutzer, die X dutzende Male am Tag öffnen, durchlaufen viele ihrer Anfragen den Empfehlungsalgorithmus überhaupt nicht; sie sehen eine alte Liste im Redis-Cache.

Ein Beitrag, den du gerade gesendet hast, könnte für diese Vielnutzer völlig unsichtbar sein. Deine Inhalte haben nur eine Chance einzutreten, wenn der Cache das nächste Mal aktualisiert wird.

Dies erklärt auch ein kontraintuitives Phänomen: Einige Konten posten dutzende Male am Tag, und ihr Traffic ist nicht schlecht. Das liegt daran, dass häufiges Posten die Wahrscheinlichkeit erhöht, „bei einer bestimmten Cache-Aktualisierung ausgewählt zu werden". Punk2898 prognostiziert jedoch, dass diese Strategie später angepasst wird.

Für gewöhnliche Creators lautet der Vorschlag: 10-30 Minuten vor der Spitzenaktivität deiner Zielgruppe posten, damit dein Beitrag eine bessere Chance hat, bei der Cache-Aktualisierung aufgenommen zu werden.

Beobachtung 7: MediumRisk ist die versteckte Gewichtsreduzierung, von der du nichts weißt

Das Werbesystem-Codearte die Variable brand_safety_verdict zum ersten Mal offen. Sie hat vier Stufen: Safe / LowRisk / MediumRisk / HighRisk.

Wichtige Entdeckung: Der Standardwert ist MediumRisk.

Mit anderen Worten, wenn dein Beitrag nicht vollständig von Grox überprüft wurde (oder Tags fehlen), behandelt das System dich standardmäßig als „Mittleres Risiko". Beiträge mit mittlerem Risiko werden nicht direkt blockiert, aber sie werden neben Anzeigen vermieden. Und Positionen um Anzeigen herum sind oft Bereiche mit hoher Belichtung (visuelle Fokusbereiche der Benutzer).

Das Ergebnis: Du erhältst nie eine Verletzungsmitteilung, aber deine Belichtung wird bereits abgezinst. Dies ist der am leichtesten übersehene „versteckte Schattenverbot" im v2-Algorithmus.

Wie vermeidet man das? Beiträge mit klaren Themen und ohne „provokante" Inhalte werden eher schnell als Safe eingestuft. Nachdem du einen wichtigen Beitrag gepostet hast, warte 30-60 Minuten, bis die Überprüfung abgeschlossen ist, bevor du starke Werbung machst.

Checkliste für Creator-Maßnahmen

Basierend auf den 7 Beobachtungen oben, hier sind spezifische umsetzbare Schritte:

Bezüglich Inhaltsqualität

Die ersten 10 Wörter jedes Beitrags bestimmen dwell oder not_dwelled. Du musst im ersten Satz eine kognitive Lücke oder Datenwirkung erzeugen. Mit „Ich habe heute einen kleinen Trick gelernt" zu beginnen, löst direkt ein Wegwischen aus.

Inhalt sollte klare Argumente, Informationsdichte und ein Gefühl von Struktur haben. Die 0,4-Qualitäts-Score-Schwelle ist nicht hoch, aber „vorlagenartig + wenig Info + ein paar Worte mit einem Bild"-Füllbeiträge werden sie definitiv nicht bestehen.

Vermeide KI-Vorlagen-Gefühl: einheitliche Satzstrukturen, feste Eröffnungen („Erstens... Zweitens... Abschließend") und große Enden werden von slop_score erkannt.

Bezüglich Kreisoperationen

Prüfe deine Follow-Liste. Entfolge zufälligen Konten nicht in deinem Zielkreis. Jedes Follow formt deinen Jaccard-Koeffizienten.

Folge gegenseitig 5-10 Kernkonten in deinem Zielkreis. Gegenseitiges Follow-Gewicht ist viel höher als einseitige Follows.

In den großen V-Beiträgen des Kreises hinterlasse Kommentare mit Informationszuwachs. Nicht „gelernt", sondern ergänze einen Datenpunkt, teile ein Gegenbeispiel oder stelle eine Erweiterungsfrage.

Bezüglich Kommentarbereichsverwaltung

Reinige regelmäßig Spam-Kommentare unter deinen Beiträgen. Anzeigen und bedeutungslose Antworten senken das Gewicht des Hauptbeitrags.

Spamme nicht deine Präsenz unter irrelevanten Beiträgen. 0-Punkte-Kommentare hinterlassen einen Spam-Eintrag auf deinem Konto.

Bezüglich Posting-Zeitpunkt

Poste 10-30 Minuten vor der Spitzenaktivität deiner Zielgruppe. Lasse ein Fenster, damit die Cache-Aktualisierung dich einschließt.

Warte 30-60 Minuten nach einem wichtigen Beitrag, bevor du ihn bewirbst. Lasse die Grox-Überprüfung abschließen, um vom Standard-MediumRisk auf Safe hochzustufen.

Bezüglich Zitat-Retweets

Sei vorsichtig beim Zitieren von grenzwertigen Inhalten. Der v2 VF Joint Liability Mechanismus führt dazu, dass Gewichtsreduzierung von bestraften Beiträgen entlang der Zitatkette auf dich übergeht.

Verwende Screenshots + eigene Kommentare für kontroverse Inhalte anstelle direkter Zitate.

Bezüglich Hashtags

Identifiziere 1-2 Kern-Grok-Themen und erstelle konsequent darüber. Die Entdeckungsströme neuer Benutzer werden streng nach Themen gefiltert; wenn du nicht in ihrer Themensammlung bist, existierst du für sie nicht.

Verwende gelegentlich # explizite Tags, um die Themenklassifizierung des Algorithmus zu stärken.

Bezüglich Video

Die erste 1 Sekunde eines Videos ist die Grenze zwischen Leben und Tod. Das not_dwelled-Signal ist bei Videos am offensichtlichsten.

Wichtige Inhalte müssen eine reine Textversion haben. Einige Benutzer haben Filter „weniger Videos anzeigen" aktiviert, und Beiträge mit Videodauerfeldern werden vollständig herausgeschnitten.

Referenzlinks:

https://github.com/xai-org/x-algorithm

https://x.com/punk2898/status/2013538743467286981

https://x.com/punk2898/status/2055439323693289598

Beobachtung 1: Open-Source-Ranking und der echte Feed haben nahezu null Korrelation

Beobachtung 2: Ein Qualitäts-Score von 0,4 ist die unsichtbare Grenze zwischen Leben und Tod

Beobachtung 3: Wegwischen ist eine aktive Strafe, nicht nur „nicht sehen"

Beobachtung 4: Wem du folgst, bestimmt, in welchen Kreis der Algorithmus dich einordnet

Beobachtung 5: Der Kommentarbereich ist jetzt eine unabhängige Spur

Beobachtung 6: Caching-Strategien machen „wann posten" subtiler als „was posten"

Beobachtung 7: MediumRisk ist die versteckte Gewichtsreduzierung, von der du nichts weißt

Checkliste für Creator-Maßnahmen

Use YouMind to read viral articles deeply

Aktuelle virale Artikel

Wie ich eine „Prompt-Bibliothek“ mit 100 Prompts in NotebookLM verwalte

FSD V14 LITE: Mein Testbericht

Scrolling gilt als minderwertig

Wie man bezahlte Anzeigen über Claude Code schaltet: Der Mega-Guide

Vollständiger Leitfaden zur Einrichtung von Claude Cowork: Führen Sie Ihr Unternehmen im Alleingang

Wie man mit KI ein Ein-Personen-Unternehmen aufbaut