X が 5 月にオープンソース化したレコメンデーションアルゴリズムを実際に動かしてみたところ、オープンソース部分が実際の Feed ランキングを説明できるのはわずか 30% であることがわかりました。残りの 70% は、サーバーサイドの設定、VM Ranker、運用ルールに隠されています。
しかし、この 30% の公開コードでも、ある疑問に答えるには十分です。それは、クリエイターが実際にコントロールできるものは何か、ということです。
元のリポジトリ: xai-org/x-algorithm(5 月 15 日更新、187 ファイル、18,263 行のコードが追加)
この記事では、アルゴリズムの概要(Punk2898 の 2 つの投稿ですでに非常に完成度が高い)を繰り返すのではなく、以下の 3 点に焦点を当てます:
1️⃣ パイプラインを実際に動かして気づいた直感に反する現象
2️⃣ 5 月のコード更新でクリエイエイターに最も影響を与えるメカニズム
3️⃣ これらの観察に基づく具体的な運用提案
観察 1: オープンソースのランキングと実際の Feed にはほぼ相関がない

Phoenix モデルを使って、537,000 件のスポーツ投稿のコーパスを実行しました。モデルが出力した最終スコアの範囲は 0.0000 から 0.0015 と、非常に平坦でした。Fav、Reply、RT の予測確率はすべてゼロに近く、ランキングは主に Dwell(滞在時間)というシグナルを使って差を作り出していました。
次に、実際の「おすすめ」Feed をスクレイピングして比較しました。Kendall の τ でランク相関を計算した結果は -0.10 でした。
この数字が意味するのは、オープンソースコード内のデモウェイト(fav1.0 + reply0.5 + RT0.3 + dwell0.2)を使って実際に表示される Feed ランキングを予測することは、ランダムに推測するのとほぼ同じ精度だということです。
実際の Feed では、インタラクションがゼロの投稿がトップ 7 に登場する一方、インタラクションの多い投稿が 9 位や 10 位に押しやられています。公開から 3 分以内の、インタラクションがゼロのまったく新しい投稿も Feed に入ることができます。
これは何を意味するのでしょうか?
つまり、オープンソースの Phoenix モデルは「初期候補のスクリーニング」のみを担当しているということです。他の誰かの Feed でのあなたの順位を実際に決定するのは、その後の再ランキングレイヤーです。5 月にオープンソース化されたコードは、ちょうどこれらの再ランキングレイヤーのロジックを完成させるものです。
観察 2: 品質スコア 0.4 は見えない死活ライン

5 月に新たに追加された Grox モジュールは、今回のアップデートで最も重要な部分です。これは Phoenix の代替ではなく、Phoenix の上流サプライヤーです。新しい投稿が送信されるたびに、Grox は VLM 大モデルを使って 5 つの処理を行います:
- 品質スコア(quality_score、0 から 1)を割り当てる
- 7 つの真偽値タグ(成人向けコンテンツ、暴力、ヘイトスピーチなど)を生成する
- スロップスコア(slop_score、レベル 1〜3)を割り当てる
- マルチモーダル埋め込みベクトルを生成する
- PTOS 安全性レビューを実行する
コードには明確に記述に明確に書かれています:初期スクリーニングを通過するためには quality_score >= 0.4 が必要です。0.4 未満のものは「低品質」とラベル付けされ、その後の拡散はあらゆる場面で妨げられます。
この 0.4 の閾値は、キーワードマッチングではなく VLM モデルによって判断されます。テキストの意味、画像の内容、動画のフレームを理解できます。「画像を追加してキーワードを積み上げる」ことで以前は騙せていたルールベースのシステムは、もはや機能しません。
slop_score はもう一つの新たな武器です。テンプレート化されたコンテンツ、情報密度の低いもの、AI 生成の痕跡が明らかな投稿は高いスコアを受けます。レベル 1 は正常で、レベル 2〜3 はアルゴリズムがあなたのコンテンツを「薄めている」と判断したことを意味します。
観察 3: スワイプして通過することは、単に「見られない」だけでなく、アクティブなペナルティである

5 月のバージョンでは、行動シグナルが 18 の個別ヘッドから、19 の個別ヘッド + 8 の連続補助ヘッドにアップグレードされました。新しい連続ヘッドは、「どのくらい滞在したか」「読了率」などの詳細な指標を予測します。
しかし、クリエイターに最も大きな影響を与えるシグナルは、not_dwelled です。
これまで、「ユーザーのインタラクションがないこと」は中立的で、見られなかったことと同じだと考えていました。違いました。ユーザーがあなたの投稿を素早くスワイプして通過することは、アクティブなネガティブシグナルであり、アルゴリズムはそのペナルティをあなたに与えます。
これは以下を意味します:
- 動画の最初の 1 秒で注意を引けない = アクティブなペナルティ
- 長文投稿の最初の文が面白くない = アクティブなペナルティ
- 視覚的なインパクトのない画像 = アクティブなペナルティ
実際の Feed を観察していると、ある現象に気づきました。インタラクションがゼロの投稿がトップ 7 に入る一方で、インタラクションの多い投稿が後ろに押しやられる現象です。合理的な説明としては、インタラクションがゼロの投稿は、いいねはされていないものの、ユーザーが実際に「滞在」した(dwell シグナルを生成した)のに対し、一見データが良さそうな投稿の中には、大量のクイックスワイプが発生したものがあるということです。
観察 4: 誰をフォローするかが、アルゴリズムがあなたをどのサークルに配置するかを決定する

5 月のコードでは mutual_follow_jaccard_hydrator が追加され、「あなたと特定の作者との間の相互フォローサークルの類似度」を計算します。
あなたと作者が多くの同じ人々をフォローしている(Jaccard 係数が高い)場合、アルゴリズムはあなたを同じ「情報サークル」に属していると見なし、その人のコンテンツをあなたにプッシュする傾向が強くなります。
このメカニズムは、基本的な前提を変えます。以前は「コンテンツの品質が配信を決める」でしたが、今は「コンテンツの品質 + サークルへの帰属が配信を共同で決定する」となります。
具体的には:
- あなたがフォローするすべてのアカウントが、あなたのサークルアイデンティティを計算している
- ランダムにフォローすることは、あなたのサークルタグを希釈することと同義
- 同じ分野の KOL との相互フォローは、100 のランダムなアカウントを一方的にフォローするよりもはるかに効果的
- 大 V の投稿への高品質なコメントは、following_replied_users シグナルチェーンに入り、あなたのアバターが「あなたのフォローしている人もここにコメントしています」というプロンプトに表示される可能性がある
私自身の「おすすめ」Feed がこれを裏付けています:推奨コンテンツの 60% 以上は、中国の AI サークルのクリエイターからのものです。私のフォローリストがそのサークルに集中しているからです。
観察 5: コメント欄は現在、独立したトラックである

5 月のコードにより、コメント欄のための独立したスコアリングシステムが明らかになりました。各コメントは Grok によって 0〜3 で評価されます:
- 3 点: 議論を引き起こす情報増分のあるコメント
- 2 点: 通常のインタラクション
- 1 点: 短いがスパムではない
- 0 点: スパムタグをトリガーし、アカウントのクレジットに影響
0 点のコメントは単に折りたたまれるだけでなく、あなたのアカウントに「過去にスパムコメントを投稿した」という記録を残します。長期的に蓄積されると、アカウント全体のウェイトに影響を与える可能性があります。
同時に、あなたの投稿の下にあるスパムコメントも、メイン投稿のウェイトに影響します。「相互フォロー」「1st」「+1」といったコメントに対して、アルゴリズムは単に嫌うだけでなく、それらがあるためにあなたのメイン投稿の配信を下げます。
逆に、高品質なコメント 1 つの露出価値は、あなたが普通の投稿を 10 個投稿するよりも大きいかもしれません。大 V の投稿に、データに裏打ちされた議論を引き起こすコメントを残すことは、大 V のトラフィック入り口を借りることに相当します。
観察 6: キャッシュ戦略により、「何を投稿するか」よりも「いつ投稿するか」がより微妙になる

コードには細かい点があります:キャッシュプール内の投稿数が 500 以上になると、システムは Thunder/Phoenix/TweetMixer からのリアルタイム投稿取得ロジックをすべてスキップし、キャッシュされたコンテンツールに直接戻ります。
つまり、X を 1 日に何十回も開くヘビーユーザーにとって、リクエストの多くはまったくレコメンデーションアルゴリズムを通過せず、Redis キャッシュ内の古いリストを見ていることになります。
あなたが送信したばかりの投稿は、これらのヘビーユーザーにはまったく見えない可能性があります。あなたのコンテンツが表示される可能性があるのは、次にキャッシュがリフレッシュされるときだけです。
これはまた、直感に反する現象を説明します:1 日に何十回も投稿するアカウントがあり、そのトラフィックが悪くないのはなぜか。これは、高頻度の投稿が「特定のキャッシュリフレッシュで選択される」確率を高めるからです。ただし、Punk2898 はこの戦略は後で調整されると予測しています。
一般のクリエイターへの提案は、対象オーディエンスのアクティブピークの 10〜30 分前に投稿することです。これにより、キャッシュがリフレッシュされる際に、あなたの投稿が含まれる可能性が高まります。
観察 7: MediumRisk は、あなたが知らない隠れたウェイト減である

広告システムのコードにより、brand_safety_verdict 変数が初めて明らかになりました。これには 4 つのレベルがあります:Safe / LowRisk / MediumRisk / HighRisk。
重要な発見:デフォルト値は MediumRisk です。
つまり、あなたの投稿が Grox によって完全にレビューされていない(またはタグが不足している)場合、システムはあなたをデフォルトで「Medium Risk」として扱います。Medium Risk の投稿は直接ブロックされるわけではありませんが、広告の隣に配置されることは避けられます。そして、広告の周辺の位置は、多くの場合、露出の高いエリア(ユーザーの視覚的焦点領域)です。
その結果、あなたは違反通知を一切受け取らないにもかかわらず、あなたの露出はすでに割り引かれていることになります。これは、v2 アルゴリズムにおいて最も見落とされがちな「隠れたシャドウバン」です。
どうすれば回避できるでしょうか?テーマが明確で、「際どい」コンテンツがない投稿は、Safe として迅速に分類される可能性が高くなります。重要な投稿をした後は、レビューが完了するまで 30〜60 分待ってから、本格的なプロモーションを行うようにしましょう。
クリエイター向けアクションチェクションチェックリスト

上記 7 つの観察に基づく、具体的なアクション手順は以下の通りです。
コンテンツ品質について
各投稿の最初の 10 語が、dwell か not_dwelled かを決定します。最初の文で認知的ギャップやデータ的なインパクトを生み出さなければなりません。「今日、ちょっとしたコツを学びました」で始まると、即座にスワイプアウェイを誘発します。
コンテンツは、明確な主張、情報密度、構造感を持つべきです。0.4 の品質スコア閾値はそれほど高くありませんが、「テンプレート化 + 低情報 + 画像に一言」の埋め草投稿は間違いなく通過しません。
AI テンプレート感を避けてください:均一な文構造、固定された書き出し(「第一に…第二に…最後に…」)、大げさな締めくくりは、slop_score によって検出されます。
サークル運用について
フォローリストを監査しましょう。ターゲットサークルに属さないランダムなアカウントはフォローを解除しましょう。すべてのフォローがあなたの Jaccard 係数を形成します。
ターゲットサークル内のコアアカウント 5〜10 と相互フォローをしましょう。相互フォローのウェイトは一方向フォローよりもはるかに高くなります。
サークル内の大 V の投稿には、情報増分のあるコメントを残しましょう。「勉強になりました」ではなく、データポイントを補足したり、反例を共有したり、発展的な質問を投げかけましょう。
コメント欄の管理について
自分の投稿の下にあるスパムコメントを定期的に削除しましょう。広告や意味のない返信は、メイン投稿のウェイトを下げます。
関係のない投稿に自分の存在をスパムのように撒いてはいけません。0 点のコメントは、あなたのアカウントにスパム記録を残します。
投稿タイミングについて
ターゲットオーディエンスのアクティブピークの 10〜30 分前に投稿しましょう。キャッシュリフレッシュがあなたを含めるための時間的な猶予を残します。
重要な投稿後は、30〜60 分待ってからプロモーションを行いましょう。Grox のレビューが完了し、デフォルトの MediumRisk から Safe にアップグレードされるのを待つのです。
引用リツイートについて
際どいコンテンツを引用する際は注意しましょう。v2 の VF 連帯責任メカニズムにより、ペナルティを受けた投稿からのウェイト減が、引用チェーンに沿ってあなたにも波及します。
物議を醸すコンテンツについては、直接引用する代わりに、スクリーンショット + 自作のコメントを使用しましょう。
ハッシュタグについて
1〜2 のコア Grok トピックを特定し、その周りで一貫してコンテンツを制作しましょう。新規ユーザーの発見ストリームはトピックによって厳密にフィルタリングされており、あなたが彼らのトピックセットにいなければ、あなたは彼らにとって存在しないも同様です。
偶数的に # 明示的なタグを使用して、アルゴリズムのトピック分類を強化しましょう。
動画について
動画の最初の 1 秒は生死のラインです。not_dwelled シグナルは動画で最も顕著です。
重要なコンテンツには、テキストのみのバージョンも用意しましょう。「動画を減らす」フィルターを有効にしているユーザーもおり、動画時間フィールドのある投稿は完全にカットされます。
参考リンク:
https://github.com/xai-org/x-algorithm





