X 剛開源了驅動「為你推薦」動態消息的演算法
我讀了每一行程式碼,然後用 Claude Code 建立了一個 Agent,能以我的語氣產出內容,並針對演算法實際衡量的每個訊號進行最佳化
以下是你也能做到的方法:

大部分關於 X 的內容建議都是瞎扯:
- 持續發文
- 與你的領域互動
- 使用主題標籤
這些建議沒有一項是基於演算法的實際運作方式,因為直到最近,根本沒人知道。
這一切在 xAI 開源了整個「為你推薦」動態消息推薦系統後改變了 → github.com/xai-org/x-algorithm
• 不是關於演算法的部落格文章
• 而是實際的原始碼
正是這套管線,決定了哪些貼文會顯示給沒追蹤你的人,以及哪些貼文會石沉大海。
我花了一週讀完它。然後我用 Claude Code 建立了一個 Agent,利用所學的知識,以我的語氣產出內容,並針對演算法所衡量的特定互動訊號進行最佳化。
這篇文章就是我對如何做到同樣事情的所有知識!
沒人讀過的程式碼
X 演算法倉庫包含四個主要元件:
→ Home Mixer(編排層)
→ Thunder(網路內貼文檢索)
→ Phoenix(機器學習評分模型)
→ Candidate Pipeline 框架
它們共同組成一個推薦系統,會針對它考慮顯示給你的每一篇貼文,預測十四種不同使用者行為的機率。
以下是埋藏在評分程式碼中的關鍵洞察:
> 來自 phoenix/scoring 的實際加權分數公式:最終分數 = Σ (weight_i × P(action_i)) 演算法會預測 14 種行為的機率,然後將每個機率乘以一個權重並加總 正向行為會把你的貼文往上推。負向行為則會往下壓。權重並未公開,但行為是公開的
這之所以重要,是因為它完全改變了你應該如何看待內容策略。
演算法不是在尋找單一的「互動」數字。它是在預測十四種特定行為,並對每一種行為給予不同的評分。
14 個訊號 → 它們對你的內容意味著什麼
回覆(↑ 高權重)
回覆代表真正的興趣。
能引發思考、不同意見或疑問的內容會驅動回覆。開放式的貼文比斷言式的貼文表現更好。
轉貼(↑ 高權重)
轉貼代表「我希望我的觀眾看到這個」。
有幫助、新穎或具有驗證價值的內容比個人更新更能驅動轉貼。
喜歡(↑ 中等權重)
按讚是摩擦最低的訊號。它們有影響力,但在評分模型中的權重低於回覆和轉貼。
追蹤作者(↑ 非常高權重)
一篇能讓人追蹤你的貼文是最高的正向訊號。能清楚展現獨特觀點或有價值專業知識的內容最能驅動這個訊號。
點擊(↑ 中等權重)
個人檔案點擊暗示對作者的好奇心。強烈的個人風格和一致的定位會隨著時間驅動這個訊號。
停留時間(↑ 中等權重)
沒有互動但閱讀貼文所花的時間。長篇串文和值得閱讀的貼文在這項得分較高。
不感興趣(↓ 高懲罰)
點擊「不感興趣」是一個強烈的負向訊號。
- 標題與內容不符
- 離題的貼文
- 低品質的轉貼會觸發這個訊號
靜音作者(↓ 高懲罰)
靜音代表內容惱人但不值得檢舉。
- 重複性高
- 低價值
- 過度宣傳的內容會驅動這個訊號
封鎖作者(↓ 非常高懲罰)
僅次於檢舉的最強負向訊號。攻擊性、垃圾內容或極度令人反感的內容會觸發這個訊號。
檢舉(↓ 嚴重懲罰)
檢舉是核選項。即使少量的檢舉也會立即摧毀曝光度,並觸發能見度過濾。
來自原始碼的關鍵洞察:演算法已經消除了所有人為設計的特徵。基於 Grok 的 Transformer 完全從你的互動歷史中學習相關性:• 你喜歡的 • 回覆過的 • 分享過的 • 停留過的內容。這意味著:主題和風格的一致性,能訓練演算法把你的內容展示給有相似互動歷史的使用者。不一致則會讓模型困惑。
程式碼中還有一個關鍵機制:作者多樣性評分器(Author Diversity Scorer)。
在同一個會話中,如果演算法已經向同一位使用者展示過你的一篇貼文,它就會降低你下一篇貼文的分數。
這表示發文頻率很重要,但在短時間內向你的觀眾大量發文,實際上會傷害每篇貼文的曝光分佈。
手動發文的問題
你知道自己的語氣...
你知道自己的觀眾...
你大致知道什麼內容表現好...
問題在於時間、一致性,以及在每篇貼文上同時保持創意和分析的認知負擔。
一個了解你風格的個人 AI Agent,解決這個問題的方式與一般 AI 寫作工具截然不同。
差異在於記憶和模式:一般工具產生內容。
• 個人 Agent 則產出「你的」內容
並針對演算法獎勵的特定訊號進行校準,而且語氣是你現有觀眾已經熟悉的。
在開始建立任何東西之前,你需要回答一個問題:
你的模式到底是什麼樣子?
你的模式分析提示 → 先在 Claude Code 中執行這個

在開始建立任何東西之前,先執行這個。
它所產生的語氣風格指南,是你的 Agent 會用到的最重要文件。其他一切都只是圍繞它的支架。
選擇適合你工作流程的架構
沒有單一「正確」的個人 X Agent。
正確的架構取決於你想要保留多少控制權、你的技術熟悉程度,以及你想要管線自動化到什麼程度。
以下是三套完整的藍圖,從最容易上手到最強大。
藍圖 01
會話型 Agent → Claude Code + MEMORY.md
最簡單且實際可行的架構。
• 你在終端機中執行 Claude Code,並搭配一個預先配置好的 MEMORY.md 檔案,裡面包含你的語氣風格指南和演算法背景。每次會話,Claude 都會讀取你的記憶,並在無須你重新解釋的情況下產生貼文。
你要建立的東西
一個 CLAUDE.md 專案檔案,每次你在該目錄中開啟 Claude Code 會話時,它會載入你的語氣、你的主題定位,以及演算法的評分優先順序。
- 零基礎設施
- 除了 Claude 本身,不需要其他 API 金鑰

每日工作流程
在你的專案目錄中開啟 Claude Code。用一句話輸入你的想法或主題。
取得三個貼文變體,每個變體都包含串文和單篇貼文版本。選擇感覺對的那個,編輯以符合你當下的語氣,然後手動發文。總時間:每篇貼文 8 分鐘,而不是 45 分鐘。

- 無須任何基礎設施
- 完全控制,你審核每一篇貼文
- 有人類審查,語氣品質最高
- 手動發文 — 沒有排程
- 每次都需要開啟 Claude Code
藍圖 02
審核管線 → Claude Code + 佇列 + Telegram
一個半自動化的系統,可以批次產生貼文,透過 Telegram 傳送給你審核,然後透過 X API 按排程發布已批准的內容。
你仍然參與每篇貼文,但完全不再花時間在內容產出上。
架構概覽
三個元件協同運作:
- Claude Code Agent,每週日晚上產生一週的貼文批次
- Telegram Bot,將草稿傳送到你的手機,讓你一鍵批准或拒絕
- 排程器,在演算法最佳時間發布已批准的貼文


最佳發文時間 → 演算法背景
演算法的 Thunder 元件會即時檢索來自已追蹤帳號的貼文。
你的貼文在第一個小時內的互動,是決定它是否會被推送到網路外的主要訊號。
請在你最活躍的追蹤者上線時段發文。查看你的 X Analytics,了解你特定觀眾的尖峰時段。
一般來說:在你的觀眾主要時區的星期二至星期四,早上 8–10 點或晚上 6–8 點。
- 你審核每篇貼文,品質維持高水準
- 排程自動處理演算法時間
- 每週批次產生,每週只花你 30 分鐘
- 需要設定 Telegram Bot 和 X API 存取權
- X API 免費方案有發文限制
藍圖 03
自主堆疊 → 具有回饋迴圈的多 Agent 系統
一個完全自主的系統,包含三個專門的 Agent:一個 Content Agent 負責產生貼文、一個 Analytics Agent 讀取你的 X 表現數據並找出什麼有效,以及一個 Optimization Agent 根據實際互動結果持續更新你的語氣風格指南。
這個系統每週都會學習和改進,無須人工干預!
三 Agent 架構

回饋迴圈 → 這讓它與眾不同
大多數內容系統最佳化的是「寫起來感覺好的東西」。
這個系統最佳化的是「演算法真正獎勵的東西」,並根據每週的真實數據來衡量。
Optimization Agent 會讀取你的互動指標,並以具體、基於證據的變更來更新語氣風格指南:
[ 以直接問題結尾的貼文,其回覆量是以陳述句結尾的貼文的 3.2 倍 ]
更新指南:讓 70% 的貼文包含問題

- 完全自主,一旦運作起來,每天零努力
- 自我改進,每週從真實數據中變得更好
- 可擴展到任何數量,無須額外時間投入
- 需要 X API 進階存取權來取得分析數據
- 如果沒有每月審查,有語氣漂移的風險
- 初始建置時間較長,至少需要 1 整週
該告訴你的 Agent 什麼,以及絕不能讓它做什麼
了解演算法原始碼揭示了大多數內容建議完全搞錯的具體規則。
將這些直接建置到你的 Agent 指令中。
你的 Agent 必須遵守的規則
- 不要使用主題標籤
演算法的 Phoenix 模型是從你的互動歷史和內容語義中學習相關性,而不是從主題標籤。
主題標籤是低品質內容的訊號,而且不會改善曝光。
- 完全從你的 Agent 輸出中移除它們。
- 主題一致性就是演算法訓練
Grok Transformer 會學習你的內容類型,並將其與具有相容互動歷史的使用者配對。
發布離題的內容會混淆這個配對。你的 Agent 應該拒絕產生你定義的主題範圍之外的貼文。
- 回覆時間窗很重要
演算法的網路內元件(Thunder)會近乎即時地向你的追蹤者展示貼文。
但網路外曝光(Phoenix)取決於你貼文在第一個小時內的網路內互動率。請在你最活躍的追蹤者上線時段發文,而不是在你方便的時候。
- 停留時間是一個被衡量的訊號
P(dwell) 明確存在於評分模型中。
那些值得閱讀、具有非顯而易見的報酬、敘事結構或分層資訊的貼文,其得分會優於兩秒鐘就能吸收的貼文。
- 追蹤訊號是最高正向權重
能清楚展現獨特觀點或特定專業知識(且難以在其他地方找到)的內容,會驅動 P(follow_author)。
你的 Agent 應該每天至少最佳化一篇貼文,專門針對這個訊號。
絕不能讓你的 Agent 做的事
- 絕不能在沒有審核關卡的情況下自動發文
即使配置最佳的 Agent,偶爾也會產生不符合你語氣的內容。
始終在審核流程中保留人類角色,即使只是一個 Telegram 的一鍵審核。
- 絕不能產生互動誘餌
「同意或不同意?」和「你覺得呢?」
是低訊號的提示,會產生低品質的回覆。演算法能夠區分實質回覆和單詞反應。
- 絕不能讓它偏離你的語氣
AI 內容 Agent 最常見的失敗模式是語氣逐漸同質化——輸出會慢慢收斂到通用的 AI 語氣。
請每月審查你的語氣風格指南,並將其與 Agent 實際產出的內容進行比較。
- 絕不能只針對單一訊號最佳化
演算法使用十四個訊號的加權總和。
最大化某一個訊號(例如為了回覆而製造爭議)而犧牲其他訊號(觸發「不感興趣」或檢舉)的內容,最終將是淨負值。
- 你的 Agent 應該針對一組正向訊號進行最佳化。
> 演算法不在乎你寫一篇貼文有多努力 > 它衡量十四種特定行為並分別評分 > 你的 Agent 應該知道所有十四種
為什麼大多數 AI 內容聽起來就像 AI 內容
每個人都擔心的失敗模式
「內容聽起來會像 AI」——這是真實存在的。
但它並非無法避免。之所以發生,是因為一個特定的錯誤:
- Agent 被給予了一個「主題」,而不是一個「模式」。
告訴一個 Agent「寫關於 AI 工具的文章」,會產出關於 AI 工具的通用 AI 內容。告訴一個 Agent「以一個對炒作基本上持懷疑態度、只使用具體例子、並以暗示反向答案的問題結尾每篇貼文的人的方式,寫關於 AI 工具的文章」,則會產出聽起來像你的東西。
差別在於限制的精確度。
你的語氣風格指南越精確地捕捉你的實際模式(而不只是你的主題),產出的內容就越具有辨識度。
語氣保存提示 → 每週執行

在頭一個月,每週執行這個比較。
到了第四週,Agent 輸出和你自然語氣之間的差距會縮小到你的審核流程變快,編輯也變得極少。
真正重要的指標
大多數人衡量追蹤者成長和總曝光次數。
這兩者都無法告訴你,你的 Agent 是否擊中了驅動網路外曝光的演算法訊號。
以下是值得追蹤的指標:
[ 每週 Agent 表現審查 ]
每週一,在你的 Agent 產生下一批貼文之前,追蹤這些數字:
- 回覆率(回覆 ÷ 曝光次數)→ 目標:高於你使用 Agent 之前的基準線
- 追蹤率(每篇貼文來自非追蹤者的新追蹤數)→ 最高價值的訊號
- 網路外曝光比例(來自非追蹤者的曝光百分比)→ 衡量「為你推薦」動態消息的滲透率
- 個人檔案點擊率 → 表示內容是否引發對你個人的好奇
- 不感興趣 / 靜音率 → 如果這個數字上升,表示你的 Agent 正在偏向通用內容
每週將這些數字輸入你的 Analytics Agent。
它們是驅動最佳化循環的訊號。
有一個數字需要特別關注:網路外曝光比例。這是最清楚的訊號,顯示 Phoenix 檢索系統(從全球語料庫中發現貼文的機器學習模型)正在將你的內容展示給沒有追蹤你的人。
比例高於 40% 表示演算法正在積極地將你的貼文分發給新的觀眾。
• 低於 20% 表示你的觸及幾乎完全依賴你現有的追蹤者。
你的 Agent 的演算法最佳化——回覆鉤子、驅動追蹤的貼文、獎勵停留時間的內容——正是為了提高這個比例而設計的。
每週追蹤它
如果它沒有變化,表示 Agent 的輸出需要根據語氣風格指南和演算法背景進行重新校準。
謝謝閱讀!





