如何建立真正能協作的 AI Agents 團隊(完整課程)

@eng_khairallah1
英語2 個月前 · 2026年5月15日
883K
786
119
57
2.7K

TL;DR

一份關於多 Agent 編排的綜合指南,涵蓋了如 Fan-Out 和專家團隊等架構模式,協助您打造自主且達到生產等級的 AI 系統。

一個 AI Agent 很強大。但一群協同合作的 AI Agents 則是完全不同的層級。

請儲存這篇 :)

2026 年 5 月 6 日,Anthropic 在「Code with Claude」活動中宣布了 Claude Managed Agents 的多 Agent 協作功能。你現在可以在單一任務中,同時運行多達 20 個專業化的 Agent。

不是依序執行,而是平行運作。同時進行。每個 Agent 處理問題的不同部分。

這正是 Netflix、Harvey(法律 AI 公司)和 Shopify 已在生產環境中使用的相同架構。Netflix 用它來同時分析數百個建置日誌。Harvey 用它來協調跨多份文件的複雜法律工作。Shopify 則正朝著在 2026 年第三季實現 90% 自主編碼的目標邁進。

這些不是實驗。這些是現在正在大規模運行的生產系統。

而且,建立你自己系統的工具,每個人都可以使用。

以下將精確說明如何從零開始建立一個 AI Agent 團隊、哪些模式有效,以及該避免哪些錯誤。

為什麼多 Agent 勝過單一 Agent

單一 Agent 就像一個員工。無論他多有才華,一次也只能做一件事。如果任務有五個部分,他會依序處理:第一部分、第二部分、第三部分、第四部分、第五部分。

而多 Agent 系統就像一個團隊。五個 Agent,各自專精於任務的一部分,同時工作。單一 Agent 需要 30 分鐘的工作,一個五人團隊只需 6 分鐘就能完成。

但速度甚至不是最大的優勢。

真正的優勢在於專業化。

一個被要求做所有事情——研究、分析、寫作、編碼、審查——的單一 Agent,會因為注意力過於分散而在各方面產出平庸的結果。

而一個由專業化 Agent 組成的團隊——一個研究員、一個分析師、一個寫手、一個程式設計師、一個審查員——則能在每個方面產出優秀的結果,因為每個 Agent 都專注於自己最擅長的事。

這與人類團隊在複雜專案上勝過個人的原因相同。

三種有效的多 Agent 模式

並非所有多 Agent 設定都一樣有效。在研究了公司如何部署這些系統後,有三種模式被證明 consistently 有效。

模式 1:管道(Pipeline)

Agent 依序工作,每個 Agent 將其輸出傳遞給下一個。

研究 Agent → 分析 Agent → 寫作 Agent → 審查 Agent

當每個步驟都有清晰的輸入和輸出,且後續步驟依賴於前面的步驟時,這種模式效果最佳。研究 Agent 尋找數據。分析 Agent 識別模式。寫作 Agent 建立報告。審查 Agent 檢查錯誤。

每個 Agent 都針對其特定任務進行了優化,擁有專注的系統提示和相關工具。

模式 2:扇出(Fan-Out)

一個指揮官 Agent 將大型任務分解為子任務,並平行分配給多個工作 Agent。

指揮官 Agent 指派:

  • 工作 Agent 1 → 分析文件 A
  • 工作 Agent 2 → 分析文件 B
  • 工作 Agent 3 → 分析文件 C
  • 工作 Agent 4 → 分析文件 D
  • 工作 Agent 5 → 分析文件 E

所有五個工作 Agent 同時運行。完成後,它們的結果會被收集並整合。

這就是 Netflix 用來分析建置日誌的模式。它非常適合需要對許多獨立項目執行相同操作的任務。

模式 3:專家團隊(Specialist Team)

多個具有不同專業領域的 Agent 協作處理一個複雜任務,各自貢獻其專業知識。

對於產品發布,你可能會有:

  • 市場研究 Agent — 分析競爭對手數據和市場趨勢
  • 技術 Agent — 評估可行性和架構選項
  • 財務 Agent — 建立成本預測和定價模型
  • 文案 Agent — 撰寫行銷材料和登陸頁面文案
  • 審查 Agent — 檢查所有內容的一致性和品質

每個 Agent 在其專業領域內工作。輸出結果被組合成一個全面的交付成果。

這就是 Harvey 用於法律工作的模式。不同的 Agent 處理案件的不同方面——研究、判例分析、文件起草、合規檢查——然後結果被組合成一個完整的法律文件包。

步驟 1:定義你的團隊

在開始建構之前,先回答這些問題:

總體目標是什麼?「製作一份每週競爭分析報告。」

有哪些不同的子任務?「研究競爭對手網站、分析定價變化、監控產品發布、綜合研究發現、撰寫報告。」

哪些子任務可以平行執行?「研究、定價分析和產品監控可以同時進行。綜合和撰寫必須等到這些完成後才能進行。」

你會為每個子任務聘請什麼樣的專家?「一位市場研究員、一位定價分析師、一位產品偵察員、一位策略分析師和一位報告撰寫員。」

每個專家都變成一個 Agent,擁有自己的系統提示、工具和關注領域。

步驟 2:設計每個 Agent

團隊中的每個 Agent 都需要三樣東西:

一個明確的角色。「你是一位競爭定價分析師。你的工作是追蹤五個競爭對手產品的定價變化,並識別趨勢。」

特定的工具。定價分析師需要網路存取來檢查競爭對手網站。報告撰寫員需要文件存取來建立文件。市場研究員需要網路搜尋來查找最新新聞。

定義好的輸出。「產出一個結構化的 JSON 檔案,包含以下欄位:competitor_name, product, old_price, new_price, date_changed, significance_rating。」

輸出格式很重要,因為這是 Agent 之間溝通的方式。如果 Agent A 產出非結構化的文字,而 Agent B 需要結構化的數據,交接就會失敗。

標準化所有 Agent 的輸出格式。這是你將做出的最重要的技術決策。

步驟 3:建立協調機制

使用 Claude Managed Agents,多 Agent 協調功能已內建於 API 中。你定義你的 Agent、它們之間的關係以及它們如何溝通——Anthropic 負責處理基礎設施。

關鍵決策:

哪些 Agent 可以平行執行?不依賴彼此輸出的 Agent 應該同時運行,以最大化速度。

哪些 Agent 需要依序執行?需要另一個 Agent 輸出的 Agent 應該等待,直到該輸出可用。

Agent 如何傳遞數據?通過共享環境中的文件、通過結構化的輸出格式,或通過直接的 Agent 對 Agent 溝通。

當一個 Agent 失敗時會發生什麼?定義後備行為。如果定價分析師無法訪問競爭對手的網站,它應該記錄失敗並使用可用數據繼續運行——而不是讓整個管道崩潰。

步驟 4:使用「夢境」(Dreaming)添加記憶

這是最新功能,它將徹底改變 Agent 的長期表現。

「夢境」是一個排程的背景程序,在 Agent 工作階段之間運行。它會回顧過去的工作階段,提取模式,識別重複出現的錯誤,並策劃 Agent 的記憶儲存。

實際上,這意味著你的 Agent 團隊會隨著時間推移變得更聰明,而無需你手動更新提示。

Harvey 報告指出,在其法律 Agent 上啟用「夢境」功能後,完成率大約提高了 6 倍。這並非來自模型變更——純粹是因為 Agent 能夠跨工作階段攜帶機構知識。

你的 Agent 團隊真的能從自身經驗中學習。

要啟用「夢境」,請在你的 Managed Agents 設定中配置一個夢境排程。對於大多數團隊,建議的頻率是每晚執行。

步驟 5:定義成果(Outcomes)

「成果」是一項新功能,讓你可以使用基於評分標準的評級系統來定義什麼是「成功」。

與其期望你的 Agent 產出好的結果,不如定義具體的標準:

「報告必須包含所有五個競爭對手的定價數據。如果缺少任何競爭對手的數據,完整性分數將低於 80%。分析部分必須包含至少三個具體的見解,而非泛泛的觀察。報告字數必須少於 2,000 字。」

Claude 會根據你的評分標準評估自己的輸出,並進行迭代直到通過。這建立了一個品質循環,能在你看到輸出之前就捕捉到錯誤。

步驟 6:先從簡單任務開始測試

不要一開始就建立一個 10 個 Agent 的系統。

先從兩個 Agent 在一個簡單的管道任務中協作開始。確保溝通正確。確保輸出格式正確。確保錯誤處理正確。

然後再加入第三個 Agent。接著是第四個。每次新增都應在整合之前獨立測試。

那些能建立出色多 Agent 系統的團隊,是那些逐步建構的團隊,而不是那些試圖在第一天就設計出完美系統的團隊。

步驟 7:監控與迭代

多 Agent 系統比單一 Agent 更複雜。可能出錯的地方更多。監控不是可選項。

留意以下情況:

交接失敗 — Agent 產出的輸出,下一個 Agent 無法解析。解決方法是收緊輸出格式規範。

重複工作 — 多個 Agent 在沒有意識到的情況下做同樣的事情。解決方法是讓每個 Agent 的範圍極其具體。

品質下降 — 隨著管道的增長,輸出品質下降。解決方法是在關鍵檢查點添加審查 Agent。

Token 膨脹 — Agent 產生不必要的冗長輸出,消耗 Token 限制。解決方法是對輸出長度增加限制。

在生產環境中的實際樣貌

這是一個目前在生產環境中運行的真實多 Agent 設定:

每週市場情報報告

Agent 1:網路研究 Agent — 搜尋目標市場的最新新聞、產品發布和融資輪次。平行運行。

Agent 2:競爭對手監控 Agent — 檢查五個競爭對手網站的定價、功能和訊息變化。平行運行。

Agent 3:社群聆聽 Agent — 掃描 X 和 LinkedIn 上的相關討論、情緒和新興趨勢。平行運行。

Agent 4:分析 Agent — 接收來自 Agent 1-3 的數據,識別出五個最重要的發展,並根據影響程度進行評級。

Agent 5:報告撰寫 Agent — 接收分析結果,製作一份格式化的高層簡報,並附上建議。

Agent 6:品質審查 Agent — 根據定義的評分標準檢查報告,標記問題,並向撰寫者請求修改。

總時間:不到 15 分鐘。之前使用單一 Agent 的時間:超過一小時。之前手動完成的時間:半天。

報告每週一早上 8 點會送達 Google Drive。團隊邊喝咖啡邊閱讀。

常見的多 Agent 錯誤及如何避免

錯誤 1:讓每個 Agent 都過於通用。多 Agent 的意義在於專業化。如果你的研究 Agent 同時也在做分析和寫作,那你就偏離了目標。每個 Agent 應該把一件事做到極致。範圍狹窄才強大。範圍廣泛則軟弱無力。

錯誤 2:沒有標準化輸出格式。如果你的研究 Agent 產出自由格式的段落,而你的分析 Agent 期望結構化的 JSON,交接就會中斷。在建立任何 Agent 之前,先定義好 Agent 之間的數據契約。有哪些欄位?什麼格式?如果某個欄位為空該怎麼辦?

錯誤 3:過早平行運行太多 Agent。先從兩個 Agent 在一個簡單的管道中開始。確保溝通正常。然後再加入第三個。接著是第四個。每次新增都會引入複雜性。要逐步管理。

錯誤 4:Agent 之間沒有錯誤處理。當管道中的一個 Agent 失敗時會發生什麼?整個系統會崩潰嗎?下一個 Agent 會收到垃圾輸入嗎?建立明確的後備行為。「如果定價數據不可用,則使用歷史數據繼續進行,並在最終報告中標記這個缺口。」

錯誤 5:忽略 Token 成本。多 Agent 設定比單一 Agent 運行使用更多 Token。每個 Agent 都有自己的上下文、自己的推理過程和自己的輸出。監控你的使用量,並優化提示,使其簡潔而不失必要細節。

未來是多 Agent 的時代

Anthropic 並非將多 Agent 協作視為一個可有可無的功能來開發。他們正在將其建構為未來 AI 系統運作的基本架構。

在「Code with Claude」活動中,Anthropic 展示了他們自己的 Cowork 產品就是使用這種架構建構的。多個專業化的 Agent 協作處理複雜任務。這個能自主建構東西的工具,是由自主工作的工具建構出來的。

Apple 剛剛宣布,Claude 將透過一個新的 Extensions 系統,與其他 AI 服務一起整合到 iOS 27 中。隨著 Claude 嵌入更多的工作流程和設備,多 Agent 將成為處理複雜跨領域任務的自然方式。

今天正在投資多 Agent 基礎設施的公司——Netflix、Harvey、Shopify、Mercado Libre——並非為了樂趣。他們這麼做是因為單一 Agent 的方法無法擴展到應對他們現實世界問題的複雜性。

而現在學習這些模式的獨立開發者,將在不久的將來擁有價值不斐的技能。

誠實的事實

多 Agent 系統並非魔法。它們是應用於 AI 的軟體工程。

其基本原理與建構任何基於團隊的系統相同:明確的角色、清晰的溝通、定義好的介面、錯誤處理和迭代。

不同之處在於,這個「團隊」的成本只是一個 Claude 訂閱,而不是六份薪水,它可以每週 7 天、每天 24 小時不間斷工作,並且透過「夢境」功能隨著時間推移變得更好。

我們正處於多 Agent 時代的開端。那些現在——2026 年 5 月——就搞懂這些模式的人,當這成為所有 AI 系統的預設運作方式時,將擁有巨大的領先優勢。

大多數人讀到這裡會認為多 Agent 對他們來說「太先進了」。而那些在本週就建立第一個雙 Agent 管道的人,會發現它比他們預期的要簡單得多。

追蹤我 @eng_khairallah1 以獲取更多 AI 課程、工具和工作流程。每週都有新內容。

希望這對你有幫助,Khairallah ❤️

存到 YouMind

使用 YouMind 深度閱讀爆款文章

保存原文、追問細節、總結觀點,並在一個 AI 工作空間裡把爆款文章沉澱成可複用筆記。

了解 YouMind

更多可拆解樣本

近期爆款文章

探索更多爆款文章