名詞解析 · ai-agents

Multi-Agent Systems

Q: Multi-Agent Systems 如何運作？

多智能體系統的三種核心架構模式分別適合什麼場景？ **模式一：編排者-執行者（Orchestrator-Worker）** 一個「主 Agent」（Orchestrator）負責分析任務、分配子任務、收集結果、整合輸出；多個「執行 Agent」（Workers）各自執行分配到的子任務。 適合場景：任務有清晰的分解結構，每個子任務相對獨立，不需要彼此的輸出就能開始執行。例如：同時分析競爭對手 A、B、C 三家公司的年報，Orchestrator 分配三個 Worker 各分析一家，最後整合成比較報告。 **模式二：平行處理（Pipeline / Sequential）** 任務需要依序通過多個專門的 Agent，每個 Agent 的輸出是下一個 Agent 的輸入。這是最常見的多智能體模式，類似工廠的流水線。 適合場景：任務有明確的處理階段，每個階段需要不同的專業能力。例如軟體開發的「需求分析 Agent → 架構設計 Agent → 代碼實作 Agent → 測試 Agent → Code Review Agent」。 **模式三：評估-優化循環（Evaluator-Optimizer）** 一個「生成 Agent」產出初始結果，一個「評估 Agent」根據預設標準審查品質，不符合標準就要求生成 Agent 修改，循環直到通過。 適合場景：需要高品質輸出、且能定義明確的品質標準。例如：「代碼生成 Agent」寫代碼，「測試執行 Agent」跑單元測試，測試失敗就回到代碼生成 Agent 修改，直到所有測試通過。

Q: Multi-Agent Systems 如何實際應用？

多智能體系統最大的工程挑戰是什麼？怎麼降低風險？ **最大挑戰一：錯誤傳播（Error Propagation）** 在串行的多智能體管道裡，一個 Agent 的錯誤輸出會成為下一個 Agent 的輸入，被當成正確的資訊繼續處理，錯誤在傳播的過程中可能被放大而不是修正。 降低風險的做法：在關鍵的 Agent 之間加入「驗證節點」——讓一個獨立的驗證 Agent 審查上一個 Agent 的輸出是否符合預期的格式和品質標準，不符合就要求重做，符合才傳遞給下一個 Agent。 **最大挑戰二：複雜度管理** 每增加一個 Agent，系統的複雜度就非線性增長——更多的訊息傳遞介面、更多的錯誤模式、更難調試的問題。 降低風險的做法：從最簡單的架構開始（先用單 Agent 解決問題，確認它做不好再引入多 Agent），只在確實能帶來價值的地方增加 Agent。「能用三個 Agent 解決的問題，不要用六個」。 **最大挑戰三：成本累積** 多個 Agent 並行或串行執行，意味著多個 API 呼叫，費用快速累積。一個設計不佳的多智能體系統，費用可能是等效單 Agent 的 5-10 倍。 降低風險的做法：用較小的模型（如 Haiku）做分類和路由任務，只有確實需要複雜推理的 Agent 使用 Sonnet 或 Opus。在每個 Agent 的任務描述裡明確限制 Context 大小和輸出長度。

多智能體系統

ai-agents 進階

30 秒版 · 給沒耐心的人

由多個 AI Agent 協同工作完成複雜任務的架構——不同的 Agent 負責不同的子任務，彼此之間通過訊息傳遞協調。相比單一 Agent，多智能體系統能處理超出單個 Agent 上下文限制的長任務、並行執行多個獨立子任務、以及在專業化 Agent 之間分工提升整體品質。是目前 AI Agent 研究和應用的最前沿方向之一。

完整解說 +

01 · 這是什麼？

多智能體系統（Multi-Agent Systems）是一種讓多個 AI Agent 分工協作、共同完成複雜任務的架構。和單一 Agent 相比，多智能體系統的核心優勢在於能突破三個限制：

限制一：Context Window 上限。單個 Claude 的 Context Window 是 200K Token，對超大規模的任務（分析一家公司 5 年的財報、對整個大型代碼庫做全面重構），即使是 200K 也不夠。多智能體系統讓不同的 Agent 負責不同的部分，再把結果整合，能處理遠超單個 Context Window 的任務。

限制二：並行執行能力。單一 Agent 是串行的——做完任務 A 再做任務 B。如果一個任務有多個獨立的子任務，單一 Agent 必須一個個完成。多智能體系統讓多個 Agent 同時工作，把原本需要 10 分鐘的串行任務壓縮到 2 分鐘。

限制三：專業化深度。一個「全能」的 Agent 往往在每個領域都是泛泛而不精。多智能體系統讓每個 Agent 只專注於一個領域，配置針對性的 System Prompt 和工具，輸出品質比全能 Agent 更高。例如「代碼生成 Agent」和「代碼審查 Agent」分開，比一個「又寫又審」的 Agent 效果更好。

AnthropicClaude 在 Anthropic Academy 的課程裡把多智能體系統定義為當前 AI 開發最重要的前沿方向之一，並在 Claude Code 和 API 裡提供了多智能體架構的原生支援（Subagents 功能）。

02 · 為什麼存在？

多智能體系統的三種核心架構模式分別適合什麼場景？

模式一：編排者-執行者（Orchestrator-Worker）

一個「主 Agent」（Orchestrator）負責分析任務、分配子任務、收集結果、整合輸出；多個「執行 Agent」（Workers）各自執行分配到的子任務。

適合場景：任務有清晰的分解結構，每個子任務相對獨立，不需要彼此的輸出就能開始執行。例如：同時分析競爭對手 A、B、C 三家公司的年報，Orchestrator 分配三個 Worker 各分析一家，最後整合成比較報告。

模式二：平行處理（Pipeline / Sequential）

任務需要依序通過多個專門的 Agent，每個 Agent 的輸出是下一個 Agent 的輸入。這是最常見的多智能體模式，類似工廠的流水線。

適合場景：任務有明確的處理階段，每個階段需要不同的專業能力。例如軟體開發的「需求分析 Agent → 架構設計 Agent → 代碼實作 Agent → 測試 Agent → Code Review Agent」。

模式三：評估-優化循環（Evaluator-Optimizer）

一個「生成 Agent」產出初始結果，一個「評估 Agent」根據預設標準審查品質，不符合標準就要求生成 Agent 修改，循環直到通過。

適合場景：需要高品質輸出、且能定義明確的品質標準。例如：「代碼生成 Agent」寫代碼，「測試執行 Agent」跑單元測試，測試失敗就回到代碼生成 Agent 修改，直到所有測試通過。

03 · 如何影響你的決策？

多智能體系統最大的工程挑戰是什麼？怎麼降低風險？

最大挑戰一：錯誤傳播（Error Propagation）

在串行的多智能體管道裡，一個 Agent 的錯誤輸出會成為下一個 Agent 的輸入，被當成正確的資訊繼續處理，錯誤在傳播的過程中可能被放大而不是修正。

降低風險的做法：在關鍵的 Agent 之間加入「驗證節點」——讓一個獨立的驗證 Agent 審查上一個 Agent 的輸出是否符合預期的格式和品質標準，不符合就要求重做，符合才傳遞給下一個 Agent。

最大挑戰二：複雜度管理

每增加一個 Agent，系統的複雜度就非線性增長——更多的訊息傳遞介面、更多的錯誤模式、更難調試的問題。

降低風險的做法：從最簡單的架構開始（先用單 Agent 解決問題，確認它做不好再引入多 Agent），只在確實能帶來價值的地方增加 Agent。「能用三個 Agent 解決的問題，不要用六個」。

最大挑戰三：成本累積

多個 Agent 並行或串行執行，意味著多個 API 呼叫，費用快速累積。一個設計不佳的多智能體系統，費用可能是等效單 Agent 的 5-10 倍。

降低風險的做法：用較小的模型（如 Haiku）做分類和路由任務，只有確實需要複雜推理的 Agent 使用 Sonnet 或 Opus。在每個 Agent 的任務描述裡明確限制 Context 大小和輸出長度。

04 · 你該怎麼辦？

Claude 在多智能體系統裡的實際支援——Subagents 功能怎麼用？

Claude 4 系列在 API 層面提供了原生的多智能體支援，最核心的是 Subagents 功能（在 Claude Code 和 API 裡都有支援）。

在 Claude Code 裡使用 Subagents：在 Claude Code 裡，你可以讓一個 Claude 實例（主 Agent）在執行任務時，spawn 多個子 Claude 實例（Subagents）並行處理不同的子任務。例如：

「分析這個 codebase 的架構，並為每個主要模組生成獨立的文件。」主 Agent 分析 codebase 後，為每個模組 spawn 一個 Subagent，每個 Subagent 負責一個模組的文件生成，並行執行，最後主 Agent 整合所有文件。

在 Claude API 裡建構多智能體：最直接的方式是讓 Claude 的 Tool Use 功能呼叫「啟動另一個 Claude 實例」的工具。每個子 Agent 是一個獨立的 API 呼叫，有自己的 System Prompt 和 Context，不和主 Agent 共用記憶。子 Agent 的輸出作為工具呼叫結果返回給主 Agent。

Anthropic 建議的多智能體設計原則：讓每個 Agent 有明確、單一的職責；Agent 間的訊息傳遞要結構化（JSON 格式）而不是自由文字；在高風險操作上加入人工確認點；對每個 Agent 都設定適當的 Context 大小限制，避免 Context 無限增長。

跟你的工作有什麼關係：如果你現在的 AI 工作流有一個任務需要超過 30 分鐘才能完成，或者需要同時分析超過 200K Token 的內容，多智能體系統可能是下一步值得探索的方向。

實際例子 +

一個軟體開發公司用多智能體系統自動化他們的代碼審查流程，說明多智能體架構在真實開發工作流裡的應用：

背景：公司每天有 50-80 個 Pull Request 需要 Code Review，但高級工程師的時間有限，很多 PR 在等待 Review 時阻塞了開發進度。

解決方案：四 Agent 流水線架構

Agent 1（分類器，用 Haiku）：讀取 PR 的 diff，判斷這是什麼類型的修改（bug fix / 功能新增 / 重構 / 文件更新），以及複雜度等級（簡單 / 中等 / 複雜）。低複雜度的 PR 直接自動 approve，中高複雜度的進入下一個 Agent。

Agent 2（安全審查 Agent，用 Sonnet）：專注於安全相關的問題——SQL injection、XSS、不安全的依賴、硬編碼的密鑰。只看安全問題，不看其他。

Agent 3（代碼品質 Agent，用 Sonnet）：專注於代碼品質——可讀性、重複代碼、潛在的效能問題、測試覆蓋率。

Agent 4（整合器，用 Sonnet）：整合 Agent 2 和 Agent 3 的審查結果，生成一份結構化的 Review 報告，標注哪些是「必須修改」、哪些是「建議修改」，哪些是「可選改善」。

結果：簡單 PR 的 Review 等待時間從平均 4 小時降到 10 分鐘；中等複雜 PR 降到 30 分鐘；高級工程師只需要 Review 最複雜的 15% 的 PR，把精力集中在架構和業務邏輯上。

圖解

歡迎截圖分享，轉載請註明來源

常見誤解 +

✕ 誤解1

× 誤解一：多智能體系統一定比單一 Agent 效果更好，應該盡量用多 Agent。多智能體系統帶來了顯著的複雜度、費用和維護成本。對能用單一 Agent 完成的任務，引入多 Agent 只是增加了不必要的複雜性而不帶來實質收益。多智能體系統的價值在「突破單一 Agent 的限制」——如果你的任務沒有超過這些限制（Context Window、並行需求、專業化需求），單一 Agent 配合好的 System Prompt 通常是更好的選擇。設計規則：先用單 Agent，找到它的天花板後再考慮多 Agent。

✕ 誤解2

× 誤解二：多智能體系統裡每個 Agent 都應該用最強的模型（Opus）以確保品質。多智能體系統裡不同的 Agent 做不同的事，對能力的需求也不同。做分類和路由的 Agent 完全不需要 Opus，用 Haiku 就夠，費用是 Opus 的 1/20；只有需要複雜推理的核心 Agent 才值得用 Opus。一個設計良好的多智能體系統，通過合理的模型分層，能在不損失整體品質的前提下把費用降低 60-75%。用統一的最強模型不是「確保品質」，而是「在不需要的地方浪費費用」。

這件事跟你有什麼關係 +

直接影響

多智能體系統最核心的取捨是「能力提升 vs 複雜度和成本增加」。每增加一個 Agent，系統能處理的任務複雜度提升，但工程複雜度、調試難度、費用、和錯誤傳播風險都同步增加。在實際應用中，這個取捨常常被低估：很多工程師在設計多智能體系統時，只看到「能處理更複雜的任務」這個收益，而低估了「調試一個在第三個 Agent 出錯的六 Agent 系統」的工程代價。最有效的使用策略是「最小必要 Agent 原則」：從解決問題所需的最少 Agent 開始，只在確認現有架構有明確的瓶頸時才增加 Agent。

提問

參照詞條

實用資源

Claude API 狀態 → 模型定價 → Prompt 試驗場 → Token 計算器 → MCP 伺服器目錄 → LLM 評測排行 → 模型比較 →