news

OpenRouter Fusion API 正式上線：三模型組合逼近 Fable 5 分數，成本砍半——但 Fable 本人已被美國政府下架

30 秒速讀

Fable 5 剛上線三天就被美國政府以出口管制下架，隔天 OpenRouter 的 Fusion API 登場，三個便宜模型組合在深度研究基準上只輸它不到 1%，成本砍半。時間點的巧合說明了一件事：單一頂級模型的時代正在被質疑。

Ben Calloway · 2026/06/15

完整解析 +

01 · 為什麼發生？

Fusion API 的費用怎麼算，和直接呼叫 Claude Opus 4.8 相比划不划算?

Fusion 的計費方式是把面板內所有模型的呼叫費用加在一起，沒有額外的服務費。三個模型的面板就付三次模型費，五個就付五次，所以費用取決於你選什麼模型組合。

相比直接用 Opus 4.8 單體，預算面板（Gemini 3 Flash＋Kimi K2.6＋DeepSeek V4 Pro）的三個成員單價都比 Opus 便宜得多，加在一起仍比 Fable 5 的費率低約一半。但如果你的面板裡有 Opus 4.8 本身（例如自我融合配置），費用就會高一些。延遲也要考慮進去：Fusion 需要等所有面板模型都跑完再合併，比單一呼叫慢 2 到 3 倍，適合不趕時間的深度研究任務，不適合需要快速回應的即時互動。

02 · 運作原理是什麼？

Claude Fable 5 和 Mythos 5 什麼時候會恢復?

目前沒有時間表。Anthropic 的公開聲明只說他們在 6 月 12 日下午 5 點 21 分收到美國商務部的指令，當日即全球下線，也表示對指令背後的理由持異議，但沒有提到任何可能恢復的條件或時程。

商務部的指令本身並未說明具體的國家安全顧慮。有報導指出，指令的觸發因素之一是一家外部公司對 Fable 5 的越獄攻擊聲明，但 Anthropic 認為這個問題是「局部性的，不具普遍性」。這起事件目前被認為是有史以來第一次政府強制下架已公開部署的前沿 AI 模型，結局仍未定，建議持續追蹤 Anthropic 的官方更新。

03 · 如何應用

Fusion API 適合用來取代 Fable 5 嗎，還是兩者適合的場景不同?

兩者適合的場景確實不同，不能直接畫等號。Fusion 在 DRACO 深度研究基準上展現了接近 Fable 5 的分數，但這個基準測的主要是「廣度、多來源整合、引用品質」這類研究任務，而 Fable 5 真正的設計強項是長時間序列的自主任務（long-horizon agentic tasks），也就是需要多步驟規劃、跨工具操作、維持長對話脈絡的複雜任務，而這類場景 DRACO 並沒有涵蓋。

所以簡單說：如果你的任務是「查很多資料、整合成一份有深度的分析」，Fusion 的預算面板是目前不錯的替代選項；如果你的任務是「讓 AI 自主執行一個複雜的多步驟工作流程、過程中不需要人介入」，目前最接近的單體替代是 Opus 4.8，Fusion 並非為這類場景設計的。

04 · 我該怎麼做？

這次事件對 AI 開發者有什麼更長遠的啟示?

這是一個提醒：對單一供應商、單一模型的依賴存在監管風險。Fable 5 和 Mythos 5 在不到 72 小時內從正式上線到全球下線，許多在這三天內已經把產品接上這兩個模型的開發者被迫緊急切換，而 Anthropic 也只能提供退款，沒有其他選項。

OpenRouter 的 Fusion 背後還有一個更大的押注：未來的 AI 基礎設施應該是模型無關的（model-agnostic）。CEO Alex Atallah 在公告中說的那句「AI 的未來是神經多樣性，不是單一模型的接管」，放在這個時間點聽來已經不只是行銷語言。無論你用不用 Fusion，未來的工程設計，應該把「頂級模型突然消失」這個情境當成一個值得預案的邊界條件。

完整內容 +

這週的 AI 圈同時發生了兩件事，而且剛好互相呼應。6 月 9 日，Anthropic 發布了旗艦模型 Claude Fable 5，向外界宣告這是他們迄今最強的公開模型。三天後的 6 月 12 日，美國商務部以出口管制為由，要求 Anthropic 立即對「所有外國公民」暫停 Fable 5 和 Mythos 5 的存取權限——包括在美國境內的外國籍員工。Anthropic 因無法在技術上即時辨別使用者國籍，只好把這兩個模型對全球所有用戶一律下線。

就在 Fable 5 消失的隔天，6 月 13 日，OpenRouter 宣布 Fusion API 正式推出，並在公告中直接打出這句話：「達到 Fable 等級的智慧，價格只要一半。」時間點的巧合讓外界大量討論：當官方最強模型被迫退場，一個讓多個替代模型組合起來逼近同等分數的工具，顯然在這個時間點比任何時候都更有實際意義。

Fusion API 怎麼運作

Fusion 的核心思路其實不複雜：與其在一個問題上押注一個模型，不如把同一個問題同時丟給好幾個模型，再讓第三個「裁判模型」整合所有答案，提煉出最後回覆。整條流程在 OpenRouter 的伺服器端處理，對開發者來說，體驗上和呼叫單一模型一樣，一次 API call 搞定。

具體步驟是：使用者傳入 prompt，OpenRouter 同時把它派給選定面板內的數個模型（每個模型都配有網路搜尋和工具呼叫能力），裁判模型接著閱讀所有回應，分析各模型的共識點、矛盾之處、各自的獨到見解和盲點，最後由主模型根據這份分析整合出結構化的最終答案。根據 OpenRouter 官方說法，系統預設使用 3 到 5 個模型同時推理。

DRACO 基準的具體數字

OpenRouter 以 Perplexity AI 的 DRACO 深度研究基準進行評測，涵蓋 100 道跨十個領域的複雜研究任務，評分包含事實正確性、廣度深度、呈現品質與引用品質，並設有負權重懲罰機制。各配置的成績如下：

表現最佳的組合是 Fable 5 加 GPT-5.5 由 Opus 4.8 融合，拿到 69%；其次是三模型組合（Opus 4.8、GPT-5.5、Gemini 3.1 Pro）以 Opus 4.8 融合，得到 68.3%。Claude Fable 5 單體只完成了 93 道題（內容過濾器攔了 7 道），得分 65.3%。

最讓外界驚訝的是所謂的「預算面板」：Gemini 3 Flash、Kimi K2.6、DeepSeek V4 Pro 三個相對便宜的模型組合，經 Fusion 融合後拿到 64.7%，只差 Fable 5 單體不到 1 個百分點，但成本約只要一半。這個結果對想要控制推理費用的開發者來說意義不小。

另一個值得注意的發現：把同一個模型自己和自己融合也有效。Opus 4.8 作為面板中的兩個成員再由 Opus 4.8 裁判融合，得到 65.5%，比 Opus 4.8 單體的 58.8% 高出接近 7 個百分點。這代表 Fusion 帶來的效能提升，有相當一部分來自「讓同一模型從不同推理路徑切入再整合」本身的價值。

OpenRouter 怎麼幫基準測試「防作弊」

OpenRouter 在官方部落格中主動提到了一個細節：測試初期，當各模型被賦予網路搜尋能力時，有些模型在研究過程中找到了 DRACO 評分標準本身的文件。為此，他們用一行設定把相關域名全部排除，重跑了全部測試，公布的數字都來自這個經過修正的乾淨設定。這個細節說明 OpenRouter 的測試設計是認真的，也讓數字的可信度高一些。

Fusion 適合什麼場景、不適合什麼

根據 OpenRouter CEO Alex Atallah 的說法，Fusion 的強項在於「深度研究」類任務，也就是需要多角度資料整合、廣度比單一推理鏈重要的問題。他同時也坦承，DRACO 基準並不包含長時間序列任務（long-horizon），而這正是 Claude Fable 5 真正被設計來解決的場景，兩者並非直接取代。

開發者目前有四種方式接入 Fusion：直接在 openrouter.ai/fusion 的 Chatroom 試用；API 中指定 openrouter/fusion 模型 slug；在工具陣列中加入 fusion server tool，讓主模型自行決定何時呼叫；或透過 plugin 引數自訂面板組合。計費方式是依照實際呼叫的底層模型數量累加，不是固定訂閱費。

這對 Claude 使用者有什麼影響

就現實狀況而言，Fable 5 和 Mythos 5 目前對全球用戶都不可用，Anthropic 也沒有公布恢復時間表。美國商務部的指令內文並未說明具體的國家安全顧慮，Anthropic 在官方聲明中對指令的理由表示異議，但仍選擇立即遵從。目前仍正常運作的替代選項包括 Claude Opus 4.8 和 Sonnet 4.6。

對於已經習慣用 Fable 5 做深度研究或長任務的開發者，目前的情況是：最接近的單體替代是 Opus 4.8，而 Fusion 的預算面板在 DRACO 深度研究基準上提供了另一條接近分數的路徑，只是延遲會高出 2 到 3 倍（需等待多個模型平行推理完成再合併）。OpenRouter 表示會持續根據用戶回饋調整效能。

提問

相關詞彙