工具評測

Claude Fable 拒答基礎生物學問題：角色扮演沙盒的安全邊界卡在哪裡

30 秒速讀

使用者以為是 Claude 不肯回答，但其實是平台自己設了糟糕的過濾器——這是 AI 生態系最少被討論的信任危機。

Ben Calloway · 2026/06/11

完整內容 +

Anthropic 旗下互動敘事平台 Fable 採用 Claude 作為底層模型，卻在使用者實測中出現一個令人困惑的現象：連高中等級的生物學問題，例如人體器官功能、基礎遺傳學，都會觸發拒答機制。這不是 Claude 本身的預設行為，而是 Fable 針對其平台情境額外疊加的限制所導致的結果。

① 這是什麼？

Fable 是一個以 AI 驅動的角色扮演與互動故事平台，讓使用者可以與虛構角色展開長篇對話敘事。平台使用 Claude API，但會在系統提示（system prompt）層面對模型行為進行客製化設定，以符合其產品定位與品牌安全需求。當使用者在對話中提及生物學相關內容時，Fable 的過濾邏輯顯然將其歸類為潛在敏感範疇，即使問題本身完全無害。

② 為什麼存在？

Fable 的核心使用場景是角色扮演，其使用者群體涵蓋青少年，平台方需要對「可能被誤用的技術內容」保持高度警覺。問題在於，這套過濾邏輯設定過於粗糙：它無法區分「心臟如何運作」與「如何合成危險物質」之間的本質差異，結果就是誤殺大量正常教育性問題。這反映出當 AI 平台將安全設定外包給關鍵字或語義分類器時，極易產生的誤報（false positive）問題。

③ 如何影響決策？

Fable 這個案例揭示了一個 API 生態系統中普遍但鮮少被討論的現象：同一個底層模型，在不同平台的行為可以天差地遠。使用者習慣將「Claude 拒絕回答」理解為 Anthropic 的政策，但實際上這可能只是某個平台的自訂限制。這對使用者信任造成的傷害是雙重的——對 Claude 本身能力的誤解，以及對 Fable 平台實用性的失望。

對開發者而言，這也是一個警示：系統提示層的過度限制不只影響安全性，更會直接影響使用者體驗與留存率。如果使用者無法問「腎臟的功能是什麼」，他們很快就會離開。

④ 你該怎麼辦？

如果你是 Fable 使用者，遇到無法回答的教育性問題，可以直接切換到 Claude.ai 或其他 Claude 原生介面，這些問題在標準設定下通常不會被攔截。

如果你是 使用 Claude API 的開發者，這個案例是一個反面教材：安全邊界的設定應該精確而非廣泛，基於意圖語境而非表面語義，否則你的產品將在使用者最基本的需求上失能。

如果你是 評估 AI 平台的決策者，記住：一個平台的 AI 表現不等於底層模型的表現，評測時必須區分「模型能力」與「平台限制」兩個維度。

編輯觀點

這件事讓我有些惱火，原因不在於 Fable 做了限制，而在於這種限制如此粗糙。角色扮演平台有充分理由管控敏感內容，但把「基礎生物學」當作危險信號，只說明這套過濾系統根本沒有經過認真的使用者場景測試。Anthropic 把 Claude 的能力開放給開發者是對的，但當第三方平台用低劣的系統提示把模型能力攔腰截斷，最終受損的是整個 Claude 生態系的聲譽——這是 Anthropic 必須正視的平台治理問題。

提問