Anthropic 旗下互動敘事平台 Fable 採用 Claude 作為底層模型,卻在使用者實測中出現一個令人困惑的現象:連高中等級的生物學問題,例如人體器官功能、基礎遺傳學,都會觸發拒答機制。這不是 Claude 本身的預設行為,而是 Fable 針對其平台情境額外疊加的限制所導致的結果。
① 這是什麼?
Fable 是一個以 AI 驅動的角色扮演與互動故事平台,讓使用者可以與虛構角色展開長篇對話敘事。平台使用 Claude API,但會在系統提示(system prompt)層面對模型行為進行客製化設定,以符合其產品定位與品牌安全需求。當使用者在對話中提及生物學相關內容時,Fable 的過濾邏輯顯然將其歸類為潛在敏感範疇,即使問題本身完全無害。
② 為什麼存在?
Fable 的核心使用場景是角色扮演,其使用者群體涵蓋青少年,平台方需要對「可能被誤用的技術內容」保持高度警覺。問題在於,這套過濾邏輯設定過於粗糙:它無法區分「心臟如何運作」與「如何合成危險物質」之間的本質差異,結果就是誤殺大量正常教育性問題。這反映出當 AI 平台將安全設定外包給關鍵字或語義分類器時,極易產生的誤報(false positive)問題。
③ 如何影響決策?
Fable 這個案例揭示了一個 API 生態系統中普遍但鮮少被討論的現象:同一個底層模型,在不同平台的行為可以天差地遠。使用者習慣將「Claude 拒絕回答」理解為 Anthropic 的政策,但實際上這可能只是某個平台的自訂限制。這對使用者信任造成的傷害是雙重的——對 Claude 本身能力的誤解,以及對 Fable 平台實用性的失望。
對開發者而言,這也是一個警示:系統提示層的過度限制不只影響安全性,更會直接影響使用者體驗與留存率。如果使用者無法問「腎臟的功能是什麼」,他們很快就會離開。
④ 你該怎麼辦?
如果你是 Fable 使用者,遇到無法回答的教育性問題,可以直接切換到 Claude.ai 或其他 Claude 原生介面,這些問題在標準設定下通常不會被攔截。
如果你是 使用 Claude API 的開發者,這個案例是一個反面教材:安全邊界的設定應該精確而非廣泛,基於意圖語境而非表面語義,否則你的產品將在使用者最基本的需求上失能。
如果你是 評估 AI 平台的決策者,記住:一個平台的 AI 表現不等於底層模型的表現,評測時必須區分「模型能力」與「平台限制」兩個維度。
編輯觀點
這件事讓我有些惱火,原因不在於 Fable 做了限制,而在於這種限制如此粗糙。角色扮演平台有充分理由管控敏感內容,但把「基礎生物學」當作危險信號,只說明這套過濾系統根本沒有經過認真的使用者場景測試。Anthropic 把 Claude 的能力開放給開發者是對的,但當第三方平台用低劣的系統提示把模型能力攔腰截斷,最終受損的是整個 Claude 生態系的聲譽——這是 Anthropic 必須正視的平台治理問題。