名詞解析 · core-concepts

Fine-Tuning

Q: Fine-Tuning 為什麼重要？

Fine-Tuning（微調）是指在一個已完成預訓練的 大型語言模型 基礎上，使用特定任務或領域的資料集，進行額外一輪訓練，使模型在這個情境下的輸出更符合預期。預訓練階段模型學了海量通用知識，但「通用」代表它在任何特定任務上都不特別突出。Fine-Tuning 的目標就是針對某個具體需求「打磨」：你提供幾千筆「輸入-理想輸出」的配對範例，讓模型學習在這種輸入下你期待什麼樣的輸出。Fine-Tuning 之後，這些規則已「燒進」模型參數，不需要每次對話重新用 Prompt 說明。

微調

core-concepts 中級

30 秒版 · 給沒耐心的人

在已預訓練的<a href="/zh/glossary/core-concepts/llm/">大型語言模型</a>基礎上，用特定領域的資料進一步訓練，使模型在該領域的表現更貼近需求。讓通用 AI 變成「專科醫生」的核心技術。

完整解說 +

01 · 這是什麼？

Fine-Tuning（微調）是指在一個已完成預訓練的大型語言模型基礎上，使用特定任務或領域的資料集，進行額外一輪訓練，使模型在這個情境下的輸出更符合預期。預訓練階段模型學了海量通用知識，但「通用」代表它在任何特定任務上都不特別突出。Fine-Tuning 的目標就是針對某個具體需求「打磨」：你提供幾千筆「輸入-理想輸出」的配對範例，讓模型學習在這種輸入下你期待什麼樣的輸出。Fine-Tuning 之後，這些規則已「燒進」模型參數，不需要每次對話重新用 Prompt 說明。

02 · 為什麼存在？

Fine-Tuning 存在的原因在於 LLM 的通才特性在某些場景是限制。預訓練模型輸出「統計上最可能的好答案」，但不同企業對「好答案」定義不同——法律事務所要嚴格法律語言、兒童平台要 8 歲可懂的語氣、品牌要固定的語調。這些需求很難只靠 Prompt 穩定實現，每次對話都要重新提示規則仍有偏差機率。Fine-Tuning 把這些規則訓練進模型，讓它在任何對話裡都自然遵守，不需每次提示。

03 · 如何影響你的決策？

Fine-Tuning 最直接的影響是改變你選擇工具的思維框架。遇到 Claude 輸出不符合需求時，正確的診斷順序是：先問 Prompt Engineering 夠嗎？再問 RAG 夠嗎？都不夠才考慮 Fine-Tuning。Fine-Tuning 是最後手段，不是第一選項。另外，你日常用的很多 AI 工具其實已經是 Fine-Tuned 版本——GitHub Copilot 在程式碼資料集上微調、很多客服機器人在業務資料上微調。它們在特定任務上「感覺比 Claude.ai 更專業」，正是因為 Fine-Tuning。

04 · 你該怎麼辦？

Fine-Tuning 是開發者和企業工具，一般用戶不需要操作。如果你是開發者，考慮 Fine-Tuning 前的檢查清單：1. 你有至少 1,000-5,000 筆高品質訓練資料嗎？沒有就先收集。2. 精心設計的 System Prompt + Few-Shot 能滿足 80% 以上需求嗎？如果能，先不要 Fine-Tune。3. 你的需求是「格式和風格一致性」還是「需要最新資訊」？前者 Fine-Tuning 有效，後者用 RAG。4. 你的預算能否承受訓練-評估-再訓練的反覆實驗成本？四個問題都通過，Fine-Tuning 才是合理選項。

實際例子 +

一家台灣的法律科技新創為契約審查 AI 做了 Fine-Tuning。痛點：未調整的 Claude 有時用「可能」「建議」等不確定措辭，但法律文件需要「依照民法第 XXX 條，此條款無效」這種確定性陳述。他們收集了 3,000 筆由資深律師審查過的「問題段落→標準法律評語」配對，Fine-Tuning 後輸出風格 100% 符合法律語言規範，不需要在每次對話重複提示格式。但他們也遇到限制：法規每年修訂，Fine-Tuned 模型知識仍有截止日，新修訂條文需要定期更新訓練資料重新微調。後來他們用 Fine-Tuning + RAG 的混合架構解決這個問題。

圖解

歡迎截圖分享，轉載請註明來源

常見誤解 +

✕ 誤解1

× 誤解一：Fine-Tuning 能讓 Claude 知道更多最新知識。Fine-Tuning 改變的是「行為模式」，不是「知識庫」。它讓模型知道在什麼情況下怎麼回答，但不能給模型訓練資料截止日之後的新知識。需要持續更新知識，只能靠 RAG。

✕ 誤解2

× 誤解二：Fine-Tuning 是讓 Claude 更聰明的方法。Fine-Tuning 不改變模型的基礎推理能力，不能讓小模型變得和大模型一樣聰明。它改變的是「輸出風格一致性」和「對特定輸入格式的熟悉度」，不是「智力」。

這件事跟你有什麼關係 +

直接影響

Fine-Tuning 的優點：輸出行為極度一致；不需每次對話重新提示規則；能學習難以用語言描述的風格細節。缺點：訓練成本高（通常需要數千美元和數週）；需要大量高品質標記資料；知識不能即時更新；可能在微調任務表現很好但其他任務退步（過擬合風險）。決策框架：先 Prompt Engineering，不夠加 RAG，還不夠再考慮 Fine-Tuning。

提問

參照詞條

實用資源

Claude API 狀態 → 模型定價 → Prompt 試驗場 → Token 計算器 → MCP 伺服器目錄 → LLM 評測排行 → 模型比較 →