名詞解析 · core-concepts

LLM (Large Language Model)

大型語言模型

core-concepts 新手

30 秒版 · 給沒耐心的人

以海量文字資料訓練、具備理解和生成人類語言能力的 AI 模型。Claude、GPT-4、Gemini 都是 LLM。「大型」指的是模型的參數量龐大，不是文字輸出的長度。

完整解說 +

01 · 這是什麼？

LLM（Large Language Model，大型語言模型）是一種用海量文字資料訓練出來的 AI 模型，主要能力是理解和生成人類語言。Claude、ChatGPT 背後的 GPT-4o、Google 的 Gemini、Meta 的 LLaMA——這些都是 LLM。

「大型（Large）」指的是模型的參數量——數十億甚至數千億個參數（可以理解為模型的「可調節旋鈕」），在訓練過程中被調整，讓模型學到語言的規律。

LLM 的核心運作邏輯是「預測下一個 Token」——給定一段前文，模型計算每個可能的下一個 Token 的機率，然後輸出最可能的那個，一個接一個地生成完整的回答。這個機制解釋了 LLM 的很多行為特性，包括它為什麼有時候很準確、有時候會「幻覺」。

02 · 為什麼存在？

LLM 的起源可以追溯到語言建模研究。2017 年的《Attention is All You Need》論文提出了 Transformer 架構，它的「自注意力機制」讓模型能同時考慮整個輸入序列，讓語言模型能力跳躍式提升。隨後研究者發現：把 Transformer 做得更大（更多參數）、喂給它更多資料，能力會出現「湧現（Emergence）」——模型突然能做它的小型版本做不到的事，例如邏輯推理、程式碼撰寫。Claude 就是在這個背景下由 Anthropic 開發的，專注於讓能力強大的模型同時保持安全和對齊人類價值觀。

03 · 如何影響你的決策？

理解 LLM 是什麼，對你使用 Claude 有幾個直接影響：

解釋幻覺的來源：LLM 輸出的是「機率上最可能的文字序列」，不是「正確答案」。當它沒有足夠的資訊時，不會說「我不知道」，而是輸出一個「看起來最可能的答案」——即使那個答案是錯的。

解釋「同樣的問題，不同答案」是正常的：LLM 的機率性讓它每次輸出可能略有不同（除非把 Temperature 設為 0）。

最重要的認知：LLM 是語言生成工具，不是「真理機器」。充分利用它的推理和生成能力，但對重要資訊永遠要驗證。

04 · 你該怎麼辦？

理解 LLM 後，對日常使用 Claude 的具體啟示：

重要資訊一定要驗證：Claude 輸出「可能性最高的答案」，不是「保證正確的答案」。醫療、法律、財務決策——永遠用其他管道驗證。
把 Claude 當「思考夥伴」不是「知識百科」：LLM 最強的地方是推理、分析、生成、改寫，不是儲存正確事實。
理解「同樣的問題，不同答案」是正常的：如果需要非常一致的輸出，加入明確格式要求，或把 Temperature 設為 0（API 用戶）。
多問幾次能提升品質：對結果不滿意，試著換方式提問或加入角色設定。

實際例子 +

理解「LLM 預測下一個 Token」機制對日常使用意義的思考實驗：想像你在做「文字填空」遊戲。題目是「今天天氣很好，我決定去___」，人類大腦會填「公園」「散步」「爬山」——符合上文的合理答案。LLM 做的事情本質上一樣：根據前文計算各個可能填入詞的機率，輸出機率高的那些詞。

這個機制很強大，但也解釋了 LLM 的限制：如果你問「2026 年諾貝爾物理學獎是誰？」而這件事在 Claude 的訓練資料裡沒有，它不會說「我不知道」。它會計算「最可能」出現的答案，生成一個聽起來合理但可能完全錯誤的名字。這就是幻覺的根本來源——不是在說謊，而是在預測最可能的答案，只是最可能的答案恰好是錯的。

圖解