用語解説 · core-concepts

LLM (Large Language Model)

大規模言語モデル（LLM）

core-concepts 新手

30秒バージョン · 忙しい方へ

大量のテキストデータでトレーニングされ、人間の言語を理解・生成する能力を持つAIモデル。Claude、GPT-4、GeminiはすべてLLMです。「大規模」とはパラメータ数が膨大であることを指し、出力の長さではありません。

詳しく読む +

01 · これは何？

LLM（Large Language Model、大規模言語モデル）は大量のテキストデータでトレーニングされたAIモデルで、主に人間の言語を理解・生成する能力を持ちます。Claude、GPT-4o、GoogleのGemini、MetaのLLaMA——これらはすべてLLMです。

「大規模（Large）」とはモデルのパラメータ数を指します。LLMのコア動作ロジックは「次のトークンを予測する」です——前のテキストに基づいて可能な次のトークンの確率を計算し、最も可能性の高いものを順番に出力して完全な回答を構築します。

02 · なぜ存在する？

LLMの起源は言語モデリング研究にさかのぼります。2017年の「Attention is All You Need」論文がTransformerアーキテクチャを導入しました。研究者はTransformerを大きくしてより多くのデータを与えると「創発（Emergence）」が生じることを発見しました。ClaudeはAnthropicによってこの文脈で開発され、強力なモデルを安全で人間の価値観と一致した状態に保つことに注力しています。

03 · 意思決定にどう影響する？

LLMが何かを理解することはClaude使用に直接影響します。幻覚の原因を説明：LLMは「統計的に最も可能性の高いテキストシーケンス」を出力します。「同じ質問、異なる回答」が正常な理由を説明：LLMの確率性により、実行ごとにアウトプットがわずかに異なる場合があります。最も重要な認識：LLMは言語生成ツールであり「真理マシン」ではありません。

04 · どうすればいい？

LLMを理解した後、日常的なClaude使用への具体的な示唆：1. 重要な情報は必ず確認。2. Claudeを「百科事典」ではなく「思考パートナー」として扱う。3. 「同じ質問、異なる回答」は正常だと理解する。4. 複数回質問することで品質を向上させられる。

具体例 +

「LLMが次のトークンを予測する」メカニズムを理解するための思考実験：「穴埋め」ゲームをしていると想像してください。「今日は天気がいいので、___に行くことにした」——人間の脳は「公園」「散歩」「ハイキング」と埋めます。LLMが本質的にやることは同じです。このメカニズムは強力ですが制限も説明します：Claudeのトレーニングデータにない情報について質問した場合、「わかりません」とは言わず、もっともらしく聞こえるが間違っている可能性のある答えを生成します。これが幻覚の根本的な原因です。

図解

スクリーンショット歓迎。転載時は出典を明記してください。

よくある誤解 +

✕ 誤解 1

× 誤解1：LLMは人間と同じように「考えている」または「理解している」。LLMのコアは確率的なトークン予測であり、人間の意味での思考や理解ではありません。

✕ 誤解 2

× 誤解2：LLMはAIのすべてです。AIにはコンピュータビジョンAI、画像生成AI（Midjourney、DALL-E）、強化学習AIなども含まれます。

The Missing Link +

直接的な影響

LLMは現在最も汎用的で柔軟なAI技術の形態ですが、根本的な制限があります。利点：ほぼすべての言語タスクで非常に多用途；使用障壁が低い；推論と分析が可能。根本的な制限：アウトプットは確率的；知識にカットオフ日がある；幻覚はアーキテクチャの特性。最も重要な認識：LLMは言語生成ツールであり「真理マシン」ではありません。

質問する