fundamentals

Claudeはなぜ忘れるのか？コンテキストウィンドウ完全解説

30秒バージョン · 忙しい方へ

Claudeは忘れたのではありません。あなたの言葉がコンテキストウィンドウの外に出てしまっただけです。

Ryan Holt · 2026年06月02日

詳しく読む +

01 · なぜ起きたのか？

コンテキストウィンドウとは、Claudeが一度の会話で処理できるテキストの最大量であり、トークン単位で計測されます。トークンは単語や文字と完全には一致せず、英語では約0.75単語が1トークン、日本語では1文字が約1〜2トークンに相当します。Claude Sonnet 4.6は最大20万トークンをサポートしています。

より重要な概念は、Claudeには会話をまたいだ長期記憶がないということです。毎回の会話はゼロから始まります。コンテキストウィンドウの中にないものは、Claudeには存在しないのと同じです。

02 · 仕組みは？

コンテキストウィンドウが存在するのは、Transformerアーキテクチャの動作方式によるものです。入力処理には、テキスト全体にわたる「アテンション（注意）」の計算が必要です。この計算コストは入力長の二乗に比例して増加するため、非常に高コストです。コンテキストウィンドウの上限は、計算コスト、メモリ使用量、推論速度のトレードオフとして設計されたものです。

モデルによってコンテキストウィンドウのサイズが大きく異なるのはこのためです——それぞれの企業の技術的投資と計算インフラの違いを反映しています。

03 · 自分にどう影響する？

コンテキストウィンドウを理解することは、タスクの分割方法やプロンプトの組み立て方に直接影響します。大量の情報を一度に渡す習慣があると、ウィンドウが埋まるにつれてアウトプットの質が静かに低下します——Claudeは詳細を見落とし始め、回答が曖昧になりますが、「コンテキストが足りなくなってきました」とは教えてくれません。

開発者にとっては、コンテキストウィンドウのサイズはAPIコストに直結します。入力トークンも出力トークンも課金対象であり、毎回のリクエストでコンテキストを埋めると費用が急速に積み上がります。現在のタスクに本当に必要な情報だけを含める習慣がコスト管理の核心です。

04 · どうすればいい？

すぐに実践できる調整：

重要な情報は先頭に置く：新しい会話を始めるたびに、役割設定、プロジェクトの背景、出力フォーマットの要件を最初のメッセージに含めてください。Claudeは先頭への注意力が最も高く、重要な情報を中間に埋めてはいけません。
長い文書は分割して処理する：長い文書はセクションごとに処理し、各セクションの終わりに要点の要約を求めてから次に進みましょう。
積極的に新しい会話を始める：会話が長くなりアウトプットの質が下がってきたと感じたら、同じ会話を続けるのではなく、新しい会話を開始し、重要な結論だけを持ち越しましょう。
システムプロンプトを活用する（開発者向け）：固定の指示をシステムプロンプトに移すことで、毎回のトークン消費を減らし、モデルが常に確認できるようにします。
APIでトークン数を監視する：レスポンスのusageフィールドでprompt_tokensを確認し、上限に近づいたら積極的に管理しましょう。

全文 +

Claudeと長い会話をしていると、突然、最初に話したことを「忘れた」かのように振る舞いはじめることがあります。AIはすべてを覚えているはずだと思っていたのに、回答が矛盾したり、まるで最初からやり直しているかのような状態になります。

これはバグではありません。Claudeが「馬鹿になった」わけでもありません。コンテキストウィンドウという物理的な制約が作用しているのです。

コンテキストウィンドウとは何か

コンテキストウィンドウとは、Claudeが一度の会話の中で「見ること」ができるテキストの最大量のことです。作業机のようなものだとイメージしてください。机の面積は固定されていて、物を積み上げるほど、最初に置いたものが端から落ちていきます。

より正確には、コンテキストウィンドウはトークンという単位で計測されます。トークンは単語や文字と完全には一致せず、英語では約0.75単語が1トークン、日本語では漢字1文字がおおよそ1〜2トークンに相当します。Claude Sonnet 4.6は最大20万トークンのコンテキストウィンドウをサポートしていますが、技術文書や数十回のやり取り、コードブロックはあっという間にこのスペースを埋めてしまいます。

「有限である」ことがなぜ重要なのか

多くの方がAIには何らかの長期記憶があると思っています。しかし実際には、Claudeは毎回の会話をゼロから始めます。前回の会話の内容、先週話したこと、あなたの好みの設定——これらはすべて、今の会話の中で明示的に伝えない限り、Claudeの「記憶」には存在しません。

コンテキストウィンドウには3つの要素が含まれます：

システムプロンプト：デプロイ側があらかじめ設定した指示（ユーザーには通常見えません）
会話履歴：現在のセッションでのすべてのやり取り
アップロードしたコンテンツ：貼り付けや添付したテキスト

この3つの合計がトークン上限を超えることはできません。

ウィンドウがいっぱいになったらどうなるか

最も一般的な対処方法は2つです。

切り捨て（Truncation）：最も古いメッセージが削除され、最新のものだけが残ります。Claudeが「忘れる」のはこのためです——あなたの画面には会話全体が見えていても、Claudeには最後の数千トークンしか見えていません。

要約圧縮（Summarization）：一部のシステムでは、古い会話履歴を自動的に要約してコンテキストの先頭に挿入します。これによって有効な記憶を延長できますが、要約の過程で細かい情報が失われます。

Lost in the Middle：見過ごされがちな問題

コンテキストウィンドウ内のすべてのトークンが同じ重みを持つわけではありません。研究によると、大規模言語モデルはコンテキストの先頭と末尾に最も注意を払い、中間部分は比較的「見落とされやすい」ことが示されています。これは「Lost in the Middle（中間の喪失）」と呼ばれる現象です。

実践的な意味：重要な文書をClaudeに参照してほしい場合、長い会話の中間に埋めないようにしましょう。会話の冒頭に配置するか、質問の直前に「会話の最初に貼り付けた文書を参照して答えてください」と明示的に再確認することで、重要な情報への注意力を高めることができます。

日常的な使い方への示唆

コンテキストウィンドウを理解した後は、Claudeとのやり取り方が変わるはずです。

長いタスクは分割する：長い報告書を一度に丸ごと渡すのではなく、セクションごとに処理しましょう。各セクションの終わりに要約を求め、その要約を次のセクションへの入力として使うことで、重要なコンテキストをウィンドウ内に保つことができます。

重要な情報は先頭に置く：あなたの役割、プロジェクトの背景、出力フォーマットの要件——これらは毎回の会話の最初に配置してください。Claudeは前回の会話を覚えていません。

システムプロンプトを活用する（開発者向け）：固定の設定、ペルソナ定義、フォーマット要件はシステムプロンプトに入れましょう。コンテキストの先頭を常に占め、モデルに確実に読まれます。

トークン使用量を監視する：Claude APIのユーザーは、各レスポンスでトークン数を確認できます。上限に近づいたら、会話をリセットするか新しいセッションを始めることで、サイレントな品質低下を防げます。

コンテキストウィンドウは急速に拡大している

GPT-3のコンテキストウィンドウはわずか4,096トークンでした。現在のトップモデルは10〜20万トークンが標準となり、研究段階では100万トークンに達するものもあります。この成長は、Claudeが扱える作業の複雑さが急速に増していることを意味します——1つの記事の分析から、今では1冊の本全体を一度に処理することも可能になっています。

しかし、どれだけ大きなウィンドウも、境界は存在します。その境界を理解すること——いつタスクを分割するか、いつ再提示するか、いつ新しい会話を始めるか——これが、Claudeを本当に使いこなすための基本スキルです。

図解

スクリーンショット歓迎。転載時は出典を明記してください。

質問する