トークンとは何ですか?どれだけ使ったかどうやって知りますか?
トークンは言語モデルがテキストを処理する最小単位で、単語でも文字でもなく、その中間です。英語では約4文字が1トークン、一般的な単語は1〜2トークン。英文1ページは約400〜600トークンです。
使用量を確認するには、Anthropicの公式tokenizerツールで見積もるか、APIレスポンスのusageフィールドを確認します(input_tokensとoutput_tokensが表示されます)。Claude.aiの一般ユーザーにはトークン数が直接表示されませんが、「長い文書 = 多くのトークン = 大量のスペースを消費する」という概念を覚えておくだけで十分実用的です。
非常に長いドキュメントを貼り付けたのに、Claudeが全部読んでいないようです。なぜですか?
二つの理由が考えられます。第一に、コンテキストウィンドウが溢れた:ドキュメントと以前の会話を合わせて上限を超えると、入りきらない部分は切り捨てられます。第二に、より微妙な問題:ドキュメントがコンテキスト上限内に収まっていても、非常に長い入力に対するClaudeの注意は均等に分配されません——研究によると、ドキュメントの最初と最後への注意が高く、中間部分が低く評価される傾向があります。
実践的な解決策:質問がドキュメントの一部に関するものなら、その部分だけ貼り付けましょう。全文を総合する必要がある場合は、セクションに分けてそれぞれをClaudeに要約させ、最後に要約を統合します。すべてを一度に投入するより信頼性が高くなります。
Claude Proとフリープランではコンテキストウィンドウのサイズに違いがありますか?
あります。ただし具体的な数字はモデルの更新によって変わります。一般的にProはより新しいモデルバージョンにアクセスでき、コンテキストウィンドウが大きい場合があります。フリープランは古いモデルやより小さなコンテキスト上限に制限される場合があります。現在のClaudeの最新フラッグシップモデルは数十万トークンのコンテキストウィンドウをサポートしていますが、具体的な上限はAnthropicの現在のドキュメントによります。
より実践的な問い:日常的な会話では、古いバージョンで提供されるコンテキストウィンドウでも非常に大きく、ほとんどの場合上限に達しません。上限に当たりやすいのは:大量のコードを貼り付けたコードレビュー、長いレポートの分析、数十ターンにわたる長い会話などです。これらのケースではProの大きなスペースが実際の価値を持ちます。
上級:システムプロンプトもコンテキストウィンドウを占有しますか?開発者への影響は?
はい、システムプロンプトもコンテキストウィンドウのスペースを占有し、固定コストです——システムプロンプトが100トークンでも5,000トークンでも、すべての会話でそのトークンが差し引かれます。
開発者への実際の影響:システムプロンプトが長いほど、会話履歴とユーザー入力のためのスペースが減り、APIコールごとのコストが高くなります。これがシステムプロンプトの作成が簡潔さの技術である理由です——最も重要な指示とルールを残し、冗長な説明を削除します。5,000トークンのシステムプロンプトと500トークンのものはパフォーマンスが似ていても、前者はAPIコストを大幅に引き上げます。Anthropicのプロンプトキャッシング機能はシステムプロンプトの重複課金を減らせますが、それは別のトピックです。
Claudeをしばらく使っていると、こんな経験はありませんか?会話が進むにつれて、Claudeが以前言ったことを「忘れ」始め、矛盾した回答をしたり、品質が落ちたりすることが。これはほぼすべてコンテキストウィンドウ——Claudeの「作業記憶」——に関係しています。
この記事の目標は、コンテキストウィンドウが何であるか、何が入っているか、いっぱいになるとどうなるか、そしてよりスマートに使うための実践的なコツを本当に理解することです。
最もわかりやすいたとえ:コンテキストウィンドウはあなたとClaudeが共有するメモ帳で、大きさはトークンで決まる固定サイズです(Claudeの上限はバージョンによって数十万から約200万トークン)。あなたが送るすべてのメッセージ、Claudeのすべての返答、貼り付けた文書がこのメモ帳のスペースを占有します。
トークンは言語モデルがテキストを処理する基本単位で、単語とは1対1ではありません。英語では約4文字が1トークン、一般的な単語は1〜2トークン。英文1ページは約400〜600トークンが目安です。
メッセージを送るたびに、Claudeはそのメッセージだけでなく、共有メモ帳のすべてを読みます:システムプロンプト(Claudeの役割とルールを設定するテキスト)、会話の最初から現在まですべてのメッセージ(あなたとClaudeの両方)、貼り付けたドキュメントやファイル、そして今回の新しいメッセージです。
これがClaudeが以前言ったことを「覚えている」理由です——本当の記憶ではなく、毎回メモ帳全体を読み直しているだけです。重要な含意:Claudeは別の会話をまたいだ記憶を持ちません。新しい会話を始めるたびにメモ帳は白紙になります。
会話と文書がコンテキストウィンドウの上限を超えても、明確なエラーメッセージは出ません。通常起きるのは:新しいコンテンツのために最初の会話ターンが静かに削除されることです。あなたが以前明確に述べたことをClaudeが無視した回答をするまで、気づかないかもしれません。
長い会話の後半で回答品質が落ちることが多い理由はこれです——Claudeが馬鹿になったのではなく、最初に設定した重要な前提が「見えなくなった」だけです。
第一に、自然な区切りで新しい会話を始めること。一つの会話を際限なく続けないこと。Claudeが「忘れ始めた」と感じたり、話題が変わったりしたら、新しい会話を開いて必要な文脈を短いまとめで引き継ぐ方が、古い会話を続けるより効果的です。
第二に、貼り付けるものの大きさに注意すること。貼り付けたドキュメントはすべてコンテキストのスペースを占有します。50ページのレポートの一節だけ聞きたいなら、その一節だけ貼り付けましょう。まずClaudeに長い文書を要約させ、その要約で会話を続けるのも良い方法です。
第三に、重要なことは近くに置くこと。コンテキストウィンドウ内のすべてのコンテンツが同じ重みではありません——一般的に会話の末尾に近いコンテンツほどClaudeは注意を向けます。重要な制約や要件は、最初だけ言って終わりにするのではなく、必要な場面のたびに繰り返すことをお勧めします。
コンテキストウィンドウを理解することで、Claudeの「忘却」がバグではなく動作の基本特性であることがわかります。これにより、問題が起きてから困惑するのではなく、能動的に会話品質を管理できます。最もシンプルな覚え方:Claudeは返答のたびにメモ帳全体を読み直す;あなたの仕事は、そのメモ帳に必要なものが入っていること、そして不要なものを詰め込みすぎないことを確認することです。