Bible Network Crypto DeFi Onchain RWA AI Agent Stablecoin Chain SAFU CryptoTax DeFAI AGI Claude Me Claude Skill Claude Design Claude Cowork
独立メディア
いかなるプロジェクトとも無提携
AI知性のフロンティアを探求する
claude-me.com
最新
Claudeプロンプト実践入門:すぐに使える5つの仕事テンプレート  ·  新手第1週:ゼロからClaudeを使いこなすための完全な学習パス  ·  Claude Code完全ガイド:インストールから高度なワークフローまで一度に理解する  ·  Claude 4モデルファミリー深掘り:Opus、Sonnet、HaikuAIの能力の境界と選択ロジック  ·  Anthropic、2026年米中間選挙に向けClaudeの選挙安全対策を強化・公開  ·  アンソロピック、哲学・倫理・宗教など多分野と「先端AI対話」を数か月間実施と発表
用語解説 · prompt-techniques

Prompt Caching

プロンプトキャッシング
prompt-techniques 進階

30秒バージョン · 忙しい方へ
Anthropicが提供するAPI機能で、繰り返されるシステムプロンプトやコンテキストを最初の処理後にキャッシュします;後続のリクエストはトークンシーケンス全体を再計算するのではなく、通常コストの10%でキャッシュを再読み込みするだけで済みます。1,024トークンを超えるシステムプロンプトを持つアプリケーションでは、この機能によりAPIコストを即座に20〜40%削減できます。
詳しく読む +
01 · これは何?
プロンプトキャッシングはAnthropicが提供するAPI機能で、APIリクエストの一部に「このテキストは静的なので、キャッシュしてください」とマークできます。一旦テキストセグメントがキャッシュされると、後続のAPIコールはそのキャッシュされたセグメントを読み取るために元の計算コストの10%のみを支払います。 最も直感的な理解:システムプロンプトを作業マニュアルとして考えてください。キャッシングなしでは、すべてのAPIコールがClaudeにマニュアル全体を最初から読ませます(全額)。キャッシングありでは、Claudeが最初に読んだ後、後続のコールは「マニュアルが同じであることを確認」するだけです(10%のコスト)。
02 · なぜ存在する?
プロンプトキャッシングの適用シナリオ、高効果から低効果の順: **最高の効果**:大きな固定システムプロンプト(2,000トークン超)と高い日次コール量。 **中程度の効果**:コンテキストに参照文書を注入するアプリケーション(例:バックグラウンド文書をシステムプロンプトに持つRAGシステム)。 **低効果または適用不可**:非常に短いシステムプロンプト(閾値以下);コールごとにシステムプロンプトの内容が異なる;非常に低いコール頻度。
03 · 意思決定にどう影響する?
プロンプトキャッシングの技術的な実装の詳細:静的なシステムプロンプト部分にcache_controlマーカーを追加するだけです。 注意:キャッシュに適しているのはシステムプロンプトの静的な部分(すべてのコールで同一の部分)のみです。動的なコンテンツがある場合は、静的な部分の後に配置し、静的な部分のみにcache_controlを有効にします。 キャッシュヒット率の監視:APIレスポンスの`usage`フィールドの`cache_creation_input_tokens`と`cache_read_input_tokens`でキャッシング効率を測定できます。
04 · どうすればいい?
プロンプトキャッシングのベストプラクティス: **システムプロンプトを構造化する**:静的な汎用ルールを先頭に(この部分がキャッシュされる);動的なコール変数コンテンツを最後に(この部分はキャッシュされない)。 **キャッシュの有効期間に注意する**:5分間のキャッシュ有効期間は、コール間隔が5分を超えるとキャッシュが期限切れになることを意味します。 **プロンプト圧縮と組み合わせる**:まずシステムプロンプトをトリミングし、次にキャッシングを有効化します。 **長文書RAGに適している**:固定の参照文書をコンテキストに注入する必要がある場合、キャッシングを有効にしてシステムプロンプトに配置します。
具体例 +
法律AIアシスタントアプリケーションに、完全な法的責任免除と行動ガイドラインを含むシステムプロンプトがあり、合計4,500トークンです。このアプリケーションのユーザーは1日あたり合計20,000件の質問をします。 プロンプトキャッシングなし:4,500トークン × 20,000コール = 9,000万トークン/日 プロンプトキャッシングあり(98%ヒット率を仮定):合計:1,062万トークン(元の11.8%) このアプリケーションのシステムプロンプト関連コストは~$27/日から~$3.2/日に低下——月約$710の節約。ユーザー体験への変更なし。
図解
Prompt Caching — Cost Comparison Over 100 API CallsSystem Prompt: 3,000 tokens · User input avg: 200 tokens · Cache hit rate: 95%Without CachingSystem Prompt300,000tokens (100 × 3,000)+ User input: 20,000Total input: 320,000 tokensWith Caching (95% hit rate)First call: 3,000 tokens (full)95 cached reads:14,250tokens (95 × 3,000 × 10%)+ 1 full: 3,000+ User input: 20,000Total: 37,250 tokensSavings: 320,000 → 37,250 tokens = 88% reduction on this workloadActual savings depend on System Prompt length, call frequency, and cache hit rateClaude Me · claude-me.com
スクリーンショット歓迎。転載時は出典を明記してください。
よくある誤解 +
✕ 誤解 1
× 誤解1:プロンプトキャッシングは「キャッシュされた回答を使用する」ため、Claudeの回答品質に影響する。プロンプトキャッシングはClaudeの回答ではなく、システムプロンプトの「計算結果」(モデルのシステムプロンプトの内部表現)をキャッシュします。各コールはClaudeがキャッシュされたコンテキストと現在の質問に基づいて新しい回答を生成します。
✕ 誤解 2
× 誤解2:1,024トークンを超えるシステムプロンプトであれば、プロンプトキャッシングを有効にする価値が必ずある。これはコール頻度とキャッシュヒット率に依存します。コール頻度が非常に低い場合(例:1時間に数回のみ)、5分間のキャッシュ有効期間はほとんどのコールがキャッシュミスであることを意味し、メリットは最小限です。
The Missing Link +
直接的な影響
プロンプトキャッシングにはほぼ注目すべきトレードオフがありません——アウトプット品質に影響を与えない純粋なコスト最適化で、実装コストも非常に低い(APIリクエストにマーカーを追加するだけ)。主な考慮事項:キャッシュ有効期限の影響。アプリケーションに長いアイドル期間(5分超)がある場合、キャッシュ期限切れ後の最初のコールは全額を支払います。また、キャッシングは静的なシステムプロンプト部分にのみ適用されます。
質問する
10文字以上入力してください