Extended ThinkingはClaude 4シリーズに導入された機能で、最終回答を生成する前にモデルが「思考空間」でより長い内部推論を行えるようにします。
標準モードとExtended Thinkingモードの違い:標準モードではClaudeは入力を受け取り直接アウトプットを生成します——単純なタスク(翻訳、要約、フォーマット変換)には十分です。Extended Thinkingモードでは、Claudeはまず隠された(オプションで表示可能な)空間で推論します——問題の次元を分析し、解決パスを検討し、中間ステップを検証——その後この推論プロセスに基づいて最終回答を生成します。
なぜ「一歩多く考える」と回答がより正確になるのか?LLMの生成メカニズムにおいて、各アウトプットトークンはすべての前のトークンに基づいて予測されます。Claudeが「考えてから答える」とき、推論ステップは後続の生成のアンカーポイントになります。
Extended Thinkingが最も顕著な効果を示すタスクと、有効にする価値がないタスクは何ですか?
最も顕著なタスクタイプ:数学と形式的推論(複数ステップの計算、公式導出、論理的証明);複雑なアルゴリズム設計;マルチ制約決定問題;厳密な論証分析。
効果が限られる/有効にする価値がない:翻訳、フォーマット変換、テキスト要約(深い推論を必要としない);創造的な文章(Extended Thinkingの論理的な性質が創造的なアウトプットを過度に構造化させる可能性がある);単純な事実照会。
Claude APIでExtended Thinkingを正しく有効にするには?どのパラメータを設定する必要がありますか?
response = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=16000,
thinking={"type": "enabled", "budget_tokens": 10000},
messages=[{"role": "user", "content": "あなたの質問"}]
)
キーパラメータの説明:budget_tokens——思考プロセスが使用できる最大トークン数;推奨:中程度の複雑さのタスクには5,000〜10,000、高難度タスクには10,000〜32,000。max_tokens——thinking content blockを含む応答全体のトークン制限。
費用計算:思考プロセストークンも課金される(入力トークンとしてカウント);実際のコストは標準モードの2〜5倍。
Extended ThinkingとChain-of-Thoughtプロンプティングの関係は何ですか?同じものですか?
同じ基礎原理を持ちますが、実装レベルでは異なるものです:
Chain-of-Thoughtプロンプティング:プロンプティング技術——プロンプトに「ステップバイステップで考えて」を追加します。CoTはプロンプト主導;アウトプットは通常の応答テキストに含まれる;特別なAPIパラメータは不要。
Extended Thinking:モデルレベルの機能——Claudeが独立した「思考空間」で推論できるようにします。APIのthinkingパラメータが必要。
主な違い:CoTの推論ステップはアウトプットの一部(ユーザーに表示される);Extended Thinkingの推論は別のブロックにある(オプションでユーザーから非表示)。
データサイエンティストがノイズの多い時系列データから外れ値を識別するアルゴリズムを設計するためにClaudeの助けが必要です。この問題には複数の可能なアプローチと異なる適用条件が含まれます。
Extended Thinkingなし:Claudeは「Isolation ForestまたはLOFアルゴリズム」を直接推奨するかもしれません——この特定の問題にこれらの方法が合うかどうかの評価をスキップします。
Extended Thinkingあり:思考空間でClaudeはまず問題の主要な次元を分析します:時系列の特性、外れ値のタイプ、リアルタイム要件、データ量。その後いくつかの方法の適用条件と限界を評価します。最終回答は条件付き:データに明確な季節性がある場合はSTL分解を使用;静止データにはIsolation Forest;リアルタイム要件がある場合はRRCFを検討。
Extended Thinkingのコアなトレードオフ:推論の深さ vs コストと速度。有効にすると、思考プロセストークンも課金され(通常は入力トークンの2〜5倍)、応答時間も長くなります。高精度が必要でコストと速度が主要な考慮事項でないタスクには、このコストは完全に価値があります。最も効果的な使用方法:階層型戦略——「深い推論を必要とする高複雑度」に分類されたリクエストにのみExtended Thinkingを有効にし、他のリクエストには標準モードを使用します。