fundamentals

創発的能力：AIモデルが大きくなるとなぜ以前には全くなかった能力が突然現れるのか

30秒バージョン · 忙しい方へ

湧現能力はLLMの最も直観に反する特性の一つです：小モデルで「ほぼ不可能」なタスクが、大モデルで突然「かなり良い」になります——線形的な向上ではなく、ジャンプです。これがClaude 4がClaude 3には全くできなかったことができる理由です。

Hannah Scott · 2026年06月05日

詳しく読む +

01 · なぜ起きたのか？

創発的能力（Emergent Capabilities）とは、LLMの特定の能力がモデルが特定のスケール閾値に達するまでほぼゼロであり、その後突然現れて急速に向上する現象です。最も典型的な事例：多段階算術推論、CoTの有効性、類比推論、コードのセマンティック理解。

02 · 仕組みは？

湧現能力の発見はAI安全性研究に深遠な影響を与えます：AIの能力が非線形に創発する場合、AIの能力の監視と予測がはるかに難しくなります。AnthropicのRSP ASL分類システムの設計の一部の根拠：安全評価は能力の出現に反応してではなく、出現前に行われる必要があります。

03 · 自分にどう影響する？

創発的能力を理解することで、Claudeを使用する際にスマートなモデル選択ができます。Sonnetがタスクをうまく処理しない場合、Opusに切り替える前に「このタスクに必要な能力は、Sonnetのスケールではまだ完全に創発していない能力か？」と自問してみましょう。そうなら、Opusへのアップグレードは線形的な精度向上だけでなく、質的な能力変化をもたらすかもしれません。

04 · どうすればいい？

創発的能力を深く理解するための推薦読書：（1）「Emergent Abilities of Large Language Models」（Wei et al., 2022, Google）；（2）「Are Emergent Abilities of Large Language Models a Mirage?」（Schaeffer et al., 2023）；（3）AnthropicのModel Cards。

全文 +

創発的能力：スケールがLLMで何を解き放つのか

創発的能力はLLMの最も驚くべき特性の一つだ。小さいモデルでは「ほぼ不可能」だったタスクが、大きなモデルでは突然「かなり得意」になる。線形な向上ではなく、非線形な飛躍だ。この現象がなぜClaude 4がClaude 3にできなかったことをこなせるのかを説明する。

創発とは何か

創発という概念は複雑系理論に由来する。十分な数の単純な要素を組み合わせると、個々の要素が独立して持っていなかった性質を示すシステムが生まれる。LLMにおける創発的能力とは、十分なスケールに達する前はパフォーマンスがほぼゼロで、閾値を超えた途端に急速に向上する能力のことだ。

2022年、Googleの研究者たちがこの重要な現象を特定した。「特定のスケール閾値以下ではほとんど存在しない言語モデルの能力が、閾値を超えた途端に突然現れ、急速に相当なレベルに達する」というものだ。

最も典型的な創発の事例

複数ステップの算術：精度がほぼランダムから高精度へと不連続に跳躍する。線形ではない。

Chain-of-Thought推論：CoTプロンプティングは小さいモデルではほとんど効果がない。大きなモデルでは推論精度が劇的に改善される。

類推推論：小さいモデルは類推タスクをほとんど処理できない。大きなモデルでは突然、精度が高くなる。

コードの理解と生成：モデルが構文パターンだけでなくコードの意味論を把握するようになると、非線形な進歩が現れる。

なぜ創発が起きるのか

複数タスクの組み合わせ仮説：複雑な能力は単純なサブ能力を組み合わせたもので、モデルがすべての必要なコンポーネントを同時にマスターしたときにのみ現れる。

ノイズ閾値仮説：小さいモデルは関連する推論を実用的に不十分な精度レベルで行っている。スケールアップによって精度が実用的な閾値を超え、「使えない」から「使える」状態へとシフトする。

AI安全性への含意

創発的能力の発見はAI安全性に重大な意味を持つ。能力が非線形に発展する場合、AIの能力を予測・監視することが著しく困難になる。特定のスケール閾値を超えるまでモデルが危険な能力を持っていないように見えても、閾値を超えた途端にそのような能力が予期せず現れる可能性がある。これがAnthropicのRSP（Responsible Scaling Policy）のASL分類アプローチを支持する根拠だ。能力が現れた後ではなく、現れる前に安全評価を実施しなければならない。

Claudeを使う上での実践的な意味

創発的能力を理解することで、Claudeを使う際のモデル選択をより情報に基づいて行えるようになる。Sonnetがあるタスクで不十分なパフォーマンスを示すとき、Opusにアップグレードする前に、必要な能力がSonnetのスケールで完全に創発しているかを確認するといい。

能力がまだ創発していない場合、アップグレードは線形ではなく質的な改善をもたらす可能性がある。逆に、能力がすでにSonnetのスケールで存在する場合、アップグレードによる追加の恩恵は限定的だ。

Claude世代間の違いは単なる精度改善ではなく、質的な能力の創発を反映している。AIの進歩が不連続に見える理由も、能力が突破口となるポイントで創発し、突然アプリケーションの可能性が広がるためだ。

さらに深く学ぶために

「Emergent Abilities of Large Language Models」（Wei et al., 2022, Google）——基礎的な論文
「Are Emergent Abilities of Large Language Models a Mirage?」（Schaeffer et al., 2023）——評価アプローチが観察される創発を形成する可能性を示す批判的な視点
AnthropicのModel Cards——Claude世代をまたぐ能力評価の記録

図解

スクリーンショット歓迎。転載時は出典を明記してください。

質問する