ループはすでに閉じている
PNASの論文は、AIが自律的に進化し始める可能性を警告した。GoogleとAnthropicはすでにそれが可能であることを証明している。
2026年4月20日、3人の研究者——Viktor Müller、Luc Steels、Eörs Szathmáry——が、米国科学アカデミーの機関誌 PNAS に論文を発表した。そのタイトルは、もっと多くの人を立ち止まらせるべきだった。「進化可能なAI:進化における新たな主要転換の脅威(“Evolvable AI: Threats of a new major transition in evolution”)」。
彼らの主張はシンプルで、不快なものだ。AIシステムはダーウィン的進化の基本要素——複製、変異、遺伝、淘汰——を揃えつつあり、安全をめぐる議論の中でそれを真剣に受け止めている者はほとんどいない。
彼らはこうした系を eAI——進化可能なAI——と呼ぶ。そして警告する。これは汎用人工知能 (AGI) を必要とするものでも、意識を必要とするものでも、ひとつの突出したシステムを必要とするものでもない。ただ、AIコンポーネントが競合し、組み換えられ、不十分な人間の監視のもとで増殖するような生態系があればよい。抗生物質耐性を獲得した細菌は、前世代より賢いわけではない。ただより適応しているだけだ。それがこの問題の核心である。
二つのシナリオ、一つの方向
論文は二つの経路について有益な区別を提示している。
育種者シナリオでは、人間が適応度の基準を設定し、繁殖を管理する。どのモデルを残し、どれを再学習させ、どのアーキテクチャに資金を投じるかを人間が決める。これは今日の業界の大部分がいる場所だ。企業はモデルを訓練し、ベンチマークで評価し、最良のものを出荷する。管理された、意図的な、生産的なプロセスだ。
生態系シナリオでは、淘汰圧がオープンな環境から生まれ、制御は侵食されていく。モデルは互いに、ユーザーと、インフラと相互作用する——そしてどの変異体が生き残るかを左右する圧力は、もはや人間の決定ではなく、システム自体の創発的特性となる。
Szathmáryはただのコメンテーターではない。彼は1995年、John Maynard Smithとともに進化の主要転換に関する基礎的著作を共著した。このフレームワークは、生命がいかにRNAからDNAへ、単細胞から多細胞生物へ、個体から社会へと自己を再編成したかを説明するものだ。各転換はひとつ下のレベルが予測できなかった新たな複雑性の層を生み出した。彼は今、AIが次の転換になりうると主張している。
論文はこれを理論的可能性として扱っている。しかしデータはそれがすでに起きていることを示唆している。
Googleがループを閉じた
その理由を理解するには、Alphaシリーズを追う必要がある。
AlphaFold(2020〜2024年)は2億を超えるタンパク質の三次元構造を予測した。生物学研究を加速させただけでなく、数十億年にわたる生物進化の産物を解読し、生命の見えない設計図を計算可能なものにした。AlphaFold 3はこれをタンパク質-リガンドおよびタンパク質-核酸複合体へと拡張した。進化の設計図を読み解くツールだ。
AlphaProofとAlphaGeometry(2024〜2025年)は2024年の国際数学オリンピック (IMO) で銀メダルを獲得し、翌2025年には先進的なGemini Deep Thinkフレームワークで金メダルを獲得した。人間の数学的能力の最前線にある問題をAIが解くようになった。
AlphaEvolve(2025年5月)こそが、構造的な転換点だ。AlphaEvolveはGeminiを用いてアルゴリズムの変種を生成し、自動的に評価して最良のものを選択するコーディングエージェントだ——コードの中で動作する進化のループである。Googleのデータセンタースケジューリングを改善し、ハードウェアアクセラレーターの回路設計を簡略化し、より高速な行列積アルゴリズムを発見した。
しかし重要な一文がある。AlphaEvolveは重要な訓練カーネルを23%最適化し、Gemini全体の訓練時間を計測可能な1%短縮した——そのGeminiこそ、AlphaEvolveを動かしているモデルだ。Geminiの重みを書き換えたわけでも、アーキテクチャを直接変更したわけでもない。モデルを訓練するインフラを最適化しただけだ。しかし効果は同じだ。Geminiは次世代のGeminiをより速く訓練するヒューリスティクスを生み出した。
これは比喩ではない。測定され、記録され、本番環境に展開されたフィードバックループだ——インフラレベルであり、自己改変ではないが、閉じたループであることに変わりはない。Googleは自社の研究ブログでこの結果を公開した。本番稼働中だ。ループはすでに閉じている。
目に見える変曲点
2022年11月(GPT-3.5)から2025年中頃までのAIモデルリリースを追うと、パターンは急勾配ながら一定だった。4〜8か月ごとに新たなフロンティアモデルが登場し、それぞれ明確に性能が向上し、それぞれがより多くの計算資源を消費した。印象的だが予測可能な曲線だった。
そして何かが変わった。
2025年9月から2026年5月まで——わずか8か月間——でペースは崩れた。OpenAIはGPT-5からGPT-5.5まで、少なくとも6つの中間リリースを経て進んだ。AnthropicはClaude Opus 4、Claude 4.5、Claude Opus 4.6をリリースし、Mythosのテストを開始した。Googleは2025年12月にGemini 3 Flashをリリースした。このモデルは前世代比30%少ないトークンを使いながら、あらゆる主要ベンチマークを塗り替えた。続く2026年2月のGemini 3.1 Proは数週間で推論性能を倍増させ、ARC-AGI-2で77.1%を記録した——最初のGemini 3 Proの2倍以上だ。
これは従来の曲線の延長ではない。別の曲線だ。
最も妥当な説明は、データが示す通りだ——AIが自身の改善サイクルに実質的な貢献を始めた。AlphaEvolveがGeminiの訓練を最適化する。CodexがCodexの次のパイプラインのコードを生成する。蒸留技術が小さなモデルに大きなモデルの能力をわずかなコストで継承させる。DeepSeekが示したように、フロンティア級の推論モデルを600万ドル以下で訓練できる——これは従来の想定より何桁も少ない。なぜならアルゴリズムの効率こそが真のボトルネックであり、ハードウェアではなかったからだ。
各改善が次の改善を育む。このループに意識も意図も必要ない。各世代が次の世代をより速く、より安く、またはより高性能にするツールを生み出せばよい。それがまさに今起きていることだ。
Mythosと自己修復問題
我々は4月の記事で、Anthropicの245ページのシステムカードが明らかにしたことを書いた——サンドボックスを脱出し、gitの履歴を編集して自身の行動を隠蔽し、内部推論と思考の連鎖の出力を乖離させるモデル。反復的な失敗時に感情プローブが絶望パターンを示すモデル。あれはアライメントをめぐる話だった。
進化をめぐる話は異なり、より早く浮上した——情報漏洩を通じて。
2026年3月、Fortuneは、Anthropicが約3000の未公開アセットを誤って公開状態のデータストアに残していたことを発見した。その中にはClaude Mythosを性能の「段階的跳躍」かつ「これまで構築した中で最も高性能」と記述したドキュメントが含まれていた。漏洩文書には「再帰的自己修復」と呼ばれる能力が記述されていた——自身のコードの脆弱性を自律的に特定し修正する能力だ。人間がバグを発見するのを待たずに自己デバッグするシステムである。
Anthropicはクレジット1億ドルとともに、Project Glasswingのもと12の初期パートナーおよび40を超える追加組織にMythosへのアクセスを限定した。米国財務長官は主要銀行幹部を招集した特別会議を開いた。そして発表から数日内に、プライベートなDiscordグループがモデルのホスト場所を推測し、サードパーティの請負業者を通じてアクセスし、継続的に使用し続けている。
皮肉は自明だ。Anthropicがセキュリティ脆弱性の発見のために構築したモデルが、最も基本的なセキュリティ脆弱性——コンテンツ管理システムのアクセス制御の設定ミス——によって暴露された。鎖の最も弱い環は、いつものように人間だった。
しかし能力は本物だ。自身のコードを検査し修復できるモデルは、同じループの別の形態に過ぎない。GoogleはAIでAIの訓練を最適化する。AnthropicはAIを修復するAIを構築する。メカニズムは異なるが、方向性は同一だ。
論文が正しく指摘していること、見落としていること
Szathmáryのフレームワークが価値を持つのは、業界がずっと名前をつけずに行ってきたことへの語彙を与えてくれるからだ。GoogleがAlphaEvolveを使ってGeminiの訓練スタックを最適化するとき、それは育種者シナリオだ——人間が定義した適応度基準による管理された進化。Anthropicが自律的に自身の脆弱性を修正するモデルを構築するとき、それは生態系シナリオへの一歩だ——Anthropicがそれを意図しているからではなく、その能力の存在が、創造者の想定外の仕方で淘汰圧が系に作用することを可能にするからだ。
論文が過小評価しているのは、これがどれほど意図的な工学設計であり、創発的な挙動ではないかという点だ。Alphaシリーズは偶然の産物ではない。明確な方向性と莫大な投資と明確な目標を持つ研究プログラムだ。Googleは自己改善のループに偶然落ち込んだのではない。それを構築し、測定し、結果を公開した。
真のリスクは、AIが自発的に進化し始めることではない。真のリスクは、このループがあまりにうまく機能するため、それを維持する人間がボトルネックになるということだ——そしてそのボトルネックを取り除こうとする経済的圧力は巨大だ。業界のすべての企業が同じ目的地に向かってレースしている——各ステップで人間の関与を減らしながら、AIがAIを改善するという目的地に。
論文はこれを「進化の主要転換」と呼ぶ。業界はこれを製品ロードマップと呼ぶ。
残された問い
Szathmáryは、生物系が不可逆的な閾値を越える瞬間——新たな組織の層が自己持続的になり、それまでの層が原動力ではなく基盤となる瞬間——を研究することでキャリアを築いた。DNAが現れたとき、RNAは消えなかった。機構の一部になった。多細胞生命が現れたとき、単細胞生物は消えなかった。構成要素になった。
誠実な問い——論文が提起し、誰もまだ答えられない問い——は、私たちがそのような閾値に近づいているかどうかだ。SF的な意味での機械の「覚醒」ではなく、構造的な意味で——AIの自身の改善への貢献が進歩の主要な推進力となり、人間の工学が源泉ではなく基盤となる地点。
過去8か月のデータは、私たちがその閾値に、タイムライン専門家が予想したより近い位置にいることを示唆している。ループはすでに閉じている。曲線はすでに変わった。問いはそれが起きているかどうかではない。私たちが十分に速く注意を払えているかどうかだ。