最近もっぱら Roo から Claude Code をメインに移しているが、その界隈の進歩は今までの変化とは明らかに質が違うという感覚がある。それを今の時点で言語化しておきたい。
最初にいっておくと、自分はシンギュラリティ論自体には否定派というか、シンギュラリティが来たところで世の中の問題の大多数が解決されるとは思っていない。(特にレイ・カーツワイルは典型的なフェイク野郎だと思っている)
実現したところで、そんなものかになるという程度の話だと思っている。実現したところで、シンギュラリティ万能論者はゴールをずらし続けることで否定するだろう。終末論はいつもそうだ。
という前置きの上で、今確実に転換期を迎えている AI とプログラミングの話をしたい。
特異点があるとしたら、今はその瀬戸際。
tl;dr
- Claude Code は Claude Code によって 90%が開発されている
- その改善ループによって一番恩恵を受けるのは Claude と Claude Code 自身である
- 破綻なくスケールするエージェントが世に出るなら、ソフトウェア領域で知識爆発が起こる確率は高い
AI2027 の予言する、自己改善する AI
元 OpenAI の人が書いた 2027 に AI による知識爆発が起こるという予想。個人的には、これ自体は非常に OpenAI に都合がいい文書に見えるのだが、AI 開発に近い立場で書かれたということに一定の価値はある。
自己改善するコーディングの自動化によって、自分自身を改善するモデルがシンギュラリティの出発点になると予言している。それは現行モデルから二世代先の蒸留を繰り返したモデルによって達成されるという。
十分に賢い AI は、無限に自身を進化させることで知識爆発が起こる。
多くの人は、これをモデル自体の高性能化の話だと捉えているが、最近自分はモデル単体の話ではないと思い始めた。
正確には、モデルとそのエージェントの組み合わせで、少なくともソフトウェア領域における知識爆発が実現されるんじゃないか。そしてそれが、何らかの技術的特異点に結びつく可能性がある。
そしてそれが現在進行系で発生しているのが、おそらく Claude + Claude Code なんじゃないか?という予感がある。
Cline はパンドラの箱を開けた
これを書いたときはまだ Agentic Coding という言葉がなかったので CLINE と言っているが、要は AI モデルは性能の不足以前に単に環境知識が不足していただけで、IDE やコマンド実行権限という危険な権限を与えて再帰的なコーディングを行うことで問題の多くが解決することがわかった。
それまでは、要は人間が権限を譲り渡す勇気が足りなかった。そういうしょうもないオチ。ただ、CLINE 時点でもモデル性能は不足しているのもわかっている。バイブコーディングを工夫なくやると、早期に破綻する。
Google の Addy Osmani はこれを 70% の問題と呼び、30% は依然人間のプログラマの仕事だと言っている。
Claude Code の 90% は Claude Code によって書かれている
Cline 型のエージェントは革命的だったが、この半年の知見なので学習時期のカットオフによってモデルにその知識が反映されていない。なので現行モデルは Agentic Coding を行った際に、実際どのように成功するか・失敗するかの知識がない。
つまり、今後の LLM は Agentic Coding 自体を学習することになる。Claude Max がその性能に対して安価なのは、その学習を進めるためではないかと踏んでいる。(Cursor/Cline/Roo のような自社でないエージェント経由だと、その学習サイクルが回しづらいだという予想)
また、 Roo や Cline も確かにバイブコーディングによって書かれてはいるのだが、IDE の UI の層が多く自己進化するほどではなかったように思う。Claude Code は CLI 特化としたことで、フロントエンドの複雑性を回避している。
GitHub Copilot の作者によって書かれた LLM のプロンプトエンジニアリングにもオフライン学習について書かれているのだが、これは手元の学習データとは別に、ユーザーの手元で発生した統計的なデータをどう扱って学習を進めるかの手法が書かれている。
これは、要はユーザーが変更を受け入れたかどうかを、統計的に収集して改善する。
統計リテラシーが足りない人向けに一応述べておくが、これはデータ収集に同意の上でさらに匿名化された手法でデータを集めているのが前提だと思うので、無断学習云々の議論はここではしない。
自分の肌感: 今の AI にリファクタリングができるか?
Claude 3.7 + RooCode はできなかった。
Claude 4.0 Opus では、完全ではないが、適切時な指示があれば不可能ではない、というレベルになった。
Claude Code はさらに効率的になっている。
そして Claude Code のユーザーとしての肌感と、多少リバースエンジニアリングした感想なのだが、明らかに Claude Code はその機能や複雑性に対して機能追加スピードが速い。
もちろん、優秀な(そしておそろしく高報酬な) Anthropic のプログラマのレビュワー + 非公開のフロンティアモデルを使っているのだと予想はできるが、それにしても異様な速度で機能が追加される。
おそらく X や SNS の発言等から、ユーザーの意見を拾いながら自動的に Issue 化して機能追加ていってるのではないかとすら思う。
ドキュメントもサイトも異常な速度で更新される。
SWE Bench では Claude は世間で言われるほど点がでてないとはよく言われるが、自分の目線では肌感明らかに Claude がコンパクトな良いコードを生成している。
これは、同じタスクを解決できたという指標に対して、よりよいコードで解決している Claude がコード全体の複雑度を発散させずに解決できているということなのではないか?と予想している。
最近自分は typescirpt-mcp という TypeScript を AI にリファクタリングさせるツールを書いたが、これはほぼバイブコーディングのみで実装している。
とりあえず Lint や テストやドキュメントが十分にあり、それらが矛盾していない状態なら、ソフトウェアは自動検証できる範囲でスケールするという状態が来ようとしている。
Claude + Claude Code は、預言されていた自己改善 AI なのではないか
Claude Code の改善速度をみるに、 Claude + Claude Code の高性能化で一番メリットを享受できるのは、 Claude Code 自身なのは間違いない。モデルとエージェントはお互いに性能を高める関係にあり、そのループが回り始めているように見える。
Claude のモデルは Claude Code によって行われた操作を学習し、Claude Code は自身を改善し続ける。人間は、それに対して SNS で不平を言い、それは自動化されたクローラによって集められ、Claude Code はそれを自動的に機能追加 Issue として登録する。
これによって、 Claude Code が AI2027 で預言されていた、自己改善 AI を達成する可能性が出てきたのではないか。
良い指示や良い設計を前提にプログラミングをし続けることができれば、理論上は過去に蓄積したあらゆるものの組み合わせを実現できるし、うまくいけば人間が知らないものを発見し始める、つまり知識爆発もしくはその前兆が起きるかもしれない。
もちろん、大規模化のどこかで破綻するかもしれないし、実現するのは別のモデルかもしれない。が、今公開されていて目に見える範囲でそれに近いのは間違いなく Anthropic だろう。このタイミングで使い放題の Claude Max をリリースしたのは、それが見えているからだとも想像できる。
まだわからない。が、少なくとも「私達が知っているプログラミングの終わり」はさらに加速して、AI2027 より前に、年内に何らかの技術的特異点は来るのかもしれない
おまけ: vs プログラマ不要論 (最新版)
自分は相変わらず、プログラマが不要になるとは思っていないが、やはり必要な知識の質が大幅に変質する。
意図を正しく説明できたら、それを実現するプログラムは一晩で実現できる時代はおそらく来るのだろう。そしてバイブコーディングや Agentic Coding という言葉は消え、単に「プログラミング」になる。
良質な手法や良質なドキュメントを手札に揃えておくこと自体の価値が上がるが、おそらく労働集約的なものから排除され、個人の能力のスケールが促される。その結果どう社会が変質するかは予想がつかない。
仕事は増えるかもしれないし、減るかもしれないし、AI ベーシックインカムが来るかもしれないし、来ないかもしれない(資本主義的には、まあ来ない) 産業革命が来ても人類は幸せになったわけではないし、AI による革新もその手のものだろう。
本当にシンギュラリティなのか、シンギュラリティが来る結果については、人間的な価値基準を超えた話が進行するので、考えること自体が無駄。
Views: 0