OpenAI が SWE Agent、Codex をリサーチプレビューで公開しました。勉強がてら一次情報を元にまとめたので、もしよろしければ下記のスレッドをご覧ください。かいつまんで tl;dr にまとめています。この記事では Codex / Codex CLI を動かす手順をまとめます。
tl;dr
- Codex はタスクをサンドボックス内で並列実行可能なクラウドベースの SWE Agent
- o3 / o4-mini を SWE タスクに特化させた codex-1 / codex-mini-latest のふたつのモデルを用意
- ChatGPT の Pro、Team、Enterprise プランで利用可(Plus / Edu はもうすぐ)
- タスクの完了には 1-30 分を要し、挙動をリアルタイムで確認できる
- コーディングルールは AGENTS.md に記述
- マルウェアの開発やプロンプトインジェクションなどの攻撃を拒否
- タスク実行中はインターネットアクセス無効化
- Codex CLI のデフォルトモデルが codex-mini-latest に
- Codex CLI において ChatGPT アカウントでサインインできるように(API Key の直書き不要に)
- codex-mini-latest の価格は入出力で $1.50 / 1 M tokens、$6.00 / 1 M tokens、プロンプトキャッシュで 75% 割引
発表内容はここまで。以下はこの記事のまとめ。
- Codex は GitHub 連携でき、ウェブ UI からプルリクまで出せる
- Codex CLI で ChatGPT サインインをすると Plus / Pro プランだと API クレジットがもらえる(私はまだもらえていない)
- codex-mini-latest はレスポンスが遅く、しばらく放置できるような規模感のタスクに向いている印象(タスクを選ぶと思う)
Codex 本体を使ってみる
残念ながら私は ChatGPT Pro を現在契約していない(元を取れない)ので、Plus プランに降りてきてから試してみます。Pro ユーザの方々はよかったらタイムラインにて使い心地を教えてください。
自分で試したくなったので ChatGPT Pro を契約してみました。高い買い物ですので、気になる方は解約までセットで済ませておくことをおすすめします。
とりあえずテトリスを作ってもらえますか?Vite、React、TypeScript を想定していますが、他に何か決定されていない技術スタックなどがあれば適宜私に質問をしてください。
最初プレイグラウンドを用意してあげて、上記のようにプロンプトを入れてみたのですが、特に質問してくることもなく動くテトリスを作ってくれました。フロントエンドなんもわからんので、Codex を片手にしばらく勉強してみます。
定額で並列実行をバンバン投げられて、蠱毒のようにうまくいったものだけマージするなんて使い方もできます。ブラウザであればスマホからも Codex を実行可能なので、移動中にどんどん投げることができたりします。
codex-mini-latest を Codex CLI から使ってみる
Codex の中のモデルである codex-1
の軽量版のモデル(o4-mini ベース) codex-mini-latest
は Codex CLI で使うことができますので、こちらを試してみます。
はじめて使う方も、アップグレードしたい方も Codex CLI は下記のコマンドでインストールできます。
npm install -g @openai/codex@latest
ChatGPT アカウントでサインインできると記事にはあるのですが、今のところその機能は Codex CLI に反映されていないようなので、いったん従来の API Key を用いたやり方で試してみます。
export OPENAI_API_KEY=sk-...
作業ディレクトリに移動しておいてください。私は /Users/username/tmp
で実行しています。
Codex CLI を起動して良いか聞かれるので、y を入力してエンターキーを押します。
codex-mini-latest
が表示されていれば OK です。もし o4-mini
が表示されている場合は、Codex CLI のバージョンが古いため、先ほどのコマンドを打ち込んで再度試してみてください。
なんでも良いですが下記のプロンプトを試しに入れてみます。
Vite、React、TypeScript で、簡単なペライチの企業のホームページを作成してください。架空の企業名、事業、導入事例、メンバー、会社概要などを入れてください。空のディレクトリを作成したところで、ファイルは何もない状態がスタートです。
途中で変な挙動を始めたので二回ほど止めました。unsplash の昔の取得方法を使おうとしたので、picsum.photos に切り替えるよう指示したり、細かい修正を何度かしましたが、デザインはさておきそれっぽいものを作ってくれました。ただ、公開直後だからか、下記のエラーで止まることが何回かあって厄介でした。
⚠️ Network error while contacting OpenAI. Please check your connection and try again.
また、Reasoning を挟む都合上、レスポンスが遅いのが少し気になりました。できた雑ホームページ。
まとめ
所管としては、Codex はあり、Codex CLI 経由での codex-mini-latest
はなしかなというところです。類似のツールが多過ぎて、正直どれも変わらんやろと思っていますが、しばらく Codex を使ってみようかなと思います。同様のことを Devin や他のツールでできたりもしますが、なんだかんだ画像生成や音声対話などいろいろなことに使える点で OpenAI つよいなと思います。
リソース
発表記事
Codex ページ
公式ドキュメント
codex-mini-latest は無料利用枠の対象
システムカード
発表直後の Ask Me Anything
Codex CLI の GitHub リポジトリ
Codex のヘルプページ
おまけ
Codex や Codex CLI、codex-1 など正直わかりづらい…!私は下記の理解をしています。codex-1 があるということは、内部では codex-2 を使っているのかな…だとすると codex-mini というのは…?謎です。
Views: 0