tl;dr
- OpenAI DevDay 2025 がサンフランシスコで開催されたよ
- サンフランシスコ現地から情報をお送りするよ
- ChatGPT 上で使える Apps SDK が公開されたよ(収益化の話も)
- AI Agent ワークフローを構築するための AgentKit が公開されたよ
- 合わせてノーコードライクに操作できる Agent Builder も公開されたよ
- Codex が正式リリース、Slack から使えるようになったよ
- 動画生成の Sora 2 の API が公開されたよ
- だいたい書いたけど、DevDay は一日あるので適宜追加するよ。
サムアルトマン CEO のキーノート
Apps SDK
使用イメージはこの動画を見ておくと良い。
ChatGPT 内で使えるアプリ機能。ChatGPT との会話中に提案、あるいは明示的に指定することで呼び出せる。開発者は 8 億人を超える ChatGPT ユーザにリーチできる。本日より利用可。開発者向けに MCP に基いて開発された Apps SDK のプレビュー版を公開。年末には、アプリ機能の審査、受け付けを開始する予定で、アプリの収益化についても伝える予定。
初期のパートナー企業として、Booking.com、Canva、Coursera、Figma、Expedia、Spotify、Zillow など。まずは英語にて。今年の終わりにはもう少しパートナー企業は増える。EU を除くログイン済みのアカウントにて使える。ただし、Free、Go、Plus、Pro プランのみ、今後 Business、Enterprise、Edu プランにも。Agentic Commerce Protocol を用いた収益化も対応予定。
Apps SDKの公式ドキュメント。デザインや開発のガイドライン、デプロイをどうするか、プライバシー、トラブルシューディングなどの案内を用意。
AgentKit
エージェンティックワークフローを構築、デプロイ、最適化するためのツール。チャット UI をカスタマイズして埋め込む ChatKit、WYSIWYG のワークフロークリエイターの Agent Builder、安全性のために入出力をフィルタリングする Guardrails、データセットやスコアリング、プロンプト最適化のための Evals の四つの機能からなる。
ChatKit Studio
ChatKit の例
Agent Builder はこちらから↓
Agents Builder の公式ドキュメント
Codex が正式リリース
Codex が正式リリース。これに際して、Slack でチャンネルやスレッドから直接タスクを開始できる機能、ワークフローやアプリに GPT-5-Codex を用いた AI Agent を組み込める Codex SDK、モニタリングやダッシュボードなどを統合した管理ツールの三つの機能を追加。Codex の使用量が 10 月 20 日よりカウントされる予定。
Codex SDK の公式ドキュメント。Codex SDK は npm でインストール。
npm install @openai/codex-sdk
あるいは Codex CLI の codex
コマンドの引数 exec でも。
codex exec "未完了の TODO をすべて特定し、各 TODO に対して .plans/ ディレクトリ内に詳細な実装計画を記載した Markdown ファイルを作成してください。"
GPT-5 Pro API
ChatGPT の Pro プラン(月額 30,000 円)を契約しないと使えなかった GPT-5 Pro が API で使えるように。気になるお値段は入力 100 万トークンあたり $15、出力 100 万トークンあたり $120。Context Window は 400k、最大出力トークンは 272k。Responses API のみに対応。
GPT-5 の高速化
GPT-5 への API リクエストは Priority processing で 40% 高速に。service_tier パラメータを “priority” に指定することで使える。定常的にトラフィックをさばく必要のある時に最適で、データの処理や評価などの不規則なトラフィックには不向き。
Sora 2 の API 対応+画像生成、音声生成モデルの割引
Sora 2 と Sora 2 Pro が API 経由で使えるように。また、合わせて軽量かつフルサイズのモデルと同等の性能の画像生成モデル gpt-image-1-mini(80% オフ)、音声モデル gpt-realtime-mini(70% オフ)も公開。
以後、Sora に限って話を進めます。Sora 2 の API で使えるモデルとして、sora-2
と sora-2-pro
が存在。sora-2
は高速に動画生成、実験時に、sora-2-pro
はハイクオリティで本番向けと使い分ける。
POST /videos
でジョブの開始、GET /videos/{video_id}
でステータスをポーリング、あるいは webhook で通知を受け取り、動画生成が完了した後に GET /videos/{video_id}/content
で動画(MP4)をダウンロードできる。GET /videos
でライブラリ管理を、DELETE /videos/{video_id}
で削除。
input_reference パラメータを用いて、画像を初期のフレームとして指定でき、remix_video_id で既に生成した動画を部分的に修正できる。制限としては、18 歳未満向けのコンテンツのみに対応、版権キャラや実在する人物の生成は不可。
Sora 2 のプロンプティングガイド。プロンプトは具体的に記述すべきではあるが、ある程度の創造性の余地を残しておくことも有効。プロンプトは同じだとしても毎度異なる結果が生成されるため、生成を繰り返すことも重要。短い動画ほど指示への追従性が高い。スタイル指定を先頭に置く。
API パラメータとして指定できるのは、モデル名の model
、縦横のサイズを指定する size
、動画の秒数を指定する seconds
。size
はモデルごとに異なり、sora-2 は 1280×720 / 720×1280、sora-2-pro は 1280×720 / 720×1280 / 1024×1792 / 1792×1024。seconds
は 4 / 8 / 12 から、デフォルトは 4 秒。
その他(あとでどこか適切なカテゴリに突っ込みます)
OpenAI のクックブックに評価フライホイールというプロンプトにレジリエンスを担保するためガイドが追加。レジリエンスがあるとは、あらゆる入力に対して質の高いレスポンスを返すもの。評価フライホイールは、分析、測定、改善の 3 段階から構成される反復的なプロセスを指す。はじめの分析段階では、オープンコーディングで失敗事例にラベル付け、アクシャルコーディングで分類。測定段階では、自動的にスコアリングする仕組み(グレーダー)を構築、性能を定量評価。改善段階ではプロンプト最適化ツールで改良。
まだ追加されるかもしれないので後ほど追記します。
以上となります。お読みいただきありがとうございます。
最後に。現在サンフランシスコに来ています。OpenAI DevDay を含め、半月ほどシリコンバレーの AI スタートアップに訪問する予定です。もし気になる方がいらしたら、X のサブスクにて情報を公開しているので、よかったらどうぞ!
Views: 0