はじめに
こんにちは、Google Cloud のアプリケーションモダナイゼーションスペシャリストの関本です。
「こんなアプリが欲しいわあ、せや作ったろ」 という気持ち(ノリ、Vibes)から AI エージェントを活用してさっとコーディングを始める――そんな未来の開発スタイルを体現する、エージェントベースの開発ツールが今、大きな注目を集めていますよね!Vibe Coding とか Agentic Coding というキーワードを耳にしている方も多いと思います。
また、これを読まれている方の多くは、おそらく何かしらのツールを使ったことがある人がほとんどではないでしょうか。この強力な機能が Gemini Code Assist にもついにやってきました!その名も 「エージェントモード(Agent Mode)」 です。
本記事では、この「エージェントモード」の基本から、ゼロからアプリケーションを構築したり、既存のプロジェクトに大規模な機能を追加したりといった、開発プロセスを劇的に加速させる具体的な活用方法までを手順を追って解説します。
注: エージェントモードは 2025年6月26日時点でプレビューリリースです。今後機能が変更になる可能性があることをご容赦ください。
そもそも「エージェントモード」とは? 〜その心臓部には Gemini CLI 〜
このエージェントモードの強力な機能は、その心臓部である 「Gemini CLI」 という オープンソースの AI エージェントによって実現されています。少し大味な表現をしてしまうと、Gemini CLI の IDE 拡張機能バージョンといえるかもしれません。
Gemini Code Assist には、これまでコードに関する質問に答えるチャット機能がありましたが、エージェントモードはそこから一歩踏み込み、開発者に代わって自律的にタスクを実行します。大まかな目標(例えば「ブログ機能を追加して」など)を伝えるだけで、エージェントが以下のような一連の作業を自動で行います。
- 計画の立案: 抽象的な要求を具体的な手順に分解し、作業計画を立てる。
- ツールの使用: 必要なファイルやフォルダを新規作成したり、既存のコードを読み書きしたりする。
- 実行と検証: ターミナルコマンドを実行してライブラリを導入したり、ビルドやテストを行って結果を確認する。
- 反復的な修正: 問題が発生すれば、解決するまで試行錯誤を繰り返す。
ざっくり言うと、 「あなたの指示で動き、対話しながらプロジェクトを育ててくれる、賢い AI 開発アシスタント」 のような存在で、複数ファイルにまたがる複雑なタスクもこなしてくれます。
エージェントモードでできること(ユースケース)
エージェントがサポートできるタスクは多岐にわたります。特に、ゼロから何かを作り出す場面で真価を発揮します。
- ゼロからの新機能開発・プロトタイピング 「ユーザー認証機能を Firebase Authentication で実装して」 のように、作りたい機能の概要を伝えるだけで、必要なファイルの作成、ライブラリのインストール、APIの呼び出し、UIの骨格作成までを自律的に行います。まさに「Vibe Coding」を体験できる中心的なユースケースです。
- ビルドエラーの自動修正 「プロジェクトのビルドエラーを修正して」と依頼するだけで、エラー内容を分析し、修正案を適用。ビルドが通るまで検証と修正を繰り返してくれます。
- 既存コードへの機能追加・UI更新 「ユーザー設定画面にダークモードの切り替えスイッチを追加して」のように指示すれば、関連するファイルを特定し、UI要素の追加からロジックの実装までを提案します。
- テストデータやドキュメントの生成 「このクラスの単体テストを作成して」あるいは「偽のセッションデータを2つ追加して」と頼むだけで、退屈な作業を肩代わりしてくれます。
✨試してみよう!便利なプロンプト集
「ユーザー認証機能を実装してください。Firebase Authenticationを使います。」
「このプロジェクトに簡単なREST APIを追加してください。エンドポイントは /api/items で、GETとPOSTをサポートします。」
「composable name> コンポーザブルを新しいファイルに移動して、コードをリファクタリングします。すべてのインポートが更新されていることを確認してください。」
「nullポインタ例外を解決してください。」
「module> の class> の単体テストを作成します。」
Gemini Code Assist エージェントモードならではの3つの強み
- コストを気にせず集中できる課金体系 (個人向けは無料)
Gemini Code Assist のライセンスは、API コールごとの従量課金ではなく、ユーザー単位の定額課金です。また、利用規約は異なりますが、個人向けの Gemini Code Assist for individuals については、完全無料ながらエージェントモードを利用する事が可能です。(上限 1000 model requests/day)
「トークンが勿体ないから…」と考えることなく、大規模なリファクタリングやゼロからのアプリケーション開発に完全に没頭できます。 - 100万トークンの巨大なコンテキストウィンドウ
最大100万トークンというコンテキストウィンドウをフル活用します。これにより、非常に大規模なプロジェクトであっても、リポジトリ全体の文脈や依存関係を正確に理解した上で、的確なコード生成や修正が可能です。 - MCP による拡張性
MCP (Model Context Protocol) をネイティブサポートしており、外部ツールとの連携が可能です。これにより、エージェントは単なるコーディング支援ツールから、開発ワークフロー全体を自動化するハブへと進化します。例えば、GitHub と連携して Pull Request を自動作成したり、Jira チケットを参照しながらコーディングしたりといった、高度な自動化が想定されます。
実際に使ってみる (Cloud Workstations 編)
ここでは Cloud Workstations を例にしますが、手順は vs code でも同様です。
※Gemini Code Assist は IntelliJ などの JetBrains IDE にも対応しておりますが、エージェントモードは 2025年6月26日時点では非対応となります。ご了承ください。
個人で、Gemini Code Assist を今から導入する方はこちらをご覧ください!
基本的な使い方
-
事前準備として、拡張機能を Insider バージョンにアップデートします。(プレビューバージョンとなります。)
事前準備はこちら -
VS Code のサイドバーにある [Gemini] アイコンをクリックします。
-
[Agent]トグルを ON にしてエージェントモードを開始します。
-
利用するフォルダ、ワークスペースを開きます。
-
テキストボックスに、エージェントに実行させたいタスクを自然言語で入力します。
-
エージェントがタスクを完了するための計画と変更内容を提示します。内容を確認し、[Accept] することで、エージェントが作業を実行します。また、コマンド実行が必要な場合は [Run] を実施します。
変更を一つずつ確認するのが面倒な場合は、[変更を自動承認] を選択することで、プロセスを完全に自動化することも可能です。
🧩 MCPで外部ツールと連携し、可能性を広げる
前述の強みでも触れた MCP (Model Context Protocol) は、エージェントが外部ツールと対話するための「共通言語」です。これを設定することで、エージェントは IDE の中だけでなく、GitHub、Jira、Slack といった外部の世界と連携し、より広範なタスクを自動化できます。
MCPサーバーを追加するには、mcp.json という設定ファイルを作成し、構成ディレクトリに配置します。ファイルには、使用したいツールの接続情報を記述します。
MCP サーバーの設定
この部分についてはまた記事にしたいと思います!
command や args の正確な内容は、使用する MCP サーバーのドキュメントをご確認ください。また、Node.js や Docker など、サーバーソフトウェアの要件に応じたツールのインストールが必要になる場合があります。
おわりに
本記事では、Gemini Code Assist に搭載された新機能「エージェントモード」について、その技術的な背景から具体的な活用法までを解説しました。
エージェントモードは、単なるコーディング支援ツールではありません。開発者の意図を汲み取り、対話を通じて自律的にタスクを遂行する、まさに「エージェント」です。これまで時間を取られていた反復的な作業や、ゼロから何かを生み出す際の初期コストをエージェントに任せることで、私たちはより創造的で本質的な開発に集中できるようになります。
ぜひ、本記事を参考にエージェントモードを日々の開発に取り入れ、対話しながらアプリケーションを育てていくという、新時代の開発効率を体験してみてください。
Appendix
Gemini CLI
エージェントモードの魔法のような能力は、その心臓部である 「Gemini CLI」 という技術に基づいています。これは、ターミナルで直接利用することもできる AI エージェントです。エージェントモードは、この Gemini CLI の能力を IDE に統合したものです。
Gemini CLI が持つ主な能力は以下の通りです。
- ファイルシステム操作: ファイルやフォルダの作成、編集、読み取り。
- ターミナル連携: サンドボックス化された安全な環境でのシェルコマンド実行。
- コードインテリジェンス: Gemini 2.5 Pro による大規模なコードベースの深い理解。
- Web検索: 必要に応じて Web から情報を収集する能力。
- 対話的モード: ユーザーとの対話ループを通じて、出力を洗練させ、タスクを反復的に改善。
これらの能力を組み合わせることで、エージェントモードは単なるコード生成に留まらない、真の開発支援を実現しています。
Views: 0