金曜日, 5月 23, 2025
ホームニューステックニュースGoogleの拡散型言語モデル「Gemini Diffusion」はどれくらい爆速なのか? - GIGAZINE

Googleの拡散型言語モデル「Gemini Diffusion」はどれくらい爆速なのか? – GIGAZINE



Googleの拡散型言語モデル「Gemini Diffusion」はどれくらい爆速なのか? - GIGAZINE


2025年5月21日にGoogleが発表したAIモデル「Gemini Diffusion」は、言語モデルとしては珍しく「拡散モデル」を採用しており、生成速度の速さがアピールされています。インターネット上には、Gemini Diffusionを実際に使ったユーザーによる実使用時の速度報告が投稿されています。

Gemini Diffusion
https://simonwillison.net/2025/May/21/gemini-diffusion/

一般的な言語モデルは自己回帰モデルと呼ばれる手法を採用しており、テキストを1トークンずつ順番に生成しています。一方で、Gemini Diffusionは画像生成モデルなどで広く使われている拡散モデルを採用しており、「ノイズを段階的に洗練させて最終的な成果物を出力する」という動作をします。これにより非常に高速な処理が可能になったほか、「生成プロセス中にエラーを修正できる」というメリットも獲得しています。

Google DeepMindが爆速でテキストを生成する拡散モデル「Gemini Diffusion」を発表 – GIGAZINE


GoogleはGemini Diffusionで1秒当たり1479トークンのテキストを生成できるとアピールしています。


また、Gemini Diffusionは非常に高速ながら「Gemini 2.0 Flash-Lite」に匹敵するベンチマークスコアを記録しています。


ペリカンを用いたAIの性能テストなどで知られるサイモン・ウィリソン氏は、Gemini Diffusionのウェイトリストに参加して実際に使用し、コードの生成にかかった時間を報告しています。以下の動画を作成すると、Gemini Diffusionの速さが一発で理解できます。

「チャットアプリのシミュレート版を構築して」と入力すると、爆速でコードが生成されて画面右側にプレビューも表示されました。画面左下には1秒当たり857トークンを生成できた旨が記されています。表示されているプレビューには「テキストを入力する機能」や「入力されたテキストをチャット風に表示する機能」が実装されており、与えられたタスクを的確にこなせていることが分かります。


さらに、「チャットアプリのペリカン版を作って」という指示にも爆速で応答。1秒当たり727トークンでコードを生成できました。


ちなみに、拡散モデルを用いて言語モデルを構築するというアイデア自体は新しいものではなく、2025年2月にはAI開発企業のInceptionが高速に動作する拡散型言語モデル「Mercury Coder」を発表して話題を呼んでいます。

ノイズから単語を抽出して爆速なコード生成が可能な拡散型の言語モデル「Mercury Coder」 – GIGAZINE


なお、GoogleはGemini Diffusionの発表と同日にスマホでローカル動作する軽量マルチモーダルAIモデル「Gemma 3n」も発表しています。Gemma 3nは拡散モデルではなく従来の言語モデルと同様の自己回帰モデルを採用していますが、メモリ使用量の削減に寄与する技術「Per-Layer Embeddings (PLE)」を採用していることを大きな特徴としており、メモリ容量の少ないスマートフォンでもローカルで動作させることが可能です。Gemma 3nを実際にスマートフォンで動作させる手順は以下の記事で詳しく解説しています。

スマホでローカル動作するGoogle製オープンソースAIモデル「Gemma 3n」登場、今すぐスマホで使う方法はコレ – GIGAZINE


Googleは「Google AI Studio」の大幅なアップデートも実施しており、「Gemini 2.5 Proでのコード生成」「30種類以上の音声での自動読み上げ機能」「Model Context Protocol(MCP)のサポート」といった機能が新たに加わっています。

An upgraded dev experience in Google AI Studio – Google Developers Blog
https://developers.googleblog.com/en/google-ai-studio-native-code-generation-agentic-tools-upgrade/

この記事のタイトルとURLをコピーする



続きを見る


🧠 編集部の感想:
Googleの新しい言語モデル「Gemini Diffusion」は、生成速度の速さが際立っています。拡散モデルの採用により、高速かつエラー修正が可能で、ユーザーの実体験でもその威力が証明されています。今後のAI開発における新しいスタンダードになりそうで、非常に楽しみです。

Views: 0

RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

- Advertisment -

インモビ転職