2025年6月26日、Googleは軽量かつ高性能なマルチモーダルAIモデル「Gemma 3n」を正式にリリースしました。この新モデルは、スマートフォンでも動作するほどの小型設計でありながら、音声や動画の入力にも対応しています。さらに、日本語にも対応しており、開発者にとって非常に使いやすい設計となっています。
Gemma 3nの特徴
-
軽量で高性能:
- Gemma 3nは、わずか2GBのメモリ使用量で動作します。これにより、スマホを含むさまざまなデバイスでの運用が可能です。
- 「Gemma 3n E2B」は、パラメーター数5Bでありながら、従来の2Bモデルと同等のメモリ消費量を実現しています。一方、「Gemma 3n E4B」は8Bのパラメーターを持ち、3GBのメモリ使用量で運用可能です。
-
技術的背景:
- モデルは「MatFormer」と呼ばれるアーキテクチャで訓練されており、大きなモデル内部に小型版を含む「マトリョーシカ」のような設計が特徴です。
- 新たに採用された「Per-Layer Embeddings (PLE)」技術により、必要なデータ量が大幅に削減されることで、メモリ効率が向上しました。
-
多様な入力対応:
- テキストだけでなく、画像や音声、動画の入力にも対応しています。開発環境として、「Hugging Face Transformers」や「Google AI Edge」などが利用可能です。
- 対話性能の評価:
- Gemma 3n E4Bは、商用モデルなどと比較しても優れた性能を示し、多様な用途での活用が期待されています。
実行環境
Google AI Edge Galleryを通じて、スマートフォン上でのローカル動作も可能です。特に、Pixel 8 Proのような最新デバイスにおいて、実装が容易です。また、Google AI Studioでは、デモ実行が可能で、実際にチャットAIとしての機能を試すことができます。
リンク
まとめ
Gemma 3nは、スマートフォンにも対応する軽量な設計と高い性能を兼ね備えた次世代AIモデルとして、特に開発者やユーザーにとって魅力的な選択肢となるでしょう。今後の活用が楽しみです。
🧠 編集部より:
Gemma 3nの特長と背景
Googleが2025年6月26日に正式リリースした「Gemma 3n」は、軽量かつ高性能なマルチモーダルAIモデルです。このモデルは、音声や動画の入力にも対応しており、最小2GBのメモリで動作可能。これはスマートフォンなどのリソースの限られたデバイスでの実行を可能にする特長があります。
Gemmaシリーズの利点
Gemmaシリーズは、Googleが提供するオープンウェイトモデルの一環で、開発者はモデルデータを自由に利用できる点が魅力です。これに対し、同じくGoogleのAI製品のGeminiは、特定のアプリやAPIを通じてのみ使用され、そのデータは制約されているため、開発者の自由度は低いです。
テクノロジーの革新
Gemma 3nは「MatFormer」アーキテクチャに基づいており、大型モデルの中に小型のサブモデルが含まれているという特長を持っています。また、「Per-Layer Embeddings (PLE)」という省メモリ技術を採用しており、メモリ消費量を大幅に削減しています。この技術により、従来のモデルと同等の性能を維持したまま、より少ないリソースで動作できます。
パフォーマンス比較
Gemma 3nは、他の大規模AIモデルと比較しても高性能を示しています。例えば、「Gemma 3n E4B」は、商用モデルの「GPT 4.1-nano」よりも良好な性能を発揮しました。
使用環境と導入方法
Gemma 3nは、多様な実行環境をサポートしており、スマートフォン向けアプリの「Google AI Edge Gallery」を使用することで、ローカルで動作させることも可能です。このアプリを使用することで、サポートされるスマートフォンでモデルを実行できます。
補足情報
- Gemma 3nの公式リリースガイド: Google Developers Blog
- Hugging Faceでのモデルダウンロード: Hugging Face
- Kaggleでのモデルダウンロード: Kaggle
- 実際の利用方法: GIGAZINEの導入記事
このように、Gemma 3nは、その軽量性や高性能、多様な使用環境により、今後のAI開発において重要な役割を果たすことが期待されます。
-
キーワード
Gemma 3n
このキーワードは、記事の中心的なテーマである軽量オープンウェイトモデルの名称を表しています。
Google AI Edge Gallery をAmazonで探す
※以下、出典元
▶ 元記事を読む
Views: 0