Googleがスマートフォン向けの最適化技術を取り込んだオープンソースAIモデル「Gemma 3n」の早期プレビュー版を公開しました。すでにAndroidスマートフォンで簡単に試す方法が用意されていたので、実際に使ってみました。
Gemma 3n – Google DeepMind
https://deepmind.google/models/gemma/gemma-3n/
Announcing Gemma 3n preview: powerful, efficient, mobile-first AI – Google Developers Blog
https://developers.googleblog.com/en/introducing-gemma-3n/
Gemma 3nはスマートフォンやタブレットなどでローカル動作させることを念頭に開発されたAIモデルで、メモリ使用量を大幅に削減できる「Per-Layer Embeddings (PLE)」という技術を採用しています。Gemma 3nのパラメーター数は5Bと8Bの2種類で、Gemma 3nの5Bモデルのメモリ使用量は一般的な2Bモデルと同等、Gemma 3nの8Bモデルのメモリ使用量は一般的な4Bモデルと同等です。
チャットAIの性能を人間に評価させる「Chatbot Arena」でのスコアを比較したグラフが以下。Gemma 3nは「GPT-4.1 nano」や「Llama-4-Maverick-17B-128E-Instruct」を超えるスコアを記録しました。
Google製Androidアプリ「Google AI Edge Gallery」を使えばGemma 3nを簡単に試せるとのことだったので、実際にPixel 8 ProにGoogle AI Edge Galleryをインストールし、Gemma 3nを実行してチャットしてみました。まず、以下のリンクをクリックしてGoogle AI Edge Galleryの配布ページを開きます。
Releases · google-ai-edge/gallery · GitHub
https://github.com/google-ai-edge/gallery/releases
配布ページを開いたら最新版の「ai-edge-gallery.apk 」をタップしてダウンロードします。今回はバージョン1.0.0をダウンロードしました。
警告が表示されたら「ダウンロードを続行」をタップ。
「開く」をタップ。
「インストール」をタップ。
インストールが完了したら「開く」をタップ。
Google AI Edge Galleryのホーム画面はこんな感じ。今回はGemma 3nとチャットしたいので「AI Chat」をタップします。
モデル選択画面が表示されたら「Gemma-3n-E2B-it-int4」をタップ。
「Download&Try」をタップ。
Hugging Faceのログイン画面が表示されたらメールアドレスとパスワードを入力して「Login」をタップします。アカウントを持っていない場合は「Sign Up」をタップして新規作成してください。
「Authorize」をタップ。
ユーザー規約に同意するように求められたら「Open user agreement」をタップ。
以下の画面が表示されたら下方向にスクロールします。
規約とライセンスをよく読んでから「Agree and send request to access rep」をタップ。
「Authorize」をタップ。
すると、アクセスリクエスト画面が表示されます。
ファーストネームとラストネームを入力し、利用規約を読み進めます。
規約に同意するチェックを入れてから「Accept」をタップ。
以下の画面が表示されたら左上の「×」をタップ。
すると、モデルデータのダウンロードが始まります。
ダウンロードは2分くらいで完了しました。後は、画面下部の入力欄にテキストを入力すればGemma 3nが返答してくれます。
試しに「ネギとニンジンで作れる料理のレシピを教えて」と入力して送信ボタンをタップ。
炒め物やみそ汁のレシピを教えてくれました。テキスト生成処理はPixel 8 Proのデバイス上で実行されているのでオフラインでも使えます。
Gemma 3nは画像とテキストの同時入力にも対応しており、「画像の詳細を尋ねる」という操作が可能です。実際に使ってみたいので「Ask Image」をタップ。
モデル選択画面が表示されたら「Gemma-3n-E2B-it-int4」をタップ。
「Try it」をタップ。
チャット画面が表示されました。テキストチャットを試した際にモデルのダウンロードが完了しているので、今回は面倒な同意操作などは不要です。カメラで撮影した写真について尋ねたいので、画面左下の「+」をタップしてから「Take a picture」をタップ。
カメラの使用許可を求められたら「アプリの使用時のみ」をタップ。
詳細を聞きたい物を撮影します。今回はiPhone 13 Proを撮影しました。
「これは何」と入力して送信ボタンをタップ。
すると、「iPhone 13」という間違った回答が返ってきました。カメラやロゴから「iPhone 13」だと判断したそうです。iPhoneというところまでは正解ですが、iPhone 11シリーズ以降のiPhoneには「カメラが3個付いていたらProモデル」という見分け方が存在するので、「Proモデルのどれか」というところまで判断してほしかったところです。
なお、Google AI Edge GalleryはiOS版の開発も進んでいます。また、Gemma 3nに採用されたメモリ使用量削減技術は、2025年後半に登場予定の次世代Gemini Nanoにも採用されるそうです。
この記事のタイトルとURLをコピーする
🧠 編集部の感想:
Googleの新オープンソースAIモデル「Gemma 3n」が登場し、スマホでのローカル処理が可能になったのは非常に興味深いです。この技術がAIの普及をさらに加速させ、ユーザーに新しい体験を提供するだろうと思います。また、オフラインでも利用できる点が特に便利で、さまざまな应用が期待できます。
Views: 2