ホームニューステックニュースGoogle I/O 2025 で驚いたところメモ #Android

Google I/O 2025 で驚いたところメモ #Android

By インモビ運営局

2025年5月28日

0

1

Google I/O 2025 で驚いたところメモ #Android

AIが一般的になってきて、AIでみんなNotebookLMとかでキャッチアップしているのではないかと思います。
AIの力を借りて概要を見たりして、掴んだ後に、動画を見ていきます。
驚いたところを太字にしています。

<br />

分かった気になれるキーワード関連グラフ

Introduction
- たくさんGemini関連のリリースをしていっている
  
   https://youtu.be/o8NiE3XMPrM?t=222
- Gemini性能向上
  - LMArenaですべてのカテゴリ1位になった話。
  - CursorではGeminiが一番成長している
  - Pokemon Blueクリア
- AIプラットフォーム
  - 次世代TPU Ironwood
  - AIトークン処理量が50倍になったそう
- Project StarlineとGoogle Beam
  - 3Dビデオ技術「Project Starline」が進化して、ビデオ通信プラットフォーム「Google Beam」になったそう (later this year)
- Google MeetへのAI翻訳
  - https://youtu.be/o8NiE3XMPrM?t=688
  - これはXなどでも話題になっていましたね。
  - リアルタイムに翻訳してくれます。
- Project AstroとProject Mariner
  - Project AstroがGemini Liveに統合されて、現実世界を理解できるようになった
- Project MarinerとAIエージェント
  - Project Marinerは、インターネットを自分で操作して、ユーザーの代わりにさまざまなタスクをこなすことができる、Googleの研究中のAIエージェント
  - 10 Multitaskできるようになった
  - Teach and repeat搭載: AIに一度やり方を見せるだけで、AIがその手順を覚えて、同様のタスクを繰り返し実行できるようになる機能
  - Gemini APIに来る予定
  - Gemini SDKが MCP toolsに対応
  - Agent ModeがChrome, SearchとGemini Appに追加(Project Marinerを使う) (comming soon)
- パーソナライゼーション
  - personal context: ユーザーのGoogleアカウントにある情報（メール、写真、ドキュメントなど）をAIが（ユーザーの許可を得て）理解し、それに基づいてパーソナライズされた応答やサービスを提供する
  - Personalized Smart Replies: 従来のSmart Replyをさらに進化させたもので、AIがユーザー自身の過去のメールや書き方を学習し、よりユーザーらしい言葉遣いやトーンで返信を自動生成する機能
DeepMind + Gemini for Developers
- Native Audio Output
  - 今日から利用できる
    - 普通に以下で試せました。
    - https://aistudio.google.com/generate-speech
    - https://youtu.be/o8NiE3XMPrM?t=1455
  - 2人で会話しているようなのが作れる
  - Live APIも Native Audio Dialogに対応
- Gemini 2.5の改善
  - 考えた内容のサマリがGenini APIで利用できる
  - Flashが22%トークン利用料が少なくなった
- Thinking badget
  - どれだけ考えるトークンを使うか設定できる
- Jules
  - Googleのコーディングエージェント
    - ベータに
    - https://jules.google
- Gemini Diffusion
  - (画像モデルと同じように生成する。)ノイズを訂正することで動く。
  - 一番速い。
  - 2.5 Flash Lightに技術を持っていく予定だそう
- Gemini Deep Think
  - コーディングやマルチモーダルでベンチマークが強くなった。(trusted testerが利用可能に)
- World Model
  - Deep Think: AIが現実の世界の仕組みを理解し、その中で何が起こるかを予測したり、新しい状況をシミュレーションしたりできる能力
- Project Astraのデモ
  - Astraは未来のAIアシスタントを試作するプロジェクト
  - pdfを勝手に開いてスクロールして、必要なページを見つけたり、YouTube開いたり、アシスタントが勝手にやってくれて、色々できる
  - 一見の価値あり
    - https://youtu.be/o8NiE3XMPrM?t=2348
- AIの科学的発見
  - 色々やってるよという話。最近のAlphaEvolveなど
  - 特にAlphaFoldは250万人以上の科学者に使われている
検索
- エージェンティックでパーソナライズドするそう。
- これまで
  - OverviewとかLensとかめっちゃ使われた
- AI Modeを導入
  - もっと複雑で長い質問をできる
  - テスターによると2-3倍長い質問が投げられるようになった
  - 今日(I/Oの日)からアメリカでローリングアウトを始める
- AIMode Gemini 2.5をSearchに。4つできる。
  - Personal context
    - Opt InでGmailと接続できる。いつでも切断もできる。
      - 例えば飛行機予約やホテルの情報と連携して、近くのおすすめの場所を教えてくれたりする。
  - Deeper research(夏に来るらしい)
    - もっとfanout techniqueを使う
  - Analysis & visuallization(夏に来るらしい)
    - 数値的な集計や、そのvisualizeを表やグラフなどで出せるようになる。
  - Live multimodality
    - Gemini Liveでカメラを共有しながら検索したりなどができる
  - New ways to shop
    - Project Astraと連携して、チケットを探して、チケットのフォームの情報を入力し、主要な情報を教えてくれて、購入を決定できる。
    - Shopping Graph
      - 50Bの商品
      - 検索のときに例えば子どもがいるというのを付け加えると汚れに強い素材のものを選んでくれたりなどする。
      - Try it on: 画像と商品で、着たときの画像を作れる。これのための画像モデルを作った。
- 検索のAI Modeはquery fanout technique を使う
  - query fanout techniqueは、AIが複雑な質問を受けたときに、それを複数の小さなサブトピックに分解し、同時に多くの関連する検索を実行して、最終的に包括的な答えを構築する技術です。これにより、非常に詳細な情報を効率的に収集できる。Google Mapのレビューなどのコミュニティの投稿内容も利用する。
Gemini
- Geminiのゴール
  - personal
    - 過去の検索履歴を使ってGeminiが答えるなど。
  - proactive(先を見越した)
    - 例えばカレンダーを見て提案したりする
    - カレンダーで物理学のテストがある → 物理学のテストあるから問題作ってみたよみたいなことができる
      - → コンセプトを説明する動画も生成したよ
  - powerful
    - Gemini 2.5で色々なことができるようになった
- Gemini Live
  - カメラと画面共有がAndroid iOSで無料に
  - 例えば友達からの買い物リストをこれで取ったらGoogle Keepに起こせたりする
- Deep Researchでファイルをアップロードできるようになって、ドキュメントの中から情報を探せるようになった
- Canvasのアップデートで以下に変換できるように
  - Webページ化
  - 棒グラフなど
  - クイズ
  - オーディオオーバービュー(45分のものも作れる)
  - 他にもなんでも指示できる
- Gemini in Chrome
  - ページのコンテキストを理解する。
  - ウェブページの長いレビューページからをべたりなど。
- Imagen4がGeminiアプリで使えるように
  - 画像生成
  - 文字を骨で書くとかそういうこともできる
  - 10倍速くなった
- Veo3
  - 動画生成
  - オーディオジェネレーションサポート
Geneartive Media
- Lyria2がenterprisesとYouTube creatorとミュージシャンに利用可能に
- SynthID
  - ウォーターマーク
  - 10ビリオン画像、ビデオ、オーディオにウォーターマークをつけた。
  - 新しいdetector
  - https://labs.google/synthid
- Veo
  - キャラクターやシーンを使って統一感のある形で生成できる
- Flow 動画作成メーカーみたいなやつ？
  - 今日launch
  - 画像を渡して、統一感がある形で生成できる
  - シーンの次のシーンを統一感のある形で作れる
  - 次のシーンに対してどういうものを作るのかのプロンプトも指定できる
  - 一見の価値あり
  - https://youtu.be/o8NiE3XMPrM?t=5548
Google AI Pro
- 19.99 / month
- Flow with Veo2など
Google AI Ultra
- 249.99 / month
- Flow with Veo3など
- https://youtu.be/o8NiE3XMPrM?t=5807 より
Android
- GeminiがWear, Car, TVに。
- AndroidXR
  - XRは以下4つに分類される。映画見たり、ゲームしたり、仕事するのはイマーシブヘッドセットなど。外に出かけているときはグラスなど。
  - SamsungのProject Moohan 最初のAndroidXRヘッドセット
    - Geminiと連携して、Mapがみれたり、色々できる
  - AndroidXRのグラスのデモ
    - お店のレビューが見れたり、ナビが見れたり。
    - https://youtu.be/o8NiE3XMPrM?t=6189
    - ライブ翻訳
  - AndroidXRのグラス向けの開発が今年の後半に可能になる
  - AndroidXRの開発パートナーとしてGENTLE MONSTERとWARBY PARKERが参加
Closing
- FireSat山火事早期発見

<br />

デモ中心で行うそう。
Building with Gemini
- Stitch
  - https://stitch.withgoogle.com/
  - プロンプトでデザインができる。
  - HTMLコピーできる、またFigmaにもコピーできる。
  - これ試したんですが結構すごかったです。トップページでプロンプト入れるだけです。
- AI Studio上のデモ
  - Gemini APIとAI Studioの最新情報
    - URL Context
      - Geminiモデルがウェブページにアクセスし、その内容を理解するために使用できる新しいツールです。これにより、モデルは最新の関連情報に基づいて応答を生成できる
      - 20 Linkまで追加できる
    - Code Editor
      - AI Studio上でコードエディタ使える
  - GenAI SDKのMCPサポート
    - 音声通話でのMCPの非同期実行をサポート。シームレスな会話が可能に
  - AI Studioで作ったものをCloud Runで走らせられる。
    - VSCodeのCLOUD CODE/CLOUD RUNから走らせたコードを見ることができる
    - https://youtu.be/GjvgtwSOCao?t=875
Android
- AndroidifyというDroidくんのアバターを作れるアプリを今AIを作ったらどうなるだろうというプロジェクト
  - https://github.com/android/androidify
  - 写真を撮ったらそのアバターができるというもの
  - FirebaseのAIを使っている
  - Material 3 Expressiveを使っている
    - クッキーぽいデザインなど
- LiveUpdate
  - Android 16: フードデリバリーなどで利用できる通知
- R8とBaseline profile
  - Redditで、40%のCold startupの改善など
- Adaptive
  - Large screen対応
    - Canvaでは2倍複数デバイスで使うユーザーが増えた
  - Car, XR
    - XR
      - SamsungがXRデバイスを作っている話
      - Project Aura: XREALがdeveloper向けのXRデバイスを出すそう
      - XR Preview2
        
        new material XR Components
  - Adaptive対応すると500Mデバイス(5億？)で走らせられるという話
- Prodactiity (このあたりはWhat new in AndroidやWhat’s new in Android development toolsとかぶってそう)
  - Compose
    - トップアプリの60%のアプリで使っている
    - CameraX(Beta), Media3(Stable)対応
    - Navigationライブラリを再実装している(多分Navigation3の話)
      - ここでのモチベはいろんなサイズのデバイスでのナビゲーションが難しいこと
  - Journey
    - E2Eテストはアプリの大部分を見れるのでいいよねという話。
    - ただ実装するのが難しいよねという話。
    - 自然言語でできるようになったよという話。
  - Auto Version update
    - まずアップデートして、Geminiがエラーを見て対応してくれる感じ
  - Gemini in Android Studio for businesses
Web(飛ばし気味です)
- カルーセル(Chrome 135)やホバーカードなどの新しいUI機能
- ブラウザ互換性の可視化
- Chrome DevToolsのAI機能
  - DevTool内でAIにHTMLを直させて真ん中寄せして！とか言って直させられる
    - コードにも反映できるっぽい？
- 7つのAI APIがWebで利用できるように
  - ローカルLLMで処理される
- マルチモーダルなビルドインAI APIも
  - 画像とプロンプト → text
  - オーディオ → textなど
  - https://goo.gle/chrome-ai-preview
Firebase Studio
- Figmaデザインからフルスタックアプリを生成するAIワークスペースの機能
  - builder.ioの協力を得ているらしい
  - Figmaでbuilder ioプラグインを使って、Firebse Studioにexportできる
Gemma
- Gemma 3n
  - 2GBのRAMで動く
  - Gemini nanoと同じアーキテクチャ
  - 音声理解が追加
- MedGemma
  - medial text向け
- Gemmaで簡単にファインチューンができるデモ
  - unsloth(Googleとは関係なさそうですが)
    - LLMのファインチューンするツール
    - 速くて、少ないメモリで動く
    - Google Colabの無料ティアのNVIDIA GPUでよく動く
  - 文章を絵文字に変換するもの
  - lunaという犬がいるので、その時に犬の絵文字になるように
  - ColabのAI機能を使う
    - これで、オリジナルのGemmaと比較するUIを作ってもらったりできる
    - https://youtu.be/GjvgtwSOCao?t=3727
- Navarasa: 去年の発表インドの15言語が喋れるモデル
- Gemmaは140言語で利用できる
- SignGemma: 手話
- DolphinGemma: イルカの喋る言語のLLM