土曜日, 5月 24, 2025
ホームニュースPCニュースGoogle、Gemini 2.5 Proが複数の仮説を検討可能に。AI音声の話し方も指定可能に

Google、Gemini 2.5 Proが複数の仮説を検討可能に。AI音声の話し方も指定可能に


 Googleは21日(米国時間)、AIモデル「Gemini 2.5 Pro」向けの新機能として、応答前に複数の仮説を検討する「Deep Think」を発表した。

 Deep Thinkは、ユーザーのプロンプトへ応答する前に複数の仮説を検討する実験的な推論モード。Googleは「これまでで最も高性能なモデル」としており、社内実施テストにおいてUSAMO2025(米国数学オリンピック)、LiveCodeBench v6、MMMU(マルチモーダル推論テスト)の各ベンチマークで現行のGemini 2.5 ProやChatGPT o3/o4-miniよりも高い結果が出たという。

 そのほかの詳細については明らかにしていないが、現在は安全性評価テスト中であり、今後は一般提供を開始する前の段階で、Gemini APIを通してフィードバックを募る予定だとしている。

 Gemini 2.5 Pro/Flash共通の新機能としてはこのほか、音声出力時における指示内容の拡張、API経由でのツール利用サポート、セキュリティの強化を施している。

 AIが音声で応答する際の話し方やアクセント、スタイルについて新たにプロンプトで指示できるようになった。AIと音声で対話する際にはさらに、ユーザーの声色から感情を認識する「Affective Dialogue」と、バックグラウンド雑音を無視してスムーズに対話する「Proactive Audio」など初期段階の機能が試せる。またセキュリティ面では、プロンプトインジェクションに対する保護を強化した。





続きを見る


🧠 編集部の感想:
GoogleのGemini 2.5 Proが複数の仮説を検討できる新機能を搭載したことは、AIの応答精度を大幅に向上させる可能性があり期待大です。音声応答のスタイルや感情をユーザーが指定できるようになった点も、より人間らしいコミュニケーションを実現しそうです。セキュリティ面の強化も今の時代には欠かせない要素で、全体的に進化を感じます。

Views: 0

RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

- Advertisment -

インモビ転職