📌 ニュース:
GoogleのGemini 2.5に、
自然な音声生成機能「ネイティブオーディオ」が追加され、
日本語を含む多言語に対応しました。
主な機能は「リアルタイム音声ダイアログ」と
「制御可能なテキスト読み上げ」の2つです。
リアルタイム音声ダイアログでは、
アクセントやトーンを設定でき、
日本語の自然な表現が可能です。
一方、制御可能なテキスト読み上げでは、
スタイルや感情を指示し、
2人までの会話文を生成できます。
この機能はGoogle AI StudioやVertex AIで利用可能で、
生成音声にはGoogleの透かし技術「SynthID」が埋め込まれています。
-
以下のポイントをまとめましたので、ご覧ください。
-
🎤 音声生成機能の強化
- Gemini 2.5に「ネイティブオーディオ」機能が追加され、リアルタイム音声ダイアログや制御可能なテキスト読み上げが可能になりました。
-
🌏 多言語対応
- 日本語を含む多言語での音声生成ができ、高品質で豊かな表現力を持っています。
- ⚙️ 使いやすいインターフェース
- Google AI Studioを利用すれば、簡単にプロンプトを入力して音声を生成できるため、多様なシナリオで応用が期待できます。
-
※以下、出典元
▶ 元記事を読む
Views: 1