木曜日, 5月 1, 2025
ホームニューステックニュースグーグルの「NotebookLM」でポッドキャストのようなAIの会話を生成可能に、さっそく使ってみた - ケータイ Watch

グーグルの「NotebookLM」でポッドキャストのようなAIの会話を生成可能に、さっそく使ってみた – ケータイ Watch


米グーグル(Google)は、文書作成などを支援するAIサービス「NotebookLM」の機能のひとつ「オーディオオーバービュー(音声概要)」で、日本語を含む50の言語へ新たに対応した。音声概要では、あたかもポッドキャストのようなAIによる会話を生成できる。

 Google LabsのソフトウェアエンジニアであるMichael Chen氏と、Usama Bin Shafqat氏への取材内容とともに、音声概要と多言語対応をご紹介しよう。

NotebookLMとは

 「NotebookLM」は、“AIを活用した調査・執筆アシスタント”という位置づけ。複雑な資料を理解し、探求することへの支援がミッションとされている。

 ユーザーが提供するソースのみに基づいて応答を生成するようになっており、ソース以外の情報から回答が生成されることを防ぎ、不正確な回答や誤解を招く回答のリスクを抑える。

 利用できるソースは、Googleドキュメント、Googleスライド、PDF、ウェブサイト、YouTube動画、音声ファイルなど。

NotebookLM

 Plusユーザーであれば、最大50個のソース、合計2500万語という大量の資料を1つのノートブックにアップロードすることが可能で、それ以上の制限もある。

 ソースをもとに、「◯◯して」とプロンプトを入力するだけではなく、ソースと生成した内容を保存した「メモ」から、マインドマップを生成できる。

 また、ユーザー自身が追加するソースに加えて、「Discover Sources」機能で「◯◯について調べて」と入力すると、Web上にある情報を探してソースへ追加してくれる。

音声概要(オーディオオーバービュー)

 今回、多言語対応した音声概要(オーディオオーバービュー)機能は、アップロードされたソース資料をもとに、AIが音声での会話を生成してくれるというもの。ソースの内容をテーマに、深掘りするディスカッションといった内容へ変換する。

 生成する際にはプロンプトを入力することもできる。

 2024年9月、英語で利用できる機能として登場しており、今回、50以上の言語に対応した。新たに対応する言語のなかには日本語も含まれる。英語やほかの言語で入力したソースを、日本語の音声で出力することもできる。今後も対応言語は拡充される予定。

使ってみた

 生成される音声は、AIがホスト2人として振る舞う。ソースの情報を要約するだけではなく、資料同士のつながりを見つけようとして、トークショー、つまり「えー」「それはですね」と言った間投詞が含まれ、口語での仕上がりとなる。

 堅苦しい言い回しではなく、軽妙なやり取りとなり、生成した音声をダウンロードしてスマートフォンへコピーしておけば、電車などで聴くこともできる。

 イントネーションや漢字の読みが必ずしも正しいわけではなく、いわばAIらしい語り口ではあるが、音声の語りは、Google DeepMindなど、グーグル社内の各チームと連携して開発された。

 AIが使う音声は、大まかに男性、女性といった組み合わせで、声の変更はできない。また、日本語で漢字の読み方を指定するといったことも現在はできない。ただ、今後も声の変更、単語の読み方の変更といった機能が実現するよう開発は進められるという。

 なお、具体的な回数は明らかにされていないが、音声概要の生成回数には上限が設定されている。ただし、「NotebookLM Plus」のユーザーではその制限が大幅に緩和されているとのこと。

下記の内容を操作していた際の画面

 ひとまず、4月21日~26日に本誌「ケータイ Watch」に掲載された記事をいくつかソースとして登録。実際にAIによるトークを生成してみた。

 NTTドコモの新料金、モトローラが海外で発表した新機種、楽天モバイルの発表会といったものだ。ひとつの発表会で複数の記事を掲載したものについては、できるだけ多くソースへ登録した。

 その冒頭部分30秒程度をテキスト化してみると、単なる読み上げではなく、人が会話しているかのような始まりになっている。

男性風ボイス
 こんにちは。今週もケータイ Watchから、えっと、特に皆さんが注目しているであろう記事、いくつかピックアップしました。

女性風ボイス
 よろしくお願いしまーす。

男性風ボイス
 ドコモの大きな動きとか、あとは通信技術のま少し先の未来の話、それから私たちのスマホ利用に直接関わるセキュリティの話まで、今回もちょっと深く見ていきたいなと思ってます。

女性風ボイス
 ええ、今回の記事を見ると単に新製品が出たっていうニュースだけじゃなくて、通信業界全体の戦略が変わってきているな。とか、技術の将来像に関する、まー、なかなか深い議論が見られますよね。

男性風ボイス
 ですね。

女性風ボイス
 利用者としてあなたが知っておくべきポイントも多いかなと思います。

 では、早速まずはドコモの話からいきましょうか。

女性風ボイス
 はい。

男性風ボイス
 新料金プラン「ドコモ MAX」と「ドコモ mini」を発表して、これまでの「eximo」「irumoは新規受付を終了すると。

女性風ボイス
 そうですね。

 合いの手も入り、かなり完成度が高い。

 では、ソースを変えて会話の内容がどう変化するか。プロンプトとして、ソースがどういったものか(ドコモの新料金の記事、プレゼンテーションの記事、質疑と囲み取材の記事)という情報を添えた。

男性風ボイス
 さて、えっと今回はNTTドコモですね、4月25日に発表した新しい携帯料金プラン。これについてちょっと深掘りしていきたいと思います。

女性風ボイス
 はい。

男性風ボイス
 発表内容を伝える記事があって、それから、ま、当日のプレゼンをまとめた記事、あとは質疑応答とか囲み取材、ここだけを詳しく報じた記事といくつかソースがありますね。

女性風ボイス
 ええ、料金プランの変更って、ま、単に値段が変わるだけじゃなくて、結構その企業の戦略が見えたりしますよね。

男性風ボイス
 そうなんですよ。

女性風ボイス
 今回は 特にその価値っていうのを重視する方向になんか舵を切ったなという感じがします。

男性風ボイス
 まさにその価値っていうのがキーワードになりそうですね。これまでのデータ量と料金だけで比較するみたいなところから何が変わるのか早速見ていきましょうか。

 なるほど、パターンとしては近い。ニュースを元にしたためか、

 今回はニュース解説風の会話となったが、グーグルの担当者によれば、何らかの学習に向けた資料としての活用を想定しているという。

 開発にあたっては、あらゆる言語のニュアンスを理解することが課題であり、ジェンダーに関わる表現など非常に微妙なニュアンスを理解することが難しいのだという。このあたりは、グーグルのAI「Gemini」の得意とするところとのことで、今回の機能追加に至った。

 とはいえ、間違ってしまう可能性はゼロではない。たとえば、漢字の読み方もそのひとつであり、現時点では、ユーザー側で修正できない。

 また、NotebookLMとしてソースを限定して会話を生成するとはいえ、誤った内容(ハルシネーション)を含んだ会話になってしまう可能性もまた、ゼロにはできない。

 担当者は「資料を理解するため、移動中でもテキストではない形のメディアでも情報を消費したいと考える場面がある。学習資料の理解を深めるだけではなく、自分が執筆したものを批評したい場合、同僚や友人と共有したい場合でも活用できる」と新機能について語っていた。

 NotebookLMは、現在のところ、パソコンのWebブラウザから利用する。スマホアプリ版は現在開発中とのことで、今後の登場で、どういった使い勝手になるかも注目したい。



フラッグシティパートナーズ海外不動産投資セミナー 【DMM FX】入金

Source link

Views: 0

RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

- Advertisment -

Most Popular

Recent Comments