マダライルカの母イルカが子イルカの餌探しの様子の観察。子イルカが餌を食べ終わると母イルカが独特のホイッスルで呼び戻す。右はそのホイッスルを視覚化したスペクトログラム

 米Googleは14日(現地時間)、ジョージア工科大学およびWild Dolphin Project(WDP)のフィールド調査と連携して、イルカの鳴き声を理解できるようにする4億パラメータのAI「DolphinGemma」の開発に取り組んでいることを発表した。

 WDPは1985年以来水中におけるイルカの行動について研究を行なっているが、その中でイルカの鳴き声と特定の行動を直接結びつけることができるようになった。この観察研究の最終的な目標は、音声シーケンスの構造と潜在的な意味を理解し、言語を示唆する可能性のあるパターンや規則を見つけることだという。

 ただ、イルカの自然かつ複雑なコミュニケーションを分析するのは、途方もない作業量になる。そこでGoogleはWDPが持つ膨大なラベル付きデータセット、具体的には野生のタイセイヨウマダライルカの音響データベースを利用してAIをトレーニング。

 これにより、DolphinGemmaはオーディオ入力/出力モデルとして機能し、イルカの鳴き声のシーケンスを処理してパターンを識別/構造化し、シーケンス内の次の音を予測できるようになった。これは、人間の言語の大規模言語モデルが文中の次の単語やトークンを予測するのと似ているという。

DolphinGemmaの初期テスト中に生成されたホイッスル(左)とバーストパルス(右)

 また、Google独自の音声技術を活用。SoundStreamトークナイザーにより、複雑なシーケンスに適したモデルアーキテクチャによって、イルカの鳴き声を効率的に表現できる。これにより、WDPが現場で使用しているPixelスマートフォンで直接実行できるようにした。

 さらにWDPでは、こうした自然コミュニケーションの分析に加え、技術を用いた双方向インタラクションを探る独自研究も行なっている。それがジョージア工科大学との提携による「CHAT(Cetacean Hearing Augmentation Telemetry:クジラ類聴覚増強テレメトリー)」システムの開発だという。

 CHATは、イルカの自然な鳴き声とは異なる新しい合成ホイッスルを、ホンダワラ類、階層、スカーフといったイルカが好む特定のものと関連付ける。そしてこの関連付けを人間同士が実演することで、イルカが合成ホイッスルを真似て、これらのものを要求するようになることに期待している。将来的には、より多くの自然な鳴き声が理解されるにつれて、システムに追加できるようにする。

 実行には「Pixel 6」を用いたが、2025年夏には「Pixel 9」を用いることで、スピーカーとマイクの機能を統合し、高度な処理能力を生かし、ディープラーニングとテンプレートマッチングアルゴリズムを同時に実行するという。

最新CHATに導入されたPixel 9

 GoogleはこのDolphinGemmaを2025年夏にオープンモデルとして公開する予定。モデル自体はタイセイヨウマダライルカの鳴き声を使ってトレーニングされているが、バンドウイルカやハシナガイルカといったほかの鯨類を研究する研究者の役に立つことに期待している。



フラッグシティパートナーズ海外不動産投資セミナー 【DMM FX】入金

Source link