BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Googleがイルカのコミュニケーション研究支援にDolphinGemmaを投入

Googleがイルカのコミュニケーション研究支援にDolphinGemmaを投入

原文リンク(2025-05-13)

GoogleはDolphinGemma、研究者がイルカの発声を分析・解釈することを支援するために開発された新しいAIモデルを発表した。このプロジェクトはWild Dolphin Project(WDP)とジョージア工科大学の研究者との継続的な共同研究の一環であり、大西洋マダライルカの自然なコミュニケーションにおけるパターンの特定にフォーカスしている。

DolphinGemmaはGoogleのGemma言語モデルアーキテクチャを基盤とし、特に音声データ専用に適合されている。このモデルはSoundStreamトークナイザーを使用してイルカの音を機械可読なシーケンスに変換し、繰り返し現れるパターンを検出したり、シーケンス内で次に現れる可能性の高い音をモデルが予測できるようにしている。約4億パラメータのこのモデルは、WDPがフィールドで使用するGoogle Pixelデバイスを含むスマートフォン上でローカル実行できるほど小型だ。

WDPは、約40年にわたって収集された野生のイルカの行動と音声に関するもっとも包括的なデータセットの1つをまとめている。このデータセットには、特定の個体イルカ、彼らの社会的関係、観察された行動に紐づいた音声および映像記録が含まれている。研究者たちはシグネチャーホイッスル、バーストパルススクォーク、バズなど、特定の種類の音と特定の行動状況との関連性を確立している。DolphinGemmaはこのデータを分析するために開発され、音のシーケンス内の統計的な規則性や潜在的に重要な構造の特定を促進する。

自然なコミュニケーションの分析に加えて、DolphinGemmaはジョージア工科大学が開発したCHAT(Cetacean Hearing Augmentation Telemetry)システムに統合されている。CHATはイルカが海藻やスカーフなどの物体とインタラクトする際にそれに関連付けられた合成ホイッスル音を使い、イルカとシンボリックなやり取りを行う基本的な手段を提供する。イルカがこれらの音を模倣すると研究者はそれを物体リクエストとして解釈できる。DolphinGemmaは音の認識精度と応答速度を向上させることでこのシステムをサポートしており、これは水中でのインタラクションにおいてキーとなっている。

このモデルは、Google Pixel 9のような最新世代のスマートフォンで動作し、専用ハードウェアの必要性を減らしている。これによりフィールドでの展開が簡素化され、システムのコストとサイズを抑えることができる。スマートフォンの内蔵処理能力により、DolphinGemmaはフィールドワーク中にリアルタイムで動作し、研究者がイルカの発声を追跡・応答する際に支援する。

Googleは、2025年後半にDolphinGemmaをオープンソースモデルとしてリリースする意向を示している。現在は大西洋マダライルカの音声に基づいて訓練されているが、このモデルは他の種にもファインチューニングして利用することが可能だ。これはクジラ類のコミュニケーションに関するより広範な研究を支援する可能性があるが、実際の応用は種ごとに十分ラベル付けされたデータセットを入手できるかに依存する。

このモデルはイルカのコミュニケーションの意味を解釈するものではないが、さらなる調査の指針となる構造的特徴を研究者が特定するのを助ける可能性がある。このニュースはAI研究者の間で大きな関心を呼び、多くの人が非ヒトコミュニケーションの理解におけるターニングポイントとなる可能性があると考えている。

作者について

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT