Google DolphinGemma AI 突破：解码海豚语言的新里程碑

70次阅读

共计 746 个字符，预计需要花费 2 分钟才能阅读完成。

在国家海豚日之际，Google 发布了一项突破性的人工智能技术——DolphinGemma，这一创新有望彻底改变人类对海豚交流方式的理解。这一 AI 模型是与乔治亚理工学院和野生海豚项目（WDP）共同开发的，专注于分析和复制大西洋斑点海豚的发声模式。

自 1985 年以来，WDP 在巴哈马群岛开展了世界上持续时间最长的水下海豚研究。通过非侵入性方法，研究人员收集了庞大的水下音频和视频数据集，这些数据与特定的海豚行为相关联。科学家们已经能够将海豚的签名哨声、突发脉冲叫声和嗡嗡声等声音模式与社交行为（如团聚、冲突和求偶）联系起来。

DolphinGemma 的核心技术基于 Google SoundStream，并采用了包含约 4 亿参数的模型。它能够处理海豚的声音，并生成预测性的、类似海豚的音频序列，帮助研究人员识别交流模式和声音结构。值得注意的是，该模型经过优化，可以在 Google Pixel 智能手机上运行，为现场研究提供了极大便利。

这项技术还将提升现有的水下系统。例如，CHAT（鲸类听力增强遥测技术）通过将哨声与海豚偏爱的物体（如海藻或围巾）结合，促使海豚在想要该物体时模仿哨声。DolphinGemma 的预测能力与 CHAT 的整合，将显著提高互动的速度和准确性。

Google 宣布，DolphinGemma 将在今年夏天成为开源工具，旨在与全球海洋研究人员的努力无缝衔接，并适应不同种类的海豚。这一进展标志着人类在理解海豚语言的漫长道路上迈出了重要一步，使我们更接近与海洋中最聪明的生物建立 ” 共享词汇 ” 的目标。

这一突破不仅展示了人工智能在跨物种交流研究中的潜力，也为未来探索其他海洋生物的交流方式开辟了新的可能性。随着技术的进一步发展，我们或许能够揭开更多海洋生物交流的神秘面纱，深化人类对海洋生态系统的理解。

正文完