共计 746 个字符,预计需要花费 2 分钟才能阅读完成。
在国家海豚日之际,Google 发布了一项突破性的人工智能技术——DolphinGemma,这一创新有望彻底改变人类对海豚交流方式的理解。这一 AI 模型是与乔治亚理工学院和野生海豚项目(WDP)共同开发的,专注于分析和复制大西洋斑点海豚的发声模式。
自 1985 年以来,WDP 在巴哈马群岛开展了世界上持续时间最长的水下海豚研究。通过非侵入性方法,研究人员收集了庞大的水下音频和视频数据集,这些数据与特定的海豚行为相关联。科学家们已经能够将海豚的签名哨声、突发脉冲叫声和嗡嗡声等声音模式与社交行为(如团聚、冲突和求偶)联系起来。
DolphinGemma 的核心技术基于 Google SoundStream,并采用了包含约 4 亿参数的模型。它能够处理海豚的声音,并生成预测性的、类似海豚的音频序列,帮助研究人员识别交流模式和声音结构。值得注意的是,该模型经过优化,可以在 Google Pixel 智能手机上运行,为现场研究提供了极大便利。
这项技术还将提升现有的水下系统。例如,CHAT(鲸类听力增强遥测技术)通过将哨声与海豚偏爱的物体(如海藻或围巾)结合,促使海豚在想要该物体时模仿哨声。DolphinGemma 的预测能力与 CHAT 的整合,将显著提高互动的速度和准确性。
Google 宣布,DolphinGemma 将在今年夏天成为开源工具,旨在与全球海洋研究人员的努力无缝衔接,并适应不同种类的海豚。这一进展标志着人类在理解海豚语言的漫长道路上迈出了重要一步,使我们更接近与海洋中最聪明的生物建立 ” 共享词汇 ” 的目标。
这一突破不仅展示了人工智能在跨物种交流研究中的潜力,也为未来探索其他海洋生物的交流方式开辟了新的可能性。随着技术的进一步发展,我们或许能够揭开更多海洋生物交流的神秘面纱,深化人类对海洋生态系统的理解。