共计 880 个字符,预计需要花费 3 分钟才能阅读完成。

华盛顿大学 /YouTube
想象一下,你正处于一个有多人交谈的拥挤房间中,你试图仅聆听其中一个具体的人。这是一个我们都曾面对的具有挑战性的情况。现在,华盛顿大学的一个团队已经创建了一项旨在解决这一挑战的技术。
根据 华盛顿大学的一则新闻发布,该团队设计了一个 AI 系统,让戴着现成耳机的人能够在人群中只聆听其中一个人。要录取一个人的声音,你只需看着他们三到五秒钟。这个名为“目标性言语听觉”的系统接着会封锁周围所有其他声音,让你只聆听你所注册的那个人。你甚至可以四处移动远离说话者,继续聆听他们的声音。
以下是系统的工作原理:
戴着任何一副装备有双麦克风的耳机,你在看着说话的人时按一下按钮。那个人的声音波会击中耳机两侧的麦克风。该信号发送到系统内部的计算机,嵌入的 AI 会学习说话者的语音模式。系统接着捕捉这个声音并继续播放给你听。人说话的时间越长,系统学习的内容加深并扩充训练数据。
目前的耳机和耳塞已经提供了降噪功能和其他选项,帮助你更好地聆听特定声音。例如,苹果的 AirPods Pro 提供噪音控制设置,可以消除周围的声音,使你专注于耳塞传来的音频。你还会发现个性化音量和对话感知等功能,旨在自动调整音频音量。iOS 中称为 对话放大 的辅助功能可以放大附近人们的对话。此外,据报道 iOS 18 将引入 助听器模式 以帮助你解决听力问题。
华盛顿大学团队开发的系统承诺扩展这种能力,尤其是通过其创新的目标性言语听觉技术,为用户提供了一个在嘈杂环境中清晰聆听特定声音的解决方案。