共计 1052 个字符,预计需要花费 3 分钟才能阅读完成。
Sabrina Ortiz/ZDNET
ElevenLabs 是人工智能音频领域的领先者。其工具,如AI 语音克隆,已在全球范围内获得认可。现在,这家初创公司推出了其 AI 音效工具,帮助创意人士为其项目找到完美的音效。
据 ElevenLabs 称,这款工具最初在二月份宣布,能根据文本提示生成音效、独特的角色声音和音乐片段。您可以在下方观看由该工具为 OpenAI 的 Sora 演示视频创造的音效:
ElevenLabs 表示,这些工具旨在帮助内容创作者、电影和电视制作人员以及视频游戏开发者,以“负担得起且规模化”的方式生成他们需要的声音,使项目更加生动和真实。
ElevenLabs 的联合创始人兼首席执行官 Mati Staniszewski 在一份声明中表示:“在过去一年里,我们通过推出了第一个真正具有情感、类似人类的文本转语音平台,彻底改变了 AI 语音技术。随着文本转音效的推出,我们又迈出了重要的一步,为创作者提供了更多音频工具,帮助他们制作高质量内容。”
为了实现 AI 效果,ElevenLabs 与 Shutterstock 合作,利用 Shutterstock 授权音轨库的内容对其模型进行优化,解决了使用生成式 AI 模型时的道德顾虑。
AI 音效工具已经在 ElevenLabs 网站上线,提供不同层次的计划以满足用户需求。您可以免费尝试该工具,尽管它会计入您每月的 10,000 字符限制。
作为一名业余喜欢编辑视频的人,我对能更轻松地找到音效的可能性感到兴奋。我尝试了这个工具以了解其工作原理。要开始,请访问ElevenLabs 网站,点击右侧面板上的音效,并输入您想听到的内容。我输入的第一个提示是“小狗叫。”如下是工具生成的五个不同版本:
Sabrina Ortiz/ZDNET 的屏幕截图
作为一只自豪的约克夏主人,我可以证明生成的音效与真实情况相近。该工具非常直观,流程与使用大多数 AI 图像或音乐生成器基本相同。
当我使用更复杂的提示“女性欢呼”时,生成器花费更长的时间输出结果,质量也不如第一次测试那样准确或可用。然而,当我回到更简单的提示,比如“厨房警报铃响”,我取得了很好的结果。这五个输出听起来像提示,但略有不同,提供了不同的选择。
AI 音效工具还可以生成音乐。当要求创作“带有爵士风格的 lo-fi 节拍”时,工具生成了五个高质量选项。
最终,我对这个工具印象深刻,并鼓励您进行测试。AI 音效是一次有趣且免费的体验。不过,我建议不要让工具发出人类声音,因为这可能会引起伦理问题。如果想生成语音,请查看 ElevenLabs 的 文本转语音工具。