共计 677 个字符,预计需要花费 2 分钟才能阅读完成。
语音克隆初创公司 ElevenLabs 今日推出了一款创新的声音生成工具,该工具允许用户通过简单的提示来创造各种声音效果。这一项目最初在二月份被宣布,现在已正式向所有用户开放。
用户只需输入如“海浪拍打声”、“金属撞击声”、“鸟鸣声”或“赛车引擎声”等提示,即可生成相应的声音片段。此外,该工具还能生成长达 22 秒的器乐音乐片段,如吉他循环、爵士萨克斯独奏和电子音乐循环。
免费用户每月可以生成 10,000 个字符组合,大约相当于 60 种声音效果。但需注意的是,发布包含这些声音片段的内容时,必须将声音归属于“elevenlabs.io”。
ElevenLabs 透露,他们使用了 Shutterstock 音频库中的授权音轨来训练其模型。在 α 测试阶段,该工具已被视频游戏开发人员、电影制片人、社交媒体内容创作者和营销人员广泛尝试。
值得注意的是,该工具严格遵守其 禁止内容和使用政策,不允许通过违反政策的提示生成声音,如涉及自残、威胁儿童安全和欺诈等主题。
尽管目前只有少数公司和初创公司在开发基于 AI 的声音生成技术,ElevenLabs 在这一领域的竞争仍然激烈。其他公司如稳定性 AI 支持的 Harmonai 已发布 Dance Diffusion;谷歌正在研究 MusicLM;OpenAI 推出了Jukebox;Meta 拥有其AudioCraft 模型。此外,TikTok和 Adobe 也在尝试他们自己的基于生成 AI 的音乐创作工具。
ElevenLabs 的这一创新工具无疑为声音创作领域带来了新的可能性,为创作者提供了更多样化的声音资源,同时也展示了 AI 技术在音乐和声音效果生成方面的巨大潜力。