共计 620 个字符,预计需要花费 2 分钟才能阅读完成。
声音克隆初创公司 ElevenLabs 今日推出了一项创新工具,允许用户通过输入提示词生成声音效果片段。该公司早在今年 2 月份就已宣布了这一项目。
从即日起,该工具面向所有用户开放,用户只需输入如“海浪拍打”、“金属碰撞声”、“鸟鸣声”或“赛车发动机声”等提示词,即可生成相应的声音片段。
此外,该工具还能通过提示生成长达 22 秒的器乐音乐片段,例如吉他循环、爵士萨克斯独奏和电子音乐循环。
免费用户每月可生成 10,000 个字符,每个声音片段请求大约需要 150 个字符。这意味着免费用户每月可生成近 60 个声音效果,并在发布包含这些声音剪辑的内容时,需将声音归因于“elevenlabs.io”。
ElevenLabs 透露,他们的模型训练使用了 Shutterstock 音频库中的许可曲目。在 α 测试阶段,试用该工具的用户包括视频游戏开发人员、电影制片人、社交媒体内容创作者和营销人员。
值得注意的是,该工具不允许通过违反其 禁止内容和使用政策 的提示生成声音,这些政策涵盖了自残、威胁儿童安全和欺诈等敏感主题。
尽管目前只有少数公司和初创公司在 AI 声音生成领域活跃,ElevenLabs 仍需面对音乐生成领域的激烈竞争。例如,Stability AI 支持的 Harmonai 已发布 Dance Diffusion;Google 开发了 MusicLM;OpenAI 拥有 Jukebox;Meta 有其 AudioCraft 模型 。TikTok 和Adobe也尝试过基于生成式 AI 的音乐创作工具。