ElevenLabs推出新音效工具，助力播客、电影和游戏创作

213次阅读

共计 637 个字符，预计需要花费 2 分钟才能阅读完成。

ElevenLabs 近期推出了一款新的音效工具，该工具能够生成最长 22 秒的声音，用户可以根据自己的提示进行定制。这一工具与公司的语音和音乐平台相结合，提供了至少四种可下载的音频选项。

该公司与库存媒体平台 Shutterstock 合作，建立了一个音效库，并利用 Shutterstock 的内容对其模型进行了训练。Shutterstock 的内容库已被多家 AI 公司授权使用，包括 OpenAI、Meta 和谷歌。

声音效果的使用是免费的，但付费用户可以使用生成的音频剪辑进行商业许可。免费用户在使用时需要在标题中包含“elevenlabs.io”，以示对 ElevenLabs 的认可。此外，ElevenLabs 对用户在编写提示时设定了字数限制，免费用户每月有 10,000 个字符的使用额度。对于 Sound Effects，如果用户自定义音频片段的持续时间，每秒将消耗 40 个字符；若使用默认时长，则每个提示请求将消耗 200 个字符。

市场上已有多种声音效果剪辑库，供创作者、电影制片人和视频游戏开发者使用。然而，这些库有时价格昂贵或难以找到恰好合适的声音类型。ElevenLabs 在其博客文章中强调，其设计的 Sound Effects 能够快速、经济、规模化地生成丰富且沉浸式的音景。

此外，其他 AI 开发者也在开发自己的文本转语音生成器。例如，Stability AI 去年发布了 Stable Audio，用于创建音乐和音效的音频剪辑；Meta 的 AudioCraft 模型则专注于生成自然声音，如风或交通的背景噪音。

正文完

发表至： AI行业动态

2024-06-02 03:37

0