ElevenLabs推出新音效工具,助力播客、电影和游戏创作

90次阅读
没有评论

共计 637 个字符,预计需要花费 2 分钟才能阅读完成。

ElevenLabs 近期推出了一款新的音效工具,该工具能够生成最长 22 秒的声音,用户可以根据自己的提示进行定制。这一工具与公司的语音和音乐平台相结合,提供了至少四种可下载的音频选项。

该公司与库存媒体平台 Shutterstock 合作,建立了一个音效库,并利用 Shutterstock 的内容对其模型进行了训练。Shutterstock 的内容库已被多家 AI 公司授权使用,包括 OpenAI、Meta 和谷歌。

声音效果的使用是免费的,但付费用户可以使用生成的音频剪辑进行商业许可。免费用户在使用时需要在标题中包含“elevenlabs.io”,以示对 ElevenLabs 的认可。此外,ElevenLabs 对用户在编写提示时设定了字数限制,免费用户每月有 10,000 个字符的使用额度。对于 Sound Effects,如果用户自定义音频片段的持续时间,每秒将消耗 40 个字符;若使用默认时长,则每个提示请求将消耗 200 个字符。

市场上已有多种声音效果剪辑库,供创作者、电影制片人和视频游戏开发者使用。然而,这些库有时价格昂贵或难以找到恰好合适的声音类型。ElevenLabs 在其博客文章中强调,其设计的 Sound Effects 能够快速、经济、规模化地生成丰富且沉浸式的音景。

此外,其他 AI 开发者也在开发自己的文本转语音生成器。例如,Stability AI 去年发布了 Stable Audio,用于创建音乐和音效的音频剪辑;Meta 的 AudioCraft 模型则专注于生成自然声音,如风或交通的背景噪音。

正文完
 0
admin-gah
版权声明:本文于2024-06-02转载自TheVerge,共计637字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码