ElevenLabs推出AI音效工具,助力播客、电影和游戏创作

105次阅读
没有评论

共计 632 个字符,预计需要花费 2 分钟才能阅读完成。

ElevenLabs 近期推出了一个创新的人工智能音效工具,该工具能够根据用户提示生成最长 22 秒的声音,适用于播客、电影或游戏制作。用户可以与公司的语音和音乐平台无缝结合,并从至少四个可下载的音频剪辑选项中选择。

该公司与库存媒体平台 Shutterstock 合作,利用 Shutterstock 的音频剪辑建立了一个音效库,并用于训练其 AI 模型。Shutterstock 的内容库已被授权给包括 OpenAI、Meta 和 Google 在内的多家 AI 公司使用。

音效工具对用户免费开放,但付费用户可以使用生成的音频剪辑进行商业授权。免费用户在使用时需在标题中包含 ’elevenlabs.io’ 以引用 ElevenLabs。此外,ElevenLabs 用户在编写提示时有一定的字符数限制,免费用户每月可获得 10,000 个字符。对于音效工具,如果用户自定义音频剪辑的持续时间,每秒将从分配的字符数中扣除 40 个字符;若使用默认音频持续时间,每个提示请求将收取 200 个字符。

尽管市场上已有供创作者、电影制片人和游戏开发者使用的音效库,但这些库有时价格昂贵,或难以找到理想的声音类型。ElevenLabs 设计此音效工具旨在快速、经济且规模化地生成丰富而沉浸式的音景。

除了 ElevenLabs,其他 AI 开发者也在开发自己的文本转音频生成器。例如,Stability AI 去年发布的稳定音频,能创建音乐和音效的音频剪辑,而 Meta 的 AudioCraft 模型则能生成自然声音,如背景噪音,如风声或车辆声。

正文完
 0
admin-gah
版权声明:本文于2024-06-01转载自TheVerge,共计632字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码