共计 637 个字符,预计需要花费 2 分钟才能阅读完成。
ElevenLabs 近期推出了一款新的音效工具,该工具能够生成最长 22 秒的声音,用户可以根据自己的提示进行定制。这一工具与公司的语音和音乐平台相结合,提供了至少四种可下载的音频选项。
该公司与库存媒体平台 Shutterstock 合作,建立了一个音效库,并利用 Shutterstock 的内容对其模型进行了训练。Shutterstock 的内容库已被多家 AI 公司授权使用,包括 OpenAI、Meta 和谷歌。
声音效果的使用是免费的,但付费用户可以使用生成的音频剪辑进行商业许可。免费用户在使用时需要在标题中包含“elevenlabs.io”,以示对 ElevenLabs 的认可。此外,ElevenLabs 对用户在编写提示时设定了字数限制,免费用户每月有 10,000 个字符的使用额度。对于 Sound Effects,如果用户自定义音频片段的持续时间,每秒将消耗 40 个字符;若使用默认时长,则每个提示请求将消耗 200 个字符。
市场上已有多种声音效果剪辑库,供创作者、电影制片人和视频游戏开发者使用。然而,这些库有时价格昂贵或难以找到恰好合适的声音类型。ElevenLabs 在其博客文章中强调,其设计的 Sound Effects 能够快速、经济、规模化地生成丰富且沉浸式的音景。
此外,其他 AI 开发者也在开发自己的文本转语音生成器。例如,Stability AI 去年发布了 Stable Audio,用于创建音乐和音效的音频剪辑;Meta 的 AudioCraft 模型则专注于生成自然声音,如风或交通的背景噪音。