共计 689 个字符,预计需要花费 2 分钟才能阅读完成。
ElevenLabs 公司已经推出了专用于生成人声和音乐的 AI 版本。如今,他们还计划开发一个用于创作播客、电影或游戏音效的工具。这个全新的音效工具可根据用户的提示创作长达 22 秒的声音。这些声音可以与 ElevenLabs 公司的语音和音乐平台相结合,并提供至少四个可供下载的音频剪辑选项。
该公司表示,他们与库存媒体平台 Shutterstock 合作,建立了一个音频剪辑库,并对其进行了模型训练。Shutterstock 已向多家 AI 公司(包括 OpenAI、Meta 和 Google)授权其内容库。
音效工具可免费使用,但付费用户可以获得商业许可来使用生成的音频剪辑,而免费用户“必须在标题中标明‘elevenlabs.io’以展示归属于 ElevenLabs”。ElevenLabs 用户在撰写提示时有一定的字符限制,免费用户每月可使用 10,000 个字符。对于音效,ElevenLabs 在其常见问题页面上指出,如果用户自行设置音频剪辑的持续时间,每秒将消耗 40 个字符。如果使用默认音频持续时间,则每个提示请求将消耗 200 个字符。
市场上已经存在为创作者、电影制作人和视频游戏开发人员提供的音效库。然而,有时这些库的价格过高,或者很难找到合适的声音类型。ElevenLabs 在其博客文章中表示,他们设计音效工具的目的是“快速、经济、大规模地产生丰富而沉浸式的声音景观”。
其他 AI 开发者也在开发他们自己的文本转音频生成器。去年,Stability AI 推出了 Stable Audio,该工具可以生成音乐和音效的音频剪辑。而 Meta 公司的 AudioCraft 模型则可以生成包括风声、交通等自然声音的背景噪音。