共计 683 个字符,预计需要花费 2 分钟才能阅读完成。
ElevenLabs 已经推出了通过人工智能生成的人声和音乐版本。现在,他们还推出了 音效工具,可以为播客、电影或游戏创作音效。这个新工具可以根据用户的提示生成长达 22 秒的音效,并可以与公司的语音和音乐平台结合使用,用户至少可以选择四种可下载的音频剪辑选项之一。
公司表示,他们与库存媒体平台 Shutterstock 合作建立了一个库,并在其音频剪辑上训练了自己的模型。Shutterstock 已经授权其内容库给包括 OpenAI、Meta 和 Google 在内的许多人工智能公司。
音效工具免费使用,但免费用户必须在标题中包含 ’elevenlabs.io’ 以表示对 ElevenLabs 的致谢,而付费用户可以使用生成的音频剪辑进行商业许可。ElevenLabs 音效工具的使用对于免费用户每个月有一个字符数限制,限制为 10,000 个字符。对于音效工具,ElevenLabs 在其音效工具的常见问题页面上表示,如果用户自定义音频剪辑的持续时间,将从字符数分配中每秒使用 40 个字符。如果使用默认的音频持续时间,将从字符数分配中每个提示请求收取 200 个字符。
市场上已经存在为创作者、电影制片人和游戏开发人员提供音效剪辑的库。但是有时候,这些音效剪辑可能价格昂贵,或者很难找到合适类型的音效。ElevenLabs 在其博客文章中表示,设计音效工具的目的是为了快速、经济地、以大规模生成丰富和沉浸式音景。
其他人工智能开发者也正在开发自己的文本转音频生成器。Stability AI 去年发布了 稳定音频 ,可以生成音乐和音效剪辑,而 Meta 的Audiocraft 模型 可以生成自然声音(比如风声或交通噪音)。