共计 719 个字符,预计需要花费 2 分钟才能阅读完成。
ElevenLabs 已经提供了由人工智能生成的人声和音乐。现在,它还将允许人们为播客、电影或游戏创建音效。新的 Sound Effects 工具可以根据用户的提示生成长达 22 秒的音效,这些音效可以与该公司的语音和音乐平台结合使用,并且它为用户提供至少四个可下载的音频剪辑选项。
该公司表示,它与库存媒体平台 Shutterstock 合作,在其音频剪辑上构建了一个库并对其模型进行了训练。Shutterstock 已经向许多人工智能公司,包括 OpenAI、Meta 和 Google,授权了其内容库。
Sound Effects 可以免费使用,但付费用户可以使用带有商业许可的生成的音频剪辑,而免费用户“必须在标题中包含 ’elevenlabs.io’ 来归因 ElevenLabs。”ElevenLabs 的用户在撰写提示时有一个固定的字符计数限制,免费用户每月可获得 10,000 个字符。对于 Sound Effects,ElevenLabs 在其常见问题页面上表示,对于 Sound Effects,如果用户自行设置音频剪辑的持续时间,将每秒钟消耗 40 个字符。如果使用默认的音频持续时间,每个提示请求将收取 200 个字符。
市场上已经存在着面向创作者、电影制片人和游戏开发者的音效库。但有时,这些可能会很昂贵或者很难找到合适类型的声音。ElevenLabs 在其博客文章中表示,它设计 Sound Effects 是为了“快速、经济、规模化地生成丰富和沉浸式的音景”。
其他人工智能开发者也在开发他们自己的文本转语音生成器。Stability AI 去年发布了 Stable Audio,可以创建音乐和音效的音频剪辑,而 Meta 的 AudioCraft 模型可以生成自然声音(比如风或交通的背景噪音)。