稳定AI发布开放AI模型Stable Audio Open,用于生成声音和歌曲

111次阅读
没有评论

共计 745 个字符,预计需要花费 2 分钟才能阅读完成。

稳定 AI(Stability AI),一家由 AI 驱动的艺术生成器 Stable Diffusion 创立的公司,最近发布了一个名为 Stable Audio Open 的开放 AI 模型,专门用于生成声音和歌曲。该模型基于非受版权限制的录音进行训练,旨在为用户提供一个创新的声音创作工具。

Stable Audio Open 模型能够根据文本描述生成录音,例如描述为“在一个处理过的录音室中演奏的摇滚节拍,使用原声鼓打鼓”。生成的录音长度最长可达 47 秒,这些录音是通过使用大约 486,000 个来自免费音乐库 FreeSound 和 Free Music Archive 的样本训练得来的。

稳定 AI 表示,该模型适用于创建鼓点、乐器演奏、环境声音以及视频、电影和电视节目的制作元素。此外,它还能用于修改现有歌曲或将一首歌曲的风格(如平滑爵士乐)应用于另一首歌曲。

一个显著的特点是,用户可以使用自己的录音数据对模型进行微调,例如,一位鼓手可以使用自己的鼓录音样本来生成新的节拍。然而,Stable Audio Open 模型也有其局限性,它无法生成高品质的完整歌曲、旋律或人声。稳定 AI 建议,如果用户需要这些功能,可以选择该公司的高级 Stable Audio 服务。

此外,Stable Audio Open 模型不能用于商业用途,并且在音乐风格、不同文化和不同语言的描述方面表现不一。稳定 AI 指出,这些偏见是由于训练数据的来源可能缺乏多样性,各种文化在数据集中得到的平等代表不一致。

稳定 AI 最近在旧金山举行的 Disrupt 2024 活动中展示了其技术,并提供了赢取 10 万美元奖金的机会。随着 AI 音乐生成器的日益流行,版权问题也成为了行业关注的焦点。今年 5 月,Sony Music 向 700 家 AI 公司发出警告信,禁止其内容被用于训练音频生成器的没有授权的使用。

正文完
 0
admin-gah
版权声明:本文于2024-06-06转载自Techcrunch,共计745字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码