共计 5217 个字符,预计需要花费 14 分钟才能阅读完成。
当 HEALTH 乐队的一张专辑突然出现在我的 Spotify 新发布雷达上时,我第一次察觉到事情有些不对劲。除了封面设计异常——看起来完全不像 HEALTH 乐队的风格。
2024 年 10 月 12 日拍摄的假 Annie 专辑截图。
某种人工智能垃圾被上传到了 HEALTH 乐队在 Spotify 的艺术家页面上,这是那个周末出现在他们名下的三张假专辑之一。乐队在推特账号上对此进行了一些调侃,并表示这些专辑最终被移除,我也就继续忙自己的事了。然后,下个周末,我看到一张新的 Annie 专辑发布了。
那张专辑看起来更可信——Annie 刚刚发布了一首新单曲“The Sky Is Blue”——但当我点击进去时,在歌曲列表中找不到它。困惑中,我播放了专辑,听到了鸟鸣声和一种模糊的新世纪风格的器乐。那……听起来不像 Annie 的风格。
“这让我很不安,因为如果你有耳朵,你肯定能听出这不是我们的音乐。”
于是我做了任何正常人都会做的事:我在群聊中抱怨了这件事。正是在那里,我听说这种情况也发生在其他艺术家身上,很多艺术家,而且已经持续了几个月。(“我经常在我的发布雷达中看到这些,”我的朋友 Gordon 说。)一段时间以来,金属核艺术家如 Caliban、Northlane 和 Silent Planet 成为了目标。但也有很多单字名称的艺术家,如 Swans、Asia、Standards 和 Gong 也受到了影响。一张新专辑会出现在艺术家的 Spotify 页面上,打着他们的名字,但与他们的音乐毫无相似之处。有时,像假 HEALTH 专辑一样,它们会在几天后消失。其他时候,它们会无限期地停留,即使艺术家不愿意。
你能看出哪张是假的吗?
“这非常奇怪,”Standards 的主创和吉他手 Marcos Mena 说。“我以为,‘哦,这是 Spotify 会处理的事情。’”毕竟,Standards 有一个经过验证的艺术家页面。但当一张假专辑在 9 月 26 日发布时,它并没有被移除。Mena 给 Spotify 发了邮件,告诉他们出了问题。流媒体平台在两周后的 10 月 8 日回应:“看起来内容正确映射到了艺术家的页面上。如果需要进一步协助,请联系您的音乐提供商。请不要回复此消息。”截至 11 月 8 日,假 Standards 专辑仍然在乐队经过验证的蓝色勾选名下。它最终在 11 月 11 日被移除。
“这让我很不安,因为如果你有耳朵,你肯定能听出这不是我们的音乐,”Mena 告诉我。“这确实令人沮丧,因为我们今年确实有一张新专辑发布,我觉得这分散了人们对那张专辑的注意力。”如果有人在 Standards 为另一支乐队开场时去听演唱会,然后去 Spotify 查看更多曲目,结果却得到了假专辑,那该怎么办?
你能看出哪张是假的吗?
对我来说,这一切引发了一个明显的问题:他妈的为什么?
整个过程实际上是基于信任系统运作的,对于像假 Standards 专辑这样的事情,问题就从这里开始。
要理解这是如何运作的,你需要了解机制。像 Spotify 这样的流媒体平台不像你的 Facebook 页面——Mena 和其他艺术家并不是直接登录并添加专辑到他们的账户。相反,他们通过一个处理许可、元数据和版税支付的分销商。分销商批量向流媒体服务发送歌曲和元数据。元数据部分很重要;它包括歌曲标题和艺术家名称,但也包括其他信息,如词曲作者、唱片公司等。这对艺术家(和其他人)获得报酬至关重要。
但整个过程实际上是基于信任系统运作的,对于像假 Standards 专辑这样的事情,问题就从这里开始。分销商相信你就是你所说的那个人,Spotify 相信分销商的他们的话,然后砰,一张假专辑出现在真正的艺术家页面上。大多数时候,这种情况发生时,这是一个诚实的错误。但在最近的假专辑浪潮中,似乎艺术家们直接成为了目标。
因为艺术家从流媒体中获得的收入是通过分销商的,假 Standards 专辑——如果它真的有任何收入——将奖励给 Mena 以外的人。我们知道真正的 Standards 在 Topshelf Records,但假专辑似乎在 Gupta Music 上,所以 Standards 的真实唱片公司也没有分到一杯羹。如果有足够多的人播放这张专辑,版税将直接流向 Gupta Music……以及其他数百个充满垃圾的发布。
Mena 说他已经向他的分销商提交了移除假 Standards 专辑的请求。但无论是 Spotify 还是他的分销商,都没有通知 Mena;当我问他是否参与了移除时,是我告诉他的。他没有,他给我发短信说,“但耶耶耶有人做了些什么。”
去 Every Noise at Once 网站——基本上是 Spotify 上内容的百科全书——搜索 Gupta Music,我看到了超过 700 个发布。封面艺术看起来非常相似,而且明显是人工智能生成的。所谓的乐队名称大多是单字:“Rany”、“Living”、“Bedroom”和“Culture”。专辑与假乐队共享名称。搜索“Gupta Music”只返回了一个 14 年前的 TED 演讲,演讲者名叫 Robert Gupta。
专辑被移除前的 Every Noise at Once 截图。
即使是所谓的唱片公司名称也让我感到可疑。有一个著名的营销机构叫 Gupta Media。它代表包括迪士尼音乐集团、Republic Records(服务于 The Weeknd 的专辑)和索尼音乐在内的娱乐公司。
看起来 Standards、Annie、HEALTH、Swans 和许多其他著名的单字艺术家直接成为了目标。Spotify 证实,这一波人工智能垃圾来自一个来源,许可方 Ameritz Music。Ameritz Music 没有回应评论请求。
“由于多次严重违反 Spotify 的元数据风格指南,我们结束了与提供问题内容的分销商的关系,”Spotify 全球音乐传播主管 Chris Macowski 在电子邮件声明中说。“因此,内容已从我们的平台上移除。”
Macowski 还表示,Spotify“在自动化和人工审查上投入了大量资金”以防止版税欺诈。
但数百或数千首流媒体数量相对较小的歌曲,加起来可以带来大笔收入。
早期的尝试主要集中在金属核音乐人如 Fit for an Autopsy、Alpha Wolf 和 Like Moths to Flames,这也似乎是有组织的尝试,以分流合法的流媒体。根据 Idioteq,在这种情况下,罪魁祸首是 Vibratech Musicians。
Spotify 上每首歌曲的流媒体收入微乎其微,正如使用该平台的合法音乐人经常抱怨的那样。但数百或数千首流媒体数量相对较小的歌曲,加起来可以带来大笔收入。骗子只需要上传音乐并找到让账户播放它的方法。而这不仅仅发生在 Spotify 上。有超过 100 个流媒体平台,艺术家可以在这些平台上进行这种诈骗。
今年早些时候,环球音乐集团(UMG)起诉 Believe 音乐,一家音乐分销商,及其美国子公司 TuneCore 音乐。在那起诉讼中,UMG 指控 Believe 有一个“有意识的商业策略,即不分青红皂白地分发和声称授权曲目,完全知道其分销服务的许多客户是骗子。”该诉讼涉及版权侵权,其中的细节令人震惊。
UMG 指控艺术家如“Kendrik Laamar”、“Arriana Gramde”、“Jutin Biber”和“Llady Gaga”是 Believe 上传的——这表明了一种策略,即试图捕捉那些只是打错字的用户的流媒体。
“人们上传大量专辑,意图进行流媒体欺诈。”
另一种策略是创建流行歌曲的人工智能封面,并将它们放到热门播放列表中,以便普通人会播放它们。另一种涉及机器人“听”歌曲。
今年早些时候,一名丹麦男子因使用机器人获得约 30 万美元的版税而被判入狱 18 个月。另一名男子 Michael Smith 被逮捕并指控在七年内从流媒体服务中诈骗了 1000 万美元。Smith 使用人工智能工具以假艺术家如“Calm Baseball”、“Calm Connected”和“Calm Knuckles”的名义创建了数十万首歌曲。然后,检察官指控,他使用机器人播放了数十亿次这张巨大的目录。这转移了本应流向真正音乐人的钱,而真正的人确实在听这些音乐。(在这种情况下,Spotify 只向 Smith 支付了 6 万美元,这表明公司的保护措施在限制支付方面起了作用,Macowski 说。)
“人们上传大量专辑,意图进行流媒体欺诈,”Beatdapp 的 CEO Andrew Batey 说,该公司旨在防止流媒体欺诈。Batey 估计,每年有 20 亿到 30 亿美元通过这种欺诈从艺术家手中被盗。
分销商的角色很大。大多数分销商的业务模式是基于从艺术家和唱片公司获得的版税中抽成。“即使他们可能不参与欺诈,他们直接从中受益,”Batey 说。在诉讼中,UMG 指控 Believe“错误地收取了数字音乐服务如 UMG 在受版权保护材料上应支付的版税”。
分销商的角色很大。大多数分销商的业务模式是基于从艺术家和唱片公司获得的版税中抽成。“即使他们可能不参与欺诈,他们直接从中受益,”Batey 说。
一个复杂的欺诈操作将使用多个假标签和多个分销商,以避免单点故障。除了机器人账户,许多不良行为者还可以访问真实人士的受损账户。“他们以你和我的身份登录,播放他们的歌曲三次然后离开,”Batey 说。那个假流媒体随后隐藏在真实账户的所有真实听众中。
Gupta Music 并不是我找到的唯一进行批量上传的标签。还有三个在做类似的事情:Future Jazz Records 唱片公司、Ancient Lake Records 唱片公司和 Beat Street Music 唱片公司。所有这些标签都上传了数百张看起来像人工智能生成的专辑封面。目前尚不清楚这些标签打算如何生成流媒体,如果有的话。到出版时,大多数这些专辑已被移除。
元数据问题已经存在多年——有些是无辜的,有些则不然。“我们基本上到目前为止都很幸运,”前 Spotify 员工、Every Noise at Once 网站的运营者 Glenn McDonald 说。“没有艺术家级别的输入,内容验证系统相当疯狂。”
“正确的做法是,所有这些专辑都应该被标记为新艺术家,然后就无所谓了。”
当出现问题时,有两个层面可以解决:流媒体服务和分销商。分销商必须保持微妙的平衡。他们通过从流媒体支付中抽成来赚钱。如果他们在监管上传方面过于激进,合法艺术家就会被抓住。修复这个问题很昂贵,而且分销是一个低利润、批量业务,McDonald 说。但如果允许太多垃圾乐队通过,会给流媒体服务带来问题。
至于流媒体服务,他们通常有数据可以帮助他们解决这个问题。例如,如果通常上传 Standards 专辑的分销商不是用于新专辑的那个,这就是可以用来标记专辑进行审查的那种事情。(标签的变化也是如此。)McDonald 告诉我,他还为 Spotify 构建了工具,以识别当一首歌曲听起来不像艺术家目录中的其他歌曲时。有时这可能是合法的原因;Ed Sheeran 的 EDM 混音不会听起来像 Ed Sheeran,但它可能仍然得到了标签和艺术家的批准。
此外,一些合法艺术家共享相同的名称,尤其是小独立乐队,他们只是有单独的页面。“正确的做法是,所有这些专辑都应该被标记为新艺术家,然后就无所谓了,”McDonald 告诉我。
此外,人工智能只是加速了 Spotify 上已经存在多年的欺诈类型。
至于分销商,需要关注的是 UMG 的诉讼。预审会议定于 1 月举行。诉讼的结果可能会改变分销商如何过滤人们试图通过其平台上传的音乐——因为如果诉讼比内容审核更昂贵,那么可能会有更多的内容审核。这可能会改善 Spotify 的情况,因为它是下游的。
仅仅禁止人工智能生成的内容从 Spotify——或分销商——可能感觉像是一个直观的解决方案。但尽管对人工智能生成媒体有反弹,但也有合法的人工智能生成歌曲。例如,“10 Drunk Cigarettes”,来自 Girly Girl Productions 公司,算是一个热门。(它也可能是人类辅助的,而不是完全人工智能生成的。)UMG 与 Soundlabs 公司达成协议,允许艺术家使用 Soundlabs 的人工智能技术。它还与 Klay Vision 公司合作创建了一个生成音乐的模型。
此外,人工智能只是加速了 Spotify 上已经存在多年的欺诈类型,Batey 说。骗子过去常常挖掘旧的、晦涩的专辑并数字化它们,或者稍微改变一首已经存在的歌曲。人工智能只是减少了制作假歌曲所需的工作量,以获得流媒体收入。
与此同时……加速器确实使事情燃烧得更快。许多平台随着人工智能垃圾的泛滥而变得不那么有用——Facebook、Instagram、前身为 Twitter 的艺术家,甚至 Google 本身。
人工智能音乐对 Spotify 构成了同样的威胁,McDonald 说。他指出,我一直在等待 Annie 的专辑,对它感到兴奋。然后,我被垃圾骗了。“所有这些机制都假设这些东西是正确的,”他说。但目前,这些机制是坏的——而真正关心的人,如艺术家自己,没有掌握控制权。