人工智能版权争议：Meta与Anthropic的法庭胜利背后

133次阅读

共计 2131 个字符，预计需要花费 6 分钟才能阅读完成。

过去一周，大型人工智能公司在法律领域取得了两项理论上的重大胜利。然而，这场胜利的表象之下暗流涌动。自从上个月国会图书馆的版权争议以来，版权法从未像现在这样受到如此广泛的关注。

首先，法官 William Alsup 裁定 Anthropic 使用一系列作者的书籍进行训练属于合理使用。随后，法官 Vince Chhabria 驳回了另一组作者针对 Meta 使用他们的书籍进行训练的投诉。然而，这些裁决远未解决现代人工智能面临的法律难题，反而可能使情况更加复杂。

人工智能版权争议：Meta 与 Anthropic 的法庭胜利背后

这两起案件对 Meta 和 Anthropic 来说确实是有限的胜利。至少 Alsup 法官似乎对人工智能行业关于版权的核心论点表示同情。但同一裁决也强烈反对该初创公司使用盗版媒体，可能使其面临巨额财务损失。与此同时，Meta 的裁决断言，由于大量人工智能内容可能排挤人类艺术家，整个人工智能系统训练领域可能与合理使用原则根本对立。这两起案件都未解决生成式人工智能最大的问题之一：其输出何时构成版权侵权，如果侵权，谁应负责？

Alsup 和 Chhabria 对相对相似的事实做出了裁决。Meta 和 Anthropic 都盗版了大量受版权保护的书籍，以构建其大型语言模型 Llama 和 Claude 的训练数据集。Anthropic 后来改弦易辙，开始合法购买书籍，撕掉封面以“销毁”原始副本，并扫描文本。

作者们认为，除了最初的盗版行为外，训练过程还构成了对其作品的非法和未经授权的使用。Meta 和 Anthropic 则辩称，这种数据库构建和大型语言模型训练属于合理使用。

两位法官基本上都同意，大型语言模型符合合理使用的一个核心要求：它们将源材料转化为新的东西。Alsup 称使用书籍训练 Claude“极具变革性”，而 Chhabria 得出结论，Llama 的变革价值“无可争议”。合理使用的另一个重要考虑因素是新作品对旧作品市场的影响。两位法官也都同意，根据作者们的论点，这种影响并不足以改变天平。

将这些因素综合起来，结论显而易见……但仅在这些案件的背景下，并且在 Meta 的案件中，因为作者们采取的法律策略被法官认为完全无效。

换句话说，当一位法官表示他的裁决“并不代表 Meta 使用受版权保护的材料训练其语言模型是合法的”，并且“仅代表这些原告提出了错误的论点，未能为正确的论点建立记录”——正如 Chhabria 所做的那样——人工智能公司在未来与他相关的诉讼中的前景并不乐观。

这两项裁决都专门涉及训练——或输入模型的媒体——并未涉及大型语言模型的输出，或模型在响应用户提示时生成的内容。但输出实际上极其相关。《纽约时报》与 OpenAI 之间的一场重大法律纠纷部分始于 ChatGPT 逐字逐句地复述《纽约时报》文章大片段的指控。迪士尼最近起诉了 Midjourney，理由是它“将生成、公开展示和分发包含迪士尼和环球影业受版权保护角色的视频”与一款新推出的视频工具。即使在尚未以输出为重点的待决案件中，如果原告现在认为这是一个更好的选择，他们也可以调整策略。

在 Anthropic 案件中，作者们并未指控 Claude 直接生成侵权输出。在 Meta 案件中，作者们认为 Llama 确实如此，但他们未能说服法官——法官发现它不会吐出超过 50 个单词的任何给定作品。正如 Alsup 所指出的，纯粹处理输入大大改变了计算。“如果用户看到的输出是侵权的，作者们将有一个不同的案件，”Alsup 写道。“而且，如果输出将来变得侵权，作者们可以提起这样的案件。但这不是本案。”

在目前的形态下，主要的生成式人工智能产品基本上没有输出就毫无用处。而且我们对相关法律还没有一个清晰的了解，特别是因为合理使用是一种特例的、逐案辩护的防御，可以不同地应用于音乐、视觉艺术和文本等媒介。Anthropic 能够扫描作者们的书籍，但这对 Midjourney 是否合法地帮助人们制作 Minions 表情包几乎没有告诉我们。

Minions 和《纽约时报》文章都是输出中直接复制的例子。但 Chhabria 的裁决特别有趣，因为它使输出问题变得更加广泛。尽管他可能做出了有利于 Meta 的裁决，但 Chhabria 的整个开场白都认为，人工智能系统对艺术家和作家的损害如此之大，以至于其危害超过了任何可能的变革价值——基本上，因为它们是垃圾邮件机器。

值得一读：,

生成式人工智能有可能用无尽的图像、歌曲、文章、书籍等充斥市场。人们可以提示生成式人工智能模型以极短的时间和创造力生成这些输出。因此，通过使用受版权保护的作品训练生成式人工智能模型，公司正在创造一种通常会极大地破坏这些作品市场的东西，从而极大地削弱人类以传统方式创造事物的动力。

…

正如最高法院所强调的，合理使用的调查高度依赖于事实，几乎没有明确的规则。当然没有规则说，当你对受保护作品的使用是“变革性的”时，这自动使你免受版权侵权的指控。在这里，复制受保护的作品，无论多么变革性，都涉及创造一种产品，这种产品有能力严重损害被复制作品的市场，从而严重削弱人类创造的动力。

…

结果是，在许多情况下，未经许可复制受版权保护的作品来训练生成式人工智能模型将是违法的。这意味着，为了避免版权侵权的责任，公司通常需要向版权持有者支付使用其材料的权利。,

而且，如果有人提起诉讼并证明这一点，那肯定

正文完