OpenAI在诉讼中意外删除关键训练数据

182次阅读

共计 758 个字符，预计需要花费 2 分钟才能阅读完成。

2024 年 11 月 21 日，一份法庭文件披露，OpenAI 的工程师在处理《纽约时报》和其他主要报纸的 AI 训练数据诉讼时，意外删除了关键证据。这一失误引起了广泛关注。

OpenAI 在诉讼中意外删除关键训练数据

据文件显示，这些报纸的法律团队花费了超过 150 小时搜索 OpenAI 的 AI 训练数据，以查找其新闻文章被包含的实例。然而，文件并未详细说明这一错误是如何发生的，也没有说明被删除数据的具体内容。尽管 OpenAI 承认了这一错误并试图恢复数据，但恢复的数据不完整且不可靠，无法帮助正确追踪新闻机构的文章内容在构建 OpenAI 的 AI 模型中的使用情况。

《纽约时报》公司于去年 12 月发起了这场诉讼，声称 OpenAI 及其合作伙伴微软通过“复制和使用数百万”该出版物的文章构建了其 AI 工具，并且现在“直接与该出版物竞争”。该出版物要求 OpenAI 承担“数十亿美元的法定和实际损害赔偿”，因为其涉嫌复制其作品。

《纽约时报》已经在与 OpenAI 的法庭斗争中花费了超过 100 万美元，这是一笔很少有出版商能够匹敌的巨额费用。与此同时，OpenAI 与 Axel Springer、Conde Nast 和《The Verge》的母公司 Vox Media 等主要出版商达成了协议，这表明许多出版商更愿意合作而不是对抗。

OpenAI 拒绝与《纽约时报》一起向法院提交更新文件。这一声明由代表新闻机构的律师 Jennifer Maisel 提交，以正式通知法院发生了什么。

在给《The Verge》的一封电子邮件中，OpenAI 发言人 Jason Deutrom 表示，该公司不同意所做的描述，并将很快提交自己的回应。《纽约时报》拒绝了《The Verge》的评论请求。

这一事件不仅揭示了 AI 训练数据管理的复杂性，也凸显了在法律诉讼中数据保护的重要性。希望 OpenAI 能够从中吸取教训，未来在数据管理和法律合规方面做得更好。

正文完

发表至： AI行业动态

2024-11-22 06:11

0