共计 758 个字符,预计需要花费 2 分钟才能阅读完成。
2024 年 11 月 21 日,一份法庭文件披露,OpenAI 的工程师在处理《纽约时报》和其他主要报纸的 AI 训练数据诉讼时,意外删除了关键证据。这一失误引起了广泛关注。
据文件显示,这些报纸的法律团队花费了超过 150 小时搜索 OpenAI 的 AI 训练数据,以查找其新闻文章被包含的实例。然而,文件并未详细说明这一错误是如何发生的,也没有说明被删除数据的具体内容。尽管 OpenAI 承认了这一错误并试图恢复数据,但恢复的数据不完整且不可靠,无法帮助正确追踪新闻机构的文章内容在构建 OpenAI 的 AI 模型中的使用情况。
《纽约时报》公司于去年 12 月发起了这场诉讼,声称 OpenAI 及其合作伙伴微软通过“复制和使用数百万”该出版物的文章构建了其 AI 工具,并且现在“直接与该出版物竞争”。该出版物要求 OpenAI 承担“数十亿美元的法定和实际损害赔偿”,因为其涉嫌复制其作品。
《纽约时报》已经在与 OpenAI 的法庭斗争中花费了超过 100 万美元,这是一笔很少有出版商能够匹敌的巨额费用。与此同时,OpenAI 与 Axel Springer、Conde Nast 和《The Verge》的母公司 Vox Media 等主要出版商达成了协议,这表明许多出版商更愿意合作而不是对抗。
OpenAI 拒绝与《纽约时报》一起向法院提交更新文件。这一声明由代表新闻机构的律师 Jennifer Maisel 提交,以正式通知法院发生了什么。
在给《The Verge》的一封电子邮件中,OpenAI 发言人 Jason Deutrom 表示,该公司不同意所做的描述,并将很快提交自己的回应。《纽约时报》拒绝了《The Verge》的评论请求。
这一事件不仅揭示了 AI 训练数据管理的复杂性,也凸显了在法律诉讼中数据保护的重要性。希望 OpenAI 能够从中吸取教训,未来在数据管理和法律合规方面做得更好。