共计 1419 个字符,预计需要花费 4 分钟才能阅读完成。
周四,Reddit 推出了一项旨在平衡其希望将内容授权给较大科技公司(如 Google)并保护用户隐私的新政策。新宣布的“公共内容政策”现在将加入到 Reddit 现有的隐私政策和内容政策中,以指导科技成员和其他合作伙伴如何访问和使用 Reddit 的数据。与此相关,该公司还宣布了一个致力于与 Reddit 数据合作的研究人员的子社区。
该公告发布不久后,就在 Reddit 的股票市场首次公开上市,公司定位自己的增长收入不仅来自其平台上运行的广告和开发者使用 API 的收费,还来自其数据的收集。该公司在其 IPO 招股说明书中表示,已经通过数据授权协议赚取了 2.03 亿美元,并预计这个数字会随着时间的推移而增加。
虽然 Reddit 历来没有阻止 AI 训练目的的数据访问,但它在 2023 年改变了方向。Reddit 首席执行官 CEO 史蒂夫·哈夫曼告诉《纽约时报》,Reddit 继续免费向世界上一些最大的公司提供“所有这些价值”是没有意义的,这表明了该公司进入数据授权领域的计划。
随着这些努力正如火如荼进行,新的公共内容政策将对未经协议访问 Reddit 的数据进行限制。Reddit 说他们没有添加新的限制,只是公布了他们已经在内部实施了一段时间的政策。
“不幸的是,我们看到越来越多的商业实体未经授权访问或滥用授权访问来大规模收集公共数据,包括 Reddit 公开内容”,Reddit 在其博客中写道。“更糟糕的是,这些实体认为他们对数据的使用没有限制,并且他们对用户权利或隐私毫不在意,他们忽视合理的法律、安全和用户删除请求。虽然我们将继续努力封锁已知的不良行为者,但我们需要做更多工作以限制对受信任的商业实体的 Reddit 公共内容的访问,这些实体已同意遵守我们的政策。但我们还需要继续确保用户、版主、研究人员和其他善意的、非商业实体的访问。”
换句话说,用于研究和其他非商业目的的 Reddit 数据访问将继续,但那些想要将 Reddit 数据用于其他目的(包括用于人工智能训练)的实体将需要付费。Reddit 在博客上共享的图表清楚地表明了这一点,指出有兴趣使用 Reddit 数据来“为任何商业目的提供动力、增强或增强产品”的企业需要签订合同。
图片来源:Reddit
与此同时,广告客户被引导进入一个广告 API,用于管理广告活动并跟踪其表现。
TechCrunch 活动
“每个阶段的创新”旧金山,10 月 28 日至 30 日
立即注册
由于该公司实质上只是一个可以被搜索引擎索引的大型网站,这一新政策旨在阻止未经授权的数据收集,同时尊重用户的权利。
例如,Reddit 表示其合作伙伴必须上传用户删除其内容的决定。因此,如果用户不希望其个人帖子成为未来 AI 引擎的素材,他们应该有选择权。根据新政策,合作伙伴也受到禁止使用 Reddit 的内容来识别个人或其个人信息,包括用于广告定位。任何机构还不能使用 Reddit 的内容来发送垃圾邮件或骚扰其用户,也不能用 Reddit 内容来进行“背景调查、面部识别、政府监视或帮助执法机构执行上述行为”。
该政策还限制对成人媒体的访问,并澄清 Reddit 不会出售用户的个人信息。该公司还指出,它永远不会授权非公开内容,比如私人信息或非公开账户信息,如用户的电子邮件或浏览历史,等等。
为了帮助希望以非商业目的使用 Reddit 数据的研究人员,该公司建立了一个新的子社区,Reddit 研究者专区。公司表示,他们正在与 OpenMined 合作,制定一个计划来指导并促进研究人员与 Reddit 的合作。