AI生成文章数量短暂超越人类,未来趋势如何?

4次阅读
没有评论

共计 1427 个字符,预计需要花费 4 分钟才能阅读完成。

根据 SEO 公司 Graphite 的最新报告,AI 生成的新文章数量曾短暂超过人类撰写的文章,但两者目前大致持平。

为何重要: 研究人员长期以来担心,如果在线 AI 生成的内容压倒人类创作的材料,大型语言模型可能会因自身输出而窒息并崩溃。

AI 生成文章数量短暂超越人类,未来趋势如何?

大局观:2022 年 Europol 的一份报告估计,到 2026 年,90% 的在线内容将由 AI 生成。,

  • 根据 Graphite 对 2020 年至 2025 年间发布的 65,000 个 URL 的分析,自 2023 年 ChatGPT 推出后,AI 生成文章的比例急剧上升。
  • 在该数据集中,AI 生成文章的比例在 2024 年 11 月曾短暂超过人类撰写的文章,但此后两者大致持平。

他们做了什么:Graphite 使用名为 Surfer 的 AI 检测器分析了来自 Common Crawl(一个包含超过 3000 亿网页的开源数据库)的随机 URL 样本。该数据库跨越 18 年,每月新增 3 -50 亿个页面。,

  • 这些页面的发布日期在 2020 年 1 月至 2025 年 5 月之间,并使用 Graphite 的文章页面类型分类器将其分类为文章或列表文章。
  • 如果 Surfer 发现 50% 或更少的内容是由人类撰写的,则该文章被视为 AI 生成。

深入探讨: 区分机器和人类撰写的内容具有挑战性。,

  • 为了评估 Surfer 的准确性,Graphite 用其自己的 AI 生成文章样本和 ChatGPT 推出前发布的一组文章(可能是人类撰写的)进行了测试。
  • Surfer 在由 GPT-4o 生成的文章中,误报率(将人类撰写的文章标记为 AI 生成)为 4.2%,漏报率(将 AI 撰写的文章标记为人类撰写)为 0.6%。

数据解读: 根据 Graphite 的第二份报告,内容农场可能也在了解到,AI 生成的内容并未被搜索引擎和聊天机器人响应优先考虑。,

  • Graphite 发现,在 Google 搜索中排名的文章中有 86% 是由人类撰写的,14% 是由 AI 生成的。
  • 这种模式在聊天机器人中也适用。根据 Graphite 的研究,ChatGPT 和 Perplexity 引用的文章中有 82% 是由人类撰写的,只有 18% 是 AI 生成的。
  • 当 AI 生成的文章出现在 Google 搜索中时,它们的排名往往低于人类撰写的文章。

但是: 研究人员告诉 Axios,使用目前的工具和定义无法对 AI 生成的内容进行明确的统计。,

  • 很难确定哪些内容是 AI 生成的,哪些是人类生成的,因为人类越来越多地与 AI 合作。
  • Google 发言人告诉 Axios,人们在工作中有许多不同程度地利用 AI 的方式,因此很难明确地说某物是否是 AI 生成的。
  • “ 目前,这更像是一种共生关系,而不是二分法,” 加州大学洛杉矶分校计算机科学教授兼亚马逊网络服务副总裁 Stefano Soatto 告诉 Axios。
  • Google 发言人表示,并非所有使用 AI 创建的内容都被视为垃圾邮件。

有趣的是:Common Crawl 并不是整个网络,但它是大型语言模型的最大训练数据来源之一。,

  • 因此,一些付费网站(内容可能是人类撰写的)正在阻止 Common Crawl 索引他们的页面。
  • 这可能意味着人类撰写的文章数量甚至比 Graphite 的数据显示的还要多。

我们正在关注:Graphite CEO Ethan Smith 告诉 Axios,明确标注的封闭专有内容的 AI 摘要在搜索中表现良好。,

  • 但对于由搜索引擎自动生成的 AI 摘要来说,情况则不同。
  • 上周皮尤的一项调查发现,对大多数 AI 摘要的热情并不高:只有 20% 的用户认为这些 AI 摘要非常或非常有用,只有 6% 的用户表示非常信任它们。

底线: 目前,人类仍然希望阅读主要由人类撰写的内容。

正文完
 0
admin-gah
版权声明:本文于2025-10-15转载自Axios,共计1427字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码