AI生成内容占互联网新文章过半,人类创作仍占一席之地

2次阅读
没有评论

共计 1024 个字符,预计需要花费 3 分钟才能阅读完成。

超过 50% 的互联网新文章现由 AI 生成,这一发现或许能让人类网民稍感欣慰。根据_Axios_中强调的一份新报告,尽管 AI 生成内容在互联网上占据主导地位,但人类创作仍未被完全取代。

自 2022 年 11 月 ChatGPT 公开发布以来,AI 生成内容的洪流不断涌现。然而,这股洪流尚未完全淹没所有人。SEO 公司 Graphite 发布的报告分析了 2020 年 1 月至 2025 年 5 月期间发布的 6.5 万篇随机抽样的英文文章。通过使用名为 Surfer 的 AI 检测工具,任何被发现有 50% 或以上内容由大型语言模型生成的文章都被视为 AI 生成。

AI 生成内容占互联网新文章过半,人类创作仍占一席之地

分析显示,随着 ChatGPT 的发布,AI 生成文章的数量迅速激增,从 2022 年底的约 10% 增长到 2024 年的 40% 以上,随后增速放缓,趋于平稳。现在,好消息是:AI 文章的涌入似乎已经达到了一个平台期。在 2024 年 11 月 AI 生成文章达到峰值后,新发布的 AI 生成内容与人类撰写内容的比例一直徘徊在五五开左右。截至今年 5 月,新 AI 文章的比例为 52%,与上个月人类撰写文章短暂占据多数的情况发生了互换。

此外,人类内容的比例可能更高。研究人员使用了名为 Common Crawl 的开源数据集,该数据集包含数千亿个网页。由于 AI 公司曾利用这一数据宝库训练其大型语言模型,许多付费网站开始阻止 Common Crawl 索引其页面,_Axios_指出。这些几乎肯定由人类撰写的文章因此被排除在 Graphite 的分析之外。

AI 检测工具的判断也应持保留态度,因为其可靠性存疑。在 Graphite 对 Surfer 准确性的测试中,检测工具分析了 AI 生成文章样本和人类撰写文章样本,发现其在 4.2% 的情况下将人类撰写的文章误判为 AI 生成——这是此类工具的常见问题——但仅有 0.6% 的情况下将 AI 生成的文章误判为人类撰写。

无论如何,AI 文章数量为何趋于平稳尚不明确。_Axios_的报道援引 Graphite 的第二份报告指出,这可能是因为 AI 内容农场意识到,搜索引擎和聊天机器人对其粗制滥造的内容收录较少。Graphite 发现,Google 搜索中 86% 的文章由人类撰写,仅有 14% 由 AI 生成。

然而,这可能掩盖了另一种趋势。越来越多的作者可能在创作过程中使用 AI 聊天机器人和其他工具,从而绕过 AI 检测工具,模糊了机器生成与人类撰写之间的界限。

“目前,这更像是一种共生关系,而非二分法,”加州大学洛杉矶分校计算机科学教授、亚马逊网络服务副总裁 Stefano Soatto 告诉_Axios_。

正文完
 0
admin-gah
版权声明:本文于2025-10-16转载自Futurism,共计1024字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码