共计 1497 个字符,预计需要花费 4 分钟才能阅读完成。
谷歌对自己的 AI 概述也感到尴尬。在过去一周里,经历了一连串挑剔和恶搞的洪流,这些恶搞批评了这家科技巨头推出的新 AI 搜索功能质量低劣和明显错误信息,于是在周四,该公司发表了某种程度上的致歉。谷歌——一个与搜索网络同义的公司——其品牌专注于“整理世界信息”并将其提供给用户,实际上在一篇博文中写道:“确实出现了一些奇怪、不准确或无用的 AI 概述。”
这篇由谷歌搜索副总裁兼负责人 Liz Reid 撰写的致歉声明似乎证明了将 AI 技术应用于一切如何导致谷歌搜索变得更糟的事实。
在题为“上周事”(这个过了公关吗?)的博文中,Reid 详细解释了其 AI 概述犯错的多种方式。她说,虽然它们不像其他大型语言模型(LLMs)那样“产生幻觉”或虚构事物,但它们可能因为错误解释查询、错误解释网络上语言的微妙之处,或者没有太多可用的优质信息而出错。
Reid 还指出,过去一周社交媒体上分享的一些截图是伪造的,而其他一些是针对毫无意义的查询,比如“我应该吃多少块石头?”——之前没有人真的搜索过这个问题。由于这个话题上几乎没有实际信息,谷歌的 AI 引导用户查看了讽刺内容。(在石头的情况下,这个讽刺内容是发布在一个地质软件提供商网站上的。)
值得指出的是,如果你搜索“我应该吃多少块石头?”并看到一组无用的链接,甚至是一篇幽默文章,你不会感到惊讶。人们对的反应是 AI 以一种自信的态度回答“地质学家建议每天至少吃一小块石头”这样的回答,仿佛这是一个事实。从技术上讲,这可能不是“幻觉”,但最终用户并不在乎。这太疯狂了。
同样令人担忧的是,Reid 声称谷歌“在推出前对该功能进行了广泛测试”,包括进行了“强大的红队测试”。
此外,谷歌低估了其 AI 功能对 Reddit 用户数据作为知识和真相来源的依赖性。尽管人们长期以来在搜索中经常添加“Reddit”,以至于谷歌最终将其作为内置搜索过滤器,但 Reddit 并不是一个真实知识体系。然而,AI 会指向 Reddit 论坛帖子来回答问题,而不理解第一手 Reddit 知识何时有用,何时不有用,或者更糟糕的是,何时会是一个恶作剧。
如今,Reddit 通过向公司提供数据,如谷歌,OpenAI 和其他公司进行盈利,但这并不意味着用户希望谷歌的 AI 决定何时搜索 Reddit 来获取答案,或者建议某人的观点是事实。学会何时搜索 Reddit 是有技巧的,而谷歌的 AI 目前还不理解这一点。
正如 Reid 承认的那样,“论坛通常是真实的第一手信息来源,但在某些情况下,可能会导致不太有用的建议,比如使用胶水让奶酪粘在披萨上,”她说,提到了过去一周 AI 功能中的一个更令人瞩目的失败案例。
尽管上周是一场灾难,但至少谷歌正在快速迭代作为结果——或者它是这样说的。公司表示,他们已经查看了 AI 概述的示例,并确定了可以改进的模式,包括为毫无意义的查询构建更好的检测机制,限制用户生成内容用于可能提供误导性建议的回复,为 AI 概述不适用的查询添加触发限制,不在硬新闻主题中显示 AI 概述,“在这些主题中,新鲜度和事实性很重要”,并为健康搜索的保护添加额外的触发精化。
随着 AI 公司每天都在构建越来越好的聊天机器人,问题不在于它们是否会超越谷歌搜索来帮助我们理解世界的信息,而在于谷歌搜索是否会能够迅速跟上 AI 的发展,以便回击它们。
尽管谷歌的错误可能很荒谬,但现在还为时过早,不要排除它的竞争力——尤其是考虑到谷歌的大规模测试团队,基本上是任何使用搜索的人。Reid 表示:“没有什么比让数百万人使用这个功能并进行许多新颖搜索更有趣。”这句话表明了让数百万人使用功能并进行新颖搜索的重要性,因为这可以帮助谷歌快速发现并解决问题,从而不断改进其 AI 搜索功能。