谷歌AI搜索功能遭遇批评与调整

212次阅读

共计 1497 个字符，预计需要花费 4 分钟才能阅读完成。

谷歌对自己的 AI 概述也感到尴尬。在过去一周里，经历了一连串挑剔和恶搞的洪流，这些恶搞批评了这家科技巨头推出的新 AI 搜索功能质量低劣和明显错误信息，于是在周四，该公司发表了某种程度上的致歉。谷歌——一个与搜索网络同义的公司——其品牌专注于“整理世界信息”并将其提供给用户，实际上在一篇博文中写道：“确实出现了一些奇怪、不准确或无用的 AI 概述。”

这篇由谷歌搜索副总裁兼负责人 Liz Reid 撰写的致歉声明似乎证明了将 AI 技术应用于一切如何导致谷歌搜索变得更糟的事实。

在题为“上周事”（这个过了公关吗？）的博文中，Reid 详细解释了其 AI 概述犯错的多种方式。她说，虽然它们不像其他大型语言模型（LLMs）那样“产生幻觉”或虚构事物，但它们可能因为错误解释查询、错误解释网络上语言的微妙之处，或者没有太多可用的优质信息而出错。

Reid 还指出，过去一周社交媒体上分享的一些截图是伪造的，而其他一些是针对毫无意义的查询，比如“我应该吃多少块石头？”——之前没有人真的搜索过这个问题。由于这个话题上几乎没有实际信息，谷歌的 AI 引导用户查看了讽刺内容。（在石头的情况下，这个讽刺内容是发布在一个地质软件提供商网站上的。）

值得指出的是，如果你搜索“我应该吃多少块石头？”并看到一组无用的链接，甚至是一篇幽默文章，你不会感到惊讶。人们对的反应是 AI 以一种自信的态度回答“地质学家建议每天至少吃一小块石头”这样的回答，仿佛这是一个事实。从技术上讲，这可能不是“幻觉”，但最终用户并不在乎。这太疯狂了。

同样令人担忧的是，Reid 声称谷歌“在推出前对该功能进行了广泛测试”，包括进行了“强大的红队测试”。

此外，谷歌低估了其 AI 功能对 Reddit 用户数据作为知识和真相来源的依赖性。尽管人们长期以来在搜索中经常添加“Reddit”，以至于谷歌最终将其作为内置搜索过滤器，但 Reddit 并不是一个真实知识体系。然而，AI 会指向 Reddit 论坛帖子来回答问题，而不理解第一手 Reddit 知识何时有用，何时不有用，或者更糟糕的是，何时会是一个恶作剧。

如今，Reddit 通过向公司提供数据，如谷歌，OpenAI 和其他公司进行盈利，但这并不意味着用户希望谷歌的 AI 决定何时搜索 Reddit 来获取答案，或者建议某人的观点是事实。学会何时搜索 Reddit 是有技巧的，而谷歌的 AI 目前还不理解这一点。

正如 Reid 承认的那样，“论坛通常是真实的第一手信息来源，但在某些情况下，可能会导致不太有用的建议，比如使用胶水让奶酪粘在披萨上，”她说，提到了过去一周 AI 功能中的一个更令人瞩目的失败案例。

尽管上周是一场灾难，但至少谷歌正在快速迭代作为结果——或者它是这样说的。公司表示，他们已经查看了 AI 概述的示例，并确定了可以改进的模式，包括为毫无意义的查询构建更好的检测机制，限制用户生成内容用于可能提供误导性建议的回复，为 AI 概述不适用的查询添加触发限制，不在硬新闻主题中显示 AI 概述，“在这些主题中，新鲜度和事实性很重要”，并为健康搜索的保护添加额外的触发精化。

随着 AI 公司每天都在构建越来越好的聊天机器人，问题不在于它们是否会超越谷歌搜索来帮助我们理解世界的信息，而在于谷歌搜索是否会能够迅速跟上 AI 的发展，以便回击它们。

尽管谷歌的错误可能很荒谬，但现在还为时过早，不要排除它的竞争力——尤其是考虑到谷歌的大规模测试团队，基本上是任何使用搜索的人。Reid 表示：“没有什么比让数百万人使用这个功能并进行许多新颖搜索更有趣。”这句话表明了让数百万人使用功能并进行新颖搜索的重要性，因为这可以帮助谷歌快速发现并解决问题，从而不断改进其 AI 搜索功能。

正文完

发表至： AI行业动态

2024-06-01 22:06

0