共计 2724 个字符,预计需要花费 7 分钟才能阅读完成。
几个世纪以来,人类一直在努力实现任务的自动化。如今,AI 公司看到了利用我们对效率的追求来盈利的机会,他们将这些解决方案称为“代理”。
AI 代理是自主程序,能够在极少的人类干预下执行任务、做出决策并与环境互动。它们是当今各大 AI 公司关注的焦点。微软的“Copilots”旨在帮助企业自动化客户服务和行政任务。谷歌云 CEO Thomas Kurian 最近概述了六种不同的 AI 生产力代理的推广,而谷歌 DeepMind 则从 OpenAI 挖走了其 AI 视频产品的主要负责人 Sora,以开发用于训练 AI 代理的模拟。Anthropic 为其 AI 聊天机器人 Claude 发布了一项功能,允许任何人创建自己的“AI 助手”。OpenAI 在其达到通用人工智能(AGI)的五级方法中,将代理列为第二级。
显然,计算领域充满了自主系统。许多人访问过带有弹出式客服机器人的网站,使用过像 Alexa Skills 这样的自动化语音助手功能,或者编写过一个简单的 IFTTT 脚本。但 AI 公司认为“代理”——最好不要称它们为机器人——是不同的。他们认为,代理将能够与环境互动、从反馈中学习,并在没有持续人类输入的情况下做出决策,而不是遵循一套简单的、刻板的指令。它们可以动态管理任务,如购买商品、预订旅行或安排会议,适应不可预见的情况,并与可能包括人类和其他 AI 工具的系统互动。
人工智能公司希望代理能够提供一种方式来实现强大且昂贵的 AI 模型的商业化。风险投资正在涌入承诺革命化我们与技术互动方式的 AI 代理初创公司。企业设想通过代理处理从客户服务到数据分析的一切,实现效率的飞跃。对于个人,AI 公司正在推销一个新纪元,其中日常任务被自动化,为创造性和战略性工作腾出时间。真正的信徒的最终目标是创造一个真正的合作伙伴,而不仅仅是一个工具的 AI。
“你真正想要的,”OpenAI CEO Sam Altman 今年早些时候告诉《MIT 技术评论》,“就是这个东西在背后默默帮助你。”Altman 将 AI 的杀手级应用描述为一个“超级能干的同事,它绝对了解我整个生活的方方面面,每一封邮件,每一次对话,但并不感觉像是一个延伸。”它可以立即处理简单的任务,Altman 补充道,对于更复杂的任务,它会尝试但如果有需要会返回并提出问题。科技公司自 20 世纪 70 年代以来一直在尝试自动化个人助手,现在,他们承诺终于接近实现这一目标。
在 OpenAI 年度 Dev Day 之前的媒体活动上,开发者体验负责人 Romain Huet 展示了公司的新实时 API 与一个助手代理。Huet 给代理设定了一个预算和一些购买 400 个巧克力草莓的限制,并要求它通过电话向一家虚构的商店下单。
这项服务类似于 2018 年谷歌的预订制作机器人 Duplex。但那个机器人只能处理最简单的场景——事实证明,其四分之一的电话实际上是由人类拨打的。
虽然那次订单是用英语下的,但 Huet 告诉我,他在东京进行了更复杂的演示:他提示代理用日语为他预订酒店房间,代理用日语处理对话,然后用英语回电确认完成。“当然,我听不懂日语部分——它只是处理了,”Huet 说。
但 Huet 的演示立即在满是记者的房间里引发了担忧。AI 助手是否可能被用于垃圾电话?为什么它没有表明自己是 AI 系统?(一位与会者表示,Huet 在正式的 Dev Day 上更新了演示,使代理表明自己是“Romain 的 AI 助手”。)不安感显而易见,这并不令人意外——即使没有代理,AI 工具已经被用于欺骗。
还有一个更直接的问题:演示没有成功。代理缺乏足够的信息,错误地记录了甜点的口味,导致它在列中自动填充了香草和草莓等口味,而不是说它没有这些信息。代理经常在多步骤工作流程或意外场景中遇到问题。而且它们比传统的机器人或语音助手消耗更多的能量。它们在推理或与多个系统互动时需要大量的计算能力,这使得它们在大规模运行时成本高昂。
AI 代理提供了巨大的潜力,但对于日常任务,它们目前并不比机器人、助手或脚本显著更好。OpenAI 和其他实验室希望通过强化学习来增强其推理能力,同时希望摩尔定律继续提供更便宜、更强大的计算。
那么,如果 AI 代理目前并不非常有用,为什么这个想法如此受欢迎?简而言之:市场压力。这些公司拥有强大但昂贵的技术,迫切希望找到他们可以向用户收费的实际用例。承诺与现实之间的差距也创造了一个引人注目的炒作周期,推动了资金流动,而 OpenAI 恰好在此期间筹集了 66 亿美元。
AI 代理初创公司在过去 12 个月内获得了 82 亿美元的投资。
大型科技公司一直在急于将其产品整合各种“AI”,但他们希望 AI 助手特别是解锁收入的关键。Huet 的 AI 呼叫演示超越了模型目前在大规模上所能做到的,但他告诉我,他预计类似的功能将在明年更常见地出现,因为 OpenAI 正在完善其“推理”o1 模型。
目前,这个概念似乎主要局限于企业软件堆栈,而不是面向消费者的产品。提供客户关系管理(CRM)软件的 Salesforce 在年度 Dreamforce 会议前几周推出了一个“代理”功能,引起了极大的轰动。该功能允许客户通过 Slack 使用自然语言在几分钟内构建一个客户服务聊天机器人,而不是花费大量时间编写代码。聊天机器人可以访问公司的 CRM 数据,并且比非基于大型语言模型的机器人更容易处理自然语言,可能在有限的任务中表现更好,如询问订单和退货的问题。
AI 代理初创公司(仍然是一个相当模糊的术语)已经成为相当热门的投资。它们在过去 12 个月内获得了 82 亿美元的投资,分布在 156 笔交易中,同比增长 81.4%,根据 PitchBook 数据。其中一个较为知名的项目是 Sierra,一个类似于 Salesforce 最新项目的客户服务代理,由前 Salesforce 联合 CEO Bret Taylor 推出。还有 Harvey,提供律师的 AI 代理,以及 TaxGPT,一个处理税务的 AI 代理。
尽管对代理充满热情,但这些高风险用途提出了一个明确的问题:它们真的可以被信任处理像法律或税务这样严肃的事情吗?AI 幻觉,这经常困扰 ChatGPT 用户,目前还没有解决办法。更根本的是,正如 IBM 在 1979 年预见性地指出,“计算机永远不能被追究责任”——因此,“计算机绝不能做出管理决策。”与其将 AI 助手视为自主决策者,不如将它们视为它们真正所是的:强大但不完美的低风险任务工具。这是否值得 AI 公司希望人们支付的大笔费用?
目前,市场压力占主导地位,AI 公司正在竞相实现商业化。“我认为 2025 年将是代理系统最终进入主流的一年,”OpenAI 的新任首席产品官 Kevin Weil 在媒体活动上说。“如果我们做得对,它将带我们进入一个世界,在这个世界中,我们实际上可以花更多时间在重要的人类事务上,而少花时间盯着我们的手机。”