共计 1600 个字符,预计需要花费 4 分钟才能阅读完成。
通过其独特的 Agent 模式,OpenAI 最新推出的 Atlas 浏览器能够接管用户的浏览器标签,执行购物、点击等任务。我亲自体验了这一功能,以下是详细的过程和感受。
OpenAI 最近发布了全新的 AI 浏览器 Atlas,目前仅支持 Mac 用户。作为一名 Mac 用户,我在观看公司演示后立即进行了尝试。这款浏览器结合了 ChatGPT 的强大功能和完整的网页界面,特别为 Plus 和 Pro 用户提供了 Agent 模式,使 ChatGPT 能够接管用户的浏览器,执行各种任务。
为了测试这一功能,我决定让 Agent 完成一项日常任务:从沃尔玛订购杂货和五金用品,并要求当天送达。
Atlas 与 Agent 模式的日常应用
在 OpenAI 的演示中,CEO Sam Altman 和其他高管展示了 Agent 模式,他们让 ChatGPT 读取食谱,然后通过 Instacart 从 Safeway 为八个人订购食材——整个过程无需任何人工干预。这令人印象深刻。
然而,我居住在农村地区,Instacart 无法提供服务,而沃尔玛是当地少数提供送货服务的商店之一。因此,我认为这是测试 Atlas 和 Agent 模式的完美案例。为了简化操作,我决定只购买几件商品,而不是通常每周订购的 50 多件商品。
下载 Atlas 后,设置过程要求我导入 Chrome 数据、使用 Apple Keychain 管理密码,并将其设为默认浏览器。在批准这些权限后,浏览器启动。界面让我想起新的 Google Chrome 标签页——一个简单的白色页面,中央有一个搜索框,下方有一些建议。OpenAI 表示,这些建议将根据我的浏览习惯和使用数据逐步改进。
遇到的问题
很快,Agent 遇到了一些障碍。沃尔玛的网站弹出了一个语言选择窗口,似乎阻止了 Agent 的导航。尽管我允许 Atlas 访问 Chrome 数据和 Keychain,但我并未在浏览器中登录沃尔玛,因此 Agent 也不知道我的位置或默认商店。没有这些信息,它无法判断哪些商品有货并可配送。
我停止了会话,手动登录了沃尔玛,重新选择了 Agent 模式,并改进了提示:
从纽约州马龙市的沃尔玛订购 5 个木材腻子、5 个可涂漆的填缝剂和一包 2 英寸螺丝。我希望一小时内送货到我家。
Agent 重新开始,这次成功搜索并将商品添加到购物车。但我注意到它没有选择我通常购买的品牌——尽管我之前购买过这些商品。因此,我再次改进了提示:
从纽约州马龙市的沃尔玛订购 5 个木材腻子、5 个可涂漆的填缝剂和一包 2 英寸螺丝。我希望一小时内送货到我家。我之前订购过这些商品,因此请根据我的购买历史找到我使用的正确产品和品牌。
这一次,它成功了。
Agent 查看了我在沃尔玛的购买历史,搜索了商品,在过去的订单中找到了它们,并正确地将商品添加到沃尔玛购物车中。当结账页面出现时,我只需选择配送时间、调整小费并确认付款。
我的订单已经在路上了。
成功之处与未来展望
总体而言,这次体验一半是魔法,一半是优化。在多次调整提示并手动登录沃尔玛后,Agent 模式完美理解了任务,与沃尔玛的在线商店互动,并几乎完成了整个结账过程。
当我未登录沃尔玛且未直接指示其参考购买历史时,Agent 模式在处理弹出窗口和购物偏好方面遇到了困难。尽管如此,对于第一天的测试和 1.0 版本来说,它的表现已经相当出色。我本可以更快地完成订单,但看着 ChatGPT Agent 实际导航实时网站、点击菜单并构建购物车无疑是非常酷的。整个过程大约花了 10 分钟。还不错,对吧?
我迫不及待想看看还能用它做些什么。我认为在假期期间使用它可能会非常棒。例如,我已经计划让它找到亚马逊上最热门的 4 岁儿童玩具,按畅销和评论过滤,控制预算,并自动填充购物车。如果它能成功,可能会为我节省数小时的礼物搜寻时间——或者至少激发一些好礼物的灵感。
虽然现在还为时尚早,但如果 OpenAI 继续更新 Atlas 和 Agent 模式(它计划这样做),它们很容易成为最有用的 AI 工具之一,供日常用户使用。