共计 3416 个字符,预计需要花费 9 分钟才能阅读完成。
Dia 是由 The Browser Company 推出的全新浏览器,与其前作 Arc 截然不同。Arc 是一款彻底颠覆传统浏览器模式的应用:它将标签页移至侧边栏,与书签功能结合,提供了无限的组织方式,并引入了许多让网页浏览更加愉悦的创新设计。
The Browser Company 的 CEO Josh Miller 表示,Dia 未来也会加入类似的功能。目前,这款应用主要面向现有 Arc 用户,仍处于测试阶段(仅支持 Mac)。但这些功能并非 Dia 的核心。Miller 强调,Dia 的重点是将人工智能深度融入用户的在线活动中。其核心功能是一个聊天工具,能够查看用户访问的每个网站、登录的每个账户,并帮助用户查找信息、完成任务,使网页浏览更加轻松。
经过一段时间的测试,Dia 的界面设计简洁直观。想象一下 Chrome,但设计更加精致,动画更加流畅。再想象一下右侧边栏中有一个类似 ChatGPT 的聊天机器人,用户可以随时调用。用户可以通过这个聊天机器人讨论当前标签页、其他打开的标签页,甚至浏览历史。它可以回答问题、查找信息、将各种内容整合到一个线程中,等等。
带有聊天机器人的 Chrome——这就是 Dia 的定位。Miller 表示:“尽管我个人非常喜欢 Arc,但数据显示,Arc 的创新性太高,很多人不愿意尝试。”Arc 的数据显示,一旦用户开始使用,他们就会爱上它,但大多数人从未尝试过。“当我们开始开发 Dia 时,选择水平标签页并不是出于战略考虑,而是基于反思。这是正确的选择。”
当被问及与聊天机器人整天交谈是否也是一种新颖的体验时,Miller 表示,这其实并不新奇。ChatGPT 是互联网历史上增长最快的应用,整个行业已经围绕聊天重新定位,尤其是年轻人,与 AI 交谈已经成为他们的第二本能。Miller 说:“与大学生或高中生交谈,他们会像对待真人一样与 AI 聊天。”
早期 Dia 测试者在没有 The Browser Company 指导的情况下,已经使用其 AI 助手进行饮食规划、学习辅助以及约会和交友建议。Miller 表示:“我们发现,很多人在开始项目之前会先使用聊天功能。在打开应用程序或进行 Google 搜索之前,他们的第一反应是打开电脑,向 AI 提问或寻求计划。”在过去的一年里,Miller 自己也更频繁地依赖 AI 聊天完成各种任务。尽管这可能会让人感到不安甚至反乌托邦,但趋势不可否认。
如果相信 AI 关系既深刻又不可避免,那么围绕它们构建一个网络浏览器就完全合理。这一观点已成为共识:Perplexity 正在开发浏览器,OpenAI 也被报道正在做同样的事情,而 AI 公司们都在排队购买 Chrome 如果它被出售。与此同时,Google 正忙于将 Gemini 集成到 Chrome 中。The Browser Company 成立时,其核心观点是浏览器的重要性远超人们的想象。如今,所有人都意识到了这一点。
为 AI 构建浏览器有三个重要原因。首先,通过观察一个人的网页浏览行为,可以了解很多关于他的信息。The Browser Company 的 CTO Hursh Agrawal 表示:“系统如何理解你一天中的所有行为?你点击哪里、输入什么——如何抓取你浏览的所有页面?”Dia 团队找到了快速查找和存储网站重要信息的方法,并能够识别哪些网站与用户相关,哪些用户不想再看到。所有这些数据和历史记录都会反馈到每次聊天互动中。Agrawal 表示,随着时间的推移,个性化已成为 Dia 最重要的功能。
浏览器的第二个优势是 URL 栏。Agrawal 表示:“在这个新世界中,最有价值的是浏览器拥有 CMD-T 和 omnibox,因为这是用户表达意图的单一入口——它是计算机上使用最频繁的文本框。”这一点非常重要,以至于美国政府计划通过强制 Google 出售 Chrome 来打破其搜索垄断地位,从而夺走 omnibox。
在 Dia 中,每个标签页和窗口都以 omnibox 开始。如果输入网站名称,它会直接跳转到该网站。如果输入类似网络搜索的内容,用户会得到网络搜索结果。如果请求 AI 助手可以处理的内容,它不仅会调出助手,还会调出具有正确数据和技能的版本,以帮助用户完成任务。
与尝试构建像 Gemini 这样的全能聊天机器人或让用户在数百万个专用模型之间选择不同,The Browser Company 在 Agrawal 所称的“路由系统”上投入了大量精力。Dia 主要不依赖于自己的模型,经过数月的尝试,The Browser Company 放弃了在该领域的竞争。相反,该公司在现有模型的基础上构建了所谓的“技能”,帮助将提示和模型结合起来,以满足用户的需求。Agrawal 表示:“关键的是,我们可以为每个技能定制 UI 和记忆系统。”
当要求 Dia 找一件外套时,助手可能会激活购物技能,它知道用户在 Amazon 和 Anthropologie 上查看的所有内容;当要求它起草一封电子邮件时,写作技能可以看到用户写过的所有邮件以及用户喜欢阅读的作者。
The Browser Company 产品工程负责人 Tara Feener 表示,技能系统有点像 iPhone 的 App Store。“它真正关注的是如何解锁用户在浏览器中执行的任务和操作中的特定价值。”目前,大多数 AI 系统希望成为超级应用,能够随时为所有人提供所有功能。通过更加具体和专注,Dia 可以更好地完成个别任务(且成本更低);通过正确构建路由系统,它可以实现所有这些功能,同时保持无缝体验。
浏览器的第三个优势不太明显,但可能更强大:cookie。由于 Dia 存储了用户从每个网站获得的 cookie,它实际上能够代表用户与所有这些网站进行交互。这意味着 Dia 不仅能看到用户访问的每个网页——它还能看到用户登录的每个网站中的所有内容。
Agrawal 表示,目前 Dia 主要使用 cookie 从用户访问的网站中获取更多信息,但它可以做更多事情。在未来,随着 AI 代理能够浏览网页并代表用户执行操作,浏览器将成为所有机器人的强大指挥中心。Agrawal 表示,The Browser Company 实际上构建了一个类似的工具。“我们广泛使用它来预订会议、预约,以及所有可以通过 cookie 完成的事情。”团队发现的问题是技术并不完美,用户不喜欢浏览器超出他们控制的感觉。目前,Dia 中没有太多代理功能。但这将会改变。
然而,伴随着所有这些功能,也带来了许多问题。首先是浏览器给用户的感觉。当 Dia 第一次让你意识到它知道你的社保号码时,这会让你感到有帮助还是恐怖?浏览器一直知道你大量的信息,但从未如此直接地反映它知道的内容。Agrawal 表示,The Browser Company 已经做了大量工作,以确定哪些数据(无论是健康、财务还是其他数据)过于重要,不应该被保存。他希望它永远不会复述你的社保号码,即使它知道。
Agrawal 还谨慎地指出,所有数据都存储在用户的计算机上并进行加密。他表示:“每当数据发送到我们的服务进行处理时,它只会在那里停留几毫秒,然后就会被清除。”Arc 在过去曾出现过一些安全问题,Agrawal 多次强调,隐私和安全从 Dia 开发之初就是核心。随着时间的推移,他希望 Dia 中的几乎所有功能都能在本地完成。
那么,这一切意味着什么?起初,Dia 是一款让用户与标签页聊天的浏览器。这或多或少是 Dia 的营销口号,也是浏览器目前的主要功能。Dia 的演示展示了如何交叉引用多个标签页中的各种面试材料,以汇总一个人的表现。用户可以使用 Dia 总结 Slack 对话并撰写回复,或者帮助用户检查 GitHub 中的拉取请求。这些功能大多并不新鲜——只是它们被整合在一起,用户无需复制粘贴、下载上传,甚至无需截图。机器人可以看到浏览器,反之亦然。
但从长远来看,如果 Miller 和 The Browser Company 对 AI 发展方向判断正确,用户的网络浏览器可能会变得不仅仅是浏览器。它可能会成为无处不在、最了解用户、能够帮助用户完成任何事情的应用程序。如果这是未来,每家公司都需要竞相成为用户开始建立关系的应用程序,因为切换成本将非常高昂。Miller 将其比作切换音乐应用,他说:“我从未切换到 Apple Music 是有原因的,尽管它在 Apple 生态系统中表现更好。它只是不像 Spotify 那样随着时间的推移了解我的音乐品味。”
Miller 希望,每次打开标签页时,Dia 都会变得更加个性化和好用。最终,用户不会因为浏览器如何处理标签页而爱上它——用户会因为它如何与用户互动而爱上它。