共计 1764 个字符,预计需要花费 5 分钟才能阅读完成。
说实话,谁会真的需要一个 AI 助手来帮忙上网找信息呢?这得看你找的是什么。
几十年前,想找点资料?得去图书馆翻书。现在呢?搜索引擎一搜,信息全来了。不过,AI 的出现,让信息获取变得更自动化了。
微软最近推出了Copilot Vision,这玩意儿能实时查看你在网上干啥,还能给你口头建议。想象一下,你在浏览网页时,突然需要点帮助,它就能立马跳出来帮你。
这功能目前只在 Microsoft Edge 里,而且只对 Copilot Pro 订阅者开放预览。订阅费每月 20 美元,通过 Copilot Labs 和US Copilot Pro订阅。我有幸提前体验了一把,感觉如何?往下看。
一个全能的助手
理论上,上网搜索已经很简单了,再找个助手帮忙,是不是有点多余?但当我体验了入门演示后,感觉这玩意儿确实有点意思。
举个例子,屏幕上有几张狗的图片,我让 Copilot Vision 给我讲讲这些狗的品种。它不仅能识别每张图片,还能告诉我每个品种的详细信息,尽管图片上根本没有文字。
截图由 Sabrina Ortiz/ZDNET 提供
另一个例子,屏幕上有几张城市图片,我让它告诉我哪个城市最古老。它不仅识别了每个城市,还解释了为什么某个城市最古老。
最让我印象深刻的是,我让它帮我总结了一篇文章。这对于研究来说简直是神器,特别是当你不想花时间自己浏览文章时,直接问它就行了。
截图由 Sabrina Ortiz/ZDNET 提供
在所有演示中,Copilot Vision 的理解能力非常强,无论我说得多快或多模糊,它都能准确理解。这让它用起来非常流畅和直观。不过,当我开始在自己常用的网站上使用它时,感觉有点失望,因为它的实际应用场景有限。
限制
目前,Copilot Vision 只能访问有限数量的网站,比如 Wikipedia、Tripadvisor、Amazon、Target、OpenTable、Wayfair、Food & Wine、Williams Sonoma 和 Geoguessr。
截图由 Sabrina Ortiz/ZDNET 提供
这些网站大多是购物网站,我在购物时感觉它并没太大帮助。它主要能帮我导航到特定部分,比如优惠页面,或者告诉我该点哪个标签。
比如在 Amazon 上,我让它帮我妈找圣诞礼物,它建议我点哪些标签,但这些我自己也能看到。然后它给了我一些通用的建议,比如一本书或一件毛衣,感觉没什么特别的。
在三个内容网站——Wikipedia、Tripadvisor 和 Food & Wine——Copilot Vision 表现得更有潜力,特别是它能总结文章内容,这对学生和研究人员来说是个大福利。
在 Food & Wine 上,它为我概述了首页的热门文章,解释了头条新闻和其他特色内容,感觉挺实用的。
不过,我不太用 Wikipedia 做研究,因为它的内容是第三方提供的。另外两个网站比较小众,所以我不确定 Copilot Vision 在这些网站上能有多大帮助,除非你正好在这些网站上找东西。
在 OpenTable 上,它并不太有用,因为它只能根据你当前看到的内容提供建议。比如,你问它今晚推荐哪家墨西哥餐厅,它只会告诉你已经显示的内容。
在 GeoGuessr 上,Copilot Vision 最有用,它就像一个知道所有答案的助手,给你一些有用的提示,虽然有点作弊的感觉。
安全问题
当然,让 AI 查看你的屏幕,难免会引发隐私担忧。微软为此专门做了一个 详细的 Q &A,解答了大家的疑问。
微软保证,Copilot Vision 只在活跃的 Vision 会话中查看你的 Edge 窗口,并且会用一个带色调的浏览器框架提示你当前处于活跃会话中。这与 Recall 功能不同,Recall 会在后台随时拍摄你的屏幕快照,已经引发了不少争议。
根据微软的说法,Copilot 的响应只会被记录下来以监控不安全的交互,但用户的输入,包括文本、图像和上下文,永远不会被存储。一旦会话结束,用户输入的数据就会被删除。
值得吗?
目前来看,仅仅为了 Copilot Vision 而订阅 Copilot Pro 并不划算,特别是它的访问权限还不稳定。不过,每月 20 美元的订阅费还包括其他福利,比如优先访问最新模型,以及在 Microsoft 365 应用中使用 Copilot。如果你已经是 Copilot 的重度用户,并且能从这些福利中受益,那 Copilot Vision 可能会成为一个有趣的额外功能。