共计 2085 个字符,预计需要花费 6 分钟才能阅读完成。
当苹果于 2011 年首次推出 Siri 时,搭载在 iPhone 4S 上,该公司推出了一系列非常引人注目的广告,展示了人们可能如何使用这个新奇的语音助手。在其中一段广告中,Zooey Deschanel 问她的手机有关送达番茄汤的事情;在另一段广告中,John Malkovich 要求获得某种存在主义的人生建议。还有一段广告中,马丁·斯科塞斯从纽约市的出租车后座上调整自己的日程安排。广告中展示了提醒、天气、闹钟等功能。广告的重点是 Siri 是一个有用的、始终陪伴的伙伴,能够解决你所需要的任何问题。无需应用或点击,只需询问。
Siri 对于苹果来说具有重要意义。在 4S 的发布会上,苹果的菲尔·席勒说 Siri 是新设备的最佳功能,“几十年来,技术专家一直以这个梦想来取悦我们,这个梦想是,你将能够与技术对话,并通过它为我们做事情”,他说,“但它永远都没有实现!”他说,我们真正想做的,就是以我们任何想要的方式与设备交流,获取信息和帮助。在经典的苹果傲慢口吻下,席勒宣称苹果已经解决了这个问题。
苹果没有解决这个问题。自从那次首次发布以来的 13 年里,对于大多数人来说,Siri 要么是设定定时器的方式,要么是一个应尽量避免使用的无用功能。Siri 很长时间以来一直存在问题,以至于多年来似乎苹果要么忘记了它的存在,要么选择装作它不存在。
但在下周的 WWDC 上,如果传闻和报道属实,我们可能将首次见到真正的 Siri,或者至少更接近真正的 Siri。根据_Bloomberg_、_The New York Times_等媒体的报道,苹果将为助手推出一次巨大的改版,使 Siri 更加可靠,这要归功于大型语言模型,但新功能不多。即使只有这个功能的改进,也是一次胜利。但苹果似乎还在努力开发并且可能即将发布一款可以在应用程序内部进行整合的 Siri 版本,这意味着助手可以代表您对您的设备采取行动。至少在理论上,您在手机上可以做的任何事情,Siri 很快可能都可以为您完成。
这显然一直是 Siri 的愿景。在那些 iPhone 4S 的广告中,你甚至可以看到这一点:这些名人在向 Siri 寻求帮助,而 Siri 几乎从来没有真正完成工作。它为 Deschanel 提供了一份提到送餐的餐厅列表,但没有提供订购任何东西或显示菜单的选项。对 Scorsese 来说,Siri 告诉他有交通堵塞,但没有重新规划路线——它难道不应该已经知道他要迟到吗?Siri 告诉 Malkovich 要善待人们并读一本好书,但没有提供任何实际帮助。迄今为止,使用 Siri 就像拥有一个虚拟助手,它唯一的工作就是为您搜索内容。这虽然也是一种功能,但并不够多样化。
Siri 一直不能发挥其潜力的原因有两个。第一个是很简单的:底层技术不够好。如果你用过 Siri,你就会知道它常常会听错姓名、误解命令,并且当你只是想播放播客时,它会回复“我找到一些相关信息”。这就是大型语言模型的激动人心之处,因为我们已经看到类似 Whisper 的语音转文字工具有多么好,以及这些模型能够更广泛地理解语言。它们并不完美,但是它们比我们先前拥有的工具要好很多 —— 这就是为什么亚马逊也将 Alexa 转向 LLMs,并且 Google 的 Assistant 被 Gemini 所取代。
Siri 从未完全发挥作用的第二个原因仅仅是苹果和第三方开发者从未弄明白它应该如何运作。你怎么知道 Siri 能做什么或者如何提问?开发者应该如何集成 Siri?即使现在,如果要将任务添加到你的待办事项应用中,Siri 也不能自动识别你使用的是哪个应用。你必须说“嘿 Siri,在 Todoist 中提醒我浇花”,但是在我个人的经验中,它只有一半的成功率。如果你想执行多步操作,你唯一的选择就是在 Shortcuts 中进行调整,这是一个非常强大的工具,但就差一点需要你编写代码。对大多数人来说,这太复杂了。
人工智能也可能为苹果提供机会绕过整个问题。今年早些时候,苹果的研究人员发表了一篇论文,详细介绍了一种名为 Ferret-UI 的系统,该系统使用 AI 模型来理解屏幕图像的细节。研究人员甚至详细介绍了一个使用 Siri 的整体应用程序的工作方式:OpenAI 的 GPT- 4 在广泛理解图像方面做得很好,然后 Ferret 能够理解小区域和细节。实际上,这可能意味着一个系统说,“这就是 Ticketmaster 应用!”而另一个系统说,“这就是购买按钮。”
我们对苹果对 Siri 提出的任何声称都应持怀疑态度。十多年前,席勒登台宣称苹果已经建立了更好的语音助手,然而,事实并非如此。现在的情况可能也是如此,因为人工智能的炒作速度远超过实际技术的进展速度。Humane、Rabbit、Google 和其他公司都在开展类似的工作,“智能代理”是 AI 领域的时髦词汇,然而还没有人证明这些技术已经完全准备就绪。
但如果苹果在这方面有所突破,这可能是我们首次看到真正的 Siri —— 那个多年前苹果向我们承诺的真正的 Siri。也许在下一则广告中,Deschanel 的番茄汤将会神奇地出现在她家,Headspace 应用将启动,让 Malkovich 感到内心宁静。也许我们终于能够看到苹果一直想要实现的 Siri。