共计 1101 个字符,预计需要花费 3 分钟才能阅读完成。
今年 WWDC 的最大亮点是 Apple Intelligence——Apple 在 AI 领域的布局。Apple 宣布了一系列 AI 功能,其中最引人注目的是 Siri 的改进。Siri 常被认为是同类语音助手中表现最差的。但最近获得的生成式 AI 改造可能使其远超 Google Gemini,并将专用 AI 硬件如 Rabbit R1 甩在身后。
新的 Siri 展示了语音助手应有的样子
新的 Siri 为语音助手设定了高标准,其令人印象深刻的应用内操作仅需语音命令,超越了 Google Gemini。Apple 的设备内 AI 处理优先考虑隐私和效率,与 OpenAI 合作,在用户同意下使用高级模型如 GPT-4o。Google 需加强应用内操作以跟上 Siri,而 Rabbit R1 则在适应用户行为和个性化方面面临挑战。
Siri 的实际应用与挑战
智能手机上的智能助手下一步自然的发展是代表用户在应用内执行任务。Apple 通过其新增强的 Siri 率先实现了这一便捷功能。在演示视频中,Apple 展示了新 Siri 如何通过屏幕感知理解手机上的上下文,帮助用户总结长篇文章。此外,Siri 还能理解用户的意图并完成任务,如编辑照片,而无需手动操作编辑工具。
Google 与 Rabbit 的挑战
Google 展示了 Gemini 的进步,包括更深入的集成、Project Astra 的实时视觉搜索以及 AI 概览在搜索中的应用。虽然 Google 提到了 AI 代表用户执行任务,但在舞台上并没有展示任何内容。Rabbit R1 提供的是一个简化的用户界面,而所有处理都在 Rabbit 的服务器上进行,代表用户与应用交互。这接近 AI 的未来愿景,但 Rabbit 的方法主要因两个原因注定失败。
Apple 的隐私与效率
Apple 非常注重隐私。大部分 AI 处理在设备上进行(因此支持的设备有限),而发送到 Apple 云的查询据称与手机上的查询一样私密。Apple 使用专门为这些任务训练的自己的生成和语言模型,使得它们在智能手机有限的资源下更加高效。此外,Apple 与 OpenAI 的合作允许访问最新的 GPT-4o 模型,Siri 在将任何内容转发给 OpenAI 之前会获取用户的明确许可。
未来展望与挑战
尽管如此,整个 Siri 的故事应该给 Google 一些思考的食粮。Apple 抄袭了 Android 的 Material You 图标主题令人感到荣幸,因此 Google 效仿 Siri 的应用内操作也是公平的。否则,Gemini 将再次落后于曲线,我相信自从 WWDC24 以来,Google 的高管们一直在为此挠头。与此同时,Rabbit,尽管听起来可能很残酷,应该开始计算它的日子,除非它想被丛林中的大猫之一拯救,正如你所猜测的,这也不会是一个童话故事。