共计 2576 个字符,预计需要花费 7 分钟才能阅读完成。
尽管 iPhone 几乎拥有所有最新 AI 先驱提供的最智能 AI 应用,但它缺乏只有在操作系统和最新硬件结合时才能实现的深度 AI 功能集成。这正是 Google Pixel 10 系列发布时所展示的。以下是如果这些功能在 iPhone 17 中无缝嵌入系统级别,将会产生巨大影响的七个功能。,
1. ChatGPT 的语音模式
OpenAI 的 ChatGPT 语音模式基本上实现了用户一直希望 Siri 在 iPhone 上实现的功能。用户只需启动它,然后以自然语言与其对话,它可以回答问题、提取信息,甚至执行一些操作。ZDNET 的 Sabrina Ortiz 已经解释了如何将语音模式分配给 iPhone 的操作按钮,以将其用作 Siri 的替代品。
但语音模式(即将更名为 ChatGPT Voice,并很快向免费用户推出)在 iPhone 上执行的命令仍然有限。Apple 版本的此功能或与 OpenAI 的合作可能会在日历、电子邮件、短信、笔记、设置和其他操作系统任务中实现更深入的集成(在 Apple 隐私保护的前提下)。同样,Google 已经推出了 Gemini Live,微软也提供了 Copilot Voice,因此 Apple 需要更加谨慎地行动,以帮助 iPhone 跟上步伐。,
2. Pixel 10 的 Pro Res Zoom
用户曾撰文表达了对变焦摄影的热爱,并指出这是手机摄像头仍然不足的领域,因此不得不经常依赖 Sony 的无反相机和 70-200mm 变焦镜头。然而,Google 最近在 Pixel 10 Pro 中迈出了一大步,填补了变焦摄影的空白。凭借其新的 Super Res Zoom 功能,Pixel 10 Pro 将填补缺失的数据,并自动处理高达 100 倍的数字变焦图像,使其更具可用性。
这引发了许多关于照片本质的问题,用户仍需在 Pixel 10 Pro 上试用,以报告其效果如何,但这似乎是计算摄影的有价值应用。唯一能在计算摄影领域与 Google 竞争的智能手机制造商是 Apple。,
3. Google 的 Magic Cue
去年在 WWDC 2024 上,Apple 大力宣传了其个人智能功能,该功能可以理解用户的问题和请求,因为它从用户的日历、邮件、短信和其他存储在 Apple 生态系统中的数据中获取了信息。在 WWDC 主题演讲中,Apple 使用了诸如“调出 Joz 上周与我共享的文件”等示例,以及实时提醒用户即将重新安排的会议可能与接送孩子参加常规活动冲突。
当然,Apple 从未发布此功能——但 Google 已经做到了。在 Pixel 10 中,Google 推出了 Magic Cue,它可以通过了解用户的信息,帮助用户在应用之间跳转。Google 提供的一个示例是,有人通过短信询问晚餐预订时间,Magic Cue 可能使用了来自 Gmail 确认邮件的信息,在消息应用中直接显示信息,用户只需点击即可发送回复。,
4. Anthropic 的深度研究
生成式 AI 为用户节省时间的一个重要方式是将其用作研究助手。现在有几款 AI 应用提供了深度研究功能,用户可以提出关于更复杂主题的重要问题,并给 AI 额外的时间(通常为 5 -30 分钟)来搜索可用资源,并返回一个包含明确标记信息来源链接的答案。
用户更喜欢使用 Anthropic 的 Claude 应用中的深度研究功能,因为它注重准确性。有许多报道称,Apple 一直在与 Anthropic 讨论各种合作机会。将 Claude 的深度研究集成到 Siri 中,以便用户可以通过语音或文本提示快速触发,这将是一个强大的选项。,
5. Google Photos 的最佳拍摄
Google 首次在 2023 年的 Pixel 8 上推出了最佳拍摄功能,最近在 Pixel 10 上又进行了重大升级。该功能源于 Google Pixel、Google Photos 和 Google Research 团队的合作,旨在解决“集体照困境”。
它使用连续拍摄的一组照片,其中并非每个人都睁着眼睛、看着相机或表情自然。然后它将每个人的最佳拍摄组合成一张更可用的照片。Pixel 10 上的新“自动最佳拍摄”功能在后台完成此操作,并为用户生成最佳拍摄照片。
同样,还有 Add Me 功能(在 Pixel 9 上推出),它巧妙地使用 AR 和 AI,允许摄影师通过结合两张照片(由相机应用引导)将自己添加到集体照中。可以合理预期,Apple 具备实现此功能的计算摄影能力,或者与 Google 达成技术许可协议,尤其是因为它基于已经可在 iOS 上使用的 Google Photos 应用。,
6. 更广泛的语言支持
大型语言模型最先进的功能之一是在不同语言之间进行翻译,用户不仅看到智能手机利用了这一功能,还看到智能眼镜也在使用——包括 Meta Ray-Bans、Solos AirGo 3、Even Realities G1 和 Brilliant Labs 的 The Frame。其中一些智能眼镜以及几款手机应用现在可以翻译成数十种语言(Google Translate 支持超过 100 种语言)。
Apple 仍然落后,仅在 Apple Translate 中支持 20 种语言。通过利用 LLM 的力量,Apple 应大幅增加支持的语言数量,并将其集成到 Siri 和其他 AI 功能中,如电话和短信中的实时翻译,以及视觉智能。,
7. Google 的对话式照片编辑
也许新款 Pixel 10 手机中最大的惊喜功能是 Google Photos 中的新对话式编辑功能。它允许用户描述想要对照片进行的更改,然后 AI 会自动执行。例如,用户可以要求移动场景中的主体、去除眩光或反光、重新居中对象、替换背景、在蓝天上添加云彩、增加或减少背景模糊等。
当然,修改照片可能很敏感。在 LinkedIn 上,Google 的计算摄影产品负责人指出:“用户已经调整了模型,使其对照片中的小细节非常敏感,以便在用户想要进行的更改中反映用户想要保留的上下文。”
用户怀疑这将是一个非常受欢迎的功能,因为它非常易于访问,并且不需要用户以前进行此类照片编辑所需的高级技术技能。,
最后的话
Apple 在追赶领先 AI 公司为其 iPhone 应用带来的功能方面还有很多工作要做——更不用说 Google 现在为其 Pixel 手机的关键功能带来的深度 AI 集成。
尽管在过去一年中,Apple Intelligence 功能的延迟推出似乎并未对 iPhone 造成伤害,但 Apple 需要缩小差距,以避免 iPhone 17 给人一种落后一步的感觉。截至目前,Google 可以有力地证明它提供了市面上最智能的手机。