共计 1594 个字符,预计需要花费 4 分钟才能阅读完成。
苹果公司于周一宣布了一系列人工智能功能,包括在其软件和服务的更新中开放 Apple Intelligence 的底层技术,为其未来的进步奠定基础。
在其年度全球开发者大会(WWDC)上的演示更多地聚焦于渐进式的发展,包括电话通话的实时翻译,这些改进旨在提升日常生活,而不是像苹果的竞争对手那样营销宏大的 AI 愿景。
在未能兑现对 Siri 等关键产品的基于 AI 的升级承诺一年后,苹果对消费者的 AI 承诺保持低调,传达出它可以协助完成诸如找到在线看到的类似夹克的购买地点等任务。
在幕后,苹果暗示了一种向开发者提供自家工具以及竞争对手工具的策略,类似于微软上个月采取的策略。苹果软件主管 Craig Federighi 表示,公司将在其关键的苹果开发者软件中提供自家和 OpenAI 的代码完成工具,并开放其用于部分自家功能的基础 AI 模型给第三方开发者。
“我们正在开放访问权限,让任何应用都能直接接入苹果设备上的大型语言模型核心,”Federighi 说。
在一个早期的工作演示中,公司将 OpenAI 的 ChatGPT 图像生成功能添加到其 Image Playground 应用中,并表示未经用户许可,用户数据不会与 OpenAI 共享。
“你可以看到苹果的优先事项是他们在后端的工作,而不是前端的工作,大多数人目前对此并不真正关心,”分析公司 Creative Strategies 的首席执行官 Ben Bajarin 说。
苹果在启动其软件开发者大会时,面临着一系列前所未有的技术和监管挑战。
苹果的股价在活动开始前持平,周一收盘下跌 1.2%。
“在市场质疑苹果在 AI 领域能否取得任何领先地位的时刻,宣布的功能感觉最多是渐进式的,”Investing.com 的高级分析师 Thomas Monteiro 说。他补充道,与其他大型 AI 公司推出的产品相比,“苹果的时钟似乎每天都在加快。”
这与苹果去年提出的雄心勃勃的愿景形成对比。
“他们从具有远见卓识并在许多人之前谈论代理,到现在意识到最终需要做的是兑现一年前提出的承诺,”Technalysis Research 的首席分析师 Bob O’Donnell 说。
苹果高管表示,开发者将只能访问苹果设备上的 Apple Intelligence 版本,该版本不会接入苹果为其 AI 努力构建的特殊数据中心。设备上的模型大约有 30 亿个参数,这是模型复杂度的衡量标准,意味着它无法处理基于云的模型所能处理的更复杂任务。
Federighi 还表示,苹果计划对其所有操作系统进行设计大修。
苹果对其操作系统的重新设计集中在一种称为“液态玻璃”的设计上,图标和菜单部分透明,苹果高管表示,这是可能的,因为苹果设备中的定制芯片比十年前更强大。
Federighi 表示,新设计将涵盖 iPhone、Mac 和其他苹果产品的操作系统。他还表示,苹果的操作系统将采用年份名称而不是每个版本的顺序编号。这将统一命名约定,由于苹果的手机、手表和其他设备的核心操作系统在不同时间启动,导致不同产品的操作系统编号混乱,这一直令人困惑。
一些分析师告诉路透社,苹果决定将熟悉的 Mac 功能(如多任务界面和菜单栏)引入 iPad,可能预示着其向消费者营销的设备优先级发生转变。
在其他新功能中,苹果推出了“来电筛选”功能,iPhone 将自动接听来自未知号码的电话并询问来电者的来电目的。一旦来电者说明目的,iPhone 将显示来电原因的转录,并为机主响铃。
苹果还表示,它将为电话通话添加实时翻译,并允许开发者将其实时翻译技术集成到他们的应用中。苹果表示,电话另一端的来电者不需要拥有 iPhone,实时翻译功能即可工作。
苹果的 Visual Intelligence 应用——可以帮助用户找到与 iPhone 摄像头指向的鞋子类似的鞋子——将扩展到分析 iPhone 屏幕上的物品,并与应用链接。苹果举了一个例子,在线看到一件夹克,并使用该功能在用户 iPhone 上已安装的应用中找到类似的夹克出售。