苹果智能技术新功能即将亮相

206次阅读

共计 2578 个字符，预计需要花费 7 分钟才能阅读完成。

苹果智能技术新功能即将亮相

苹果的智能技术不断涌现。

苹果备受瞩目的人工智能热潮中的首批功能将于下周某个时间向公众发布，但该公司已经在着手下一个项目。

周三，苹果推出了 iOS 18.2、iPadOS 18.2 和 macOS 15.2 的开发者测试版，这些版本运行了之前仅在苹果的营销材料和产品公告中见过的苹果智能功能：三种不同类型的图像生成、ChatGPT 支持、视觉智能、扩展的英语语言支持以及写作工具提示。

苹果的一系列基于图像的生成式 AI 工具，包括 Image Playground、Genmoji 和 Image Wand，将首次面向公众开放。当苹果在六月的 WWDC 上介绍这些功能时，表示它们旨在创建有趣且富有创意的图像，这些图像在家人和朋友之间分享。这也是苹果避免生成逼真图像的原因之一，而是选择了两种不同的风格，分别称为“动画”和“插图”。

Genmoji 可以根据用户的提示生成自定义表情符号，并提供多种选项，允许生成的图像不仅作为贴纸发送，还可以内嵌或作为点击反馈。例如，可以要求生成一个“彩虹色的苹果”表情符号。它还可以根据照片库中“人物”部分的面孔创建表情符号。目前，Genmoji 在 Mac 上尚不支持。

Image Playground 是一个直接的图像生成器，但有一些有趣的限制。该功能将提供概念选择以启动生成过程，或者用户可以直接输入描述想要生成的图像类型。与 Genmoji 类似，Image Playground 可以使用照片库中的人物生成基于他们的图像。它还可以使用照片中的单个图像创建相关图像。生成的图像符合某些特定的非摄影风格，例如皮克斯风格的动画或手绘插图。

Image Wand 允许用户将草图转换为更详细的图像。它通过从 Apple Pencil 工具调色板中选择新的 Image Wand 工具并圈出需要 AI 升级的草图来工作。Image Wand 还可以根据周围的文本生成图片。

当然，图像生成工具可能会引发生成不当内容的问题，苹果正在通过多种方式来应对这一风险，包括限制模型训练的材料类型以及对接受哪些类型的提示进行限制——例如，它会特别过滤掉尝试生成涉及裸露、暴力或受版权保护材料的图像。在生成意外或令人担忧的结果的情况下——任何此类模型的风险——苹果提供了一种在工具内直接报告图像的方式。

第三方开发者也将获得 Genmoji 和 Image Playground 的 API 访问权限，使他们能够将这些功能集成到自己的应用中。这对于 Genmoji 尤为重要，因为第三方消息应用将无法支持用户创建的自定义表情符号。

更新还增加了一些与大型语言模型相关的文本输入和自由联想功能。例如，写作工具——在第一波功能发布中主要允许用户点击不同的按钮来修改文本——现在有一个自定义文本输入字段。当用户选择一些文本并调出写作工具时，可以点击输入文本以描述希望苹果智能如何修改文本。例如，可以选择这段文字并输入“让它更有趣”。

随着开发者测试版的推出，苹果还发布了写作工具 API。这很重要，因为虽然写作工具在所有使用苹果标准文本控件的应用中都可用，但许多应用——包括我经常使用的一些应用！——使用自己的自定义文本编辑控件。这些应用将能够采用写作工具 API 并获得所有写作工具功能。

这一波新功能还包括首次与 ChatGPT 的连接。这包括将 Siri 查询传递给 ChatGPT 的能力，这会根据查询类型动态发生，例如，要求 Siri 为你计划在另一个城市的活动日程。用户不仅会在安装测试版时被提示启用 ChatGPT 集成，还会在查询时再次被提示。该集成也可以在设置中禁用，或者可以选择移除每次查询的提示。在某些情况下，可能会提示用户与 ChatGPT 共享特定类型的个人数据——例如，如果查询还上传照片。

苹果表示，默认情况下，发送给 ChatGPT 的请求不会被服务存储或用于模型训练，并且用户的 IP 地址会被隐藏，以防止不同的查询被关联在一起。虽然使用该功能不需要 ChatGPT 账户，但用户可以选择登录 ChatGPT 账户，以获得对特定模型和功能的更一致访问。否则，ChatGPT 将自行决定使用哪个模型来最佳响应查询。

如果你曾经尝试过免费的 ChatGPT，你会知道该服务在使用的模型和允许的查询数量方面有一些限制。值得注意的是，苹果智能用户使用 ChatGPT 并不是无限的——如果使用足够多，可能会遇到使用限制。尚不清楚苹果与 ChatGPT 的交易是否意味着 iOS 用户的限制比 ChatGPT 网站上的随机用户更好。如果你付费使用 ChatGPT，你将受到 ChatGPT 账户的限制。

对于 iPhone 16 和 iPhone 16 Pro 型号的所有者，此测试版还将包括上个月在这些设备首次亮相时展示的视觉智能功能。要激活它，按住相机控制按钮以启动视觉智能，然后瞄准相机并再次按下按钮。视觉智能随后会查找相机当前所见内容的信息，例如你面前的餐厅的营业时间或海报上的活动详情，以及翻译文本、扫描二维码、朗读文本等。它还可以选择使用 ChatGPT 和谷歌搜索来查找更多关于所见内容的信息。

苹果智能最初仅支持美式英语，但在新的开发者测试版中，这一支持变得更加国际化。目前仍仅支持英语，但加拿大、英国、澳大利亚、新西兰和南非的英语使用者将能够在他们的英语版本中使用苹果智能。印度和新加坡的英语地区支持即将推出，苹果表示，其他几种语言——包括中文、法语、德语、意大利语、日语、韩语、葡萄牙语、西班牙语和越南语——也将在 2025 年推出。

作为这些开发者测试版的一部分，苹果正在收集其苹果智能功能的性能反馈。该公司计划利用这些反馈不仅改进其工具，还评估它们何时可能准备好面向更广泛的受众推出。可以肯定的是，苹果在谨慎行事的同时，也在全速推进其人工智能未来。它知道基于 AI 的工具会出现一些问题，这使得这些测试周期在塑造最终产品方向方面更加重要。

显然，在今年的 .2 版本向公众发布之前，还会有更多的开发者测试版，最终还会有公共测试版。还有许多已宣布的苹果智能功能尚未推出，最引人注目的是一批新的 Siri 功能，包括对个人上下文和应用使用意图的内部操作的支持。今天标志着苹果智能的下一步发展，但苹果还有很长的路要走。

总的来说，苹果的这些新功能展示了其在人工智能领域的持续创新和进步，为用户提供了更多智能化的工具和体验。

正文完

发表至： AI行业动态

2024-10-24 10:14

0