共计 3155 个字符,预计需要花费 8 分钟才能阅读完成。
Just_Super/Getty Images
生成自定义待办事项列表的应用程序与用于玩第一人称射击游戏的应用程序完全不同。允许用户预订个人出租车或酒店房间的应用程序与允许用户设计 3D 对象的应用程序也大不相同。
许多应用程序远不止是一个漂亮的界面。以 Instacart 为例。当然,该应用程序有一个产品数据库供用户选择,一个用于管理购买和账单的电子商务组件,以及一个客户与购物者之间的消息传递界面。
但它还有一个庞大的基础设施,与食品店达成协议,使其能够更新库存,并允许其购物者在这些商店的过道中穿梭。它还具有映射和路线优化功能,用于管理购物者并优化他们的体验。
编写代码不仅复杂,而且是多学科的。至少对于较大的项目来说是这样。
这为今天的主题提供了一些背景:使用 Siri 进行“氛围编码”应用程序。
9to5Mac 的团队最近发表了一篇文章,题为“[苹果希望人们通过 Siri 进行 Vision Pro 应用程序的氛围编码](https://9to5mac.com/2025/04/17/apple-wanted-people-to-vibe-code-vision-pro-apps-with-siri/)”。这个想法来自一份报告,描述了“苹果希望即使不懂计算机代码的人也可以通过 Siri 语音助手告诉头显构建一个 AR 应用程序,然后通过苹果的 App Store 供其他人下载。”
显然,苹果高管讨论过这样的功能,但尚未实施。
一方面,这个想法似乎很荒谬。Siri 在转录短信给朋友时出错的次数有多少?假设 Siri 可以做一些像创建应用程序这样复杂和强大的事情,意味着 Siri 不是我们所熟知和喜爱的相对简单的 AI。
但假设苹果智能最终能够超越其令人失望的表现,并且 Siri 最终拥有与 ChatGPT 或 Google Gemini 相当的 AI 技能。那么我们就有了一个起点。
AI 可以编写代码,这一点已经被多次证明。在最近的测试中,ChatGPT 和 Gemini Pro 2.5 都表现出了极高的水平。
因此,认为苹果(也许很快?)将拥有一个至少与竞争对手水平相当的 Siri 并不是不现实的。
苹果要能够通过 Siri 进行“氛围编码”——即 AI 编码——应用程序,需要具备哪些条件?必须讨论三个主要因素:技术、苹果与编码的关系,以及管理期望。
有一些先例表明,你可以用一句话描述一个应用程序,AI 可以编写它。上周,展示了 GitHub Spark 如何用一句话构建一个代码分析工具。是的,界面很丑,是的,尝试改进它有些徒劳,但事实是,AI 确实从一句话的描述中构建了一个可用的应用程序。
在 ChatGPT 大获成功后不久,要求它创建一个完整的 WordPress 插件,包括用户界面,它做到了。这个插件相当简单,虽然不止一句话,但 ChatGPT 当时的能力令人惊讶。
因此,虽然可能需要一些时间来完善,但技术已经存在。
苹果在赋能开发者方面有着悠久的历史,但也对开发的含义存在误解。苹果 II 是第一款成功的消费级计算机,不仅因为其友好的外壳,还因为苹果包含了 BASIC 编程语言,新手用户可以轻松上手。
当苹果推出 Mac 时,它还推出了一系列书籍,包括界面指南和编码指南,以便第三方开发者可以制作看起来像 Mac 应用程序的应用程序。
苹果推出这些产品时,意识到开发者将推动硬件的接受度。毕竟,机器的价值在于你能用它做什么,对吧?
苹果的第一款主要低代码产品是革命性的 HyperCard,这款工具允许用户绘制用户界面,并用最少的代码连接模块。(因为苹果创办了第一家为 HyperCard 开发者构建工具的公司,并为苹果运营了一个 HyperCard 项目。)
但苹果内部存在很大的脱节。记得坐在 HyperCard 产品经理的办公室里,听他告诉我,没有人想制作自定义应用程序。苹果用户不想要自定义,他说。
然而,每天都会与学校教师、体育教练、医生、技工、小企业主,甚至偶尔的大预算电影导演和情景喜剧明星交谈,他们都非常想构建自己的应用程序来帮助他们完成工作。
苹果推出的其他低代码工具包括 Automator、Shortcuts、Playgrounds(作为 Swift 的一部分)和 Xcode Interface Builder。苹果甚至还尝试了 AR 创作工具,如 2019 年推出的 Reality Composer,允许开发者通过拖放进行 3D 资产放置、动画和基本交互,而无需编写代码。
这些工具被视为赋能公民开发者的资源。这些人不一定是开发者,但愿意学习完成工作所需的任何技能。虽然不是每个人都想构建应用程序,也有一些人因为认为可以赚大钱而开发应用程序,但也有一个庞大且多样化的人群,他们想构建应用程序,只是为了让他们的计算机为他们完成专门的任务。
这引出了所有面向大众的 AI 编码的核心问题。天真的新手希望能够发出单行命令,突然就掌控下一个价值数十亿美元的 Uber。
这永远不可能实现,但 AI 编码工具完全有可能帮助 Uber 开发者维护和改进他们的代码。
AI 工具确实可以“氛围编码”一个应用程序。GitHub Spark 和 WordPress 插件的例子已经证明了这一点。也可以为交互体验创建拖放界面。Reality Composer 早在六年前就帮助人们做到了这一点。
真正的问题是:AI 可以为你构建什么样的应用程序?你愿意投入多少工作?AI 在迭代和逐步改进方面表现如何?
到目前为止,AI 在逐步改进其工作方面表现糟糕。当要求它们完全重新创建某些东西时,它们表现更好,但添加了一些新元素。这使得在不改变某些基本内容的情况下,让 AI 进行增量更改变得特别困难。
某些项目在“氛围编码”所暗示的那种“你的愿望就是我的命令”的编码方面并不实用。例如,虽然非编码者或低编码者完全有可能构建 AR 和 VR 环境,但构建一个让脊柱外科医生自信地切开并修复患者脊柱的 AR 体验,需要一支经验丰富的工程师团队。
在考虑通过“氛围编码”创建应用程序时,重要的是要意识到,这些工具在某些应用程序(特别是基于表单的应用程序)中表现良好,而在其他类型的应用程序,特别是推动数十亿美元业务的复杂大型应用程序中表现不佳。
在营销中,“描绘愿景”指的是呈现一个如此生动的营销信息,以至于它能在脑海中形成一幅画面,从而捕捉到你要销售的产品的本质以及潜在客户的想象力。通常,这种做法夸大了使用产品的实际体验,但它能引起潜在客户的共鸣,并有助于提升销售。
那么,期望人们能够通过 Siri 进行 Vision Pro 应用程序的“氛围编码”是否愚蠢?这确实是在“描绘愿景”。
首先,Vision Pro 的销售情况不佳。对于那些需要该设备的人来说,如果他们能够构建自己的应用程序会更好,因为该设备的销量不足以证明更商业化的编码商店的开发努力。
其次,Siri 在大多数用户信任它正确发送短信之前,还需要做很多工作。
但低代码、AI 支持的“氛围编码”应用程序开发是否是 AR 和 VR 体验未来的一部分?当然!这些都不是不可能的。技术已经存在(只是不在苹果智能中)。剩下的就是逐步改进,找出哪些地方需要帮助,然后等待实施。
只需保持期望的合理性。了解这些工具,它们擅长什么,以及它们在哪些地方遇到瓶颈。虽然苹果不太可能批准大量业余编码的 VR 和 AR 应用程序上架 App Store,但毫无疑问,会有一些非专业编码者的出色作品,我们可能会看到一些令人惊叹的作品。
底线:通过 Siri 进行 Vision Pro AI 应用程序的“氛围编码”并不是不切实际的期望。但在实现之前,还需要做一些工作,并且需要控制期望。
你怎么看?你能想象自己只需向 Siri 描述就能构建一个应用程序吗?你尝试过像 HyperCard、Shortcuts 或 Reality Composer 这样的低代码或无代码工具吗?你认为苹果在这个愿景上走在正确的轨道上,还是我们只是“描绘愿景”得过于生动了?在下面的评论中告诉我们。