共计 4829 个字符,预计需要花费 13 分钟才能阅读完成。
此前,OpenAI 的 Codex 模型作为专为编程工作设计的 AI 模型已被广泛讨论。尽管它具备一定的能力,但仅限于在 GitHub 或命令行终端界面中使用,这让人感到非常受限。
然而,这一切在 8 月底发生了变化。Codex 现在可以作为 VS Code、Cursor 和 Windsurf(另一款 AI 编程 IDE)的扩展使用,并且也包含在 OpenAI 每月 20 美元的 ChatGPT Plus 计划中。
Codex 与 VS Code 的集成极大地提升了生产力,尤其是考虑到每月 20 美元的选项。虽然也探索了其他 AI 编程工具,但许多宣传未提及的是,这些工具可能会迅速变得非常昂贵,月费可达 400 至 800 美元。
然而,每月 20 美元的 Codex 计划并非没有限制。在使用一整天后,突然遇到了 33 分钟的使用限制。第二天,在使用约四小时后,又遇到了 90 分钟的限制。随后,在工作了另外四小时后,Codex 直接暂停了一周的使用权限。
这感觉有点像毒品。初次尝试后,仅在 12 小时内完成了 192 小时的工作。但如果想要更多高效生产力,就需要每月支付 200 美元。目前尚不清楚更高价的计划能提供多少编程支持,但确实在考虑升级以保持这种高效状态。
最终,在通常只能完成一个项目的时间里,完成了四个项目并开始了第五个。
既然了解了核心体验,接下来将详细介绍。
在最近的一次 YouTube 讨论中,程序员 Ray Fernando 和 Robin Ebers 分享了他们每月在编程工具上至少花费 800 美元的经历。
Fernando 表示,他每月支付 200 美元用于 Claude Code Max 20x 计划。Claude Code 是由 Anthropic 专门为程序员设计的结对编程助手模型,因其规划和推理能力而备受青睐。
Fernando 还每月支付 400 美元用于 Cursor Ultra。Cursor 是 VS Code 集成开发环境(IDE)的分支,具备更多原生 AI 智能。该开发环境在整个界面中集成了 AI 功能,提供了强大的基于 AI 的编程辅助。
此外,Fernando 每月支付 200 美元用于 ChatGPT Pro,这是 ChatGPT 的高端版本,具备更高级的深度推理能力和更少的限制。
对 Fernando 和 Ebers 来说,这些费用是值得的,因为这些工具显著提升了他们的生产力。从另一个角度来看,雇佣一个入门级程序员的成本也远高于他们每月的支出。
暂且不讨论 AI 是否扼杀了入门级程序员的机会,而是聚焦于 AI 如何帮助专业程序员提升生产力(或获得更多睡眠时间)。
总体而言,在 VS Code 中使用 Codex 的体验(在能使用时)非常愉快。几乎完全依赖于 IDE 中的聊天机器人界面。
第一个重要测试是让 Codex 重写代码的欢迎界面。欢迎界面基于 HTML 和 CSS,手动编写并不复杂。但有一个小秘密:非常不喜欢编写 CSS 代码。
CSS 是用于定制网页显示的格式化“语言”,由委员会开发,经过多次定制和调整,以至于任何理性的程序员都难以忍受。当然,有 CSS 大师,但显然不在其中。
因此,将这项工作委托给 AI 是一种解脱。首先,CSS 广为人知且文档丰富,AI 对其工作原理有深入了解。其次,代码中没有关键任务部分,即使显示出现问题,也只是影响审美。第三,该界面的所有代码都存在于两个文件中:HTML 和 CSS 文件。如果 AI 完全搞砸了,只需从主分支或最近的备份中恢复这些文件。
经过多次尝试,AI 最终完成了任务。最初,当指示 AI 让界面看起来更现代和吸引人时,它完全不知道该如何处理。但当逐步指示(例如,制作三个白色框)时,它表现得非常出色。因此,逐步给出指示,每次等待 5-10 分钟让它思考,然后继续。
以下是修改前的界面。
以下是修改后的界面。
最终版本更简洁、易读且更具吸引力。
还使用 Codex 测试和调试了邮件列表注册表单,该表单之前存在许多问题。Codex 进入了 JavaScript 部分,经过多次迭代,最终生成了可用的代码。
需要注意的是,必须非常仔细地指导 AI 进行修改,能够清晰地描述哪些部分有效,哪些无效,并能够进入代码和浏览器控制台进行测试。因此,Codex 并非非程序员工具,必须有具备丰富编码和项目知识的人来主导项目。
然而,每月 20 美元的 ChatGPT Plus 计划存在一些巨大的陷阱。大多数编程 AI 都是基于使用量计费的。每次向 AI 发出提示时,都会消耗一定数量的令牌(通常数量很大)。更高价的计划在切断使用前提供更多令牌。
大多数编程工具会显示计划中可用的令牌数量以及剩余多少令牌需要休息。至少目前,VS Code 中的 Codex 没有提供此类信息。
在 VS Code 中使用 Codex 一整天后,突然在复杂的调试过程中被告知:“已达到使用限制。升级到 Pro 或等待 33 分钟。”
没有警告,直接中断。因此,无法确定它是否在停止时进行了部分更改。无法访问通常在 Codex 运行后提供的“更改内容”界面,代码处于非常不确定的状态。
这种情况令人不安,并且变得更加糟糕。Codex 在切断使用时不提供任何通知。如前所述,它又切断了两次,同样没有警告。
虽然可以回滚分支到使用 Codex 之前的状态,但这样会浪费所有使用量。
说到使用量浪费,请记住,虽然程序员为令牌或使用量付费,但 AI 经常犯低级错误。因此,也在为不可用的结果付费。如果使用量有任何指示,至少一半的请求将是无用的。
第一次被切断时,不知道 33 分钟后会恢复多少使用量。事实证明,限制时间逐渐延长,且总是在 AI 编程过程中毫无预警地切断。
等待 33 分钟后,又连续发出了八个完整的编程指令提示,没有中断,结束了第一天使用 Codex 的体验。
第二天早上,在使用约四小时后,又遇到了硬性限制。这次,Codex 要求等待 90 分钟。再次在编程过程中被切断,代码再次处于未知状态。
90 分钟的工作中断非常痛苦,因为正处于高效的工作状态中。
转而处理了一个非编程项目,直到 90 分钟过去。
随后,又进行了一次非常高效的使用 Codex 的编程。大约工作了五个小时,但随后遇到了最大的障碍。
被切断了。Codex 将在 5 天 16 小时内不再响应,除非升级到每月 200 美元的计划。
因此,这是一个艰难的选择。是否限制自己在每月 20 美元的 Plus 计划中使用 Codex?实际上,这似乎意味着每月或每周两天的使用时间。
由于没有太多空闲时间编程,这可能是一个可行的选择。尽管如此,在仍有时间编程时被切断仍然令人沮丧。但对于专业程序员来说,这种两天工作、五天休息的模式显然不可行。
已联系 OpenAI 了解 Plus 使用限制的详细信息以及如何知道这些限制何时结束。请继续关注,将在了解更多信息后更新。
尽管被切断了 AI 编程帮助,仍然可以独立编程。然而,在体验了这种高效后,不确定是否还想继续。
以下是不到两天内完成的编程任务,期间还包括撰写本文等其他活动。
需要注意的是,所有使用 AI 完成的任务都不是关键任务或安全相关代码。这些都是非常不错的功能添加,但不会对用户造成安全问题。这些部分仍由手动编码完成。
1. 美化了欢迎页面
这几乎完全基于 HTML 和 CSS 的任务,是真正不喜欢的平凡编程活动。
使用 Codex 大约花费了 90 分钟,而独立完成则需要一整天。
2. 调试了邮件列表界面
使用 Codex 深入研究了无法正常工作的邮件列表界面代码。它会调用 Mailchimp,但未能成功。之前多次尝试修复,但从未成功。
使用 Codex,在约 10 分钟内修复了问题。这为之前多次尝试的项目节省了数小时。
3. 创建了子标签 UI engine
界面被划分为标签部分,但变得越来越复杂。使用参数化用户界面 engine 来指定这些标签。昨天,添加了一个完整的子标签 engine,创建了一个全新的用户界面组件。
不仅提供了新的 UI 元素,而且非常模块化且易于部署。这种模块化功能添加的实现和锁定非常复杂。
独立完成可能需要至少一周时间,而此次仅花费了不到四小时,包括 33 分钟的强制休息。
4. 添加了设置备份管理器
添加了一个新的子系统,用于备份、恢复和清除程序中的所有设置。这创建了一个外部 JSON 文本文件,可以轻松移动、保存和修改,独立于程序的数据库。
不仅构建了保存和恢复设置的代码,还构建了使站点所有者能够使用它的用户界面。
通常,UI 需要大约一天时间,保存 / 恢复 / 重置功能可能需要另外一天左右。此次仅花费了约三小时,其中 90 分钟是强制休息。
5. 开始了用户活动监控插件
开始了一项可能成为免费增值产品的付费插件的工作,即用户活动监控器。这是一个非常深入、功能丰富的工具,用于捕获用户和站点活动、分析并标记可疑活动。
完成了整个用户界面的原型设计,并创建了实际逻辑的初稿。不幸的是,在切断之前仅完成了这些工作。接下来一周无法使用 Codex。
即便如此,完成这些工作独立完成可能需要至少一周时间用于 UI 原型设计,另外一周用于功能逻辑。此次仅花费了四小时,其中两小时用于仔细设计产品需求文档,另外两小时用于与 AI 生成代码。
毫不夸张地说,在两天内完成了约 24 天的工作,每天约六小时。在 Codex 的帮助下,12 小时内完成了 192 小时的工作。这简直是生产力倍增器!
如果是专业编程,每月 200 美元的 Pro 账户(甚至每月 800 美元,如 Fernando 和 Ebers 所花费)是完全值得的。但大多数编程是为了保持技能,且大多数工作是开源和免费的。
可以证明每月 20 或 40 美元的编程费用是合理的,但无法证明每月数百美元的支出是合理的。
之前在使用 ChatGPT 的聊天机器人界面时,已经看到了 AI 带来的生产力提升。但此次,Codex 可以访问整个 492 文件的代码库,并能够看到文件之间的关系。换句话说,Codex 可以针对整个系统进行编码,而不仅仅是某个模块。
因此,虽然之前在使用 ChatGPT 帮助处理独立例程时看到了生产力提升,但从未见过 16 倍的生产力提升,这是 Codex 在周末提供的。
但不要误解为 AI 可以让你开发出价值百万美元的应用。在没有持续指导的情况下,Codex 犯了很多错误。需要指导它如何使各种元素协同工作,需要指导它如何解决某些问题。有时,必须完全偏离它的方法并指向其他方向。
换句话说,它是一个强大的工具,而不是一个神奇的许愿池。
这个类比很贴切。在车间里有四五种不同的电锯。每种电锯都擅长某些切割任务。每种电锯相比手锯都节省了大量时间。每种电锯都需要足够的技能才能安全且生产出勉强可用的东西。
除非是工匠(或想避免电锯产生的噪音和锯末),大多数木工不太可能用手锯完成大部分工作。但仅仅拥有电锯并不意味着工作简单。它们是生产力倍增器,而不是技能替代设备。
这也是 AI 编程伙伴的工作方式。它们无疑是生产力倍增器。但要完成像复杂安全产品这样的大型项目,仍然需要人类程序员的知识和技能。
这也使得 AI 是否会取代程序员的问题更加复杂。一方面,每月 1000 美元的成本低于最入门级程序员的成本。另一方面,每月 200 至 800 美元的费用对大多数周末程序员、爱好者和学生来说过于昂贵。换句话说,AI 结对编程不仅可能切断入门级工作机会,还可能将除企业程序员外的所有人排除在使用 Codex 等工具之外。
但天哪!在周末使用 Codex 的时间里,真的以极快的速度完成了代码。这令人惊叹。需要认真思考这个问题。
在撰写上述内容四天后更新,截至昨天早上,仍需等待一天 12 小时才能重新使用。但非常想看看能在用户活动插件上走多远,因此支付了 200 美元购买了一个月的 Pro 计划。
昨天花费了八小时,为安全软件构建了一个完整的站点智能插件。它广泛而深入,跟踪用户访问、站点机器人、AI 机器人等。具备导出功能,并有一个不寻常的活动守护程序,对站点活动进行大量分析以标记潜在问题。包括所有 UI、花式手风琴效果等。
独立完成需要八周时间,而此次仅花费了不到八小时(以及大量挫败感——AI 有时非常固执和愚蠢)。这绝对不是不熟悉核心代码的人可以使用的东西,因为 AI 总是想在错误的地方工作。但天哪,最终的生产力令人惊叹。
因此,不确定是否能在接下来的两天内构建其他东西。还想看看在使用 OpenAI 最顶级计划几天后是否会被切断。请继续关注。