共计 1036 个字符,预计需要花费 3 分钟才能阅读完成。
最近,我尝试使用 ChatGPT Codex 来修复我的 WordPress 插件,结果却让我感到失望。尽管它最终完成了任务,但整个过程并不如预期那般顺畅。以下是我的经历。,
初次接触:GPT-5 的发布与 Codex 的架构
在 GPT-5 发布后,OpenAI 一度试图强制用户使用新模型,但遭到了强烈反对。随后,他们恢复了对旧模型的支持。我使用 GPT-5 运行了我的编程测试集,结果一半的测试都失败了。这让我对 Codex 是否仍然基于 GPT-4 架构产生了疑问。然而,当我查询 Codex 时,它明确表示自己仍基于 GPT-4。
开始使用:初步分析与安全审计
我的第一步是让 Codex 检查代码库。我使用了“询问”模式,该模式仅进行分析而不进行实际修改。尽管我期望得到深入的分析,但结果却远未达到预期。于是,我转而让 Codex 进行一次快速的安全审计,并识别出三个需要改进的领域。虽然这些问题都有效,但我只决定立即处理其中一项:nonce 和跨站请求伪造(CSRF)风险。,
修复代码:精确但耗时
接下来,我指示 Codex 进行实际修复。它启动了虚拟终端,并在完成后显示了代码差异。Codex 的修改非常精确,仅针对需要改进的部分代码。它建议对九个文件进行更改,并在 GitHub 上创建了拉取请求。我对这些更改感到满意后,将其合并到主代码库中。,
问题出现:测试服务器崩溃
然而,当我在测试服务器上运行修改后的插件时,服务器崩溃了。我将错误信息反馈给 Codex,它花了三分钟提出了一个修复方案。我再次将其合并到代码库中,这次测试服务器成功运行。,
体验总结:效率与流畅感的缺失
尽管 Codex 完成了任务,但整个过程并不如预期那般流畅。编码通常能带来一种愉悦的心境,但使用 Codex 却感觉像是在与一个固执的承包商交换电子邮件。它的响应时间约为 10 到 15 分钟,而同样的代码可能需要我几个小时才能完成。虽然 Codex 节省了时间,但使用它感觉更像是一项苦差事,而非享受编码的过程。,
未来展望:Codex 与 Jules 的对比
在测试了 Google 的 Jules 和 ChatGPT Codex 之后,我的印象是 Jules 能够更深入地理解代码。目前,我无法用大量数据支持这一断言,但这只是我的印象。我计划通过 Jules 运行另一个项目,并期待 OpenAI 将 GPT-5 集成到 Codex 中的那一天。
你是否尝试过在开发工作流程中使用像 ChatGPT Codex 或 Google 的 Jules 这样的 AI 编码工具?你给它们分配了哪些任务?它们表现如何?请在评论中分享你的体验。