共计 1069 个字符,预计需要花费 3 分钟才能阅读完成。
随着 OpenAI 发布 GPT-5 的重大消息,ZDNET 团队深入研究了其在代码分析方面的表现。本文将通过对比 GPT-5 的多个变体,揭示其在理解复杂代码库时的优缺点。
在本文中,我们测试了三种 GPT-5 变体在分析相同代码库时的表现。以下是四种模型的详细对比:
- o3: 一种优化推理的 GPT-4 变体。
- GPT-5: OpenAI 的新主 ChatGPT 模型,适用于所有层级,包括免费用户。
- GPT-5 Thinking: GPT-5 的变体,OpenAI 称其优化了“架构反思”。适用于 20 美元 / 月的 Plus 和 200 美元 / 月的 Pro 层级。
- GPT-5 Pro: OpenAI 当前 200 美元 / 月的顶级模型,具有最高的推理和上下文能力。
我们将这些模型连接到私有 GitHub 仓库,该仓库包含一个开源的免费 WordPress 安全插件及其附加模块。通过以下提示,我们让模型分析仓库并报告其结构和架构。,
检查仓库并学习其结构和架构。然后报告你所学到的内容。
结果显示,GPT-5 Pro 在代码级别提供了最具体的分析,而 GPT-5 则在覆盖范围和防御性编码洞察方面表现出色。o3 模型虽然简洁,但在底层架构上较为薄弱,而 GPT-5 Thinking 则提供了最佳的上手叙述,但评估深度最浅。
在安全态势分析中,GPT-5 Pro 能够精确命名安全机制,如文件顶部防护、nonces 和 manage_options。相比之下,GPT-5 确认了最佳实践,但保持概念性。o3 描述了运行时行为,而 GPT-5 Thinking 则为新开发人员提供了清晰的执行流程。
在许可和更新机制方面,GPT-5 Pro 逐步解释了过程,而 GPT-5 则抽象了架构。GPT-5 Thinking 增加了关于附加模块如何插入许可标签的细节,而 o3 则几乎未提及此主题。
在状态管理方面,GPT-5 Pro 和 GPT-5 都明确指出了代码如何使用“一个选项数组 + 修剪 + 无操作写入”,这是 WordPress 代码可维护性的最佳实践。o3 和 GPT-5 Thinking 则描述了生命周期和效果,而不是确切的选项结构。
总体而言,GPT-5 在分析复杂代码库时表现出色,尤其是在理解互连系统和提供详细分析方面。虽然 GPT-5 Pro 提供了最高级别的细节,但通过优化提示,基础 GPT-5 也能接近 Pro 级的结果。
如果你想深入了解这些模型的详细报告,可以参考以下链接:,