共计 905 个字符,预计需要花费 3 分钟才能阅读完成。
在经历了去年的失败后,微软的 AI 编程助手 Copilot 在今年重新接受测试,结果令人刮目相看。曾经的“三振出局”选手,如今已成长为一名强击手,展现出令人信服的编程能力。
Copilot 的早期表现可以用“挥棒落空”来形容。在 2024 年 4 月的测试中,它未能通过任何一项标准化测试,表现堪称灾难。然而,经过一年的调整和优化,Copilot 在今年 4 月的测试中展现出了显著进步,成功击出了“平飞球”并跑上了垒。
测试逐场分析
- 编写 WordPress 插件
在去年的测试中,Copilot 未能生成有效的代码,导致任务失败。然而,今年的测试中,它成功编写了一个功能正常的插件,尽管在代码末尾留下了一个随机的空白行,但整体表现已经达到了预期。 - 重写字符串函数
该测试旨在验证 Copilot 能否正确处理美元和美分的转换。去年的测试中,Copilot 生成的代码虽然能识别一些错误,但未能进行完整的验证。今年,它成功通过了大部分测试,能够正确处理小数点右侧超过两位的数字和额外的前导零。 - 找到一个烦人的 bug
去年,Copilot 在面对这个测试时表现得相当“幽默”,甚至建议用户自行解决问题,并附上了一个表情符号。然而,今年的表现截然不同,它迅速、干净地解决了问题,展现出了更高的效率和准确性。 - 编写脚本
这个测试涉及一个较为晦涩的 Mac 脚本工具 Keyboard Maestro,以及 AppleScript 和 Chrome 脚本行为。去年,Copilot 完全忽略了 Keyboard Maestro,并且在生成的 AppleScript 中未能按要求操作。今年,它成功完成了所有要求,准确使用了 Keyboard Maestro 和 Chrome API,并正确编写了 AppleScript。
总体结果
与去年的“三振出局”相比,Copilot 在今年取得了显著进步。它从“地下室的打击手”变成了“灯光下的锦旗追逐者”,展现出了在大联盟中立足的潜力。微软在过去一年中对 Copilot 的改进显然取得了成效。
你是否已经尝试过 Copilot 或其他 AI 编程助手?你认为它是否已经准备好进入大联盟,还是仍然需要继续磨练?在开发过程中,你是否经历过“三振出局”或“本垒打”?请在评论中分享你的看法。
正文完