AI编程助手实战测评：11个大语言模型谁最靠谱？

183次阅读

共计 690 个字符，预计需要花费 2 分钟才能阅读完成。

作为一个在科技圈摸爬滚打了十几年的老码农，我原本以为已经很难有什么新技术能让我眼前一亮了。直到那天，我抱着试试看的心态让 ChatGPT 帮我老婆的网店写了个 WordPress 插件。说实话，当那个插件真的能跑起来的时候，我下巴都快惊掉了。

从那以后，我就跟中了邪似的，一头扎进了 AI 编程的坑里。前前后后折腾了 11 个大语言模型，做了四次实战测试。结果嘛 … 有点让人哭笑不得。都过去一年半了，我测的 10 个 LLM 里，居然还有 5 个连个像样的插件都搞不定。

AI 编程助手实战测评：11 个大语言模型谁最靠谱？

说到这儿，我得先打个预防针：别指望 AI 能帮你写出整个应用程序。它们顶多就是帮你写写小段代码，或者修修 bug。不过话说回来，对于一些小项目，比如我老婆那个插件，AI 确实挺管用的。

现在市面上这些 AI 编程助手，我挑了几个比较有代表性的说说：,

ChatGPT Plus：这家伙确实有两把刷子。所有测试都通过了，而且还有专门的 Mac 应用。不过有时候会犯迷糊，给出些莫名其妙的答案。20 刀一个月，值不值就看你自己了。
Perplexity Pro：也挺有意思，能同时用好几个大模型。就是登录方式有点麻烦，只能用邮箱。不过它显示搜索标准的功能挺实用的。
Grok：这个免费选手倒是让我挺意外的。虽然只能用浏览器访问，但表现还不错。就是不知道这免费午餐能吃到啥时候。

至于那些不太靠谱的，比如微软的 Copilot，我劝你还是别浪费那个钱了。测试结果惨不忍睹，连个像样的代码都写不出来。

说实话，看到微软和谷歌砸了那么多钱，结果却这么拉胯，我也是挺意外的。不过这个领域发展太快了，说不定过段时间又会有新的惊喜。反正我是打算继续关注下去，毕竟谁不想找个靠谱的 AI 助手呢？

正文完