AI编程助手实战测评:11个大语言模型谁最靠谱?

73次阅读
没有评论

共计 690 个字符,预计需要花费 2 分钟才能阅读完成。

作为一个在科技圈摸爬滚打了十几年的老码农,我原本以为已经很难有什么新技术能让我眼前一亮了。直到那天,我抱着试试看的心态让 ChatGPT 帮我老婆的网店写了个 WordPress 插件。说实话,当那个插件真的能跑起来的时候,我下巴都快惊掉了。

从那以后,我就跟中了邪似的,一头扎进了 AI 编程的坑里。前前后后折腾了 11 个大语言模型,做了四次实战测试。结果嘛 … 有点让人哭笑不得。都过去一年半了,我测的 10 个 LLM 里,居然还有 5 个连个像样的插件都搞不定。

AI 编程助手实战测评:11 个大语言模型谁最靠谱?

说到这儿,我得先打个预防针:别指望 AI 能帮你写出整个应用程序。它们顶多就是帮你写写小段代码,或者修修 bug。不过话说回来,对于一些小项目,比如我老婆那个插件,AI 确实挺管用的。

现在市面上这些 AI 编程助手,我挑了几个比较有代表性的说说:,

  • ChatGPT Plus:这家伙确实有两把刷子。所有测试都通过了,而且还有专门的 Mac 应用。不过有时候会犯迷糊,给出些莫名其妙的答案。20 刀一个月,值不值就看你自己了。
  • Perplexity Pro:也挺有意思,能同时用好几个大模型。就是登录方式有点麻烦,只能用邮箱。不过它显示搜索标准的功能挺实用的。
  • Grok:这个免费选手倒是让我挺意外的。虽然只能用浏览器访问,但表现还不错。就是不知道这免费午餐能吃到啥时候。

至于那些不太靠谱的,比如微软的 Copilot,我劝你还是别浪费那个钱了。测试结果惨不忍睹,连个像样的代码都写不出来。

说实话,看到微软和谷歌砸了那么多钱,结果却这么拉胯,我也是挺意外的。不过这个领域发展太快了,说不定过段时间又会有新的惊喜。反正我是打算继续关注下去,毕竟谁不想找个靠谱的 AI 助手呢?

正文完
 0
admin-gah
版权声明:本文于2025-01-16转载自Zdnet,共计690字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码