共计 796 个字符,预计需要花费 2 分钟才能阅读完成。
尽管未能满足市场的高期待,GPT- 5 可能仍是 OpenAI 的明智之选。上周,GPT- 5 的发布将 AI 领域的炒作推向了历史新高。在发布会前夕,OpenAI CEO Sam Altman 在 X 上发布了一张死星的图片,进一步点燃了公众的期待。然而,当 GPT- 5 正式亮相时,大多数用户并未感到惊艳。尽管 OpenAI 宣称 GPT- 5 是其“迄今为止最好的 AI 系统”,但实际表现与预期形成了鲜明对比。
用户们期待的显著进步似乎并未出现,GPT- 5 的改进更多体现在成本和速度等实用层面。尽管如此,从长远来看,这些改进可能为 OpenAI 带来稳健的财务回报。专家们对 GPT- 5 的评价也颇为严苛。纽约大学心理学荣誉教授 Gary Marcus 直言该模型“迟来、过度炒作且令人失望”。AI 政策与战略研究所联合创始人 Peter Wildeford 则认为,GPT- 5 的进步“不值得大书特书”。
然而,GPT- 5 在编码领域的表现却令人瞩目。其版本目前位居最受欢迎的 AI 模型排行榜编码类别的榜首,超越了 Anthropic 的 Claude。OpenAI 的发布推广展示了 AI 生成的游戏和工具,尽管在复杂项目上仍存在故障,但在简单任务上表现出色。这一优势对 OpenAI 来说意义重大,因为 AI 编码已成为烧钱的 AI 初创公司最现实的收入来源之一。
尽管 GPT- 5 在医疗保健方面的能力被 OpenAI 强调,但其实际效果尚待验证。近年来,AI 基准测试的意义逐渐减弱,因为它们经常变化且公司选择性公布结果。然而,这些测试仍为我们提供了 GPT- 5 的合理图景。总体而言,GPT- 5 在许多行业测试中表现优于其前身,但改进幅度有限。
如果最近的历史能说明什么,那些小幅、渐进的增加更有可能转化为具体利润,而不是让个人消费者惊叹。AI 公司深知,他们最大的赚钱途径是企业客户、政府合同和投资。在稳健的基准测试上逐步推进,加上投资于提高编码和减少幻觉,是从这三者中获得更多收益的最佳方式。