OpenAI 图表风波：GPT-5 发布会失误引发热议

102次阅读

共计 565 个字符，预计需要花费 2 分钟才能阅读完成。

在 GPT-5 的发布会上，OpenAI 展示的一系列图表引发了广泛争议。CEO Sam Altman 亲自承认其中一张图表存在“重大失误”，这一事件在科技圈内迅速发酵。

发布会上的图表旨在展示 GPT-5 在“跨模型欺骗评估”中的优异表现，但仔细观察后发现，图表的比例尺存在明显问题。例如，在“编码欺骗”部分，现场展示的图表显示 GPT-5 的欺骗率为 50.0%，而 OpenAI 的 o3 模型得分为 47.4%，但后者的柱状图却更大。然而，OpenAI 在其官方博客中提供了准确的数据，GPT-5 的实际欺骗率仅为 16.5%。

OpenAI 图表风波：GPT-5 发布会失误引发热议

这一错误在社交媒体上引发了广泛讨论。有网友指出，图表中 GPT-5 的得分低于 o3，但柱状图却更大；同时，o3 和 GPT-4o 的得分不同，但柱状图大小却相同。对此，Sam Altman 在推特上回应称这是一个“重大图表失误”，并强调博客中的版本是正确的。

OpenAI 的一名营销人员也在推特上公开道歉，表示：“我们在博客中修正了图表，对无意的图表错误表示歉意。”然而，OpenAI 官方尚未对此事发表进一步评论。

这一事件发生在 OpenAI 大力宣传 GPT-5 在“减少幻觉方面的重大进展”之际，显然对公司的形象造成了一定影响。尽管尚不清楚这些图表是否由 GPT-5 生成，但这一失误无疑为发布会蒙上了一层阴影。

图片来源：OpenAI
作者：Jay Peters

正文完

GPT-5 OpenAI 图表失误科技新闻

发表至： AI行业动态

2025-08-08 22:15

0

版权声明：本文于2025-08-08转载自TheVerge，共计565字。

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

太空科技与AI结合：脑瘫康复治疗的新突破

微软Surface Laptop 7：性价比之选

Google Pixel 11将搭载基于台积电2nm工艺的Tensor G6芯片

中国天宫空间站引入悟空AI助力太空探索

免费 GPT-5 语音功能悄然走红：AI 交互的新标杆

GPT-5.0发布引发财务欺诈风险，企业如何应对AI驱动费用欺诈？

评论（没有评论）

验证码

最新文章