共计 565 个字符,预计需要花费 2 分钟才能阅读完成。
在 GPT-5 的发布会上,OpenAI 展示的一系列图表引发了广泛争议。CEO Sam Altman 亲自承认其中一张图表存在“重大失误”,这一事件在科技圈内迅速发酵。
发布会上的图表旨在展示 GPT-5 在“跨模型欺骗评估”中的优异表现,但仔细观察后发现,图表的比例尺存在明显问题。例如,在“编码欺骗”部分,现场展示的图表显示 GPT-5 的欺骗率为 50.0%,而 OpenAI 的 o3 模型得分为 47.4%,但后者的柱状图却更大。然而,OpenAI 在其官方博客中提供了准确的数据,GPT-5 的实际欺骗率仅为 16.5%。
这一错误在社交媒体上引发了广泛讨论。有网友指出,图表中 GPT-5 的得分低于 o3,但柱状图却更大;同时,o3 和 GPT-4o 的得分不同,但柱状图大小却相同。对此,Sam Altman 在推特上回应称这是一个“重大图表失误”,并强调博客中的版本是正确的。
OpenAI 的一名营销人员也在推特上公开道歉,表示:“我们在博客中修正了图表,对无意的图表错误表示歉意。”然而,OpenAI 官方尚未对此事发表进一步评论。
这一事件发生在 OpenAI 大力宣传 GPT-5 在“减少幻觉方面的重大进展”之际,显然对公司的形象造成了一定影响。尽管尚不清楚这些图表是否由 GPT-5 生成,但这一失误无疑为发布会蒙上了一层阴影。
图片来源:OpenAI
作者:Jay Peters