OpenAI的12天：o3推理模型发布与AI技术新突破

204次阅读

共计 827 个字符，预计需要花费 3 分钟才能阅读完成。

随着圣诞节的临近，科技公司们纷纷推出各种活动和新品来吸引眼球。OpenAI 也不例外，他们在 12 天的“OpenAI 的 12 天”活动中，每天都有新惊喜。而在这场活动的最后一天，也就是 12 月 20 日，他们带来了压轴大戏——发布了最新的 o3 推理模型，包括 o3 和 o3 mini。

这个活动从 12 月 5 日开始，每天都有直播，内容涵盖了从大项目到小礼物的各种发布和演示。Sam Altman，OpenAI 的首席执行官，在活动开始前就在 X 平台上预告了这场为期 12 天的盛会，并表示他们有一些“很棒的东西”要分享。

OpenAI 的 12 天：o3 推理模型发布与 AI 技术新突破

到了最后一天，OpenAI 果然没有让人失望。他们发布了最新的 o3 模型，这个模型在各种基准测试中表现出色，尤其是在数学和科学领域，比如 AIME 2024 竞赛数学基准和 GPQA 博士级科学基准（涵盖生物学、物理学和化学问题）。o3 还在 ARC-AGI 基准上取得了新的最先进分数，这表明模型正在接近 AGI（通用人工智能），尽管目前还远未达到。

值得一提的是，o3 mini 作为 o3 系列的新成员，提供了三种推理选项：低、中和高。推理时间越长，性能越好。在低水平上，o3 mini 在 Codeforces 竞赛代码基准上的表现与 o1-mini 相当，但在中高水平上，它甚至可以与 o1 相媲美，甚至更好。

此外，OpenAI 还首次向外部安全测试开放了 o3 模型，安全研究人员可以通过填写 OpenAI 网站上的表格申请早期访问权限，截止日期是 1 月 10 日。Sam Altman 在直播结束时还透露，o3 模型计划于 1 月底发布，完整版本将在之后推出。

除了 o3 模型，OpenAI 还介绍了“deliberative alignment”，这是一种新的训练范式，旨在直接教授推理 LLM（大型语言模型）人类编写的安全规范文本，并训练它们在回答之前明确地推理这些规范。

总的来说，OpenAI 的这场“12 天”活动不仅展示了他们在 AI 领域的最新进展，也为即将到来的 2025 年埋下了不少伏笔。对于科技爱好者来说，这无疑是一场不容错过的盛宴。

正文完