共计 827 个字符,预计需要花费 3 分钟才能阅读完成。
随着圣诞节的临近,科技公司们纷纷推出各种活动和新品来吸引眼球。OpenAI 也不例外,他们在 12 天的“OpenAI 的 12 天”活动中,每天都有新惊喜。而在这场活动的最后一天,也就是 12 月 20 日,他们带来了压轴大戏——发布了最新的 o3 推理模型,包括 o3 和 o3 mini。
这个活动从 12 月 5 日开始,每天都有直播,内容涵盖了从大项目到小礼物的各种发布和演示。Sam Altman,OpenAI 的首席执行官,在活动开始前就在 X 平台上预告了这场为期 12 天的盛会,并表示他们有一些“很棒的东西”要分享。
到了最后一天,OpenAI 果然没有让人失望。他们发布了最新的 o3 模型,这个模型在各种基准测试中表现出色,尤其是在数学和科学领域,比如 AIME 2024 竞赛数学基准和 GPQA 博士级科学基准(涵盖生物学、物理学和化学问题)。o3 还在 ARC-AGI 基准上取得了新的最先进分数,这表明模型正在接近 AGI(通用人工智能),尽管目前还远未达到。
值得一提的是,o3 mini 作为 o3 系列的新成员,提供了三种推理选项:低、中和高。推理时间越长,性能越好。在低水平上,o3 mini 在 Codeforces 竞赛代码基准上的表现与 o1-mini 相当,但在中高水平上,它甚至可以与 o1 相媲美,甚至更好。
此外,OpenAI 还首次向外部安全测试开放了 o3 模型,安全研究人员可以通过填写 OpenAI 网站上的表格申请早期访问权限,截止日期是 1 月 10 日。Sam Altman 在直播结束时还透露,o3 模型计划于 1 月底发布,完整版本将在之后推出。
除了 o3 模型,OpenAI 还介绍了“deliberative alignment”,这是一种新的训练范式,旨在直接教授推理 LLM(大型语言模型)人类编写的安全规范文本,并训练它们在回答之前明确地推理这些规范。
总的来说,OpenAI 的这场“12 天”活动不仅展示了他们在 AI 领域的最新进展,也为即将到来的 2025 年埋下了不少伏笔。对于科技爱好者来说,这无疑是一场不容错过的盛宴。