OpenAI的12天:o3推理模型发布与AI技术新突破

66次阅读
没有评论

共计 827 个字符,预计需要花费 3 分钟才能阅读完成。

随着圣诞节的临近,科技公司们纷纷推出各种活动和新品来吸引眼球。OpenAI 也不例外,他们在 12 天的“OpenAI 的 12 天”活动中,每天都有新惊喜。而在这场活动的最后一天,也就是 12 月 20 日,他们带来了压轴大戏——发布了最新的 o3 推理模型,包括 o3 和 o3 mini。

这个活动从 12 月 5 日开始,每天都有直播,内容涵盖了从大项目到小礼物的各种发布和演示。Sam Altman,OpenAI 的首席执行官,在活动开始前就在 X 平台上预告了这场为期 12 天的盛会,并表示他们有一些“很棒的东西”要分享。

OpenAI 的 12 天:o3 推理模型发布与 AI 技术新突破

到了最后一天,OpenAI 果然没有让人失望。他们发布了最新的 o3 模型,这个模型在各种基准测试中表现出色,尤其是在数学和科学领域,比如 AIME 2024 竞赛数学基准和 GPQA 博士级科学基准(涵盖生物学、物理学和化学问题)。o3 还在 ARC-AGI 基准上取得了新的最先进分数,这表明模型正在接近 AGI(通用人工智能),尽管目前还远未达到。

值得一提的是,o3 mini 作为 o3 系列的新成员,提供了三种推理选项:低、中和高。推理时间越长,性能越好。在低水平上,o3 mini 在 Codeforces 竞赛代码基准上的表现与 o1-mini 相当,但在中高水平上,它甚至可以与 o1 相媲美,甚至更好。

此外,OpenAI 还首次向外部安全测试开放了 o3 模型,安全研究人员可以通过填写 OpenAI 网站上的表格申请早期访问权限,截止日期是 1 月 10 日。Sam Altman 在直播结束时还透露,o3 模型计划于 1 月底发布,完整版本将在之后推出。

除了 o3 模型,OpenAI 还介绍了“deliberative alignment”,这是一种新的训练范式,旨在直接教授推理 LLM(大型语言模型)人类编写的安全规范文本,并训练它们在回答之前明确地推理这些规范。

总的来说,OpenAI 的这场“12 天”活动不仅展示了他们在 AI 领域的最新进展,也为即将到来的 2025 年埋下了不少伏笔。对于科技爱好者来说,这无疑是一场不容错过的盛宴。

正文完
 0
admin-gah
版权声明:本文于2024-12-21转载自Zdnet,共计827字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码