共计 1066 个字符,预计需要花费 3 分钟才能阅读完成。
最近,OpenAI 又搞了个大动作,准备推出一款新的 AI 模型,据说比他们现有的产品更厉害,能进行更高级的人类般推理。这无疑加剧了他们与谷歌等竞争对手之间的竞争。
在上周五的直播活动中,OpenAI 发布了这个名为 o3 的新模型。这个模型在回答用户问题之前会花更多时间进行计算,目的是解决那些更复杂的多步骤问题。他们还计划推出一个更小的版本,叫做 o3-mini。
在直播中,OpenAI 展示了 o3 模型在处理编码等复杂问题时,如何比他们去年 9 月推出的 o1 推理模型表现更好。他们还邀请了安全研究人员来测试这些新模型,这是他们在发布新软件前的常规流程之一。OpenAI 的 CEO Sam Altman 在活动中透露,他们计划在 1 月底先发布 o3-mini 模型,随后不久再发布完整的 o3 模型。
OpenAI 在两年前通过发布 ChatGPT 引发了人工智能领域的军备竞赛。最初的 ChatGPT 是由 GPT-3.5 这个大型语言模型驱动的。去年,他们推出了 GPT-4,这个模型被描述为更准确和更具创造性。最近,他们又推出了首个推理模型 o1。有趣的是,他们决定不把新模型命名为 o2,以表示对英国电信品牌 o2 的尊重。
与此同时,其他顶级人工智能开发商也在不断推进他们的技术。比如,谷歌最近推出了他们旗舰模型 Gemini 的新版本,据说比前一版本快两倍,还能“思考、记忆、计划甚至代表你采取行动”。Meta 的 CEO Mark Zuckerberg 也暗示计划在明年推出 Llama 4。
然而,包括 OpenAI 和谷歌在内的几家领先公司,正面临开发新模型的高成本问题,这导致了收益递减。这部分是因为找到足够多新的、高质量的人工训练数据的挑战。为了解决这个问题,公司们正在转向新的策略,比如更加强调所谓的推理能力。
除了模型预览,OpenAI 还发布了一项研究,描述了他们正在使用的一种新方法,以确保像 o1 和 o3 这样的系统能够按照预期运行,并避免帮助用户进行非法活动。这种技术被称为“deliberative alignment”,它使模型在考虑如何回应用户查询时遵循一系列与安全相关的步骤。
对齐(有时称为“alignment”)是构建大型语言模型时的一个技术挑战,这些模型通常在大量互联网数据上进行训练。这一努力因人们的伦理和价值观各异,以及他们对人工智能应被允许和不应被允许做的事情的想法不同而变得复杂。
OpenAI 的最新公告结束了为期 12 天的直播产品发布活动。这家初创公司利用这一系列发布活动,推出了更昂贵的新 ChatGPT Pro 订阅选项,并开始推出名为 Sora 的人工智能视频生成工具,以及其他新产品。