OpenAI重磅开源AI模型,引领AI技术新浪潮

2次阅读
没有评论

共计 925 个字符,预计需要花费 3 分钟才能阅读完成。

OpenAI 近日发布了两款全新的开放权重 AI 模型——gpt-oss-120b 和 gpt-oss-20b,标志着这家科技巨头重新回归开源领域。这两款模型采用 Apache 2.0 许可证,这是最宽松的开源许可证之一,允许企业和开发者自由使用、修改和商业化该技术。

这是自 2019 年 GPT- 2 以来,OpenAI 首次公开发布可自由使用的 AI 模型权重。这一举措在科技界引起了广泛关注,因为它打破了大多数大型 AI 公司不公开其代码或大型语言模型(LLM)权重的传统。

OpenAI 重磅开源 AI 模型,引领 AI 技术新浪潮

开放权重模型的最大优势在于,任何人都可以下载、检查、运行或微调 LLM,而无需依赖远程云 API 或将内部敏感数据暴露给外部服务。然而,由于法律和安全问题,OpenAI 并未发布用于这些模型的训练数据。

gpt-oss-120b 模型针对高性能服务器和台式机,配备了增强的规格——60GB 的 VRAM 和多个 GPU。而 gpt-oss-20b 版本则足够紧凑,适用于大多数笔记本电脑。这些模型可以从 Hugging Face 或 GitHub 下载,但硬件必须专门运行 MacOS 或 Linux 才能运行程序。

OpenAI 表示,gpt-oss-120b 模型在核心推理基准测试中实现了与 OpenAI o4-mini 接近的同等水平,同时在单个 80GB GPU 上高效运行。gpt-oss-20b 模型在常见基准测试中提供了与 OpenAI o3‑mini 相似的结果,并且可以在仅 16GB 内存的边缘设备上运行。

AI 专家 Nate Jones 已经进行了测试并报告说,这个模型特别旨在重新夺回美国在开源模型中的主导地位。早期测试表明幻觉的风险高于平常,但模型的力量是真实的,并继续强调 AI 进展的速度。

这两个模型都采用了混合专家(MoE)架构,提供了强大的推理能力,同时优化了效率和工具使用。程序员会对它的代码执行能力感兴趣,而作家和研究人员会发现它包含的网页搜索作为其思维过程的一部分很有趣。

OpenAI 的这一举措显然是为了应对中国开源的 DeepSeek 模型在 1 月发布后引起的轰动。正如 Altman 在 Reddit 的“问我任何事”中所说,他认为 OpenAI 在开源其软件方面“站在了历史的错误一边”。如今,在 ChatGPT 5 发布前夕,OpenAI 再次站在了历史的正确一边。

正文完
 0
admin-gah
版权声明:本文于2025-08-06转载自Zdnet,共计925字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码