共计 1134 个字符,预计需要花费 3 分钟才能阅读完成。
阿里巴巴近日发布了其开源大语言模型系列的最新成员——Qwen3,这一举动被专家视为中国蓬勃发展的开源人工智能领域的又一重要里程碑。Qwen3 不仅继承了传统大语言模型的能力,还引入了“先进的动态推理”,成为阿里巴巴首次涉足的“混合推理模型”。
据阿里巴巴介绍,Qwen3 在推理、指令跟随、工具使用和多语言任务方面均有显著提升,其性能在多个行业基准测试中与 DeepSeek 的 R1 等顶级模型不相上下。该模型系列包括八种不同的架构和规模变体,为开发者在使用 Qwen 为手机等边缘设备构建 AI 应用时提供了极大的灵活性。
Qwen3 的独特之处在于其能够在“思考模式”和“非思考模式”之间无缝切换。前者用于处理编码等复杂任务,后者则用于更快地提供通用响应。阿里巴巴特别指出,与其它最先进的模型相比,Qwen3-235B-A22B MoE 模型显著降低了部署成本,进一步体现了公司对高性能 AI 普及的承诺。
新模型已在 Hugging Face 和 GitHub 等平台以及阿里云的 Web 界面上免费提供给个人用户。Qwen3 还被用于驱动阿里巴巴的 AI 助手 Quark,展示了其在商业应用中的潜力。
AI 分析师指出,Qwen3 对阿里巴巴在中国的同行以及美国的行业领导者构成了严峻挑战。Counterpoint Research 的人工智能首席分析师 Wei Sun 表示,Qwen3 系列不仅在性能上表现出色,其多项功能还展示了“模型的应用潜力”,包括混合思维模式、涵盖 119 种语言和方言的多语言支持以及其开源可用性。
开源软件的普及正在推动中国 AI 领域的创新和采用。今年年初,DeepSeek 的开源 R1 模型震撼了 AI 界,并迅速成为中国 AI 领域和开源模型采用的催化剂。阿里巴巴发布 Qwen 3 系列进一步凸显了中国实验室在开发高度竞争性、创新性和开源模型方面的强大能力,尽管美国出口管制收紧带来了越来越大的压力。
据阿里巴巴介绍,Qwen 已成为全球最广泛采用的开源 AI 模型系列之一,全球下载量超过 3 亿次,并在 Hugging Face 上衍生出超过 10 万个模型。分析师 Ray Wang 表示,这种采用可能会在 Qwen3 上继续,并补充说其性能宣称可能使其成为全球最佳的开源模型——尽管仍落后于 OpenAI 的 o3 和 o4-mini 等全球最前沿的模型。
在 DeepSeek 出现后,百度等中国竞争对手也纷纷推出新的 AI 模型,包括计划转向更开源的商业模式。与此同时,路透社在 2 月份报道称,DeepSeek 正在加速推出其 R1 的继任者,援引匿名消息来源。
在更广泛的美中 AI 竞赛背景下,美国和中国实验室之间的差距已经缩小——可能只有几个月,有些人甚至认为只有几周。随着 Qwen 3 的最新发布和 DeepSeek R2 的即将推出,这一差距不太可能扩大——甚至可能继续缩小。