Meta 发布 Llama 4 系列 AI 模型，性能超越竞争对手

214次阅读

共计 883 个字符，预计需要花费 3 分钟才能阅读完成。

Meta 近日发布了其最新的 AI 模型系列 Llama 4，该系列现已为 Meta AI 在网页端及 WhatsApp、Messenger 和 Instagram Direct 等平台提供支持。目前，用户可从 Meta 或 Hugging Face 下载两款模型：Llama 4 Scout 和 Llama 4 Maverick。前者是一款小巧的模型，能够适配单个 Nvidia H100 GPU；后者则更类似于 GPT-4o 和 Gemini 2.0 Flash。此外，Meta 正在训练 Llama 4 Behemoth，Meta CEO 马克·扎克伯格在 Instagram 上称其“已经是全球性能最高的基础模型”。

据 Meta 介绍，Scout 拥有 1000 万 token 的上下文窗口（即 AI 模型的工作记忆），在“广泛报道的基准测试中”击败了 Google 的 Gemma 3 和 Gemini 2.0 Flash-Lite 模型，以及开源的 Mistral 3.1，同时仍能适配单个 Nvidia H100 GPU。Meta 对其更大的 Maverick 模型的性能也做出了类似声明，称其在与 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0 Flash 的对比中表现相当，并在编码和推理任务中与 DeepSeek-V3 结果相近，且“使用的活跃参数不到一半”（活跃参数是指导 AI 模型行为的变量）。

Meta 发布 Llama 4 系列 AI 模型，性能超越竞争对手

与此同时，Llama 4 Behemoth 拥有 2880 亿活跃参数，总参数达到 2 万亿。Meta 再次表示，Behemoth 可以在“多项 STEM 基准测试中”超越其竞争对手，包括 GPT-4.5 和 Claude Sonnet 3.7。

对于 Llama 4，Meta 表示其转向了“专家混合”（MoE）架构，这种方法通过仅使用模型中对特定任务所需的部分来节省资源。Meta 计划在 4 月 29 日举行的 LlamaCon 上讨论 AI 模型和产品的未来计划。

与过去的模型一样，Meta 将 Llama 4 系列称为“开源”，尽管其许可证的不完全开放要求曾受到批评。例如，Llama 4 许可证要求月活跃用户超过 7 亿的商业实体在使用其模型前需向 Meta 申请许可证，开源倡议组织在 2023 年曾指出，这一要求使其“脱离了‘开源’的范畴”。

正文完

AI 模型 Llama 4 Meta 开源性能

发表至： AI行业动态

2025-04-06 08:01

0

版权声明：本文于2025-04-06转载自TheVerge，共计883字。

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

三星Galaxy Buds 3 Pro因质量问题推迟发布

如何利用ChatGPT撰写出色的求职信

APT37 新型网络攻击：利用 JPEG 文件隐藏恶意软件

StarV Air1 – MYVU 和 StarV View：新一代AR智能眼镜

Google Gemini AI 助力快速查找廉价航班，旅行更轻松

ChatGPT新功能引发吉卜力风格艺术抄袭争议

评论（没有评论）

验证码

最新文章