Meta 发布 Llama 4 系列 AI 模型,性能超越竞争对手

30次阅读
没有评论

共计 883 个字符,预计需要花费 3 分钟才能阅读完成。

Meta 近日发布了其最新的 AI 模型系列 Llama 4,该系列现已为 Meta AI 在网页端及 WhatsApp、Messenger 和 Instagram Direct 等平台提供支持。目前,用户可从 Meta 或 Hugging Face 下载两款模型:Llama 4 Scout 和 Llama 4 Maverick。前者是一款小巧的模型,能够适配单个 Nvidia H100 GPU;后者则更类似于 GPT-4o 和 Gemini 2.0 Flash。此外,Meta 正在训练 Llama 4 Behemoth,Meta CEO 马克·扎克伯格在 Instagram 上称其“已经是全球性能最高的基础模型”。

据 Meta 介绍,Scout 拥有 1000 万 token 的上下文窗口(即 AI 模型的工作记忆),在“广泛报道的基准测试中”击败了 Google 的 Gemma 3 和 Gemini 2.0 Flash-Lite 模型,以及开源的 Mistral 3.1,同时仍能适配单个 Nvidia H100 GPU。Meta 对其更大的 Maverick 模型的性能也做出了类似声明,称其在与 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0 Flash 的对比中表现相当,并在编码和推理任务中与 DeepSeek-V3 结果相近,且“使用的活跃参数不到一半”(活跃参数是指导 AI 模型行为的变量)。

Meta 发布 Llama 4 系列 AI 模型,性能超越竞争对手

与此同时,Llama 4 Behemoth 拥有 2880 亿活跃参数,总参数达到 2 万亿。Meta 再次表示,Behemoth 可以在“多项 STEM 基准测试中”超越其竞争对手,包括 GPT-4.5 和 Claude Sonnet 3.7。

对于 Llama 4,Meta 表示其转向了“专家混合”(MoE)架构,这种方法通过仅使用模型中对特定任务所需的部分来节省资源。Meta 计划在 4 月 29 日举行的 LlamaCon 上讨论 AI 模型和产品的未来计划。

与过去的模型一样,Meta 将 Llama 4 系列称为“开源”,尽管其许可证的不完全开放要求曾受到批评。例如,Llama 4 许可证要求月活跃用户超过 7 亿的商业实体在使用其模型前需向 Meta 申请许可证,开源倡议组织在 2023 年曾指出,这一要求使其“脱离了‘开源’的范畴”。

正文完
 0
admin-gah
版权声明:本文于2025-04-06转载自TheVerge,共计883字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码