MLPerf Training v5.1发布:生成式AI推动基准测试创新

22次阅读
没有评论

共计 1906 个字符,预计需要花费 5 分钟才能阅读完成。

旧金山,2025 年 11 月 12 日(全球新闻社)—— MLCommons® 今日发布了 MLPerf® Training v5.1 基准测试套件的最新结果,展示了人工智能生态系统的快速发展与日益丰富的多样性,以及新一代系统带来的显著性能提升。

MLPerf Training 基准测试套件包含了一系列全系统测试,涵盖了多种机器学习(ML)应用的模型、软件和硬件。这一开源且经过同行评审的基准测试套件为行业竞争提供了一个公平的竞技场,推动了整个行业的创新、性能和能源效率。

MLPerf Training v5.1 发布:生成式 AI 推动基准测试创新

版本 5.1 在系统多样性方面创下了新纪录。本轮基准测试的参与者提交了 65 个独特的系统,涵盖了 12 种不同的硬件加速器和多种软件框架。近一半的提交是多节点系统,与一年前的版本 4.1 相比增加了 86%。这些多节点系统采用了多种不同的网络架构,其中许多还结合了定制解决方案。

在本轮测试中,针对生成式 AI 场景的两个基准测试相比版本 5.0 的结果有了显著的性能提升,甚至超越了摩尔定律预测的改进速度。

“更多硬件系统的选择使客户能够在最先进的 MLPerf 基准测试上进行比较,并做出明智的购买决策,”MLPerf Training 工作组联合主席 Shriya Rishab 表示。“硬件供应商正在利用 MLPerf 展示其产品在多节点环境中的卓越扩展效率,本轮测试中记录的性能改进表明,AI 生态系统中的活跃创新正在产生重大影响。”

MLPerf Training v5.1 轮次包含了来自 20 个提交组织的性能结果:AMD、ASUSTeK、Cisco、Datacrunch、Dell、Giga Computing、HPE、Krai、Lambda、Lenovo、MangoBoost、MiTAC、Nebius、NVIDIA、Oracle、Quanta Cloud Technology、Supermicro、Supermicro + MangoBoost、University of Florida、Wiwynn。“我们特别欢迎首次提交 MLPerf Training 的 Datacrunch、University of Florida 和 Wiwynn,”MLCommons 的 MLPerf 负责人 David Kanter 表示。

提交的模式还显示出对生成式 AI(genAI)任务基准测试的日益重视,Llama 2 70B LoRA 基准测试的提交量增加了 24%,而新的 Llama 3.1 8B 基准测试的提交量相比其替代的 BERT 测试增加了 15%。“总的来说,生成式 AI 基准测试提交量的增加以及这些测试中记录的性能提升表明,社区正高度关注生成式 AI 场景,这在某种程度上是以牺牲 AI 技术其他潜在应用为代价的,”Kanter 表示。“我们很自豪能够提供这些关键洞察,帮助所有利益相关者做出更明智的决策。”

广泛的行业利益相关者的积极参与增强了整个 AI 生态系统,并有助于确保基准测试满足社区的需求。MLCommons 邀请提交者和其他利益相关者加入 MLPerf Training 工作组,帮助继续推动基准测试的发展。

基准测试套件中的测试集合经过精心策划,以跟上领域的发展,并根据 AI 社区专家小组的判断添加、更新或删除个别测试。

在 5.1 版本中,两个之前的测试被新的测试所取代,这些新测试更好地代表了相同任务的最新技术解决方案。具体而言:Llama 3.1 8B 取代了 BERT;Flux.1 取代了 Stable Diffusion v2。

Llama 3.1 8B 是一个用于预训练大型语言模型(LLM)的基准测试。它与套件中已有的 Llama 3.1 405B 基准测试属于同一“家族”,但由于其可训练参数较少,可以在单个节点上运行,并部署到更广泛的系统中。这使得该测试对更多的潜在提交者开放,同时仍然是较大集群性能的良好代理。

Flux.1 是一个基于 Transformer 的文本到图像基准测试。自 2023 年 Stable Diffusion v2 被引入 MLPerf Training 套件以来,文本到图像模型在两个方面取得了重要进展:它们将 Transformer 架构整合到了扩散过程中,并且其参数数量增加了一个数量级。Flux.1 结合了基于 Transformer 的 119 亿参数模型,反映了当前生成式 AI 在文本到图像任务中的最新技术水平。

“AI 领域是一个不断变化的目标,随着新场景和能力的出现而不断发展,”MLPerf Training 工作组联合主席 Paul Baumstarck 表示。“我们将继续推动 MLPerf Training 基准测试套件的演进,以确保我们能够衡量对社区今天和未来都重要的内容。”

请访问 Training 基准测试页面,查看 MLPerf Training v5.1 的完整结果,并获取有关基准测试的更多信息。

正文完
 0
admin-gah
版权声明:本文于2025-11-13转载自GlobeNewswire,共计1906字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码