Nvidia 发布 Blackwell Ultra GB300 和 Vera Rubin,引领 AI 芯片革命

54次阅读
没有评论

共计 1813 个字符,预计需要花费 5 分钟才能阅读完成。

Nvidia 近日宣布了其下一代 AI 芯片 Blackwell Ultra GB300 和 Vera Rubin,旨在巩固其在人工智能领域的领先地位。Blackwell Ultra 是 Blackwell 的增强版本,尽管 Nvidia 主要将其与 2022 年的 H100 进行比较,但其性能提升显著。

Blackwell Ultra 服务器集群的发布标志着 Nvidia 在 AI 革命中的持续领先。凭借每秒 2,300 美元的利润,Nvidia 的数据中心业务规模庞大,甚至其网络硬件收入已超过游戏 GPU。Blackwell Ultra GB300 将于今年下半年推出,而 Vera Rubin 则计划在明年下半年面世,Rubin Ultra 则将于 2027 年下半年推出。

Nvidia 发布 Blackwell Ultra GB300 和 Vera Rubin,引领 AI 芯片革命

Blackwell Ultra 并非基于全新架构,而是 Nvidia 加速 AI 芯片生产计划的一部分。Nvidia 在今年的 GDC 主题演讲中,迅速从 Blackwell Ultra 转向,揭示了下一代架构 Vera Rubin,其完整机架的性能预计将是 Blackwell Ultra 的 3.3 倍。

Nvidia 并未明确说明 Blackwell Ultra 相较于原始 Blackwell 的具体改进,但在与记者的预先简报中透露,单个 Ultra 芯片将提供与 Blackwell 相同的 20 petaflops AI 性能,但配备了 288GB 的 HBM3e 内存,而非之前的 192GB。Blackwell Ultra DGX GB300“Superpod”集群将提供与 Blackwell 版本相同的 288 个 CPU、576 个 GPU 和 11.5 exaflops 的 FP4 计算能力,但内存容量为 300TB,而非 240TB。

Nvidia 主要将 Blackwell Ultra 与 2022 年的 H100 芯片进行比较,H100 最初为 Nvidia 带来了 AI 财富。Nvidia 表示,Blackwell Ultra 提供 1.5 倍的 FP4 推理能力,并显著加快“AI 推理”,NVL72 集群能够在短短十秒内运行 DeepSeek-R1 671B 的交互式副本,而 H100 需要 1.5 分钟。这是因为 Blackwell Ultra 每秒可以处理 1,000 个 token,是 2022 年芯片的十倍。

有趣的是,一些公司将能够购买单个 Blackwell Ultra 芯片:Nvidia 宣布了一款名为 DGX Station 的台式机,配备单个 GB300 Blackwell Ultra 芯片、784GB 统一系统内存、内置 800Gbps Nvidia 网络,以及承诺的 20 petaflops AI 性能。Asus、Dell 和 HP 将加入 Boxx、Lambda 和 Supermicro,销售该台式机的版本。

Nvidia 还将提供一款名为 GB300 NVL72 的单机架,提供 1.1 exaflops 的 FP4 计算能力、20TB 的 HBM 内存、40TB 的“快速内存”、130TB/s 的 NVLink 带宽和 14.4 TB/s 的网络速度。

当 Vera Rubin 和 Rubin Ultra 在 2026 年和 2027 年推出时,它们的性能可能会大幅提升。Rubin 的 FP4 计算能力为 50 petaflops,高于 Blackwell 的 20 petaflops。Rubin Ultra 将配备一个芯片,该芯片实际上包含两个连接在一起的 Rubin GPU,性能翻倍,达到 100 petaflops 的 FP4 计算能力,内存容量几乎翻四倍,达到 1TB。

完整的 NVL576 Rubin Ultra 机架声称提供 15 exaflops 的 FP4 推理能力和 5 exaflops 的 FP8 训练能力,Nvidia 表示这是今年推出的 Blackwell Ultra 机架性能的 14 倍。

Nvidia 表示,Blackwell 的出货收入已经达到 110 亿美元;仅前四大买家在 2025 年就购买了 180 万个 Blackwell 芯片。Nvidia 将这些新芯片——以及其所有 AI 芯片——视为未来计算的关键,并试图在今天论证,公司将需要越来越多的计算能力,而不是像一些人在 DeepSeek 动摇投资者假设并导致 Nvidia 股价暴跌后所假设的那样减少需求。在今天的 Nvidia GPU 技术大会上,创始人兼 CEO 黄仁勋表示,为了满足需求,行业需要“比去年这个时候我们以为的还要多 100 倍”。

黄仁勋表示,Nvidia 在 Vera Rubin 之后的下一代架构将于 2028 年推出,命名为 Feynman——可能是以著名理论物理学家理查德·费曼的名字命名。他表示,天文学家 Vera Rubin 的一些家人今天也在观众席中。

正文完
 0
admin-gah
版权声明:本文于2025-03-19转载自TheVerge,共计1813字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码