Nvidia 发布 Blackwell Ultra GB300 和 Vera Rubin，引领 AI 芯片革命

176次阅读

共计 1813 个字符，预计需要花费 5 分钟才能阅读完成。

Nvidia 近日宣布了其下一代 AI 芯片 Blackwell Ultra GB300 和 Vera Rubin，旨在巩固其在人工智能领域的领先地位。Blackwell Ultra 是 Blackwell 的增强版本，尽管 Nvidia 主要将其与 2022 年的 H100 进行比较，但其性能提升显著。

Blackwell Ultra 服务器集群的发布标志着 Nvidia 在 AI 革命中的持续领先。凭借每秒 2,300 美元的利润，Nvidia 的数据中心业务规模庞大，甚至其网络硬件收入已超过游戏 GPU。Blackwell Ultra GB300 将于今年下半年推出，而 Vera Rubin 则计划在明年下半年面世，Rubin Ultra 则将于 2027 年下半年推出。

Blackwell Ultra 并非基于全新架构，而是 Nvidia 加速 AI 芯片生产计划的一部分。Nvidia 在今年的 GDC 主题演讲中，迅速从 Blackwell Ultra 转向，揭示了下一代架构 Vera Rubin，其完整机架的性能预计将是 Blackwell Ultra 的 3.3 倍。

Nvidia 并未明确说明 Blackwell Ultra 相较于原始 Blackwell 的具体改进，但在与记者的预先简报中透露，单个 Ultra 芯片将提供与 Blackwell 相同的 20 petaflops AI 性能，但配备了 288GB 的 HBM3e 内存，而非之前的 192GB。Blackwell Ultra DGX GB300“Superpod”集群将提供与 Blackwell 版本相同的 288 个 CPU、576 个 GPU 和 11.5 exaflops 的 FP4 计算能力，但内存容量为 300TB，而非 240TB。

Nvidia 主要将 Blackwell Ultra 与 2022 年的 H100 芯片进行比较，H100 最初为 Nvidia 带来了 AI 财富。Nvidia 表示，Blackwell Ultra 提供 1.5 倍的 FP4 推理能力，并显著加快“AI 推理”，NVL72 集群能够在短短十秒内运行 DeepSeek-R1 671B 的交互式副本，而 H100 需要 1.5 分钟。这是因为 Blackwell Ultra 每秒可以处理 1,000 个 token，是 2022 年芯片的十倍。

有趣的是，一些公司将能够购买单个 Blackwell Ultra 芯片：Nvidia 宣布了一款名为 DGX Station 的台式机，配备单个 GB300 Blackwell Ultra 芯片、784GB 统一系统内存、内置 800Gbps Nvidia 网络，以及承诺的 20 petaflops AI 性能。Asus、Dell 和 HP 将加入 Boxx、Lambda 和 Supermicro，销售该台式机的版本。

Nvidia 还将提供一款名为 GB300 NVL72 的单机架，提供 1.1 exaflops 的 FP4 计算能力、20TB 的 HBM 内存、40TB 的“快速内存”、130TB/s 的 NVLink 带宽和 14.4 TB/s 的网络速度。

当 Vera Rubin 和 Rubin Ultra 在 2026 年和 2027 年推出时，它们的性能可能会大幅提升。Rubin 的 FP4 计算能力为 50 petaflops，高于 Blackwell 的 20 petaflops。Rubin Ultra 将配备一个芯片，该芯片实际上包含两个连接在一起的 Rubin GPU，性能翻倍，达到 100 petaflops 的 FP4 计算能力，内存容量几乎翻四倍，达到 1TB。

完整的 NVL576 Rubin Ultra 机架声称提供 15 exaflops 的 FP4 推理能力和 5 exaflops 的 FP8 训练能力，Nvidia 表示这是今年推出的 Blackwell Ultra 机架性能的 14 倍。

Nvidia 表示，Blackwell 的出货收入已经达到 110 亿美元；仅前四大买家在 2025 年就购买了 180 万个 Blackwell 芯片。Nvidia 将这些新芯片——以及其所有 AI 芯片——视为未来计算的关键，并试图在今天论证，公司将需要越来越多的计算能力，而不是像一些人在 DeepSeek 动摇投资者假设并导致 Nvidia 股价暴跌后所假设的那样减少需求。在今天的 Nvidia GPU 技术大会上，创始人兼 CEO 黄仁勋表示，为了满足需求，行业需要“比去年这个时候我们以为的还要多 100 倍”。

黄仁勋表示，Nvidia 在 Vera Rubin 之后的下一代架构将于 2028 年推出，命名为 Feynman——可能是以著名理论物理学家理查德·费曼的名字命名。他表示，天文学家 Vera Rubin 的一些家人今天也在观众席中。

正文完