NVIDIA Blackwell RTX架构：AI与图形处理的革命性突破

86次阅读

共计 1061 个字符，预计需要花费 3 分钟才能阅读完成。

在 Hot Chips 2025 大会上，NVIDIA 的演讲聚焦于其最新发布的 Blackwell RTX 架构，这一架构在神经渲染和游戏领域带来了多项创新。Blackwell RTX 于今年 1 月首次亮相，其核心技术逐渐揭晓，展示了 NVIDIA 在人工智能（AI）和图形处理领域的持续突破。

NVIDIA 的 AI 技术发展可追溯至 2006 年，当时公司推出了 CUDA 架构，为加速计算和 AI 应用奠定了基础。如今，Blackwell RTX 的推出标志着 NVIDIA 在计算密度、稀疏性、新指令集架构（ISA）以及低精度格式等方面的进一步优化，这些创新已超越了传统的摩尔定律。

NVIDIA Blackwell RTX 架构：AI 与图形处理的革命性突破

Blackwell RTX 的核心技术包括实时光线追踪和深度学习超级采样（DLSS），这些技术依赖于 RT 核心和 Tensor 核心的结合。最新的 Blackwell 架构引入了这些技术的最先进版本，并扩展了其功能。在数据中心领域，NVIDIA 引入了 FP4 精度，显著提升了密集型工作负载的性能。NVIDIA 创始人兼 CEO 黄仁勋表示，Blackwell RTX 将 AI 带回其起源领域——图形处理，开启了神经渲染和图形处理的新时代。

Blackwell RTX 的技术亮点包括 DLSS 4、MFG、ACE 和路径追踪等，这些技术显著提升了性能和视觉效果。NVIDIA 宣称，Blackwell RTX 在性能、设计周期和占地面积方面实现了“10 倍的提升”。DLSS 4 利用 AI 生成初始帧后的所有像素，从而缩短渲染时间并延长移动平台的电池续航。

Blackwell RTX 的设计原则包括优化新型神经工作负载、减少内存占用、为神经 + 图形提供服务质量以及可扩展的能效。其架构融合了 AI、Tensor 核心、G7 内存和先进的渲染技术，支持高达 4000 AI TOPS 和 360 RT TFLOPs 的计算能力。此外，Blackwell RTX 还配备了全球最快的内存解决方案，支持 30 Gbps 的 GDDR7 内存。

在专业领域，NVIDIA 展示了 Blackwell RTX 的多项新特性，如通用 MIG（多实例 GPU）功能。通过 MIG，用户可以将 RTX PRO GPU 划分为最多四个实例，每个实例配备 24 GB 显存，从而实现可预测的延迟和吞吐量。NVIDIA 还演示了 RTX PRO 6000 在运行多个《赛博朋克 2077》实例时的扩展能力，展示了其在多租户环境下的卓越性能。

总体而言，Blackwell RTX 架构的发布标志着 NVIDIA 在 AI 和图形处理领域的又一次重大突破。随着更多游戏和内容创作应用开始利用其 AI 和神经增强功能，未来几年开发者如何进一步扩展这些特性，令人期待。

正文完