共计 1061 个字符,预计需要花费 3 分钟才能阅读完成。
在 Hot Chips 2025 大会上,NVIDIA 的演讲聚焦于其最新发布的 Blackwell RTX 架构,这一架构在神经渲染和游戏领域带来了多项创新。Blackwell RTX 于今年 1 月首次亮相,其核心技术逐渐揭晓,展示了 NVIDIA 在人工智能(AI)和图形处理领域的持续突破。
NVIDIA 的 AI 技术发展可追溯至 2006 年,当时公司推出了 CUDA 架构,为加速计算和 AI 应用奠定了基础。如今,Blackwell RTX 的推出标志着 NVIDIA 在计算密度、稀疏性、新指令集架构(ISA)以及低精度格式等方面的进一步优化,这些创新已超越了传统的摩尔定律。
Blackwell RTX 的核心技术包括实时光线追踪和深度学习超级采样(DLSS),这些技术依赖于 RT 核心和 Tensor 核心的结合。最新的 Blackwell 架构引入了这些技术的最先进版本,并扩展了其功能。在数据中心领域,NVIDIA 引入了 FP4 精度,显著提升了密集型工作负载的性能。NVIDIA 创始人兼 CEO 黄仁勋表示,Blackwell RTX 将 AI 带回其起源领域——图形处理,开启了神经渲染和图形处理的新时代。
Blackwell RTX 的技术亮点包括 DLSS 4、MFG、ACE 和路径追踪等,这些技术显著提升了性能和视觉效果。NVIDIA 宣称,Blackwell RTX 在性能、设计周期和占地面积方面实现了“10 倍的提升”。DLSS 4 利用 AI 生成初始帧后的所有像素,从而缩短渲染时间并延长移动平台的电池续航。
Blackwell RTX 的设计原则包括优化新型神经工作负载、减少内存占用、为神经 + 图形提供服务质量以及可扩展的能效。其架构融合了 AI、Tensor 核心、G7 内存和先进的渲染技术,支持高达 4000 AI TOPS 和 360 RT TFLOPs 的计算能力。此外,Blackwell RTX 还配备了全球最快的内存解决方案,支持 30 Gbps 的 GDDR7 内存。
在专业领域,NVIDIA 展示了 Blackwell RTX 的多项新特性,如通用 MIG(多实例 GPU)功能。通过 MIG,用户可以将 RTX PRO GPU 划分为最多四个实例,每个实例配备 24 GB 显存,从而实现可预测的延迟和吞吐量。NVIDIA 还演示了 RTX PRO 6000 在运行多个《赛博朋克 2077》实例时的扩展能力,展示了其在多租户环境下的卓越性能。
总体而言,Blackwell RTX 架构的发布标志着 NVIDIA 在 AI 和图形处理领域的又一次重大突破。随着更多游戏和内容创作应用开始利用其 AI 和神经增强功能,未来几年开发者如何进一步扩展这些特性,令人期待。