北京时间于今天(3 月 19 日)的凌晨时分,一年一度的“AI 界春晚”即 GTC 2025 在加州圣何塞正式开始举行。
老黄穿着皮衣,并且没有使用提词器,他脱稿进行了一场时长为 2 个半小时的演讲。他在演讲中从游戏显卡开始讲起,接着聊到了 AI 芯片,最后又谈到了机器人时代。IT 之家现在就来带领大家简要回顾一下这些要点。
一、从 GeForce 游戏显卡聊起
英伟达今年的 GTC 大会上未发布新的 GeForce 游戏显卡产品,然而老黄依然决定从 GeForce 的 25 周年开始谈起。
黄仁勋着重指出,当下在全球范围内都已售罄的 RTX 5090 显卡,其体积与前代 RTX 4090 相比,足足小了 30%。
GeForce 把 CUDA 带给了世界,CUDA 使得 AI 有了可能,AI 又反过来使游戏的视觉效果得到了增强。
二、Agentic AI 时代
在发布新产品之前,老黄讨论了我们在 AI 时代的发展阶段。
现在我们处于生成式 AI 这个阶段。依据路线图,我们将会迈向一个 Agentic AI 的时代。接着就是 Physical AI 登场的时候,也就是机器人登场的时候。
老黄觉得,AI 领域中 Scaling Law 的相关故事尚未讲完,并且仍在不断加速,我们对于算力的需求也没有减弱。
数据中心建设预计在 2028 年达到 1 万亿美元。IT 之家注:按照现汇率换算,约合 7.23 万亿元人民币。
三、自动驾驶,安全第一位
自动驾驶汽车的时代已经到来。英伟达将会与 GM 通用汽车展开合作,其目的是打造出未来的自动驾驶汽车。
面对安全问题时,老黄发布了英伟达 Halos。这款系统是全方位的安全系统,涵盖从芯片到系统、软件、算法、策略等方面。其中,700 万行代码都经过了第三方的安全评估。
四、Dynamo,AI 工厂的操作系统
英伟达发布了 Dynamo,其目的是让客户能够“买得越多、省得越多”,并且号称是“AI 工厂的操作系统”。
Dynamo 是一个被称作“分布式推理服务库”的东西。从本质上来说,它是一个针对用户需求 token 方面的情况,即当无法生产足够 token 时的一种开源解决方案。
黄仁勋展示了一张图表,这张图表是关于推理的。在这张图表中,X 轴显示的是用户每秒的 Token 数,Y 轴显示的是工厂每秒的 Token 数。
Dynamo 和 Grace Blackwell NVlink72 超级芯片起到了加持作用。Blackwell 与 Hopper 相比,能够实现 25 倍的性能提升。
而在推理模型中,这一性能差距更是扩大到了 40 倍。
五、超大杯 Blackwell Ultra 芯片
老黄随后正式发布了之前传言很久的“超大杯”GB300 芯片,并且把它命名为 Blackwell Ultra。这颗芯片单颗配备了 288GB 的 HBM3e 内存,同时还拥有 15PF 的稠密 FP4 算力。
Blackwell Ultra NVL72 平台拥有 72 颗 GB300,它将于 2025 年下半年推出,其算力达到原本 GB200 NVL72 的 1.5 倍。
目前有使用 Blackwell GB200 的客户,这些客户都能够平滑地切换到 Blackwell Ultra。
六、下一代 Rubin 芯片,抢先预览
黄仁勋接着公布了下一代 AI 芯片 Rubin,它位于 Hopper 和 Blackwell 之后。
英伟达选择了薇拉・鲁宾(Vera Rubin,1928–2016,婚前姓 Cooper)来命名。薇拉・鲁宾是一位证实暗物质存在的女性科学先驱。英伟达延续了以杰出科学家命名芯片架构的传统。
Vera Rubin NVL144 会在 2026 年下半年推出。它具备 75TB 带宽和 13TB/s 的 HBM4 内存。这能带来比上面介绍的 GB300 NVL72 高 3.3 倍的性能。
更强的 Rubin Ultra NVL576 会在 2027 年下半年推出。它拥有 365TB 带宽以及 4.6PB/s 的 HBM4e 内存。这能带来比 GB300 NVL72 高 14 倍的性能。
Rubin 的性能比 Hopper 高很多,其性能可达 Hopper 的 900 倍。Blackwell 的性能也不错,是 Hopper 的 68 倍。
英伟达为了匹配“AI 工厂”的需求,发布了 Spectrum-X Photonics 这款光电一体化交换机,同时还发布了 Quantum-X Photonics 这款光电一体化交换机,这两款交换机是为连接数百万块 GPU 而做好准备的。
Rubin 的下一代架构会被命名为 Feynman,其目的是纪念在量子力学领域作出巨大贡献的美国物理学家理查德・菲利普斯・费曼。
七、全套 AI 计算机,任你选择
看完上面的数据中心产品之后,接下来我们来看看在老黄看来,AI 时代的电脑应该是何种模样。
DGX Station 搭载着一颗 GB300 超级芯片。它拥有 784GB 的统一内存。其 AI 算力达到了 20,000 TFLOPS。
之前在 CES 发布的 Project DIGITS 迷你主机,现在正式被定名为 DGX Spark 。只需 3000 美元(按照现汇率约合 21691 元人民币),就能够获得 1000 TFLOPS 的 AI 算力。
该专业卡为 RTX PRO 系列 Blackwell 专业卡。
其中,旗舰级的 RTX PRO 6000 系列含有 188 个 RT 核心。
八、步入机器人时代
在本次 GTC 的结尾,英伟达开始讨论机器人的相关内容。
老黄首先展示了一个物理引擎 Newton,这个物理引擎是与迪士尼团队以及谷歌 Deepmind 团队合作打造的。接着,他把小机器人 Blue 请到了台上,让小机器人 Blue 与大家进行互动。
老黄接着宣布,英伟达 Isaac GROOT N1 这个全球首个人形机器人功能模型将会开源。
Blackwell 芯片开始全面生产了。Blackwell Ultra 超大杯会在今年年底登场。面向企业的 AI 产品即将推出。面向个人的 AI 产品也在筹备之中。机器人具身智能时代即将来临。
英伟达在 GTC 2025 上传达出一个强烈信息,其简单意思是我们对 AI 算力的需求在持续加快,大家快来购买吧。