发布信息

GTC 2025亮点回顾:老黄皮衣演讲揭秘AI芯片与机器人时代

作者:软荐小编      2025-03-20 10:01:36     160

北京时间于今天(3 月 19 日)的凌晨时分,一年一度的“AI 界春晚”即 GTC 2025 在加州圣何塞正式开始举行。

英伟达人工智能芯片__英伟达的芯片是什么架构

老黄穿着皮衣,并且没有使用提词器,他脱稿进行了一场时长为 2 个半小时的演讲。他在演讲中从游戏显卡开始讲起,接着聊到了 AI 芯片,最后又谈到了机器人时代。IT 之家现在就来带领大家简要回顾一下这些要点。

一、从 GeForce 游戏显卡聊起

英伟达今年的 GTC 大会上未发布新的 GeForce 游戏显卡产品,然而老黄依然决定从 GeForce 的 25 周年开始谈起。

英伟达的芯片是什么架构__英伟达人工智能芯片

黄仁勋着重指出,当下在全球范围内都已售罄的 RTX 5090 显卡,其体积与前代 RTX 4090 相比,足足小了 30%。

_英伟达人工智能芯片_英伟达的芯片是什么架构

GeForce 把 CUDA 带给了世界,CUDA 使得 AI 有了可能,AI 又反过来使游戏的视觉效果得到了增强。

二、Agentic AI 时代

在发布新产品之前,老黄讨论了我们在 AI 时代的发展阶段。

英伟达的芯片是什么架构_英伟达人工智能芯片_

现在我们处于生成式 AI 这个阶段。依据路线图,我们将会迈向一个 Agentic AI 的时代。接着就是 Physical AI 登场的时候,也就是机器人登场的时候。

英伟达人工智能芯片_英伟达的芯片是什么架构_

老黄觉得,AI 领域中 Scaling Law 的相关故事尚未讲完,并且仍在不断加速,我们对于算力的需求也没有减弱。

数据中心建设预计在 2028 年达到 1 万亿美元。IT 之家注:按照现汇率换算,约合 7.23 万亿元人民币。

三、自动驾驶,安全第一位

自动驾驶汽车的时代已经到来。英伟达将会与 GM 通用汽车展开合作,其目的是打造出未来的自动驾驶汽车。

英伟达人工智能芯片_英伟达的芯片是什么架构_

面对安全问题时,老黄发布了英伟达 Halos。这款系统是全方位的安全系统,涵盖从芯片到系统、软件、算法、策略等方面。其中,700 万行代码都经过了第三方的安全评估。

_英伟达的芯片是什么架构_英伟达人工智能芯片

英伟达人工智能芯片_英伟达的芯片是什么架构_

四、Dynamo,AI 工厂的操作系统

英伟达发布了 Dynamo,其目的是让客户能够“买得越多、省得越多”,并且号称是“AI 工厂的操作系统”。

英伟达人工智能芯片__英伟达的芯片是什么架构

Dynamo 是一个被称作“分布式推理服务库”的东西。从本质上来说,它是一个针对用户需求 token 方面的情况,即当无法生产足够 token 时的一种开源解决方案。

黄仁勋展示了一张图表,这张图表是关于推理的。在这张图表中,X 轴显示的是用户每秒的 Token 数,Y 轴显示的是工厂每秒的 Token 数。

英伟达人工智能芯片_英伟达的芯片是什么架构_

Dynamo 和 Grace Blackwell NVlink72 超级芯片起到了加持作用。Blackwell 与 Hopper 相比,能够实现 25 倍的性能提升。

英伟达的芯片是什么架构__英伟达人工智能芯片

而在推理模型中,这一性能差距更是扩大到了 40 倍。

英伟达的芯片是什么架构_英伟达人工智能芯片_

五、超大杯 Blackwell Ultra 芯片

老黄随后正式发布了之前传言很久的“超大杯”GB300 芯片,并且把它命名为 Blackwell Ultra。这颗芯片单颗配备了 288GB 的 HBM3e 内存,同时还拥有 15PF 的稠密 FP4 算力。

_英伟达人工智能芯片_英伟达的芯片是什么架构

Blackwell Ultra NVL72 平台拥有 72 颗 GB300,它将于 2025 年下半年推出,其算力达到原本 GB200 NVL72 的 1.5 倍。

目前有使用 Blackwell GB200 的客户,这些客户都能够平滑地切换到 Blackwell Ultra。

六、下一代 Rubin 芯片,抢先预览

黄仁勋接着公布了下一代 AI 芯片 Rubin,它位于 Hopper 和 Blackwell 之后。

英伟达的芯片是什么架构_英伟达人工智能芯片_

英伟达选择了薇拉・鲁宾(Vera Rubin,1928–2016,婚前姓 Cooper)来命名。薇拉・鲁宾是一位证实暗物质存在的女性科学先驱。英伟达延续了以杰出科学家命名芯片架构的传统。

Vera Rubin NVL144 会在 2026 年下半年推出。它具备 75TB 带宽和 13TB/s 的 HBM4 内存。这能带来比上面介绍的 GB300 NVL72 高 3.3 倍的性能。

更强的 Rubin Ultra NVL576 会在 2027 年下半年推出。它拥有 365TB 带宽以及 4.6PB/s 的 HBM4e 内存。这能带来比 GB300 NVL72 高 14 倍的性能。

_英伟达的芯片是什么架构_英伟达人工智能芯片

Rubin 的性能比 Hopper 高很多,其性能可达 Hopper 的 900 倍。Blackwell 的性能也不错,是 Hopper 的 68 倍。

_英伟达的芯片是什么架构_英伟达人工智能芯片

英伟达的芯片是什么架构__英伟达人工智能芯片

英伟达为了匹配“AI 工厂”的需求,发布了 Spectrum-X Photonics 这款光电一体化交换机,同时还发布了 Quantum-X Photonics 这款光电一体化交换机,这两款交换机是为连接数百万块 GPU 而做好准备的。

英伟达人工智能芯片_英伟达的芯片是什么架构_

Rubin 的下一代架构会被命名为 Feynman,其目的是纪念在量子力学领域作出巨大贡献的美国物理学家理查德・菲利普斯・费曼。

英伟达的芯片是什么架构__英伟达人工智能芯片

七、全套 AI 计算机,任你选择

看完上面的数据中心产品之后,接下来我们来看看在老黄看来,AI 时代的电脑应该是何种模样。

英伟达人工智能芯片__英伟达的芯片是什么架构

DGX Station 搭载着一颗 GB300 超级芯片。它拥有 784GB 的统一内存。其 AI 算力达到了 20,000 TFLOPS。

英伟达的芯片是什么架构_英伟达人工智能芯片_

之前在 CES 发布的 Project DIGITS 迷你主机,现在正式被定名为 DGX Spark 。只需 3000 美元(按照现汇率约合 21691 元人民币),就能够获得 1000 TFLOPS 的 AI 算力。

英伟达人工智能芯片__英伟达的芯片是什么架构

该专业卡为 RTX PRO 系列 Blackwell 专业卡。

英伟达人工智能芯片_英伟达的芯片是什么架构_

其中,旗舰级的 RTX PRO 6000 系列含有 188 个 RT 核心。

英伟达的芯片是什么架构__英伟达人工智能芯片

八、步入机器人时代

在本次 GTC 的结尾,英伟达开始讨论机器人的相关内容。

英伟达人工智能芯片__英伟达的芯片是什么架构

老黄首先展示了一个物理引擎 Newton,这个物理引擎是与迪士尼团队以及谷歌 Deepmind 团队合作打造的。接着,他把小机器人 Blue 请到了台上,让小机器人 Blue 与大家进行互动。

_英伟达人工智能芯片_英伟达的芯片是什么架构

老黄接着宣布,英伟达 Isaac GROOT N1 这个全球首个人形机器人功能模型将会开源。

英伟达的芯片是什么架构__英伟达人工智能芯片

Blackwell 芯片开始全面生产了。Blackwell Ultra 超大杯会在今年年底登场。面向企业的 AI 产品即将推出。面向个人的 AI 产品也在筹备之中。机器人具身智能时代即将来临。

_英伟达人工智能芯片_英伟达的芯片是什么架构

英伟达在 GTC 2025 上传达出一个强烈信息,其简单意思是我们对 AI 算力的需求在持续加快,大家快来购买吧。

相关内容 查看全部