发布信息

2024年英伟达GPU销量持续猛增,数据中心市场预计超985亿美元

作者:软荐小编      2024-12-08 16:04:36     108

过去几年,由于人工智能的普及,GPU销量猛增

NVIDIA数据显示,2023年,该公司与AI工作负载相关的NVIDIA数据中心部门销售收入将达到184亿美元,比去年同期增长409%。到 2023 年,英伟达将占据数据中心 GPU 市场约 98% 的份额,其旗舰 H100 芯片几乎没有竞争对手。

进入2024年,英伟达的GPU销量依然在猛增。英伟达CEO黄詹勋也直言,该公司新推出的Blackwell在市场上受到了非常高的关注,很多客户都在购买。 Jon Peddie Research 预计,今年全球 GPU 市场规模预计将超过 985 亿美元。黄仁勋还认为,数据中心运营商将在未来四年花费1万亿美元升级基础设施,以满足AI开发者的需求,因此这个机会足以支持多个GPU供应商。

近日有消息称,埃隆·马斯克和马克·扎克伯格已率先开启新一轮GPU竞争。

埃隆·马斯克 (Elon Musk) 希望打造 100 万个 GPU 集群

据英国《金融时报》最新报道,埃隆·马斯克旗下人工智能初创公司 xAI 承诺将其 Colossus 超级计算机扩展十倍,容纳超过 100 万个图形处理单元,以超越 Google、OpenAI 和 Anthropic 等竞争对手。

Colossus 于今年早些时候建成仅三个月,被认为是世界上最大的超级计算机,运行着超过 100,000 个互连 Nvidia GPU 的集群。马斯克位于孟菲斯的超级计算机之所以引人注目,是因为他的初创公司能够快速将 GPU 组装成人工智能处理作业集群。 “从开始到完成,只用了122天,”马斯克说。超级计算机通常需要数年时间才能建造。 (关于Elon Musk的集群的信息,可以参考Semiconductor Industry Watch之前的文章《探索世界上最大的GPU集群》)

他的公司可能还花费了至少 30 亿美元来组装超级计算机,因为它目前由 100,000 个 Nvidia H100 GPU 组成,每个 GPU 的成本通常约为 30,000 美元。马斯克现在想用 H200 GPU 升级这台超级计算机,它拥有更多内存,但每个 GPU 的成本接近 40,000 美元。

英伟达还透露,它正在将其“Colossus”超级计算机的规模扩大一倍,并将其称为 xAI。马斯克还在推特上表示,超级计算机很快将在一座 785,000 平方英尺的建筑中配备 200,000 个 H100 和 H200 Nvidia GPU。

戴尔首席运营官 Jeff Clark 在周四接受采访时表示:“我们从头开始,在短短几个月内大规模部署了数万个 GPU。” “集群还在建设中,我们正在脱颖而出。”

如上所述,马斯克的初创公司 xAI 正在开发一个大型设施,以提高其在构建人工智能工具的竞赛中的计算能力。大孟菲斯商会周三也发表声明称,田纳西州孟菲斯工厂的扩建工作已经开始。该商会表示,英伟达、戴尔和超微电脑也将在孟菲斯建立业务以支持扩张,同时将成立“xAI 特别运营团队”,“为企业提供 24/7 的礼宾服务”。

相关报道表明,目前尚不清楚 xAI 计划在扩张期间使用当前一代的 Hopper 还是下一代 Blackwell GPU。 Blackwell 平台预计比 Hopper 具有更好的扩展性,因此使用即将推出的技术而不是现有技术更有意义。但无论如何,由于英伟达产品的巨大需求,获得80万至90万个AI GPU将是困难的。另一个挑战是让 1,000,000 个 GPU 以最高效率协同工作,Blackwell 再次更有意义。

据《华尔街日报》此前报道,英伟达的一名销售主管告诉同事,马斯克对芯片的需求正在给该公司的供应链带来压力。英伟达发言人表示,该公司将继续努力满足所有客户的需求。

当然,这种扩张的资金需求是巨大的。购买 GPU(每个花费数万美元)以及电力和冷却基础设施可能会使投资达到数百亿美元。 xAI 今年已筹集 110 亿美元,最近又筹集了 50 亿美元。目前,该公司估值为 450 亿美元。

meta还斥资数百亿建设数据中心

当埃隆·马斯克 (Elon Musk) 抢购 GPU 时,马克·扎克伯格 (Mark Zuckerberg) 也不甘示弱。

meta Platforms Inc周三表示,计划在路易斯安那州东北部建造一个耗资100亿美元的人工智能数据中心园区,这将是该公司迄今为止建造的最大的数据中心。占地 400 万平方英尺的校园将位于里奇兰教区,这是一个靠近现有公用设施基础设施的主要农村地区的农田。预计施工将于本月破土动工,并持续到 2030 年。

数据中心规划的基础设施将容纳处理海量数据所需的网络和服务器,以支持数字技术不断增长的使用,并将针对对数据和计算要求特别高的人工智能工作负载进行优化。一旦上线,它将能够支持 meta 的所有服务,包括 Facebook、Messenger、Instagram、WhatsApp 和 Threads。

继其他公司努力扩展其数据和计算能力以满足人工智能和机器学习应用程序和工作负载不断增长的需求之后,数据中心投资的消息也随之而来。

meta 数据中心战略总监 Kevin Janda 表示:“meta 正在构建人类互联的未来以及实现这一目标的技术。该数据中心将成为这一使命的重要组成部分。”

路易斯安那州州长杰夫·兰德里表示,新数据中心将为该地区带来新的技术机遇。路易斯安那州经济发展局是一家致力于改善该州商业环境的政府机构,预计该园区将创造约 1,500 个就业岗位。

“meta 的投资将使该地区成为路易斯安那州快速发展的科技产业的支柱,振兴我们州美丽的农村地区之一,并为路易斯安那州工人创造未来高薪工作的机会,”兰德里说。

meta 没有透露新设施将支持多少 GPU,也没有透露计划使用哪家公司的芯片。据Entergy称,该中心将由三座天然气发电厂供电,总发电量为2.2吉瓦。他们还强调,大部分成本将用于加速器以及支持它们的主机、存储和网络。如果假设人工智能设施 90% 的成本是 IT 设备,那么建设该设施的成本为 10 亿美元,设备成本为 90 亿美元。假设 IT 设备成本的一半多一点用于加速器,那么现在的成本为 50 亿美元。按平均价格 25,000 美元计算,这相当于 200,000 个人工智能加速器。如果您假设这个地方将挤满未来本土的 MTIA 加速器,其成本只有这里的一半,那么这些加速器的成本将达到 400,000 美元。

meta首席执行官马克·扎克伯格此前曾表示,到2024年底,该公司将有35万个Nvidia H100芯片在企业数据中心运行,尽管该公司也在开发自己的AI硬件。

谁拥有最多的 GPU?

除了上述两家厂商之外,包括微软、谷歌、AWS和CoreWeave,以及多家国内云厂商也成为了Nvidia GPU的追逐者。 《财富》杂志在最近的一份报告中指出,由三名特别富有的客户组成的精英群体在截至 10 月底的前 9 个月内购买了价值 100 亿美元至 110 亿美元的商品和服务。 (详情请参阅《三个客户力挺Nvidia》一文)。

至于目前的GPU数量,根据博客lesswrong的估计,如果全部换成H100的同等算力的话。截至目前,全球五大科技公司2024年的算力,以及2025年的预测:

该博客还指出,根据 2024 年人工智能状况报告,对主要供应商购买 Blackwell 芯片进行了估算——大型云公司正在大量购买这些 GB200 系统:微软购买了 70 万至 140 万个,谷歌购买了 40 万个,AWS购买了36万。据传OpenAI至少有40万GB200。

可见新一代布莱克威尔很受欢迎。目前正在建设的数据中心可能会使用Nvidia的Blackwell芯片,该公司预计明年将大量出货。不过,市场已经开始期待该公司的Rubin芯片,这是继Blackwell之后的下一代芯片。

Nvidia首席执行官黄仁勋在10月初接受CNBC“Closing Bell Overtime”采访时表示,对该公司下一代人工智能芯片Blackwell的需求“疯狂”。 “每个人都想拥有最多,每个人都想成为第一,”他说。

黄仁勋在接受CNBC采访时表示:“在技术发展如此迅速的时代,我们有机会将投资增加三倍,真正推动创新循环,从而提高产能、增加产量、降低成本、降低能耗我们正在朝这个方向努力,一切都在按计划进行。”

首席财务官科莱特·克雷斯(Colette Kress)8月份表示,公司预计Blackwell第四季度营收将达到数十亿美元。

Jensen 表示,Nvidia 计划每年更新其 AI 平台,将性能提高两到三倍。

Melius Research 分析师 Ben Reitzes 在一份研究报告中写道:“越来越多的人猜测 Nvidia 的下一代 GPU(继 Blackwell 之后)——称为 Rubin——可能会比大多数投资者预期的更好。它将在 2026 年提前 6 个月准备就绪。”

Reitzes 警告称,芯片很少会提早推出,并维持该股 195 美元的目标价,他表示假设 Rubin 在 2026 年下半年部署该芯片。

写在最后

在GPU如此盛行的当下,NVIDIA无疑是最大的赢家。但AMD并不甘心被抛在后面,正在努力成为这个市场的另一个重要参与者。此外,微软、meta、谷歌、AWS等巨头也在打造自己的AI芯片,希望通过自研加速器和NVIDIA GPU在这个市场找到另一个平衡点。

例如,AWS首席执行官马特·加曼(Matt Garman)在最近的一次会议上表示:“今天,GPU实际上只有一种选择,那就是Nvidia。我们认为客户会喜欢有多种选择。”

相关内容 查看全部