发布信息

亚马逊零售业务遭遇AI芯片短缺危机,启动格陵兰计划优化GPU资源分配

作者:软荐小编      2025-04-23 10:01:11     79

亚马逊2020年增长__亚马逊去年年底哪些产品卖的好

亚马逊

4 月 22 日,凤凰网科技讯。商业内幕曾有报道,在去年的时候,亚马逊那庞大的零售业务遭遇了一个大问题,即它没办法获取到足够的人工智能芯片去完成关键的工作。

大量亚马逊文件表明,项目被推迟了,于是该企业对内部流程进行了彻底改革,同时也对技术进行了彻底改革,以此来解决这一问题。

2024 年初,在亚马逊内部,有一些员工长达数月都未能获得 GPU。这对公司零售部门项目的及时推出造成了扰乱。该零售部门涵盖了亚马逊的电子商务平台以及庞大的物流业务。

当时,亚马逊的零售部门遭遇了供应短缺的情况,短缺的数量为 1000 多个 P5 实例。P5 是 AWS 的云服务器,它最多能够包含 8 个英伟达 H100 GPU。

2024 年 7 月,亚马逊开启了“格陵兰计划”。这是一个“集中式 GPU 协调平台”,其目的是能够更好地对有限的 GPU 供应进行管理和分配。文件表明,该公司还将内部 GPU 使用的审批程序进行了收紧。

文件解释,此平台能够跟踪每个计划的 GPU 使用状况,能够共享闲置的服务器,并且能够实施“回收”举措,把芯片重新分配给更为紧急的项目。该系统还能提供被简化的网络设置以及安全更新,与此同时,会提醒员工和领导留意 GPU 使用率低的项目。

今年,亚马逊要求员工通过格陵兰项目获取所有未来需求的 GPU 容量。该公司预计,这样做能通过减少闲置容量以及优化集群利用率来提高效率。

亚马逊的一项指导方针表明:GPU 是很宝贵的,不能以先到先得的方式进行分配。而是应该依据投资回报率来进行分配,并且要结合常识性的考虑来决定,这样做的目的是促进公司自由现金流的长期增长。

这一努力取得了成效。2024 年 12 月,亚马逊内部进行了预测。该预测表明,2025 年芯片短缺的情况将会有所缓解。并且,芯片的供应有望得到改善。

亚马逊的一位发言人在一封电子邮件中表示,该公司的零售部门通过亚马逊网络服务(AWS)来采购 GPU,现在已经完全具备使用人工智能处理器的能力。

这位发言人称:亚马逊具备充足的 GPU 容量。它能够持续为零售业务以及公司的其他客户展开创新。AWS 很早便意识到,生成式人工智能的创新促使所有客户(其中包含亚马逊)对云计算服务快速采用。他们迅速对客户不断增长的 GPU 需求进行了评估,并采取行动提供客户推动创新所需要的容量。

有这些努力存在,然而仍能看到一些迹象,这些迹象表明亚马逊对 GPU 供应问题存在担忧。

格陵兰计划团队近期发布的一份招聘启事表明,GPU 需求呈现出爆炸式的增长,这已成为这一代所面临的决定性挑战,即“我们怎样才能获得更多的 GPU 容量?”

欢迎下载凤凰新闻客户端来获取更多一手新闻并订阅凤凰网科技。若想看深度报道,可通过微信搜索“凤凰网科技”。

相关内容 查看全部