近两年,AI 大模型加速发展,使得对算力的需求加快。相关数据表明,大模型的发展让人工智能从 1.0 时代进化到 2.0 时代,每年对算力的需求增速达到 10 倍。当下,以大模型为基础特征的 AI 2.0 时代已经来临,“大模型+大算力+大数据”成为新一代人工智能发展的基本模式。
AI 的应用场景在不断地丰富,AI 大模型的更新换代在加速,AI 对于算力的需求也在持续地扩张。《算力基础设施高质量发展行动计划》提出,到 2025 年,中国的智能算力所占的比例将会达到 35%。然而,从算力基础设施这个角度去看的话,还是不能够很好地满足行业对于算力的需求。
过去以通用算力为基础。大模型爆发之前,通用算力每年算力的增长符合摩尔时代的摩尔定律。2008 年以后有了人工智能的需求,以深度学习为发展方向,每年的增速开始出现高速增长,从每 18 个月翻一番变为每 6 个月翻一番。
今年春节期间,DeepSeek 非常火爆。它对中美 AI 之间的竞争以及算力的格局都带来了巨大的改变。中科院计算所研究员张云泉指出,DeepSeek 的诞生意味着在 AI 领域有了新的技术突破,特别是在低算力训练和高效率模型优化方面。这会推动 AI 技术朝着更高效和普惠的方向发展。
人工智能不断涌现,它在重塑我们的生产方式、生活方式以及数据治理方式。同时,它深刻影响了传统的生产方式和生产关系。DeepSeek 是其中的代表,它极大地降低了大模型部署的成本,将其覆盖面大幅拓展,以较低水平达到了国际领先水平,打破了美国在最近一段时间对我们算力的围剿。这一突破使得全球市场对大模型发展的成本曲线进行重新评估,同时也推动了国内芯片以及云计算等基础设施的加速升级。
谈及这一轮 DeepSeek 带来的冲击和影响时,燧弘华创执行总裁唐锋认为,需要打破 AI 迷信。过去人们谈到 AI 时,脑海中浮现的都是美国处于领先地位,中国紧随其后。而实际上,如今我们正以不可阻挡的态势,无论是从芯片方面,还是从应用方面,都在重塑全球人工智能领域的话语权。
最近一段时间行业内有关于算力过剩的话题,对此他给出了自己的看法。他称,DeepSeek 出现后,推理的算力需求大幅增长。从事这个行业的人要树立 AI 信仰,因为算力是源源不断的,是不够的,且未来其增长不是线性的,而是指数的。
我们的智算中心去年大部分是续建工程,还有一部分是用于大模型试用的推理。DeepSeek 出现后,整个推理领域迎来了爆发,各行各业都开始应用算力,像在医疗领域、政务领域、教育领域以及智能制造领域等。
值得一提的是,DeepSeek 引发了 AI 应用的革命,同时也突破了算力瓶颈。这使得作为“中国算谷”的庆阳,获得了前所未有的关注。据相关介绍,庆阳既是全国一体化算力网络的国家枢纽节点,又是国家数据中心集群,是“东数西算”工程的重要枢纽。唐锋介绍称,正在与庆阳市政府共同制定一个投资建设规划。未来在庆阳,预计投资将超过 128 亿,用于建设整个算力基础建设。
可以确定的是,人工智能是新质生产力的重要驱动力,智算中心是新时代人工智能的重要基础设施之一。然而,在算力层面,国内的智算中心存在一些问题。尽管其总的性能达到了世界第二,但在高端智算方面仍然紧缺,存在结构性问题,与国际领先水平还有较大差距。
AI 2.0 时代已经到来。所谓算力好用,意味着要通过提供从芯片到应用的端到端整体算力优化,以此来实现算力效率和算力性能的大幅提升,从而满足多样化复杂应用的升级需求。在应对算力方面的挑战时,张云泉认为,一方面要加强人才培养,另一方面要建立我们自己的标准体系。一是要在平台化建设方面加大力度,借助平台来赋予力量,为更多创业者赋予力量。通过这个平台的建设,能够构建起创新生态,让大家在同一个生态和平台上一同发展,借此来借助力量,从而降低成本和开销。
据悉,联想是 AI 基础设施提供商,它已经构建了“一横五纵”的战略。其目的是借助联想万全异构智算平台,打造出服务器这一产品能力,打造出存储这一产品能力,打造出数据网络这一产品能力,打造出软件及超融合这一产品能力,打造出边缘计算这一产品能力。其中,“一横”实现了对“五纵”能力的全面提升。万全异构智算平台成为了 AI 2.0 时代大模型训练和推理的基础性架构底座。它对如今整体布局的基础设施进行了重新的调整与升级,从而达成了真正的 AI 导向。
联想中国基础设施业务群的战略总监黄山介绍说,万全异构智算平台有这样的能力:可以统一管理异构算力,达成对异构计算集群的高效管理与调度,还能保障其可用性,让客户能够获取到融合且稳定的通用、智能以及科学算力。
去年 4 月,异构智算产业生态联盟成立了。在 DeepSeek 大模型引领 AI 浪潮的这个时候,联想一直与异构智算产业生态联盟一起推动技术创新和产业落地。到 2025 年,联想和燧弘华创一起携手,在庆阳绿色智算中心推动了多元异构算力调度平台的突破性部署,这标志着异构算力在超大规模智算场景中实现了从技术攻坚到产业化应用的跨越。
联想中国基础设施业务群战略总监黄山
我们在第一时间于庆阳为燧弘进行 DeepSeek 部署。第一天,我们使用 2 台机器,先部署了一个完整性能的 671B。春节结束后的今天,我们能够在 1 台机器上支撑千人企业对 DeepSeek 满血版的应用。黄山表示,目前 DeepSeek 已开源的方法在推理和联想方面都已运用,并且还进行了二次开发,所以会比开源方法更优化。在 DeepSeek 未开源的部分,如传输层优化中的一些通信言语优化等,以及在专家调度方面,会做出具有差异化的调优能力。
据悉,联想及其生态伙伴在庆阳搭建了联想万全异构智算平台。该平台在管理 142 节点千卡进行 DeepSeek 后训练时,通过调优技术使训练 MFU 达到 60%以上。并且在训练期间,人为加入多类故障后,进行故障断点续训的时间小于 1 分钟。其极限吞吐量能够超过 8000 tokens/s。
此外,在算力发展期间,经营模式有了一些改变。原本 2B 端可能更多地朝着 2C 端转变。面对当前众多行业的新需求,黄山进一步表明,算力的需求实际上并未减少,近期是从预训练算力的需求转为了后训练和推理。今年要与智算中心一同为千行百业提供服务,各个行业都需要推理服务以及智能体开发平台,因此今年会在生态方面进一步拓展,并且从低到高把行业标准做好。