发布信息

深度学习框架在AI技术中的关键作用及中国市场的崛起

作者:软荐小编      2024-12-18 16:03:11     132

AI生成的图片

在AI技术体系中,深度学习框架处于“承前启后”的地位。它在南方赋能多元化算力,在北方孵化各种算法模型。是大型模型行业中不可或缺的一个环节。从全球来看,TensorFlow和PyTorch都具有先发优势,中国市场也不例外。不过,华为推出的MindSpore、百度推出的PaddlePaddle等国内力量正在加速追赶。

在12月14日举行的嵊泗人工智能框架峰会上,18家单位发布了基于嵊泗的原生开发模型成果。预计2024年嵊泗在中国AI框架新增市场的份额将达到30%。

华为ICT战略与业务发展部总裁彭洪华表示,人工智能框架是AI时代的操作系统和软件基础。领先的AI框架需要同时具备“更高效、更敏捷、更开放”的技术能力和生态能力。未来,华为将持续投资MindSpore,坚持开源方式,推动中国人工智能框架生态健康快速发展。

大型模型如何改变深度学习框架

智浦AI CEO张鹏在会上表示,去年大家更多谈论的是对卡、算力、硬件的需求。今年,算力问题得到缓解,尤其得益于华为升腾的努力。既然硬件资源有了,如何利用好价值数千万元的硬件资源,主要依靠AI大模型训练的框架和基础设施。

现阶段最关键的是提高大模型的训练性能。这是整个行业的首要任务。需要不断完善深度学习框架,让软件更好地适应硬件和上层算法。

“相比国外已经发展了十年甚至更久的框架,嵊泗做了很多工作,智浦也合作增强了分布式并行能力,增强了从训练到推理的一致性和部署可用性。最重要的是重要的是我们终于突破了从0到1的核心技术,并且在我们自己的手中,能够实现全栈自主创新的不断演进和创新。”张鹏说。

他还在现场透露,智浦从2020年开始就与国内多个生态系统合作,包括升腾系列硬件,并联合升思MindSpore进行完全自主创新的国内大规模模型训练。

智浦AI的明星产品CodeGeeX在疫情期间诞生。智浦和华为各自投入了数十人的团队,通过分布式协作完成算法调优、集群稳定性维护、推理构建等工作。如今,CodeGeeX已经更新迭代了四代模型。

MindSpore开源社区主席丁诚也提到,大模型技术还在突飞猛进的发展,MindSpore重点关注两点。

首先,大型模型的参数数量、序列长度和模态结构继续以指数速度发展。对此,深度学习框架必须解决异构模型带来的计算不平衡问题、超长序列带来的内存爆炸问题、并行模型带来的流水线空炮问题。

其次,Open AI发布了o1,将计算过程从单一任务、单一模型转变为融​​合深度学习和强化学习的多任务、多模型方式。为此,深度学习框架需要解决多模型协同交互的复杂问题。编程问题、推理和强化学习任务的混合部署和调度、训练和推理权重的在线转换、并行策略的动态调整。

开源份额4年达30%,生思成为增长最快的AI框架

开源是嵊泗快速追赶先进框架的主要策略。比如大车型的爆发带来了新的需求。嵊泗从社区论坛收集了3700多个技术问题,然后进行了有针对性的技术预研和规划。中国工程院院士何友表示,作为自主创新的AI框架,嵊泗的开源实践在大模型时代显得尤为重要,部分指标甚至与国际水平相当。

彭红华提到,嵊泗未来主要将在三个层次上发展。在开发者编程体验方面,盛思兼容行业主流生态,提供一致的开发体验,持续降低迁移学习成本;

在大模型训练方面,提供更丰富的分布式并行策略,结合自动搜索模拟优化,节省大模型训练的端到端成本;

面对最新类o1模型带来的技术挑战,我们完善了多模型多任务调度以及训练与提升之间的无缝转换能力,强化了学习亲和力架构,加速了类o1模型的演进升级;面向AI for Science场景,盛思不断升级底层功能,提供独特的编程体验,打造高性能的AI for Science赋能套件,与行业用户、科研机构、学术专家合作,加速科研创新,促进科研成果转化。科技进步。

现场公布的数据显示,MindSpore自2020年开源以来,目前已孵化支持超过50个国内外主流大模型;开源版本累计下载量1100万次,覆盖全球130多个国家和地区的2400多名用户。城市;超过 37,000 名开发者参与社区贡献。

此外,嵊泗还与360多家大学科研院所开展教学科研合作,与1700多家生态伙伴合作,打造了2000+解决方案。据PaperwithCode网站显示,已支持基于嵊泗发表原创论文1700余篇,位居榜单第一。世界第二、中国第一。预计2024年盛思在中国AI框架新增市场的份额将达到30%。(本文首发于钛媒体APP,作者|张帅,编辑|盖宏达)

更多精彩内容,关注钛媒体微信ID(ID:taimeiiti),或下载钛媒体App

相关内容 查看全部