发布信息

中国开源形成集团化作战优势,推动大模型更新并开拓海外市场

作者:软荐小编      2025-04-29 14:01:16     150

中国开源正形成集团化作战优势。DeepSeek和阿里Qwen等基础模型支撑起中国开源上限。更多中小企业在此基础上不断推出垂直模型。这些垂直模型体量更小但能力更强。这使得今年以来中国大模型更新速度不断加快。且不断带来新惊喜。在美国仍以闭源为主的情况下。中国企业拥抱开源。这充分展现了中国的技术自信。还开辟出一条技术普惠与全球共生的新路径。并且持续开拓海外市场。这代表着全球AI技术从“单极霸权”转向“多极共生”

01 中国开源,正形成合力

DeepSeek未经许可使用了GPT的蒸馏数据

这样的指责不但没有给OpenAI挽回面子,反而引来了全球科研从业者的集体嘲笑。

如今,又一个把蒸馏buff叠满的选手出现了。

开源生态论坛_开源国际_

4月13日 昆仑万维推出Skywork-OR1系列模型 即Open Reasoner 1 该系列模型在同规模情况下 性能超过阿里QwQ-32B 并与DeepSeek-R1对齐

昆仑万维资金实力不雄厚,为何能做出SOTA级别的大模型?官方其实不隐瞒,其模型是基于两款模型训练的,一款是DeepSeek-R1-Distill-Qwen-7B,另一款是DeepSeek-R1-Distill-Qwen-32B

DeepSeek的这两款模型进行了蒸馏操作。蒸馏的对象是阿里的Qwen系列模型。这两款模型的情况正如其名字所体现的那样。

昆仑万维在借助优秀开源模型之际,也在为开源社区贡献力量。与仅开源模型权重的DeepSeek不同,昆仑万维还开放了自身使用的数据集以及训练代码,更契合“真开源”理念。这表明,任何用户都能够尝试复刻其模型训练过程。

昆仑万维的这份成果,充分展现了开源最为重要的意义。它不只是为用户提供一个可免费使用的产品。更能让众多开发者借助前人的基础。快速且低成本地推动技术持续向前发展。

实际上,去年业界还在探讨大模型预训练面临瓶颈的情况。今年以来,中国大模型的迭代速度持续加快。而且,越来越多的企业投身于开源之中。

除夕夜,阿里云通义千问开源全新视觉模型Qwen2.5-VL。3月初,其发布并开源全新推理模型QwQ-32B。开源当日,该模型登顶全球主流AI开源社区HuggingFace的趋势榜。

阶跃星辰在约一个月时间内开源三款多模态大模型。其最新开源的是图生视频模型Step-Video-TI2V。该模型支持生成的视频有两大核心特点。一是运动幅度可控。二是镜头运动可控。并且它还自带一定的特效生成能力。

智谱于4月宣布开源32B/9B系列GLM模型。该系列涵盖基座模型、推理模型、沉思模型。这些模型都遵循MIT许可协议。

彻底进行文心大模型的开源

与国内开源生态日益兴盛相比,美国大模型公司至今仍以闭源为主。这为中国大模型出海带来难得机遇。DeepSeek助力印尼教育公司Ruangguru低成本优化教学模型。新加坡B2B旅游技术公司Atlas把Qwen集成到智能客服系统,实现7×24小时多语言支持。

02 为何美国闭源,中国开源?

美国AI倾向于闭源。而中国AI越来越开放。这实际上是两国AI发展环境的必然结果。

美国AI产业主要由科技大厂和风险投资人主导。资方对AI有巨大资本回报预期。所以美国AI模型企业普遍有强烈技术信仰。即追求技术领先。实现一定程度市场垄断后创造巨额利润。其生态天然倾向闭源

以OpenAI的发展历程来说,它创立时是个非盈利实体,之后却越来越封闭。GPT-1的时候是完全开源的,GPT-2部分开源,在遭遇反对后才全面开源,GPT-3正式走向闭源,到了GPT-4,闭源策略进一步加强,模型架构和训练数据完全保密,还限制企业用户的API调用频率。

尽管OpenAI称闭源是出于合规以及管控技术滥用的考虑,但市场普遍觉得,OpenAI转向闭源的标志性事件是,它与微软达成了百亿美元级别的合作,把GPT-3嵌入Azure云服务,进而形成了“技术-资本”闭环

去年10月微软首次在财报披露对OpenAI的投资。当时微软表示,对OpenAIGlobal,LLC进行了投资。总投资承诺为130亿美元。投资按权益法核算。

可以这样理解权益法,微软投资OpenAI是为了获得回报,并非单纯进行慈善科研。显然,OpenAI通过闭源生态售卖高价API,这是其当前最大的收入来源。同时,这也成为了OpenAI不愿开源的最大阻力。

Anthropic从OpenAI分离出来后成立。它从一开始就确定了闭源路线。其大模型产品Claude全面采用了闭源模式。

即便在美国开源领域堪称唯一佼佼者的meta旗下的Llama,在开源时也增添了两条针对友商的条款:

开源模型在meta批准之前 不能应用于 月活超过7亿的产品及服务

不能用Llama模型输出的内容去训练其他大语言模型。不能用Llama模型输出的内容去改进其他大语言模型。

能够看到,就算是开源模型,meta的核心目标依旧是构建自身的AI生态,而不是实现技术普惠。

美国在资本方面选择以闭源为主、开源为辅的AI战略,这可以说是出于纯粹的商业考虑。相比之下,中国自上而下进行顶层设计,从一开始就重视开源,这体现了在自主可控思维下的产业优先发展路径。

早在2017年 中国政府发布了《新一代人工智能发展规划》 明确提出要加快AI与经济深度融合的目标 还要加快AI与社会深度融合的目标 同时部署构筑AI发展的先发优势 2021年 开源相关内容明确列入中国“十四五”规划中 引发各地积极推动技术革新进程

中国科学院院士梅宏曾指出,语言模型未来发展要依靠开源平台。只有处于开放环境,才能保证各行业用户数据上传及业务整合的安全性。也才能保证各行业用户数据上传及业务整合的信任度。

去年12月 工信部等四部门发布《中小企业数字化赋能专项行动方案(2025—2027年)》 其中明确支持开放原子开源基金会设立“中小企业AI开源专项” 提供训练框架 测试工具等可复制且易推广的资源 以此降低企业技术门槛

一个更现实的问题是,因美国潜在技术封锁,中国在AI领域不能单纯做追随者。中国必须打造独立自主的国产生态。在美国已建成以闭源为主的生态情况下,再建闭源生态如同闭门造车。唯有开源生态才能快速推动AI产业发展。

除了顶层支持外,各地对开源生态上也付出了真金白银的支持。

智谱与北京国资联合成立了专注大模型生态投资的Z基金。该基金宣布出资3亿元。用于支持全球范围内AI开源社区的发展。任何基于开源模型(不限于智谱开源模型)的创业项目都可以申请。

中美AI产业在开源与闭源策略上存在分野。其本质是发展逻辑有根本差异。美国受资本驱动。科技大厂与VC的盈利诉求催生了闭源生态。这种生态是“技术垄断-高价变现”模式。即便像meta尝试开源。也摆脱不了商业壁垒的限制。中国依托顶层设计。以“技术平权+产业协同”作为核心理念。通过政策赋能构建开放生态。让开源成为降低技术门槛的基础设施。还能推动实体经济融合这种战略选择塑造了两国AI产业的不同路径。这种战略选择预示着全球AI生态正加速演进。全球AI生态正从“垄断竞争”向“开放共赢”演进。

03 够用就是够好

中国的AI开源生态正在加速中国AI产业化发展。中国的AI开源生态也正在加速全世界的AI产业化发展。中国的AI开源生态让美国技术优先的信仰陷入尴尬陷阱。

4月5日 meta发布了Llama4 称其为有史以来最强多模态大模型 这是面对DeepSeek效应步步紧逼的举措

然而实际测试下来 这是一款令人大失所望的模型 号称10m tokens的上下文长度频繁出现错误 初代小球测试很难完成 出现9.11>9.9的比大小失误 模型上线没几天 高管离职 测试作弊等丑闻被内部员工爆料证实

更多消息证实,Llama4是扎克伯格在形势逼迫下推出的。那么问题来了,为何扎克伯格非要在4月上线呢?

美国AI产业界对技术怀有迷之信仰,觉得自家产品得最强、最先进,所以纷纷展开军备竞赛。训练AI存在边际效应递减情况,大厂消耗大量成本后,技术门槛没建成,反倒陷入算力瓶颈困境。

OpenAI刚推出GPT - 4o的图像生成功能,没过几天Altman就发推文称他们的GPU“快烧了”。Gemini2.5发布不到一周,GoogleAIStudio负责人便表示他们仍被“速率限制”所困扰,开发者每分钟仅能发送20个请求。好像没有哪家公司能够满足超大模型的推理需求。

实际上 美国正走入误区 智源研究院负责人称 若一新模型 以百倍成本 换来基准测试分十分提升 那此新模型 对超八成应用场景 便毫无意义 因其毫无性价比

中国大模型企业加快开源生态建设。看起来不再争抢第一。而是凭借“够用就好”理念。赢得了更多客户认可。特别是工业界客户的认可。

相比于政企客户动辄千万的预算,很多企业和机构有迫切的AI需求。然而他们没有那么多预算。也没有现成解决方案。利用开源模型自行开发几乎成了他们的唯一选择。

宝钢运用冶金工程关键工序的“大模型 + 小模型”开展生产设备智能预警工作 宝钢借助该方式对生产设备进行智能预警 此方式为“大模型 + 小模型”且用于冶金工程关键工序 宝钢通过它实现生产设备智能预警 宝钢利用“大模型 + 小模型”于冶金工程关键工序来做生产设备智能预警 宝钢采用这种办法对生产设备实施智能预警 办法是冶金工程关键工序的“大模型 + 小模型” 宝钢依靠此开展生产设备智能预警 宝钢凭借“大模型 + 小模型”用于冶金工程关键工序的手段进行生产设备智能预警 宝钢以冶金工程关键工序的“大模型 + 小模型”来达成生产设备智能预警 宝钢借助“大模型 + 小模型”用于冶金工程关键工序之举实现生产设备智能预警 宝钢运用“大模型 + 小模型”这种用于冶金工程关键工序的方式开展生产设备智能预警 宝钢采用“大模型 + 小模型”用于冶金工程关键工序的做法进行生产设备智能预警 宝钢通过“大模型 + 小模型”用于冶金工程关键工序来实现生产设备智能预警 宝钢利用“大模型 + 小模型”用于冶金工程关键工序的途径进行生产设备智能预警 宝钢借助“大模型 + 小模型”用于冶金工程关键工序的方式来做生产设备智能预警 宝钢凭借“大模型 + 小模型”用于冶金工程关键工序的办法进行生产设备智能预警 宝钢以“大模型 + 小模型”用于冶金工程关键工序的手段开展生产设备智能预警 宝钢运用“大模型 + 小模型”用于冶金工程关键工序的途径实现生产设备智能预警 宝钢采用“大模型 + 小模型”用于冶金工程关键工序的做法来做生产设备智能预警 宝钢通过“大模型 + 小模型”用于冶金工程关键工序的方式达成生产设备智能预警 宝钢利用“大模型 + 小模型”用于冶金工程关键工序的手段进行生产设备智能预警工作 宝钢借助“大模型 + 小模型”用于冶金工程关键工序的办法开展生产设备智能预警工作 宝钢凭借“大模型 + 小模型”用于冶金工程关键工序的途径进行生产设备智能预警工作 宝钢以“大模型 + 小模型”用于冶金工程关键工序的方式实现生产设备智能预警工作 宝钢运用“大模型 + 小模型”用于冶金工程关键工序的手段来做生产设备智能预警工作 宝钢采用“大模型 + 小模型”用于冶金工程关键工序的做法开展生产设备智能预警工作 宝钢通过“大模型 + 小模型”用于冶金工程关键工序的途径达成生产设备智能预警工作 宝钢利用“大模型 + 小模型”用于冶金工程关键工序的手段进行生产设备的智能预警 宝钢借助“大模型 + 小模型”用于冶金工程关键工序的办法开展生产设备的智能预警 宝钢凭借“大模型 + 小模型”用于冶金工程关键工序的途径进行生产设备的智能预警 宝钢以“大模型 + 小模型”用于冶金工程关键工序的方式实现生产设备的智能预警 宝钢运用“大模型 + 小模型”用于冶金工程关键工序的手段来做生产设备的智能预警 宝钢采用“大模型 + 小模型”用于冶金工程关键工序的做法开展生产设备的智能预警 宝钢通过“大模型 + 小模型”用于冶金工程关键工序的途径达成生产设备的智能预警 宝钢利用“大模型 + 小模型”用于冶金工程关键工序的手段进行生产设备智能预警相关工作 宝钢借助“大模型 + 小模型”用于冶金工程关键工序的办法开展生产设备智能预警相关工作 宝钢凭借“大模型 + 小模型”用于冶金工程关键工序的途径进行生产设备智能预警相关工作 宝钢以“大模型 + 小模型”用于冶金工程关键工序的方式实现生产设备智能预警相关工作 宝钢运用“大模型 + 小模型”用于冶金工程关键工序的手段来做生产设备智能预警相关工作 宝钢采用“大模型 + 小模型”用于冶金工程关键工序的做法开展生产设备智能预警相关工作 宝钢通过“大模型 + 小模型”用于冶金工程关键工序的途径达成生产设备智能预警相关工作 宝钢利用“大模型 + 小模型”用于冶金工程关键工序的手段对生产设备进行智能预警 宝钢借助“

中煤科工的“煤科卫士大模型ChinamjGPT”产生了显著效果。它让煤机装备设备故障停机时间降低了30%。同时,它使煤机装备维修成本降低了20%。

上海孟伯智能物联网科技有限公司打造了边剪检测应用平台。该平台是基于轻量大模型打造的。还打造了连退炉工艺优化应用平台。此平台同样是基于轻量大模型打造的

弥费科技借助大模型技术达成了半导体晶圆厂自动物料搬运系统的智能预测维护。弥费科技借助大模型技术达成了半导体晶圆厂自动物料搬运系统的智能管理。

这些都是开源模型在工业场景落地的代表案例。

而除了工业用途外,开源生态也能帮助更多的公益事业。

山水自然保护中心专注于雪豹以及高原生态系统的保护工作。其布设的红外相机,每一个季度都会拍摄出数量众多的照片或者视频。依靠人工去识别雪豹的踪迹,效率是非常低的。而且这还会耗费大量的时间以及人力。华为昇腾和山水自然保护中心合作开展雪豹踪迹识别工作。华为将三江源红外影像物种识别的相关模型及工具开源。这一举措降低了参与AI开发的门槛。使得更多使用该模型的研究保护机构从中受益。能够汇聚众人力量在数据集、数据处理以及数据清洗等多方面对模型进行优化。

04 开源的 “集市”效应

开源软件运动旗手美国人埃里克·雷蒙德于1999年在《大教堂与集市》一书中提出一个比喻。传统封闭软件开发模式就像建造一座大教堂。软件由少数专家即建筑师在与世隔绝环境中精心设计构建。只有最终完成后才发布给用户。而开放源代码开发模式。软件开发是公开的。软件开发是去中心化的。软件开发是演进式的。它如同一个熙熙攘攘的集市。这个集市看似混乱但充满活力。

书中提到 对于许多类型的软件项目 特别是复杂的系统级软件 像操作系统内核 开放 协作 去中心化的“集市”开发模式 虽看似混乱 但实际上比传统 封闭 集中式的“大教堂”模式更具效率 更能产出高质量 更健壮的软件它借助“早发布、常发布”机制。还利用大规模同行评审这一“足够多的眼睛”机制。能够更快发现错误。进而更快修复错误。能更好吸纳用户反馈。也能更好吸纳社区贡献。以此推动软件快速迭代。还推动软件创新。

Linux等开源项目的巨大成功,验证了雷蒙德的观点。

开源运动曾给美国及世界带来的巨大价值远超投入本身。哈佛大学2024年一份研究报告称。开源投入41.5亿美元。为企业创造了8.8万亿美元价值。即每投入1美元创造2000美元价值。若没有开源。企业在软件上的支出会是现在的3.5倍

如今,中国公司学到了这一点。美国AI企业似乎却忘了。

实际上 对于中国大模型企业而言 就算不考虑社会效益 选择拥抱开源生态 对企业自身也并非没有好处

多家大模型企业都对观察者网表示,开源并非意味着放弃商业化。开源自有其盈利逻辑。相比开源与否,关键问题在于如何在技术上更好地服务客户。

以智谱AI来说 它宣称自己是国内唯一全面对标OpenAI的企业 然而与OpenAI的闭源战略相比 它却是行业内开源战略最坚定的践行者之一

智谱在2023年首先开源国内首个Chat大模型ChatGLM - 6B。智谱成立将近六年。这期间智谱已开源55余款模型。在国际开源社区其累计下载量接近4000万次。

智谱向观察者网表示,智谱期望自身的开源战略,能为北京打造人工智能“全球开源之都”贡献一份力量

具体到商业方面 智谱选择开源来吸引开发者生态 向B端提供付费定制解决方案 也向G端提供付费定制解决方案

而除了卖解决方案,卖API也是一个重要的盈利环节。

以DeepSeek为例 开源模型的第一笔生意是销售高性能API 基础服务免费 企业能提供高性能API服务 按调用量收费 DeepSeek-R1的API定价是每百万输入Token1元 每百万输出tokens16元免费token额度用光。基础API无法满足需求。此时用户倾向于使用付费版。以此保持业务流程稳定性。

和仅有模型服务的企业不同。阿里选择了另外一种开源变现模式。这种模式是生态捆绑。

阿里的Qwen系列身为开源的急先锋。借助全模态开源来吸引开发者运用云计算等基础设施。进而形成场景闭环。其模型在前期仅是一个引子。明码标价的商品实际上是云服务

中国开源大模型在全球化应用方面,已从“技术跟随”转变为“生态主导”。美国处于“闭源垄断”与“开源失控”的两难境地时,中国借助“协议创新 + 场景深耕”,正在重新构建全球AI开源生态的底层逻辑。这场博弈的最终战场,并非在参数规模的竞赛上,而是在AI技术与实体经济深度融合的万亿级市场。

本文源自微信公众号“观网财经” 作者是陈济深和张广凯 36氪经授权予以发布

相关内容 查看全部