“AI 六小虎”在过去两年的国内大模型时代具有重要标志意义。它指的是那些在当年最早获得 10 亿 + 美元融资的公司。并且这些公司都拥有自研的千亿参数级大模型。这些大模型在国际基准测试中能够与 GPT - 4、Llama 等进行对标。它们是大模型创业公司。
这是当时那个阶段中国大模型的典型代表,它代表着一个时代的认知。然而如今,随着六家公司走出了各自不同的发展道路,这个符号所蕴含的大模型发展也具有了不同的意义。
两年时间基本完成第一轮较量
2021 年,MiniMax 成立了。
在过去的两年多时间当中,大模型公司主要在模型层展开较量,同时也在产品层展开较量,并且在营销层展开较量。
总体来看,MiniMax 前期在技术方面对外分享得不多,月之暗面前期在技术方面对外分享也不多。不过,它们在产品上更有优势,例如月之暗面大量投放了 kimi,MiniMax 主要推出了出海的 AI 虚拟人物聊天软件 Talkie 等。这些应用的知名度比大模型本身要高。百川将精力放在了模型研发上,阶跃星辰也将精力放在了模型研发上,零一万物同样将精力放在了模型研发上,智谱入局后也将精力放在了模型研发上,大模型的知名度高于后推出的应用。
过去两年里,OpenAI 对国内大模型公司的基座模型研发影响最为显著。从参数达 1 亿多的 GPT-1 到参数为 1.8 万亿的 GPT-4,模型参数成为早期大模型创企竞相争夺的指标。去年上半年,AI 六小虎大多进入了千亿参数模型的行列,然而之后基座模型的参数规模基本上就停留在了这个阶段。
百川在 23 年 6 月首次发布了中英文语言模型 Baichuan - 7B。24 年 1 月又发布了超千亿参数的大语言模型 Baichuan 3。之后过了四个月,发布了 Baichuan4。
阶跃星辰成立一年后的 24 年 3 月,首次发布了千亿参数语言大模型 Step-1 以及 Step-1V 千亿参数多模态大模型,还有 Step-2 万亿参数 MoE 语言大模型的预览版。同年 7 月,再次发布了 Step-2 的正式版、Step-1.5V 多模态大模型以及 Step-1X 图像生成大模型。
零一万物在 11 月开源发布了首款预训练大模型 Yi - 34B。24 年 5 月,它又发布了千亿参数闭源大模型 Yi - Large。
MiniMax 的 ABAB 大模型于 2023 年 8 月完成备案并向公众开放。去年 4 月,发布了 ABAB 具有 6.5 万亿参数的 MoE 模型,该模型支持 245k 上下文窗口。
智谱在 2021 年开源了百亿规模的大模型 GLM-10B。2022 年 8 月,发布了千亿参数的大模型 GLM-130B。到 2024 年 1 月,迭代到了最新的 GLM-4。
这一时期,月之暗面没有公布基座模型的参数信息。在技术方面,是凭借长上下文而获得关注并出圈的。
第一轮关于参数的争夺已基本结束。然而,当下基座模型的参数量仍远未达到瓶颈,也未满足人类顺利使用大模型的需求目标。不再仅仅追求参数规模,这反映出大模型一直以来都处于困境之中。
白鲸开源 CEO 郭炜表示,大模型公司竞争的关键要素未曾改变,模型参数规模一直是重要的衡量指标。然而,中国原创大模型都面临着“三不够”的挑战,即钱不够、卡不够、数据不够。在这种情况下,大模型的参数很难提升上去。
基座模型最核心的问题是需要持续投入大量算力以及密集的高端人才。处于追赶阶段的大模型公司需要投入得更多。并且,基座模型的盈利周期比较长,在短时间内难以具备自我造血的能力。这就要求企业要么持续进行大规模融资,要么自身拥有足够充足的现金流来支撑长期竞争。
对于初期还在快速向前奔跑的公司而言,降本并非一件重要的事情,占领市场更为重要。郭炜觉得,等察觉到“三不够”的时候再去做降本这件事也是来得及的,不过这就要看公司的战略决心以及战略眼光了。
在存在“三不够”这种状况时,AI 六小虎早就已经在不同的赛道上发展了。这并不是仅仅因为 DeepSeek 这一个原因,更多的是在资源不够充足的情况下,有些企业开始改变策略,转而寻求其他的途径。它们在新的大模型下进行蒸馏和工程化的创新,在细分领域深入地耕耘领域大模型,在全球化的领域想方设法去做应用并获取收益。这些都是出于无奈而做出的选择。
比如,百川现在转向了垂直模型。去年 2 月的时候,百川发布了医疗垂域的通用大模型 baichuan2-Turbo。同年 12 月,推出了全链路领域增强的金融大模型 Baichuan4 - Finance。今年 3 月有消息称,百川再次收缩和裁撤了金融业务,全力投入医疗领域,并且也暂停了预训练。
零一万物去年 5 月放弃了原定的万亿参数 Yi-X-Large 模型训练计划。它转而训练更轻量化且更具商业落地前景的 MoE(混合专家)模型 Yi-Lightning。2025 年,零一万物与阿里云合作,把耗费成本和精力更大的超大模型交给阿里训练,并且明确表示不会再进行万亿以上超大参数模型的研发。
张鹏近期表示,智谱仍在进行预训练模型的研发,并非仅仅训练小模型。去年年底,阶跃星辰宣称自己会坚持预训练,并继续冲击 AGI。目前,MiniMax 和月之暗面也没有停止预训练的相关消息。由此可见,基础大模型的参数之争或许不再那么激烈,但整体的竞争还远远没有到得出最终结果的时候。
DeepSeek 催化各方迅速决策
推理是在大模型烧钱的背景下所做出的一个重要路径选择。2024 年 9 月,OpenAI 发布了推理模型 GPT-o1,此模型成为大模型竞争的一个分界点。后来者 DeepSeek 无疑成为这次游戏中的最大赢家之一。
有投资人表明,DeepSeek 能够出圈并非凭借模型能力对 OpenAI 或 Claude 的碾压,也并非实现了三五倍的用户体验优势,而是运用了一种带有中国特色的“制造业式”成本控制方式。在各个维度的性能差距仅为 5%-10%的情形下,将推理成本压缩到了 1/30 至 1/50 的程度。
在软件商店中,它以极致的性价比实现了突围。这种出圈的方式反过来印证了当前行业的竞争逻辑。目前,DeepSeek 探索出的这条路径给其他几家的技术路线带来了挑战。
DeepSeek 爆火且开源,这无疑让投资人和大模型企业都感到紧张。然而,他们最终得出的结论是:目前还远远未到能够对整个行业格局做出定论的时候。整个行业依然处于你追我赶的发展阶段,并非已经到达终局。
DeepSeek 最重要的行业影响之一是帮助生态的参与者快速找准了战略定位。之前大家在做大模型、应用开发还是深耕垂直领域等方面存在犹豫,而 DeepSeek 让各方迅速认清了适合自己的发展方向。
百川智能进行了战略收缩,将重点聚焦于 B 端医疗领域并持续深耕。例如,它与北京儿童医院展开合作,以推进医疗大模型的发展,并且在逐步深化技术的场景化能力。然而,目前其基座模型的迭代速度有所放缓,C 端应用的发展没有达到预期,近期人才流失的情况也较为严重。
阶跃星辰拥有万亿级的模型,并且具备多模态技术储备。长期以来,它一直比较低调,在市场声量方面以及用户认知度上,可能比不上其他五家。
零一万物将研发成本进行刻意控制,重点聚焦于轻量级模型。其商业化路径明确为 To B 市场,凭借性价比以及本地化服务来与大厂展开竞争。并且海外用户的付费意愿较为强烈,单款产品的年收入超过亿元。然而,其灵活调整的战略也引发了人才流动以及业务重心频繁转变的问题。
Minimax 是国内首家多模态大模型创业公司,它具备一定的多模态技术积累。同时,在国内外进行了产品的双线布局,并且取得了可观的商业化收入。2024 年收入有望达到 7000 万美元,其中大部分收入来自 Talkie。然而,多模态领域的竞争十分激烈,海外产品也将会面临合规等方面的风险。
智谱持续对基础模型和多模态模型进行迭代,同时实现了技术开源。其商业化路径较为清晰,在 B 端和 G 端市场的表现较为突出。然而,在 B 端服务方面,存在被质疑“只会做定制化项目”的情况,这可能会对规模化发展产生限制。此外,C 端应用的开发和流量方面不够突出。智谱目前已办理辅导备案,备案地点在北京证监局。同时,中国国际金融股份有限公司担任其辅导机构,正在为智谱的上市进程做准备。
月之暗面有很突出的 C 端产品叫 Kimi。然而,前期它过度依赖大厂的流量投放,这使得用户黏性和可持续性遭遇挑战。另外,该模型的信息透明度比较低,最初所建立的长文本优势迅速被打破,所以需要建立新的技术突破,并且 C 端还面临着大厂的挤压风险。
此外,AI 六小虎出现了分化。这一变化使得大厂迎来了赶超的绝佳时机。像阿里的 Qwen 这样的模型,还有字节的豆包等大模型,腾讯混元也在后续开始发力,并且吸纳了大量 DeepSeek 的红利以及流量。
郭炜进行分析指出,AI 六小虎存在“三不够”的情况,而这恰好是大厂所具备的“三够”。与 C 端 App 仅需在短期内烧钱就能得出结果不同,大模型属于一个长期的“全面战争”。在大厂具备“三够”的条件下,它们更有能力坚持下去。
“大模型没有技术壁垒”
对于是否还要投入基础模型的问题,答案其实无外乎坚持和转向。
现在,大模型公司面临的选择大致有两种:一种是转向投入较低的方向,以此来维持更长时间以实现盈利;另一种是继续争取更多资金,去摘取“皇冠上的明珠”。不过,这要取决于市场是否还愿意支持这个还需要持续高投入三、五年之久的梦想。至于最终能够登顶的是谁,取决于其选择的发展路径以及对关键环节的把握,而这个答案可能需要等待两到三年的时间才能知晓。
有部分人对继续坚持基座模型不太看好。某大厂的一位高管觉得,倘若达不到 DeepSeek 的水平,或许就没有必要投入基座大模型的研发。如今这个赛道的门槛高得超乎想象,仅仅训练集群就需要从 1 万张显卡开始,绝大多数公司完全承担不起这样的成本。DeepSeek 团队之所以能够这样做,纯粹是因为他们的老板资金很充足。他认为,现阶段最为现实的途径是等待他们即将开源的新版本。只要他们完整的技术方案得以公开,那么行业跟进所需要花费的成本就会大幅度降低。
该高管认为,只有出现革命性的技术路线突破,例如在多模态领域找到新方向,才值得重点关注。因为多模态技术能够整合图像、语音等多媒体数据,从理论上来说具备几乎无限的数据扩展空间。
基座模型的战略价值较为显著。它一方面为上层应用提供了技术底座,另一方面对整个 AI 生态的发展起到了不可替代的推动作用。
如果要在大模型上继续取得突破,业内人士认为需在两个维度进行突破。其一,模型能力要足够出色,然而这一点实现起来颇为困难,第一波从 60%到 80%准确率较易,而现在从 95%到 97%则会极为艰难;其二,要做好成本控制,能否通过更具创新性的架构,实现比 DeepSeek 更低的推理成本并实现出圈,这也是一条很好的路径。如果这两点无法做到,那么就需要慎重考虑战略转型的问题。要么选择拥抱开源生态并提供 ToB 服务,要么彻底转向产品化去做 ToC 应用。
值得注意的是,郭炜指出,大模型不存在技术壁垒。在商业世界中,技术本身并非壁垒。虽然这种说法有些绝对,但在创业之后,他深刻理解到:超强的技术算法优势背后体现的是人才的竞争;是战略的先知先决;是在困难时刻对战略方向的坚持;是需要大量资本的投入,而这些都与技术本身无关。模型技术能力在短期竞争中起着决定性作用。然而,在中长线竞争里,它绝对不是最重要的壁垒。
目前大模型公司已基本达成开源的共识。郭炜表示:“拥抱开源乃是 AI 六小虎的唯一出路。”
大模型周期较为漫长,投入也颇为巨大。一家公司难以筹集到如此多的资金,难以购置到如此多的卡,也难以找到如此多的数据。只有充分借助开源的方式,才能够建立起市场的认知标准,只有全民共同参与建设,才会有胜利的希望。不然的话,DeepSeek 及其开源大模型相关的生态将会超越 AI 六小虎所取得的所有成就。AI 六小虎只能变成“AI 六小猫”,然后去从事细分领域的模型和应用工作。郭炜分析说道。
国内外的大模型公司一直面临着闭源与开源路线的选择。经过两年的开闭源之争,天平明显倾向了开源。之前闭源的 OpenAI 和百度等也开始拥抱开源。在被曝出开启上市辅导的同一天,智谱一口气上线了三大类最新的 GLM 模型并且将其开源。
商业化,重要吗?
另外,最近能够看到大模型企业开始逐个地“展示客户”,以此来证明自身的商业落地能力。 另外,最近可以察觉到大模型企业开始不断地“展现客户”,用以证明其商业落地能力。 另外,最近能够发觉大模型企业开始陆续地“亮出客户”,来证明它们的商业落地能力。
郭炜表明,商业化对于 AI 六小虎而言并非那么关键。相比之下,收缩战线,达成单点突破(例如 DeepSeek)要比全面展开商业化行动重要许多。
王小川在百川两周年的全员信中提到了这一点,即过早商业化的问题。基础模型、垂直模型、C 端应用过早商业化,全面布局使得百川智能组织的复杂度极大增加。
有的投资人认为,大模型企业一定要紧跟各种场景,将数据优势充分发挥出来,并且把商业闭环完善好。他们认为,不管世界发生怎样的变化,商业的本质一直都存在。其核心打法就是要做出与他人不同的地方。
实际上,对于一直都在寻求融资的 AI 六小虎而言,不进行商业化似乎是不可能的。AI 六小虎融到的钱不像 DeepSeek 那样,他们融到的钱总有一天会用完。所以,他们必须要自己创造收益,自己产生现金流。
普遍来看,业内人士对 To B 领域更看好。因为这项技术可以大幅提升效率,能够降低成本,还可以减少人力投入。所以开始有一些收入产生。尤其 DeepSeek 极大地缓解了市场教育压力,很多企业是主动进行部署,而不是被动地进行推销。在 To C 领域,目前尚未出现爆款应用。并且,那些紧贴大模型能力开发的应用,一旦基础模型进行升级,许多应用或许就需要彻底发生改变。
关键在于何种应用场景会让用户愿意支付如此高的成本,以使用 AI 来解决问题。在研究领域相对特定且拥有高质量数据集的场景下,用户或许愿意为了发表论文而每个月支付 200 美金。然而,在更发散、更泛化的环境中,情况则完全不一样了。
结束语
在没有跑出最终结果之前,很难去谈论优劣。创业者始终在和时间进行赛跑,要是太早,就会成为“先烈”,要是太晚,连汤都喝不上。在合适的时机、合适的场景下做出合适的产品,这对于创业者来说,既是最难的决策,也是最具趣味的挑战。
郭炜认为,AI 六小虎在大模型领域处于先驱地位,并且是这个市场中最为出色的“教育者”。倘若没有它们,多数技术开发者便无法接触到价格低廉的国产大模型,那样的话,DeepSeek 也就不会有如今的爆点。然而,最终的结果是,先驱能否成为先烈,关键在于在“三不够”的场景下,怎样在大模型领域构建起属于自己的生态和闭环。
郭炜说道,不要去随意谈论这个时代的任何一个大模型创业者,在这个领域里的所有人都可以被称作勇士。
本文来自微信公众号,作者:褚杏娟,36氪经授权发布。