这两天,中美大模型公司各有大事发生。
4 月 15 日凌晨,OpenAI 推出了 GPT-4.1 系列模型,其中包含 GPT-4.1、GPT-4.1 Mini 以及 GPT-4.1 Nano。这些模型的主要特点是成本降低且速度加快。在同一天,另一家中国知名的 AI 公司智谱 AI 正式开始进行上市辅导备案,并且由中金公司担任辅导机构。备案报告表明,智谱 AI 会在今年的 8 月到 10 月这个时间段内完成 IPO 辅导计划。
3 月底的时候,智谱 AI 的 CEO 张鹏曾向《中国企业家》表示,他认为要实现 AGI 还有很长的路要走。他说不管融了多少钱,那其实都只是在 AGI 道路上的花费而已,未来还需要更多的花费,他们会持续地去做相关的事情。
如今看来,这个“更多的盘缠”就是指IPO。
2025 年开始的时候,DeepSeek 在 AI 圈引起了巨大的轰动。到目前为止,从 R1 模型正式发布到现在已经过去了 86 天。
DeepSeek 以及梁文锋的团队何时会推出新的大模型产品呢?特别是 R1 的更新版。
《中国企业家》对国外 Anthropic、meta 等公司更新大模型的周期进行了统计。如果是模型的重大升级,其周期大概在 5 至 10 个月;而同一版本的功能升级,周期则在 3 至 4 个月之间。
根据 DeepSeek 官网的资料,梁文锋的 AI 团队会让产品更新与国外主流公司保持同步。2024 年 9 月发布了 V2.5,12 月发布了 V3。在 2025 年 3 月,将 V3 更新为 V3-0324 版本。并且几乎每过 3 个月就会有一次升级。
一些预测表明,DeepSeek 下一次对 R1 模型进行更新可能会在 5 月初。在那个时候,可能会提前发布。然而,DeepSeek 方面目前尚未对这种预测作出回应。
OpenAI也在追求更小更快
公开资料表明,GPT-3 的参数规模是 1750 亿。GPT-4 的参数规模为 1.76 万亿。而 GPT-4o 的参数约为 2000 亿规模。此次 OpenAI 推出的 GPT-4.1 Mini 被称作 OpenAI 的高效小型模型。它在多个基准测试中表现超越了 GPT-4o 。同时大幅减少了延迟,并且降低了 83%的成本。
GPT-4.1 Nano 被称作首个超小型模型,它具备支持 100 万 token 上下文窗口的能力,适用于像分类和自动补全这样的低延迟任务。
值得注意的是,上述三个模型把上下文窗口处理的规模从 GPT-4o 的 128K 直接提升到了 100 万 token(1M)。这表明模型在更长的文本里保持专注以及理解的能力得到了增强。
在成本和价格方面,GPT‑4.1 比 GPT‑4o 要便宜 26%。其输入每百万 token 是 2 美元,输出每百万 token 是 8 美元。而 GPT‑4.1 Nano 的输入每百万 token 为 0.1 美元,输出每百万 token 为 0.4 美元。
在标准时间段内,与 DeepSeek 进行对比。V3 模型输入百万 token 的费用是 0.5 元,输出百万 token 的费用是 8 元。R1 推理的费用分别是 1 元和 16 元。
可以说,OpenAI 参与了 token 的价格战。其价格直接与 DeepSeek 相对标。
OpenAI 已暂停了 2 月发布的 GPT-4.5,原因是成本过高,其 API 定价为输入每百万 token75 美元,输出每百万 token150 美元。官方回应称此次调整是为了把更多资源投入到未来模型的研发中。
OpenAI 的 CEO 山姆·阿尔特曼在关于开源的问题上,不得不选择与 DeepSeek 相同的路径。他曾表明,DeepSeek 的出现并没有对 GPT 的增长造成影响,并且 OpenAI 将会推出更优秀的开源模型。
在 DeepSeek 的冲击之下,阿尔特曼曾一度处于恼火的状态,甚至感到恐慌。他在社交平台上指责 R1 模型使用了 GPT 的数据蒸馏。他还写了公开信给美国政府,声称要限制 AI 技术流向中国等国家,并且要禁用 DeepSeek。
但这对 DeepSeek 的影响力没有影响。在英伟达 2025GTC 开幕主题演讲会上,黄仁勋多次提及 R1 模型,并且通过 R1 模型验证了黄仁勋所说的“推理越多,所需算力越多”这一说法。
多个智能体的协作能成倍提高生产力、降低长期成本。
梁文锋的主场时间又快到了
R1 模型“爆火”之后,DeepSeek 在人事布局方面动作不少。3 月份,DeepSeek 官网发布了招聘 CFO、COO、财务负责人岗位的信息。这一行为被一些媒体解读为 DeepSeek 在为融资做准备。在模型方面,DeepSeek 最大的动作是 3 月 25 日发布了 V2 模型的更新版。
目前,DeepSeek 没有发布关于融资方面的信息。4 月 3 日,梁文锋及其团队发表了一篇论文,其题目为《通用奖励建模的推理时间缩放》,该文章阐述了怎样使注意力机制能更高效地处理更长的上下文等内容。
DeepSeek 引发了 AI 圈的轰动之后,外界对它充满了好奇以及新的期待。潞晨科技的 CEO 尤洋在近期接受《中国企业家》采访时表示,如果有机会与梁文锋当面交流,他最想询问梁文锋的是他的最终目标究竟是什么,“梁文锋是想要打造一个成功的商业化公司呢,还是想要通过某些其他的方式去做一些非盈利性的事情?”这两者的差距肯定是很大的。OpenAI 或许仍希望成为一个像 Google 那样具有极高价值的商业化公司。
记者获悉,当下,杭州本地的大公司无法见到梁文锋,深圳的顶级创投也难以见到梁文锋。
近期英伟达表明,美国政府正限制其 H20 芯片向中国出口,H20 芯片对华出口需获得许可证,此要求为“无限期”。
H20 芯片是梁文锋最为在意的“基础设施”。此前,梁文锋在接受媒体采访时表示,他们真正面临的挑战从来都不是资金方面的问题,而是高端芯片的出口禁令。
不过,面对禁令,梁文锋并非消极等待。他在接受媒体采访时曾表示,英伟达的 GPU 并没有什么神秘的地方。然而,要想赶上英伟达,就必须重建团队,并且要付出时间和成本,去追赶下一代技术,而这才是真正的护城河。