发布信息

中美AI巨头动态:OpenAI发布GPT-4.1系列模型,智谱AI启动上市辅导

作者:软荐小编      2025-04-17 16:01:03     150

从 DeepSeek 以往的产品更新周期来判断,梁文锋的主场时间即将到来。

文|《中国企业家》记者 闫俊文

编辑|张晓迪

头图来源|视觉中国

这两天,中美大模型公司各有大事发生。

4 月 15 日凌晨,OpenAI 推出了 GPT-4.1 系列模型,其中包含 GPT-4.1、GPT-4.1 Mini 以及 GPT-4.1 Nano。这些模型的主要特点是成本降低且速度加快。在同一天,另一家中国知名的 AI 公司智谱 AI 正式开始进行上市辅导备案,并且由中金公司担任辅导机构。备案报告表明,智谱 AI 会在今年 8 月这个时间段到 10 月这个时间段内完成 IPO 辅导计划。

3 月底的时候,智谱 AI 的 CEO 张鹏曾向《中国企业家》透露,他认为要实现 AGI 还有很长的路要走。他说不管融了多少钱,那其实都只是在 AGI 道路上的花费,未来还需要更多的花费,他们会持续地去做相关的事情。

如今看来,这个“更多的盘缠”就是指IPO。

2025 年开始的时候,DeepSeek 在 AI 圈引起了巨大的轰动。到目前为止,从 R1 模型正式发布到现在已经过去了 86 天。

DeepSeek 以及梁文锋的团队何时会推出新的大模型产品呢?特别是 R1 的更新版。

《中国企业家》对国外的 Anthropic、meta 等公司更新大模型的周期进行了统计。若涉及模型的重大升级,其周期大概在 5 至 10 个月;倘若只是同一版本的功能升级,周期则在 3 至 4 个月之间。

DeepSeek 官网数据显示,梁文锋的 AI 团队会更新产品,且与国外主流公司保持同频。2024 年 9 月发布了 V2.5,12 月发布了 V3。2025 年 3 月将 V3 更新为 V3 - 0324 版本,几乎每隔 3 个月就会迎来一次升级。

一些预测表明,DeepSeek 下一次更新 R1 模型或许会在 5 月初。在那个时候,有可能会提前发布。然而,DeepSeek 方面到目前为止还没有对这种预测作出回应。

OpenAI也在追求更小更快

公开资料表明,GPT-3 的参数规模达到 1750 亿。GPT-4 的参数规模是 1.76 万亿。而 GPT-4o 的参数约为 2000 亿规模。此次 OpenAI 推出的 GPT-4.1 Mini 被称作 OpenAI 的高效小型模型。它在多个基准测试中表现超越了 GPT-4o 。同时大幅减少了延迟,并且降低了 83%的成本。

GPT-4.1 Nano 被称作是首个超小型模型,它具备支持 100 万 token 上下文窗口的能力,并且适用于像分类和自动补全这样的低延迟任务。

值得注意的是,上述三个模型把上下文窗口处理的规模从 GPT-4o 的 128K 一下子提升到了 100 万 token(1M)。这表明模型在更长的文本当中保持专注以及理解的能力有所强化。

从成本和价格角度来看,GPT‑4.1 的价格比 GPT‑4o 便宜 26%,其输入每百万 token 是 2 美,输出每百万 token 是 8 美元;而 GPT‑4.1 Nano 的输入每百万 token 为 0.1 美元,输出每百万 token 为 0.4 美元。

在标准时间段内,对比 DeepSeek 而言,V3 模型输入百万 token 的费用是 0.5 元,输出百万 token 的费用是 8 元。R1 推理的费用分别是 1 元和 16 元。

可以说,OpenAI 参与了 token 的价格战。其价格直接与 DeepSeek 相对标。

OpenAI 已暂停了 2 月发布的 GPT-4.5,原因是成本过高,其 API 定价为输入、输出每百万 token 分别是 75 美元和 150 美元。官方回应称此次调整是为了把更多资源投入到未来模型的研发中。

关于开源这方面,OpenAI 的 CEO 山姆·阿尔特曼走上了与 DeepSeek 相同的道路。他曾宣称,DeepSeek 的出现并没有对 GPT 的增长造成影响,并且 OpenAI 将会推出更优秀的开源模型。

不过,在 DeepSeek 的冲击之下,阿尔特曼曾一度处于非常恼火的状态,甚至感到恐慌。他在社交平台上指责 R1 模型使用了 GPT 的数据蒸馏。他还写了公开信给美国政府,声称要限制 AI 技术流向中国等国家,并禁用 DeepSeek。

相关内容 查看全部