猝不及防地,GPT-4就这样退出历史舞台了。
4 月 10 日,OpenAI 作出正式宣布。该宣布表明,即将把两年前推出的 GPT-4 从 GPT 中移除。
4 月 30 日开始,GPT-4 会被现在的默认模型 GPT-4o 完全替换掉。
怀念 GPT-4 的用户们不必悲伤。它依然可以借助 OpenAI API 来继续被使用。
在 GPT-4 退役之前,人们的注意力很有可能会转移到 GPT 的新模型上。
如今各种爆料传得四处皆是。据说,有 GPT-4.1(包含 GPT-4.1-mini、GPT-4.1-nano 以及 GPT-4.1)。去年 12 月宣布的 o3「推理」模型要来了。还有 o4-mini 全新推理模型也要来了。
2023 年 3 月 14 日,GPT-4 正式发布。它席卷全球,在全球引发了滔天巨浪。在接下来的两年内,它引爆了全球 AI 大模型的寒武纪大爆发。
它的出现开启了一个全新的时代,见证了技术的一次大爆发,这次爆发如同井喷一般。它还为后续无数 OpenAI 大模型的繁荣奠定了基础。
如今,这座灯塔终于要退出了。
GPT-4,已成历史尘埃
Perplexity 的 CEO Aravind Srinivas 近期表明,AI 的进步已然跨越了一个关键的节点。在仅仅三个月的时间里,就好像已经跳过了一段历史的篇章。
「我们应该期待,在今年剩余的时间里,变化会来得更快。」
在过去的三个月时间里,我们迎来了 DeepSeek R1、原生图像生成、o3-mini 等重要成果。如今 2025 年已经过去了四个月。
在 AI 领域的诸多消息里,就连 GPT-4 的退出这件事也显得没有那么令人震惊了。
OpenAI 在昨天的更新日志中表示,如今 GPT-4o 已成为了 GPT-4 的合格继任者。
近期进行了升级,提升了它在指令跟随方面的能力,提升了它解决问题的能力,也提升了对话的流畅性。在评估过程中,GPT-4o 在写作方面始终比 GPT-4 优秀,在编码方面始终比 GPT-4 优秀,在 STEM 等方面也始终比 GPT-4 优秀。
现在很多人确实已经不记得自己上一次使用 GPT-4 是在什么时候了。
它确实给许多人带来了美好的回忆,还让人一度认为 AGI 已经到来。
还记得2023年3月,GPT-4推出时全网欢呼的盛况吗?
它在当时上线于 GPT 和微软的 Copilot 网页版聊天机器人中,这一情况引发了全网的惊呼。
这个模型拥有多模态的能力,它可以同时对图像和文本进行理解。它正式开启了 AI“看图说话”的时代,并且在 OpenAI 的模型当中,这是首次出现,这种情况可谓是非常惊人的。
相比于GPT-3.5,GPT-4是一次更重大的认知跃迁。
它是在专业学术基准方面首个达到哈佛、斯坦福毕业生水平的大模型。
它在数学考试中能击败大多数人类;在医学考试中能击败大多数人类;在法律考试中能击败大多数人类。它在 SAT 考试中能交出惊人答卷,能达到 TOP 10%;在 LSAT 考试中能交出惊人答卷,能达到 TOP 10%;在美国律师资格考试中能交出惊人答卷,能达到 TOP 10%。
它的多模态架构,也为后续的模型演进提供了核心蓝本。
从此,大模型的能力阈值有了彻底提升,达到了可用级。这一提升引爆了全球的 AI 应用生态,使得生成式 AI 市场的规模从百亿级别被推升至万亿级别。
它促使了 Code Interpreter 的出现,给开发者带来了极大的帮助,从而对开源生态起到了间接推动的作用。
那时,几乎每天都有一个令人震惊的消息。那是 OpenAI 非常辉煌的时刻,它的每一个举动都吸引着全世界的目光。
当时,全网都在对 GPT-4 的训练成本进行猜测。之后,奥特曼透露了相关信息,称 GPT-4 的训练成本超过了 1 亿美元。
23 年 11 月的时候,速度更快且成本更低的 GPT-4 Turbo 上线了,它接替了之前的地位。
GPT-4,经典高光时刻
还记得这些辉煌时刻吗?
下一个模型是GPT-4.1
前一天,The Verge 独家爆料,OpenAI 准备发布一系列全新模型,这些模型包括 GPT-4.1(包含 GPT-4.1 mini 和 GPT-4.1 nano)、满血版 o3 以及神秘的 o4 系列(o4-mini、o4-mini-high)。
其中,GPT-4.1 是多模态模型 GPT-4o 的改进版,它最快将在下周与大家见面。
AI 工程师 Tibor Blaho 目前已在 GPT 网页代码里发现了对这些模型的引用。
GPT-4.5 已经出现了,然而下一个却是 GPT-4.1,这让人感到疑惑。这种越来越往后退的命名规则,着实让人难以理解。
它在 OpenAI 的大模型谱系中处于一种较为特殊的状态,往前看找不到与之紧密相连的“村”,往后看也找不到可依托的“店”,让人难以确定该将其放置在何种位置。
有人赞叹道:看到从 GPT-1 一直到 o 系列,并且还有更高级别的演变情况。这种演变展示出了不断增加的复杂性以及能力。这就如同在观察人工智能的进化史一般!
关于GPT-4.1,现在坊间已经有了蛛丝马迹。
有人发现,在 GPT 的模型列表里,已经出现了 GPT-4.1 这个选项。
这就意味着,此前泄露的小道消息是真的!这就让大家非常兴奋。
但有一些人对该网友是否造假存在怀疑,他们将网址从 GPT-4o 改成了 GPT-4.1。
这名网友为了证明自己的清白,大方地分享出了自身与 GPT - 4.1 的对话链接。
大家确认这名网友没有撒谎,也没有伪造截图。因为顺着对话链接进行检查的话,会发现 model-slug 确实是 GPT-4.1。
很快,有越来越多的人发现自己也能用GPT-4.1了。
此外,有网友进行推测,奥特曼所说的“Quasars Alpha”,其指代的就是 GPT-4.1。
为保o3发布,测试时间大幅缩短
而FT的报道也再次证实,满血版o3下周很可能再次上线。
知情人士透露,meta、谷歌、xAI 这些对手逼得很紧。OpenAI 为了保持技术优势,也为了从中获利,所以不得不加快模型的发布速度。
为此,曾经进行模型“评估”需要数月时间,也就是测试模型的风险和性能,如今这一过程已被压缩到短短几天。
GPT-4 即将退役,它有着长达 6 个月的评估期。在这 6 个月中,一些危险能力是在测试进行了两个月后才被发现的。
现在给到的时间和资源不够全面测试,无法识别和规避风险。
此前,OpenAI 做出过承诺,要构建定制版的模型,用于评估潜在的滥用风险,像是否有可能促使生物病毒提升传播能力这类情况。
这种方法成本较高。一方面需要聘请外部专家。另一方面要创建像病毒学这样的专业信息数据集,并且把这些数据集“喂”给模型进行微调,这会消耗大量的工程师和计算资源。
很明显,OpenAI 不想在这件事上投入过多精力。他们仅对能力较弱的旧模型进行了微调,而没有将更强、更先进的模型运用到其中。
在 1 月份发布的 o3-mini 安全与性能报告里,只是提及了 GPT-4o 需在微调后才能执行某一生物学任务。而对于 o1 以及 o3-mini 的情况,OpenAI 没有任何提及。
另外,存在一个令人担忧的问题。这个问题是,安全测试所针对的并非是最终向公众发布的模型,而是更为早期的“检查点”(checkpoints)。并且,在这之后,模型还会持续进行更新,以提升其性能和能力。
OpenAI 面对这些质疑进行了回应。它称其评估流程已通过引入自动化测试等方式提升了效率,进而缩短了所需的时间。
目前还没有一套被广泛认可的方案。不过,OpenAI 所采用的方法必定是最为优秀的,并且已经在报告中以公开透明的方式进行了阐述。
OpenAI 指出,测试所依据的检查点跟最终发布的版本近乎一致。
参考资料: