OpenAI,正引领生成式AI的革命浪潮。
这家公司怎样确立起行业领先地位呢?它又采取了哪些策略来保持竞争优势呢?
2025 年 3 月 5 日,在伦敦举办的“高盛颠覆性科技峰会”里。OpenAI 的首席财务官 Sarah Friar 对通往 AGI 的发展路径进行了探讨,同时也探讨了资本在 AI 竞赛中的关键作用。
Sarah Friar曾担任高盛科技股权研究的主管。在会议里,她与高盛全球银行与市场部的联席主 Dan Dees 进行了深度对话,这场对话持续了 30 多分钟。
她称:我们或许已经靠近了 AGI 。同时,世界还没有学会怎样将其利用到最大化。
OpenAI 在飞速地向前行进,全方位地发起攻击:从数据中心这一领域到应用层这个层面,各个部分都在进行创新。
左为高盛全球银行与市场部的联席主 Dan Dees 先生,右是 OpenAI 的首席财务官 Sarah Friar 女士。
AI涌起,适逢其会
AI 发展迅猛,OpenAI 表现强劲,在当前最具影响力的技术领域当中,它是最具影响力的公司。
去年 OpenAI 向她抛出橄榄枝的时候,Sarah Friar 真的很难去拒绝。
去年 6 月 10 日,Sarah Friar开始在 OpenAI 工作,其担任的职位是首席财务官。
她认为,AI 浪潮非常宏大,比之前看到的其他科技浪潮都要大。她错过了个人电脑革命。
她认为加入 OpenAI 并投身于 AI 科技浪潮,这是个人所难得的一次机遇,也是一种幸运。
Sarah Friar 在斯坦福商学院进修是在互联网崛起之时。2000 届毕业生都记得,那时互联网泡沫正在膨胀。
互联网泡沫,也被称作 dot-com 泡沫或 dot-com 热潮。它在 20 世纪 90 年代末期出现,最终于 2000 年 3 月 10 日达到顶峰,这是一次股市泡沫。从 1995 年开始到 2000 年 3 月的高峰期这段时间,投资于 NASDAQ 综合指数的资金增长了 800%。而在 2002 年 10 月之前,该指数从其峰值下跌了 78%,把泡沫期间的所有涨幅都回吐了。
随后她又目睹了持续几年的硅谷寒冬。
接着是移动互联网的兴起对企业的重塑情况,后来我在高盛的事业发展轨迹,坦白来讲也主要是围绕着向云计算进行转型而展开的。
如今站在浪潮的另一边,从宏观世界的格局方面来看,从政府的政策方面来看,再到企业级的应用方面来看,对 AI 的影响进行全方位的探讨,这种角色的转换让她感到非常振奋。
而最近,OpenAI关注的焦点是AI基础设施。
这感觉像是“云计算黎明”再度降临,然而 AI 的架构以及构建方式是完全不一样的。
对亲身经历过「云计算黎明」的人来说,这波AI浪潮更加迷人。
OpenAI如何用GPT赋能工作
Sarah Friar 认为当今世界的 CEO 们以及企业领袖们都能意识到 AI 部署的紧迫性,他们甚至都在担心自己已经落后了。
她刚加入 OpenAI 担任 CFO 时,最迫切的需求是:首先要弄清楚,自己的团队,尤其是财务部门,到底该如何运用 GPT 。
当时的情况是,OpenAI 在进行大规模招聘。并且,许多被招聘的员工来自传统企业,这些传统企业尚未应用 AI。
这导致团队在AI应用方面出现了明显的认知断层——
大家对于“谁来做什么以及为什么做”这方面缺乏统一的理解,并且在整体协作方面也缺乏组织性。
她作为团队管理者,采取的第一个行动是亲自筹备了一场黑客马拉松。她召集了销售团队以及解决方案工程师,然后花费了一下午的时间来进行讨论。
从最基础的环节着手,用笔将日常工作中那些具有高度重复性的任务一一罗列出来。
随后将人员按职能进行分组,其中有税务团队一组,采购团队一组,投资者关系团队一组。接着通过小组讨论,促使初步的想法相互碰撞。
即便采用如此简单的方式,现场已经迸发出惊人的热情。
她记得,当时投资者关系团队在筹备一轮大规模的融资事宜。他们深陷于尽职调查的“地狱”之中。
OpenAI 迅速察觉到,那些持续不断的尽职调查问题,尽管它们的细节各不相同,然而其核心模式却高度重复。
当时他们时常加班至深夜,反复遭遇这样的情景:“啊,这位投资人曾问过类似的问题。赶紧找出之前的回复,稍微修改一下然后发出去。”
当定制 GPT 解决方案被开发出来,能够自动回答这些问题的时候,整个团队在会议室里表现出了极度的高兴,他们手舞足蹈,欢呼雀跃。
她深刻意识到这一点:需要让团队成员以第一性原理为起始点,切实去理解 AI 所带来的普适性效能的提升。
GPT 进行了深度研究,OpenAI 在这方面得到了帮助,解决了关于 GPU 融资的分析问题。
她的团队进行了深度研究,从而获取了一份报告,这份报告得到了 OpenAI 内部员工的认可。他们认为,与由两位 MD、三位 VP、六位助理和十位分析师组成的团队相比,DeepResearch 所做的事情要优秀很多。
GPT-3到GPT-4
OpenAI从 GPT-3 过渡到 GPT-4 花费了约一年半到两年的时间。
去年,他们首次部署了推理功能,也就是o系列模型。
这意味着从一个模型,它更倾向于进行预测且能快速响应,变为了能够更像人类那样进行推理的模型。
有一种简单的描述方式是这样的:
想象你在做填字游戏时,例如有一个横向的单词是五个字母的,你觉得它可能是三个不同的词中的一个。
你填写了一个单词,接着转向下一个竖向的线索,察觉到不对劲,第二个字母应当是 A。
这意味着之前的那个答案不正确。你需要将其划掉,然后重新填入另一个词。
所以它会自我回溯。
这一点对于AI智能体非常重要。
但如今,OpenAI远远不止这些。
AI基础设施 2.0:AI工厂
OpenAI 正在深入数据中心,他们认为当前处于 AI 基础设施的第二版本(V2),同时也如黄仁勋所说的“AI 工厂”。
数据中心生成了诸多知识产权(IP),这些 IP 对于 OpenAI 而言是极为重要的。
想象一下亚马逊在电子商务领域获得巨大成功时的样子。他们察觉到 AWS(亚马逊网络服务)开始逐渐形成。
在这个阶段,如果他们决定把这一部分外包给新兴的谷歌或者其他公司,那会是何种情形呢?如果当初亚马逊将 AWS 的所有知识产权都轻易地让给他人,那么如今这家公司将会有怎样的不同呢?
如今,AWS 在云计算市场里所占的市场份额是 40%,并且它拥有 38%的运营利润率。
因此,拥有基础设施能力非常惊人。
但现在 OpenAI 不仅仅局限于模型层面,它还朝着上方进行了扩展,延伸到了 API 层。这种扩展使得 OpenAI 能够将自身的影响力拓展至企业以及开发者。
接着进入到应用层面的上一个层次,也就是怎样去推动功能特性的发展,让消费者在个人生活以及工作当中都喜爱能够得到的东西。
现在在 GPT 的前端页面,用户能够用 Sora 生成视频,能够进行深度研究报告,能够进行搜索,能够创建项目,能够编写代码,还能够创建写作画布。
OpenAI的目标就是不断加载这些功能。
她意识到,GPT 具有很强的用户粘性。她不打算离开 GPT。
从商业视角而言,这是一桩好事。OpenAI 当前正处于这样的一个位置。
她接下来介绍了一些内容。这些内容是关于 OpenAI 实现通用人工智能(AGI)的。具体而言,是 OpenAI 实现通用人工智能(AGI)的五个步骤。
通向AGI的5个阶段
2023 年是实时预测响应的一年。聊天机器人 Chatbot 开始兴起。
2024年,OpenAI把推理带上了台面。
2025年,将是AI智能体的一年。
OpenAI实现通用人工智能(AGI)的五个步骤
去年大概在第三季度或者第四季度的时候,OpenAI开始对这个话题进行讨论。
现在,Agent已经成为整个AI行业公认的术语。
这里的 AI 指的是能够独立为你把工作完成的智能体。这里的 AI 指的是能够独立为你把工作予以完成的智能体。这里的 AI 指的是能够独立为你把工作进行完成的智能体。
这不是虚无缥缈的概念。
实际上,OpenAI已经有三项智能体在运行:
深度研究是一个能够生成深入研究报告的工具。
操作员允许任务工作者在网络上执行某些任务,这些任务可能需要后台处理时间。
即将推出的第三个功能被称作 A-SWE(Agentic Software Engineer)。
A-SWE 不只是如同 Copilot 那般,能提升现有的软件工程师的工作能力,它还是一个能够切实构建应用程序的自主型软件工程师。
它能够接纳需求,并且将其付诸实现。然而,它所做的并不仅仅局限于开发,还承担了所有软件工程师都不愿意去做的那些事情。
它能够从你给予其他任何工程师的 Pull Request(PR)着手,进而构建应用程序。
不仅如此,它还会完成所有软件工程师讨厌去做的事情:
它自己做代码质量保证、错误测试和调试。
并且它还编写文档。
这些都是所有软件工程师不愿意去做的任务。
因此,它可以成倍地提高软件工程团队的效率。
之后是AGI的第四阶段:创新的世界。
在创新的世界里,不是仅仅关乎当今世界已有的知识,而是要懂得怎样去拓展这些知识。
实际上,教授和学者们表示,他们发现模型在专业领域中提出了新的想法。
目前这些想法尚需验证。不过,OpenAI 确实收到了这样的反馈。
从长远的角度来看,代理组织会成为未来的发展走向。 代理组织在未来的发展中将会占据重要地位。 未来的发展方向很可能是代理组织。 代理组织有望成为未来的发展趋势。 代理组织在未来很可能会成为发展的主流。
AGI近在咫尺
OpenAI仍然有迄今为止最领先的模型:o3。
在软件工程领域中,o3 竞赛性编程的表现情况是:其是在全球排名第 175 位的竞赛性程序员。
在数学竞赛中,它只错了一道题。
在博士级别的科学领域中,它在物理方面达到了博士水平,在化学方面达到了博士水平,在生物学方面也达到了博士水平。
有 4 个被广泛认可的基准测试,这些测试用于衡量 AI 是否在朝着 AGI(通用人工智能)的方向发展,也就是是否真正达到了人类智能的水平,甚至超越了人类智能的水平。
OpenAI 的产品团队觉得,o3 mini 已然成为了在全球范围内极具竞争力的程序员。
在Sarah Fryer看来,如今已经非常接近AGI了。
AI 系统能够承担世界上很多真正有价值的工作,这些工作是人类的工作。
可以肯定地讲,我们作为一个世界共同体,还没有将其潜力充分发挥出来。
如今,有3个scaling law正在发生。
一个是进行预训练,其目的是让通用模型变得更加聪明。这就要求具备更多的数据以及更先进的算法专业知识。在有更多算力给予支持的情况下,研究人员能够发挥出更大的作用。
这就意味着,要想成功,就必须投入大量的资金。
GPT-3、GPT-4、GPT-5 等大模型,其计算规模呈对数增长。
然后,就进入了后训练阶段。
如果我们想要创建一个需要进行诊病的模型,那么就需要对其进行微调,使其能够专注于医学领域。
第三个阶段是推理时计算,这个阶段就如同让这辆“汽车”切换到运动模式的时候。
此时,需要在真正的赛道上行驶,从四驱模式切换到运动模式。
以上,就是关于扩展性的三条定律。
OpenAI的研究者,已经推出了「强化微调」技术。
他们发现,其实不需要大量的信息,就能够让模型在某一个特定的领域展现出非常显著的性能提升。 他们发现,其实不需要诸多的信息,就可以让模型在特定的一个领域展现出极为显著的性能提升。 他们发现,其实不需要很多的信息,就能使模型在特定的领域展现出特别显著的性能提升。 他们发现,其实不需要大量的信息,就能够让模型在某个特定领域展现出很显著的性能提升。 他们发现,其实不需要诸多的信息,就可以让模型在某一特定领域展现出相当显著的性能提升。
关键在于我们能否抵达那个具体的领域。若你想要研究神经疾病,像退行性疾病的结果这类情况,你能否在这个特定的领域获取到足够的信息呢?
即使是一点点的信息,也会极大提升模型的实用性。
星际之门,为什么需要5000亿
OpenAI 称,星际之门在计算能力方面需投资 5000 亿美元,或者说需要 10 吉瓦的算力。
这个数字是怎么得出来的?
奥特曼在白宫参与5000亿美元的Stargate计划发布会
这有三个 scaling law,分别是通过预训练扩展、通过后训练扩展以及在推理时扩展。
在模型开发的每个阶段,都会需要越来越多的算力。
可以说,OpenAI 没有推出某些模型,这是由于没有足够的计算资源。 可以说,OpenAI 之所以没有推出某些模型,是因为缺乏足够的计算资源。 可以说,OpenAI 没有推出某些模型的原因是没有足够的计算资源。
Sarah Friar表示,自己是个糟糕的CFO。
Sora 在大约前年的 2 月或者 3 月就已准备妥当,然而直至大约去年的 12 月,OpenAI 才正式将其推出。
甚至到现在,Sora也还没有完全上线。
OpenAI 选择的是推出深度研究,其原因在于他们知晓商业界对这个特性极为喜爱。
Sarah Friar 承认,由于没有足够的算力投入业务,所以她每天做出的最糟糕的决定就是不给研究者提供最有价值的资源,即研究所需的算力。
她透露:很多时候,Sam Altman 来上班时会生气。原因是她没有提供足够的算力。
为什么她会陷入这种境地?
两三年前,那些拍板决定算力决策的人,根本无法想象如今算力需求的增长速度会如此之快。
在两年的时间当中,OpenAI 的周活用户达到了 4 亿。并且它的收入每年都以三倍的速度在增长。
现在,爱尔兰的总负载为 7 吉瓦。整个国家的使用量比 OpenAI 所需的 10 吉瓦要少。
她认为,三年之后当人们回顾过往时,会觉得此时的人们对 5000 亿这个数字感到神经紧张,这种反应简直是大惊小怪。
所以,该如何扩大规模?电力来源于哪里?是否需要培养人力?
事实证明,电工是真正能够制约建设的资源。事实证明,暖通空调人员是真正能够制约建设的资源。
美国政府会对星际之门特别感兴趣。因为它是一种财政投资,并且有助于在经济上保持领先地位。
而DeepSeek也让人看到,AI正处于激烈竞争中。
OpenAI目前的关注点在于算力、研究人员、数据。
他们需要去寻找合适的地点并获取电力。他们需要将地面进行平整处理。他们要建设数据中心。他们得填充相关设备。他们还需要购买 GPU。
OpenAI需要真正证明:它有能力成功应对挑战。
参考资料: