继 OpenAI 开源了 Swarm 演示版 Multi-Agent 之后,微软也开源了 magentic-one。虽然演示的功能有所不同,前者是关于业务逻辑处理,后者是关于文件访问等基本操作,但这也是Multi-Agent的一个例子。横向比较,微软的略好于OpenAI。可以解决实际问题,确实有用。但关键并不在这里,而是当你将两个项目放在一起对比时,你会发现一场无声的竞争已经开始。
我们有理由相信,随着Multi-Agent的智能原生程序变得越来越关键,这种竞争将会越来越激烈。
很多做战略分析的同学可能不愿意看代码,而愿意看代码的同学也可能不愿意花时间去发现这种竞争的触发因素,所以这里我挑一件事情再讲一下。
OpenAI Swarm 进行了 AI 碰撞局。如需记录,请参阅:人类优先还是智能优先? (AI碰撞局第13期笔记),等我有空了,有必要在magentic-one上再做一期。我也会用非技术语言来谈论这个项目,并对两种机制进行比较。
人工智能是军事战略家的战场
AI行业兵家必争之地是什么?
事实上,备受关注的大车型基本都没有。除非只有一家公司是最好的,否则别人的模型级别是1,你的是10。
如果说大型模型是最关键的竞争领域,那么实际上OpenAI Swarm是基于GPT-4o的,微软magentic-one也是基于GPT-4o的。我们之间没有冲突。你做出了一个好的模型,我也很好地使用了这个模型。你对我好,我对你也好。根本不存在冲突。
关键是,如果你期待一个超级应用,我也期待一个超级应用,那么随着超级应用价值的增加,整个超级应用链的关键控制点就会发生你死我活的竞争。
OpenAI与微软之间隐藏冲突的根本原因不在于某个应用程序,而在于谁拥有对AI基础设施的控制权。
那么未来各种超级应用的关键控制点是什么呢?找到这个控制点将导致人工智能军事战略家的战场。
OpenAI和微软之间潜在的冲突与下面我随手画的简单图有关:
智能原生应用的详细描述请参见:对与错◎智能原生(AI Native)应用极具挑战性
因为我们谈论的是微软,所以我们将过去基于LLM的操作系统和Windows进行类比。
例如,我们常用的Windows中封装了很多算法,但是无论我们在Windows上编写多少程序,我们都不会直接使用其中封装的算法,而是通过Windows提供的接口。这些算法对您来说是透明的。谁知道Windows中封装了多少算法?
这是为什么呢?因为Windows不仅有算法等功能,还有账户管理、消息机制等链接功能的部分。
上面两张图,最核心的区别是:
左图中,系统的概念仍然存在,但右图中,系统的概念消失了。模型不仅履行了逻辑判断的能力,而且取代了系统。
为什么会导致激烈的冲突和竞争?
多大的池塘才能养大鱼
智能原生应用由于数据所有权的不同,注定会有多个应用,但基于LLM的OS和LLM并不相同。
这种基础设施是一个巨大的池子,但理论上来说,在中国联通的市场空间中,可能就只剩下几个了,而排名靠前的就占据了50%以上的市场份额。
谁在AI时代做到了这一点,谁就成为新时代的巨人。
OpenAI需要这个,微软显然不会放过这个。
但左边的构图里有微软,而右边的构图中没有。
如果世界最终选择右图,那么模型就是系统,微软将在AI的基础设施中没有一席之地!
一切才刚刚开始
以上其实都是一些猜想。这个猜想有一个大前提:智能原生(AI Native)的应用将席卷各种应用场景。这需要一些时间,因此上述深层次矛盾的一些线索只能在开源项目中找到。
但数字最违背人类传统认知的是速度。如果人类进化的速度为1,制度和文化进化的速度为100,那么数字化进化的速度至少是100万甚至更高。
一两年前,大家还不知道什么是智能原生,但现在上面提到的两个开源项目各自就是智能原生。
因此,这种潜在的冲突可能会在某个时刻爆发,而关键节点应该是智能原生应用的营收规模。
后续走势
目前,此类竞争将在无声无息的状态下展开,短期内谁会获胜,取决于用户的选择。但如果模型不继续迭代多次,适用范围仍然会比较窄。微软这次开源项目附带的说明清楚地说明了当前的状态。
1,2,3,4,5,6如果你能用一句话概括的话,你就得把它放到沙箱里,然后人类就会盯着它,避免造成不可预测的损失。
具体来说,以下任务在运行时可能正在执行其他操作。例如,可能会导致系统崩溃。
在这样的前提下,这种新的智能原生模式并不是不能用,只是范围会比较窄,你不敢让它负责那些一旦出错成本特别高的事情,比如直接诊断和治疗。
好消息是这个精度问题肯定可以得到解决。目前还不知道何时能在通用大型模型上解决这个问题。
如果你有足够的钱,其实可以沿着特斯拉FSD12在相对垂直领域走过的路走。如果没有的话,就得等待一般大机型的升级了。两者实际上是等价的。
理论上来说,如果通用大模型足够强大,那么专门训练一个E-To-E模型和直接把数据丢给通用模型其实没有什么区别。
通用模型怎么可能有智能边界呢?
在终点应用的边界实际上是数据的边界。
无论如何,这里都需要一个转折点。否则的话,我们上面所说的只是一个影子,并不会暴露真实身份。
这个转折点在技术上是通用大规模模式的进步,在商业上是顶级智能原生应用公司的出现。为什么互联网变得如此流行?本质是当年的BAT,BAT的收入水平确实足以开启一个时代。
我认为美国人正在接近这个临界点。更不用说特斯拉的FSD12了,一年之内Glean的ARR就翻了四倍,5500万美元也不是那么小了。生意永远都有,但时代的机会只有一次。
概括
更有趣的不是美国怎么做,而是美国和我国的AI显然会分成两个难以连接的生态系统。那么中国的情况又如何呢?最终,美国和我国的生态系统将如何竞争与共存?互联网花了20多年的时间来回答这些问题。从现在开始,AI可能也要花这么多时间。因此,潜在的迷你时代可能正在过去。
本文来自微信公众号“想事”,作者:老李花一三,36氪经授权发布。