文|戴静
一年一度的百度世界大会已成为观察百度AI战略动向和行业趋势的窗口。
2024年百度世界大会上,李彦宏看上去比去年更加坚定。他表示,基础模型能力已经准备就绪,我们即将迎来AI应用的闪亮时刻。
当2023年下半年大模型之间的战斗逐渐开始分化时,李彦宏提出“量模型不如量应用”。但从后续行业发展趋势来看,国内应用的“体量”集中在像ChatGPT这样的AI助手层面,其他领域的颠覆性创新AI应用并不多见。
原因之一是创新有认知门槛,开发人工智能应用也有技术门槛。
或许是意识到了这一点,李彦宏和百度今年进一步聚焦大模型战略,押注智能代理的爆发。
如果你现在要问百度的第一原则是什么,答案已经越来越明确——应用驱动。李彦宏还为这次有别于移动互联网时代的“应用驱动”补充了一句,“不是推出一个‘超级应用’,而是持续帮助更多人、更多企业创造数百万个‘超级应用’” “有用的应用程序。”
01
“做工程并不可耻”
24个月过去了,万众期待的AI超级应用依然不见踪影。有人不禁疑惑:全球大车型热潮到底是新的技术革命还是新一轮的泡沫?
但如果细想茨威格在《当人类群星闪耀时》中所写的:“历史上那些巅峰时刻需要太长的酝酿时间,每一个影响深远的事件都需要一个发展过程”,旁观者或许会更有信心。
作为这波AI浪潮最早、最深度的参与者,李彦宏提前看到了“巅峰时刻”。他对人工智能应用即将爆发的判断主要基于两个依据:
一是底层技术突破。过去24个月,AI行业最大的变化是大模型基本消除了错觉,回答问题的准确度大幅提升。基于检索增强技术的进展,百度于年初进入了iRAG(基于图像的RAG)——即检索增强的文森图片技术,进一步让文森图片消除错觉,让AI能够运用在电影、漫画、漫画、海报制作等领域落地。
▲根据提示词“爱因斯坦在天坛”生成的图片
左边是文鑫的iRAG作品,右边四幅是其他大型模型生成的作品。
其次,大模型调用量爆炸,开发者觉醒了。今年5月,文信大模型API日调用量达到2亿次。当时,百度高管在会上讨论了一个问题:大模型如何才能算“完整”?李彦宏给出的量化指标是,日均API调用量一年内增长了10倍。这说明大家确实需要它。截至11月初,文信模型每日API调用量突破15亿次,远超预期。
李彦宏在会上没有讨论的还有一个实际原因——通话费用。近两年来,大机型每个代币的使用成本下降了99%以上。以美国为例,目前一个大模型处理100万个Token的成本仅为60美分。在国内,百度的一些型号甚至是免费的。
从会上传递的信息来看,百度目前重点关注两大应用方向:C端的智能代理和B端的行业应用。
根据我们的观察,在to C端,大模型技术应用的广度可能会高于技术乐观主义者的预期,因为很多使用场景并不局限于app等传统产品形态。
例如,我的一个律师朋友有时会要求AI帮忙制定一个简单的法律协议,他可以自己修改并交给客户。如果是他自己起草这份协议,至少需要半个小时。要完成这个交互,他甚至不需要下载AI工具App,通过合法的行业公众号就可以轻松获取。
可以说,AI应用场景无处不在,但产品形态可能与以前不一样了。去年大机型爆发之初,人们就期待AI加持的iPhone在大机型领域被复制。移动互联网时代的《愤怒的小鸟》、Instagram等超级应用也将很快出现在大型模特领域。 。
一年过去了,超级AI原生应用尚未出现,但新的共识正在逐渐形成:代理将成为AI应用的主流形态——
几个月前,OpenAI发文称,在谷歌、苹果等科技巨头的推动下,2025年将是AI Agent最终成为主流的一年。在百度世界大会上,李彦宏再次给出了他对智能代理的判断:代理是大模型最重要的发展方向,即将迎来其突破点。
根据AGI的进化序列框架,智能代理被视为Copilot的下一阶段。它们具有一定程度的自主性,可以执行长期任务,例如与环境多次交互、协同工作等,并且具有自我进化的能力。
目前,全球多家顶尖科技公司都在关注智能代理,但李彦宏在会上透露,百度已将智能代理视为大模型最重要的战略方向。
原因在于智能代理的门槛足够低,天花板足够高。去年业界就意识到应该推出应用,但如何去做、如何将模型转化为应用存在太多的不确定性,这也让很多人望而却步。从移动互联网时代产品形态的变化来看,每一次产品门槛的降低,都会带来应用范式的爆发。最典型的就是从App向小程序的迁移,微信生态从中受益匪浅。
代理也类似。当平台为开发者提供了一条高效、简单的路径,在大型模型上构建智能代理变得越来越方便时,“潜力”就会聚集。例如,问心智能代理平台已吸引了15万家企业、80万开发者。每周都会创建数以万计的新代理,其中包括 11 岁小学生创建的代理。通过搜索和其他渠道分发。
不过,从李彦宏的讲话来看,百度并不是要推出超级应用,而是要帮助更多的人、更多的企业打造数百万个“超级好用”的应用。
言下之意,百度在AI时代的生态护城河宽度,未来将取决于这些应用。
由此就不难理解,为什么在AI领军者中,没有人比李彦宏更专注于应用落地。百度的AI优势更多体现在底层技术和模型层。技术的成功最终取决于其在现实生活中的应用。正如 DeepMind 创始人、微软 AI 首席执行官 Suleiman 在最近的一次交流中强调的那样,没有明确目的的 AI 模型只不过是令人着迷的计算机科学展示。
02
“免费画布”代理
开始出现
智能体的爆发与“有用”密不可分。
李彦宏此前曾警告要避免陷入“超级应用”的陷阱。在AI时代,“超能力”的应用可能比只看DAU的“超级应用”更重要。
从国内主要代理平台的案例来看,公司型代理、角色型代理、工具型代理、行业型代理是目前主要的发展方向。
其中,企业代理被认为是AI时代的企业官网。结合百度搜索引擎背景,我们认为此类代理商是百度搜索增量机会所在,企业代理商是百度升级与KA客户关系、提供更多价值的触点。
据百度官方数据显示,比亚迪官方智能手机上线后,销售线索转化率提升119%。
不过,纵观整个世界大会,最让与会者感兴趣、最引人注目的,还是工具型智能代理“Free Canvas”。这款由百度文库和百度网盘联合发布的AI创造新物种,在公测首日就吸引了超过20万人排队预约。
据现场演示,“自由画布”是文心多模态大模型支持的通用白板。是百度文库、百度网盘行业首个内容操作系统。
“Canvas”通过大模型技术,连接个人授权的公域和私域内容。通过“拖拉圈”的极简操作,可实现多格式、全模态文件的混合理解、生成和创建,并支持富媒体文档一键共享和存储,实现自由输入、编辑、创作、分享。
今年9月,百度集团宣布将网盘C端业务重新归类至移动生态事业群(MEG),并由百度副总裁兼图书馆事业部负责人王瑛接手。如果当时很多人还对这个决定的逻辑感到不解的话。如今“画布”已揭开,并通过AI能力进一步打通重构,图书馆、网盘已成为全新的智能生产力。
上述四类代理商中,从商业角度来看,“NoNoise”也着眼于行业代理商的前景。仅以保险业为例。此前,专注于大规模模型to B的AI创业者告诉我们,在这个30万亿的市场中,一些保险经纪人的佣金可以占到客户保险金额的20%-40%。如果大模型能够将保险专业知识积累到AI产品中,然后能够为客户制定一些简单保险类型的保险计划,那将是非常有前途的。
比如,被誉为“免费AI律师”的法律情报代理“发星宝”,上线半年来已解答超过1660万条法律问题。产品信息显示,该代理是百度自创的。主界面提供对话交互以及法律计算器、智能法律文书、在线法律意见书等免费工具。还有类似判决案例的链接供审查。
例如,用户可以询问交通事故或工伤的赔偿方案以及如何计算索赔金额,也可以委托代理人代写起诉书。过去,当需要法律咨询时,普通老百姓要么付费寻求专业律师的帮助,要么自己在复杂的互联网上进行搜索,但同时承担着信息不完整或不准确的风险。
当然,有律师指出,基于积累的专业知识和个人经验的法律策略、分析判断等专业法律服务目前是人工智能难以实现的。
换个角度思考,这可能是智能体未来的想象空间,因为智能体本身就是一种自主的产品形态,会不断学习和进化。
但需要指出的是,智能体的出现并不一定是在基础设施到位的情况下发生的。一个应用方向的爆发,离不开明确的商业刺激。 2012年,当《愤怒的小鸟》登陆iOS平台并取得巨大成功时,通过iOS端的下载付费和Android端的广告投放,其背后的游戏开发公司的收入比去年增长了101%。去年,达到1.5亿。欧元。
对此,OpenA联合创始人Sam Altman也发出警告。在最近的一次采访中,他不忘提醒企业家:通过更快地拥抱新技术,你可能会实现短期的爆发式增长,但从长远来看,你仍然需要打造出能够持续提供价值的产品或服务。 “现在每个人都可以做出精彩的演讲,但要真正建立一个成功的企业,这才是关键。这是困难的部分,而商业规则仍然适用。”
据了解,文信智能代理平台已逐步完成商业闭环,实现智能代理从开发到分销再到变现。单个代理商单次转化最高收入已达10万元。这背后是链接挂载、产品转化、线索转化、联盟广告、胶囊槽等商业组件的全力支持。
03
长期主义、理想主义、现实主义
必不可少
中国和美国的人工智能巨头经常被拿来比较。与美国AI同行以科学研究和底层突破驱动的AGI宏伟愿景相比,从世界大会上的发言来看,百度则典型地以工程思想和应用驱动。
在会后接受《九子光年》专访时,李彦宏直言,“做工程没有什么丢人的,在工程中,很有可能比科学更早发现机会和模式。”就好像飞机先飞上天,然后人才出发。经过研究,原来有一种东西叫空气动力学。因此,百度的AI路线是优先解决大家在场景和应用中最常遇到的技术问题。
乍一看,这与李彦宏的社会标签形成鲜明对比。百度10年1700亿研发投入的故事早已为大众所熟知,李彦宏的“长期主义”、“未来主义”标签也早已被业界认可。
例如,去年9月,当李彦宏与马斯克、黄仁勋、奥特曼一起被《时代》杂志评选为全球人工智能领袖时,《时代》杂志的评论是:“李彦宏是中国最杰出的未来学家,长期致力于人工智能领域的发展。”浪潮人工智能的发展。”在沙利文近期发布的《2024年全球AI生态系统全景概览》报告中,百度被纳入AI-Native巨头,与谷歌、OpenAI位于同一象限。
未来主义是理想主义的,但应用驱动的策略看起来很现实。
看似矛盾的情况可能取决于参与者如何看待人工智能革命的本质。如果人工智能将带来新的工业革命,那么这种变革不会在三五年内结束。未来几十年,它可能会继续渗透到社会的各个方面。作为变革的参与者,你既需要耐心,又需要真金白银的持续投入,然后凭借商业上的成功和生态上的高墙,在全球竞争中保持领先地位。
正如李彦宏此前接受采访时预测的那样:未来两三年,人工智能的竞争将会非常激烈。 “至于谁会是最后的赢家,在我看来,谁赚钱谁就能生存。”
这或许就是李彦宏孜孜不倦宣讲的初衷之一,号召大家构建智能体,使用AI;这也是百度自主开发“自由画布”、“发信宝”等智能代理应用,同时也在开发工具和基础平台的原因。不断降低开发者开发应用的门槛。
例如,世界大会上的另一项重大宣布——无代码开发工具“Miaida”,被李彦宏称为“迄今为止人类历史上最复杂的多智能体协作工具”,旨在让每个人都拥有能力程序员的知识只需要说就可以应用。此前,在设计领域,Cursor、Replit等海外产品已经能够仅根据用户的自然语言指令生成应用界面,而无需键入任何代码。
▲百度发布的免代码工具“米艾达”,只需用中文描述需求,添加一份以会议时间和地点为主题的文档,即可指挥多个代理商协作完成注册系统的开发。
这类工具有一个共同的底层逻辑——让普通人通过创意赚钱。如果类似的想法能够落地,AI应用无疑距离大规模爆发又近了一步。我们也注意到,虽然“妙爱达”要到明年一季度才会上线,但据悉目前已经有超过5000家企业排队测试。
顺着之前的思路,在 OpenAI 的 Sora 惊艳亮相之后,百度没有加入中国版 Sora 的竞争也是可以理解的。在李彦宏看来,Sora和多模态是两个不同的东西。 Sora本质上是在任何场景下生成视频的能力。这很有意义,但需要长期的成本消耗。
但这并不意味着百度不做多模态。 “我们对多式联运非常乐观,并对多式联运进行了非常长期的投资。哪里有真实的应用场景,我们的多模态能力就很强。”百度只是选择了一个更实用的方向来推进。比如“Free Canvas”就是一个多模态AI功能集于一身的平台。
发布会当天的专访结束时,李彦宏被问到有什么话要说吗?他表示,人工智能革命不会在三到五年内结束,而更像是在三到五十年内对社会的全面重构。它需要长期主义、理想主义和现实主义的结合。
对于百度来说,未来和现实可能是AI战略的两个侧面。