发布信息

AI时代:从J.K.罗琳到上班族,人们到底需要怎样的智能协作伙伴?

作者:软荐小编      2025-04-26 10:02:13     188

人们到底需要怎样的AI?

[id_177850238]

身为文字工作者,也就是俗称的码字的我认为,我理想中的 AI 是一个能够善解人意的协作伙伴。当我有需要的时候,它能够无所不能;当我有需求的地方,它能够无处不在。

几个月前,我看到了科技预言家凯文·凯利的一段话。J.K.罗琳是个天才,她缔造了哈利·波特的世界。即便她拥有如此巨大的想象力,她也没法独自制作 7 部哈利·波特电影。“但要是有了 AI,一个人是能够做到这一点的。”

AI技术飞跃,正让「未来已来」四个字变得具象化。

AI 技术取得进步,一方面体现在能够帮助 J.K.罗琳独自制作 7 部哈利·波特电影;另一方面体现在能够帮助上班族将会议录音自动转换为文档并形成结构化知识图谱,还能帮助学生党将网课中的知识点自动转录分类。将这些功能变成人们手中的“魔法棒”,就是人们所期待的 AI 模样。

01

过去 3 年,需要承认的是,虽然各种花哨概念不断出现。然而,在用户需求已经从单纯的信息检索转变为复杂的内容创作、知识管理以及跨模态协作的这样一个背景之下,许多 AI 应用表现得有些迟缓。“善于交互,难于交付”成为了普遍存在的问题。

当前大语言模型的主流交互形态主要是 ChatBot。ChatBot 的作用仅仅局限于聊天。当你让它帮你生成文案时,它会说 OK。但当你让它帮你做成 PPT 时,它可能会像皇后娘娘附体一样,说“臣妾做不到啊”。

现实中,很多网民拥有不少的 AI 工具,然而这些工具可用的地方并不多。在找资料的时候,依然需要同时在文档工具、网盘以及专业数据库中来回查找;在进行设计时,常常要在 PS、PR、AI、AE 这些工具之间频繁地进行切换……

究其原因,市面上许多 AI 工具存在共同硬伤。其一,公私域数据割裂,企业内部知识库与互联网公开数据无法联动,致使 AI 输出缺乏深度与精准性;其二,多模态能力碎片化,图片、语音、文本需调用不同工具处理;其三,交付链路断裂,从创意生成到落地执行缺乏连贯性,不得不反复切换平台。

用户在进行内容生产与消费时,需要 AI 加持,这种 AI 加持体现在公私域数据的高效整合能力以及跨场景跨设备的无缝体验上。那么,该如何实现这两点要求呢?

去年 11 月。在 2024 百度世界大会之上。百度所发布的“自由画布”。为这一情况提供了范例。

百度创始人李彦宏当时称,自由画布是一个具备万能功能的白板,且由文心多模态大模型给予加持。它能够激发人们无穷的灵感与创造力。因为有了自由画布,每个人都能够成为漫画家,也都能够成为短视频导演。并且,这并非是期货,而是能够立即使用的现货。

AI 对内容创作的助力能否更进一步呢?百度给出了肯定的回答,接着拿出了超级利器。

4 月 25 日的 2025 百度 Create AI 开发者大会上,百度文库与百度网盘进行了联合。它们推出了一个内容操作系统,这个系统是面向内容生产与消费场景而研发的,它被命名为「沧舟 OS」。

「沧舟OS」是全球首个内容操作系统。

那些仍在为解决内容创作交付问题而在一堆 AI 应用中辗转的用户,他们对于在任何时间、任何地点、任何终端都能一站式实现深度交付的期望,终于不再是遥不可及的了,因为沧舟 OS 几乎把“无所不能,无处不在”显现在了脸上。

沧舟 OS 的底气在于有四个方面的支撑,一是深度思考,二是深度交付,三是公私数据融合,四是 MCP 生态。

02

什么是“无所不能”呢?具体来讲,就是 AI 要从能够解决单一的点的问题转变为能够提供整个链路的智能服务。

真正“无所不能”的 AI,绝不能是“炫起来很酷,用起来想哭”的那种。它应该让用户体验到方便好用的“N 次方”。比如,用户用语音口述方案后,它能够自动生成 PPT 大纲或 Word 脑图,并且还能匹配图片素材;在撰写报告时,它能够自动关联文库里的白皮书、网盘中的会议录音以及学术平台上的论文等。

以往这自然是难以实现的愿望,但技术的进步让它变成了现实。沧舟 OS 以 Chatfile Plus 作为核心组件,依托“三库(文库公域专业资料库、经用户授权的网盘私域数据库、用户记忆库)一平台(百度学术平台)三器(阅读器、编辑器、播放器)”,打破了数据孤岛与能力分割的壁垒。

三库一平台实现了融合,将专业知识、个人积累和科研资源打通,构建起了知识全息图谱;Chatfile Plus与三器协同合作,达成了多模态内容的“元素级拆解”以及“向量化重组”,能够支持文档、PPT、视频、音频的混排创作和编辑。

AI Agent 矩阵把数百项 AI 能力集成到工具层,这使得“智能拆解-创意生成-格式转换-多端适配”的全流程交付变得更加容易。

需要看到的是,百度文库和百度网盘基于沧舟 OS,在自研技术沉淀以及生态合作创新的基础上,推出了极具代表性的两种能力,一种是 GenFlow 超能搭子,另一种是 AI 笔记。

WorkFlow 进行了升级成为了 GenFlow,在 GenFlow 中,“Gen”这个词既包含了 Generative(生成)的意思,又蕴含了 Genius(智慧)的含义。它仿佛被贾维斯附身了,干活时展现出聪明的特质,拥有需求识别与任务分发中枢的特性,能够构建自适应服务链,给用户提供端到端的智能解决方案,这一点或许会让人联想到 1 个多月前迅速走红的 Manus。

「GenFlow 超能搭子」的原理与其他多智能体协同平台相似,都是借助大模型去分析用户 query(提问查询)所包含的意图,并且帮助用户完成整个工作流。在这个过程中,「GenFlow 超能搭子」会根据需要调用文库和网盘上的适配工具。

GenFlow 超能搭子的优势在于:它背靠沧舟 OS,凭借算法优化与预处理,能将任务执行效率提升至“分钟级”;它具备规避模型幻觉和输出瑕疵的底层能力;还有“三库一平台”的独一份加持,所以输出结果更加稳定、高效且符合用户习惯。

我是一名即将参加高考的高中生,想要复习网盘里的学习资料。当我提出要求后,它能够拆解我的需求,梳理相关考点,总结重点内容,画出思维导图,预测考题方向,并且还能出模拟试卷等。

在帮学生备考方面,「GenFlow」可以干很多事。

在沧舟 OS 的助力下,百度网盘对 AI 笔记进行了全面升级。对于职场人士以及有学习需求的学生等人群而言,它完全可以称得上是一句“真香”。

考研党试想一下,在网盘里找到了学习视频。然后点击了右侧的「AI 笔记」按钮。接着,视频播放器的右侧出现了自带的笔记编辑区域。在这个区域里,可以实时生成逐帧摘要和思维导图,还能关联相关文献。点击关键帧,就能跳转至重点内容。点击时间戳,就能跳转到笔记的对应位置……这难道不比上李永乐视频课,前面听了后面就忘要好很多吗?

AI 价值评判存在诸多尺度,其中“好用才是硬道理”这一尺度是极为重要的。

03

“无所不在”是什么呢?沧舟 OS 的“沧”字揭示了其中的关键所在:它的形态如同水一般,能够支持不同能力的调配以及交互界面。

百度副总裁以及文库事业部、网盘事业部的负责人王颖进行介绍,沧舟 OS 与其他操作系统存在区别。其他操作系统主要是提供“大脑”,而其上的应用程序如同“四肢”。沧舟 OS 则是既具备大脑(智能决策中枢),又拥有四肢(完整工具链)的“超能人”。

过去 Windows 呈现多窗口界面,原因在于它缺乏通用性,只能将底座与应用程序区分开来。然而,沧舟 OS 是端到端的解决方案提供者,其展示形式可根据需求而变化,就如同水一样。水放在圆形杯子中形状为圆形,放在方形盒子里则为方形,但人们却离不开水。

这意味着,沧舟 OS 打破了常见操作系统所具有的形态方面的束缚。它变得更加具有活力。

这或许更符合人们的需求:在现实里,广告人设计营销方案时,不需要在“脑暴-手绘草图-PS 精修-视频剪辑”这些不同环节分别去寻找不同的工具,而是要让 AI 应用形态根据场景进行自适应。

就此来看,交互界面会随着场景发生变化。例如在办公场景中,可以使用自由画布;在学习场景里,可以使用 AI 笔记。交互界面的应用形态是由用户的需求来决定的,这种方式显得颇为贴心。

现实中,很多老师在个人电脑端完成教案后,期望能够把修改的思路同步到多个终端等。由于系统是以柔性架构融入到个人电脑端、移动终端以及物联网中的,所以这是很有必要的。

现实中,有的律所希望将自身的案例库与关联法条相融合,从而生成培训视频。系统的输入可以包含语音、图片和文本等多种形式,而输出则能够支持图文影音等多种模态。要实现“用户指哪就打哪”的效果,这变得非常重要。

说“无处不在”容易,但做起来难。如果没有 AI 能力能够动态部署和弹性伸缩,也没有根据不同场景需求自由组合和拆分的能力,同时没有实现跨模态向量空间统一化,以达到“语音指令生成图文内容”等跨模态交互的能力,那么就很难实现“无处不在”。

但“无所不在”的指向较为明确,具体而言:要让 AI 的鞋子能够主动去契合用户需求的脚,而不是让脚去适应鞋子。换句话说,就是要让服务依据用户需求而变动。

04

值得注意的是,当从“无所不能”这个维度去拆解沧舟 OS 系统时,MCP(模型上下文协议)是个绕不开的字眼;当从“无处不在”这个维度去拆解沧舟 OS 系统时,MCP(模型上下文协议)也是个绕不开的字眼。

MCP 是当前的“AI 新贵”。3 月初 Manus 变得很受欢迎,之后就间接地让 MCP 也火了起来。虽然 Manus 没有直接使用 MCP 框架,但是它所展现出的多 Agent 协同能力与用户对 AI 生产力的终极想象相契合。

Anthropic 等 AI 巨头也拥抱了 MCP。

为什么?因为 MCP 使得 AI 领域有了“书同文、车同轨”的愿景:它将各家大模型原本不同的 Function Calling(函数调用)标准进行了统一,构建出通用协议,能够兼容并无缝适配 GPT、Claude 等不同的模型,堪称“AI 界的 HTTP”“大模型界的 USB - C 接口”。

MCP 将大模型与外部交互通过 Client(客户端)、Host(应用)、Server(服务器)抽象成「客户端 - 服务器」架构。之后,那些 MCP Host 无需进行预编码适配,就能够直接使用 MCP Server(包括官方和三方的),如同 USB 可以即插即用一样。这样一来,在聊天界面能够实现“对话即操作”的革新体验,能给用户“AI 真的在动手干活”的那种感觉。

谷歌CEO桑德尔·皮查伊说:要不要MCP,这是个问题。

百度文库和百度网盘基于沧舟 OS 率先把 MCP 协议充分运用到产品与生态的链接当中,从而构建起了开放网络。它们既将文库网盘的核心能力开放出去,以此来赋能生态;也接入外部更多的能力,持续提升自身的产品体验。

文库网盘成为 MCP Server 后,接入其数据与能力的应用能够享受到内容存储服务,此服务容量更大;能够享受到内容管理服务,此服务速度更快;能够享受到内容搜索服务,此服务模态更自由;能够享受到内容总结服务,此服务模态更自由。

三星手机凭借接入百度文库&网盘的能力,在手机语音助手界面能够直接实现文件的上传网盘备份这一功能,也能够直接实现云上分享这一功能,还能够直接实现文档摘要总结这一功能以及内容问答这一功能。并且,手机自身对大文件、多文件难以批量备份与分享的问题也得到了很好的解决。

百度文库和网盘能够灵活且精准地调用内外部的模型与工具,从而满足用户在一站式的情况下,完成长文、研报、PPT、AI 绘本、海报等各种不同形式以及模态内容的获取与创作需求。

从某种程度上来看,这使得百度开源文心大模型 4.5 系列的开放姿态得以延续。

最终,是 MCP 生态的“资源互通、技术共享”使得能力天花板得以抬高,从而有了沧舟 OS 的“无所不能”;也是 MCP 生态的“网络效应”,才造就了沧舟 OS 的“无处不在”。

05

凯文·凯利曾写道:最深刻的技术乃是那些难以察觉的技术。这些技术会把自身编织进日常生活的各个细微之处,直至成为生活的组成部分。

很多底层基座式技术最终变成社会数字基础设施,就印证了这点。

可以想见,AI 时代全面到来之后,“无所不能”的技术底座与“无处不在”的生态网络相互交织形成的沧舟 OS,最终会成为内容生产与消费的“新基建”,并且会在不知不觉中发挥作用。

它撬动的内容产业生产力变革影响必然深远。大众或许不明白什么是跨模态协作,什么是多 Agent 调用,什么是知识库整合。然而,伴随内容创作门槛降低以及知识管理难度降低而产生的变化是能够看得见的。

有了百度给予的那支“AI 神笔”之后,即便不是马良那样的人,许多人依然能够在“画布”之上绘出瑰丽多彩的景象。

AI 使内容生产与消费的范式发生了革新,同时也会给内容创作带来新的机遇,并且为内容产业打开新的空间。

可以预见,在不久的将来,在知识与内容的领域中,会有越来越多的人借助 AI 这一工具,如同乘着一艘船,凭借着一根芦苇渡河,在风浪中勇往直前。

作者 | 佘宗明

运营 | 李玩

相关内容 查看全部