4 月 10 日,智东西进行了报道。今天,在谷歌云 Next 大会上,谷歌把 Agent2Agent(A2A)开放协议正式发布了。A2A 协议使得智能体之间的沟通以及协作变得更加顺畅,并且不同开发者发布的智能体也能够进行有效的通信。
[id_1[id_1005541703]7121560]
01
这一协议为智能体配备了“名片”,使得不同智能体能够看到彼此的功能。A2A 界定了智能体间沟通的固定方式,智能体可以借此相互发送消息,从而传达上下文、回复、交付物或用户说明等信息。
A2A 能够帮助智能体跨越那些孤立的数据系统和应用程序,从而完成协作。这样做有望进一步提升智能体的自主性,还能大幅提高其生产力。从长期来看,还有望降低多智能体系统的使用成本。
目前,有 50 多家企业与组织为 A2A 协议提供了技术支撑和贡献。这些企业与组织包括 PayPal、SAP、ServiceNow、埃森哲、德勤、毕马威等知名企业。
A2A 协议和 Anthropic 的 MCP 是互补的关系。A2A 协议主要关注智能体之间的通信。而 Anthropic 的 MCP 则将智能体与数据、资源以及工具相连接,使得智能体能够更好地与现实世界进行交互。
02
谷歌为了更直观地讲解 A2A 的原理以及它与 MCP 协议的互补关系,提供了一个生动的案例。
有一家汽车维修厂,该店雇佣有自主行为能力的员工,员工们借助千斤顶、万用表和套筒扳手等工具去诊断和修复问题。工人时常得诊断并修复之前从未见过的问题。维修过程或许会包含与客户的对话、研究以及与零件供应商的协作。
上述场景中的员工可被类比为智能体。MCP 协议负责处理员工对工具的调度事宜。A2A 协议则用于处理员工与员工之间的沟通以及员工与客户(对应 AI 用户)之间的协作。
具体而言,在修理厂的场景下,MCP 使得员工能够运用工具,去完成诸如“把汽车抬升 50 厘米”以及“将扳手朝右拧 4 毫米”之类的操作。
A2A 协议能让用户或员工与其他员工展开合作,凭借持续的沟通以及不断改进的计划来达成结果。在汽车修理厂的情境中,A2A 协议使得员工能够主动去询问客户或者其他员工。
“给我发一张左侧轮胎的照片。”
“我注意到液体泄漏,这种情况已经发生了多长时间?”
A2A 能够帮助汽车修理厂的员工与外部员工展开合作,其中包括他们的零件供应商。
在上述交互过程里,A2A 协议推动了“客户端”智能体与“远端”智能体之间的交流。“客户端”智能体承担着制定并传达任务的职责,“远端”智能体则负责对这些任务进行处理,给出正确的信息或者做出正确的动作。此交互涵盖了几个重要的功能:
功能发现方面,智能体能够通过使用 JSON 格式的智能体卡(类似于智能体的名片)来公布自身的功能以及验证方式,这样客户端智能体就可以确定能够执行任务的最佳智能体,并且还能利用 A2A 与远端智能体进行通信。
任务管理方面,客户端智能体与远端智能体之间的通信是以任务完成为导向的,双方通过协作来满足终端用户的请求。“任务”对象在该协议中是有完整生命周期的,对于即时任务能够快速完成;而对于耗时较长的任务,各个智能体会持续同步任务的最新执行状态。最终任务产出的结果被称作“交付物”。
智能体可以相互发送消息,以传达用户的说明。
用户体验协商机制:每条消息都包含若干“内容单元”,这些“内容单元”是诸如生成的图像等完整的内容模块。每个单元都标注了特定的内容类型,这样客户端和远端智能体就能够协商确定所需的格式,并且特别涵盖了 UI 能力的协调,其中包括嵌入式框架、视频、网页表单等交互元素的适配。
谷歌及其合作伙伴以 HTTP、SSE、JSON-RPC 等被广泛使用的现有标准为基础建立了 A2A。这表明它具备与企业日常所使用的 IT 基础设施进行集成的能力。A2A 对企业级的身份验证与授权提供支持,其认证方案在发布之时就与 OpenAPI 标准保持了同步。
A2A 协议支持多种交互模态,其中包括音视频流。它采用了灵活的设计,既可以高效地处理即时任务,又能够支持需要数小时甚至数天(包含人工介入环节)的深度研究任务。
在整个过程中,A2A会向用户提供实时反馈、通知和状态更新。
03
结语:采用率未达临界点,将继续拓展用例和场景
谷歌云业务应用平台副总裁兼总经理 Rao Surapaneni 在接受科技媒体 VeatureBeat 采访时表示,当下 A2A 已经获得了 50 多家合作伙伴的采用,然而却并未达到采用率的“临界点”。
未来,A2A 能否成为一项易用且通行的协议,这在很大程度上会取决于企业的采用率。Surapaneni 表示,谷歌会为 A2A 去寻找更广阔的用例以及场景,以实现持续的增长。
本文来自微信公众号 ,作者:陈骏达,36氪经授权发布。