发布信息

AI大模型下具身智能成焦点,机器人落地仍需务实

作者:软荐小编      2025-04-02 14:01:18     169

你随口说一句话,机器人就能为你做一些事情,比如倒一杯果汁,打一个鸡蛋,把桌子上的碗筷准确放到收纳架上。并且机器人还能够读懂你的情绪,像有幽默感似的给你讲个小笑话。

今天,这些带有科幻感的场景已成为各路科技巨头在发布机器人新品时的常见演示。AI 大模型使得 AI 能够更优地看懂世界,能够更优地理解世界,并且能够与人和世界产生更优的交互。

大模型能力在快速迭代,具身智能成为当下机器人赛道聚光灯下的焦点。国内资本市场很火爆,各路创企纷纷涌入,巨头们也都在行动。电影中的大管家“贾维斯”,仿佛正在向我们招手。

相比发布会上的“仰望星空”,机器人赛道更需要脚踏实地。如何让机器人能在更多场景中落地,如何让机器人实实在在地去服务企业和消费者,如何让机器人解决需求痛点,这些都是更为实际的问题。

服务机器人市场是机器人领域中商用较为成熟的领域。它正在受具身智能的发展影响,并且涌现出了新的变量。

近日,全球服务器机器人巨头擎朗智能拥有丰富的产品矩阵与落地场景。该公司再度发布了一系列新品,并且亮出了基于自身海量真实场景数据所打造的具身多模态模型。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

其人形具身服务机器人新品 XMAN-R1 是基于“岗位化、亲和力、安全性”的理念而设计的。它已经具备了在服务行业中处理长程任务的理解规划能力,并且成为了业内关注的焦点。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

XMAN-R1

擎朗自研的多模态模型正在助力服务机器人逐步迈向场景,它能够解决更为复杂且动态化的任务,使得具身智能核心的泛化能力得到显著提升。

去年的 WAIC 世界机器人大会上,擎朗就推出了 XMAN-W3 产品。它在酒店机器人的基础上增加了灵活的双臂。这是擎朗在具身智能领域的前瞻探索。这款 XMAN-W3 可爱,与 XMAN-R1 属于同门同系师兄弟。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

XMAN-W3

可以说,在具身智能商业化落地方面,擎朗一直跑在前面。

当下具身商用服务机器人市场无疑正涌现出巨大机遇。擎朗凭借自身 15 年的行业积淀,拿出了从大模型技术、软硬件工程化/产品化能力到技术商业化验证这三张王牌。并且,擎朗已经朝着具身商用服务机器人的蓝海迈出了一大步。

一、服务机器人规模化加速,泛化能力如何打破数据瓶颈?

市研机构 IDC 做出预测,未来全球具身智能服务机器人市场会快速增长。到五年后的 2030 年,其市场规模有可能达到 939 亿美元,也就是约合人民币 6819 亿元,复合增长率为 86.2%。

具身智能展现出了巨大的增长潜力,这给商用服务机器人赛道的玩家们提供了巨大的动力,并且也带来了新的挑战。

近年来,服务机器人在餐饮配送领域已经实现规模化落地。近年来,服务机器人在商用清洁领域已经实现规模化落地。近年来,服务机器人在银行导览领域已经实现规模化落地。近年来,服务机器人在酒店服务领域已经实现规模化落地。近年来,服务机器人在商超细分领域展现出强劲的增长潜力。近年来,服务机器人在文娱细分领域展现出强劲的增长潜力。近年来,服务机器人在医疗细分领域展现出强劲的增长潜力。近年来,服务机器人在康养细分领域展现出强劲的增长潜力。

与此同时,机器人面对的场景变得越来越复杂且非结构化。像餐厅、医院等场景存在很多不确定性,突发情况较多,光线也十分复杂。人类能够凭借经验迅速进行调整,然而传统机器人却需要依赖预编程规则和强化学习,其效率低下,并且难以覆盖长尾场景。

具身智能的核心是智能体通过身体与环境进行互动从而实现学习。这一方式恰好是当下行业痛点的良好解决办法,并且在这个过程中天然地需要泛化能力。

服务行业需要具身智能机器人具备泛化能力,需要它们“更聪明更懂人”,要克服动态非结构化复杂环境这一挑战,要克服人与机器的高频交互博弈这一挑战,要克服全流程闭环这一挑战,从而更好地解决实际生活中的问题。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

当前具身智能的泛化遭遇瓶颈。多模态大模型能够利用互联网上的文字、图像、视频、音频等数据来进行训练,然而,具身智能大模型眼下仍然缺乏能够用于训练的高质量且大规模的人类操作数据。

擎朗 CEO 李通表示,对于具身智能的发展而言,这是一个“先有鸡还是先有蛋”的问题。

具体来讲,具身智能的数据来源包含以下三个主要途径:一是遥操作采集,通过手柄、体感设备等遥控机器人完成任务来采集数据;二是生产伴随采集,在真实环境中,人类操作员通过穿戴外骨骼等设备,在实际生产中采集数据;三是仿真数据合成,在高仿真 3D 环境中,实现机器人的数据采集。

根据不同的场景任务,将三种采集方式进行综合,这样能够显著提升具身智能体模型的训练效果,并且可以快速让模型能力得以落地。

所以与“一口吃个胖子”相比,擎朗放出了一个吸睛感十足的“大招”,它选择了一条更脚踏实地且真正可行的路,优先实现局部泛化。

擎朗认为,现阶段要直接达成完全泛化的具身智能几乎是不可能的。然而,通过单一任务泛化来实现商业落地是可行的。可以让机器人先把精力集中在特定的岗位场景上,接着再逐步拓展到其他岗位场景,最终达到融会贯通的效果。

软硬件自研技术同步发展,擎朗的具身服务机器人打出了三张重要的王牌。

在这样的理念作用下,擎朗在具身智能的风口找到了恰当的方向,并且率先提交了答卷。此次 XMAN-R1 的发布,还有自研垂类多模态大模型的深度融合,为擎朗在具身智能服务机器人的赛道按下了加速的按键。

对于 XMAN-R1 而言,其核心的设计理念包含岗位化、亲和力以及安全性。这三方面的关键特性能够被视为具身智能服务机器人得以落地的关键抓手。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

在岗位化这一方面,XMAN-R1 具备模拟岗位化姿态以及岗位化行为模式的能力。简单来讲,意味着机器人能够学习人类服务人员的动作逻辑。

值得一提的是,擎朗首次提出了“机器人岗位化”的概念。直观来看,就是把服务场景进行解构,使其成为标准化的岗位单元,接着把机器人定位为标准化的“岗位员工”。

一个机器人负责快餐店汉堡的制作,一个机器人负责炸薯条的制作,另一个机器人负责打包收款结账。

每一项工作内容都能够被精准地进行描述,其结果也能够被以标准化的方式进行评估,这在商业环境中无疑是更有利于形成机器人能力的一个闭环的。

擎朗的人形具身服务机器人能够不断学习和拓展多样化工作能力,这是通过不断复制“岗位化”工作模式来实现的。同时,它还能持续迭代基础动作模型能力,进而实现更广泛的落地场景应用。

在安全这一关键特性方面,XMAN-R1 也可谓是武装到了极致。它在安全方面有着卓越的表现,就如同拥有了最先进的黑科技一般,将安全防护做到了极致。

它搭载了多种传感器,包括摄像头、激光雷达、深度相机等,这些传感器种类丰富。在算法层面,采用了擎朗自研的实时空间三维重建技术。

在各项技术的加持下,机器人具备了较为强大的环境感知能力。它能够实时对环境里的静态障碍物和动态障碍物进行精准的识别,也能够对它们的未来行为进行预测。同时,通过云端大脑可以对复杂任务进行多级规划,最后再结合本地小脑进行自适应的运动控制,以此来保障机器人的拟人化动作逻辑。

感控一体的全身运动规划模型,能够在开放式且复杂的环境里保证人机协作的顺利进行,同时也能保障周边人群的安全。

这种云端“大脑”具有任务理解的功能,本地“小脑”则负责运动规划与控制,这种模式能够很好地将性能、效率、功耗、成本等多方面因素都兼顾到。

这背后,擎朗长期积累了海量开放场景语义数据。擎朗具身多模态模型具备实时决策能力。这两者都发挥着关键作用。

擎朗在避障算法领域有深厚积累。到 2025 年时,擎朗智能在避障领域已申请 165 件发明专利。经查询,在服务机器人领域的授权发明专利数量方面,擎朗在中国服务机器人行业处于首位。

此外,在各类传感器的原始数据处理方面,擎朗实现了创新。在平衡性能与精度方面,擎朗实现了创新。在降低时延方面,擎朗实现了创新。在降低功耗方面,擎朗实现了创新。

首先,从亲和力角度来看。这次 XMAN-R1 的外观对人体比例进行了更模拟。富有亲和力的设计使其能够更好地融入商业环境。机身线条流畅且精炼,既能兼顾科技感,又能展现力量感。

擎朗自身的服务机器人生态除了具备那三大特性之外,在协同性方面也展现出了巨大的潜力。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

擎朗认为,人形具身服务机器人并非对现有产品的替代,而是对现有机器人生态的完善与升维,以解决服务行业的最后一环任务难题。人形具身服务机器人会与专用型具身服务机器人进行岗位化分工,并融入整个擎朗的机器人服务生态。

餐饮领域有配送机器人 T10,酒店场景有服务机器人 W3,清洁领域有清洁机器人 C30,医疗领域有 X101,工业领域有 S100,而人形具身服务机器人 XMAN-R1 将会成为擎朗服务机器人生态矩阵的重要一环。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

人形具身服务机器人通用性较强且适应性较好,能够去执行复杂的任务以及非结构化的任务,它可以和在特定任务方面效率高且精度高的专用机器人形成很好的“互补”关系。

在餐厅里,XMAN-R1 能够独自完成取酒和倒酒的动作,也能够放置托盘等配餐动作。并且它通过机器间的任务调度,把餐品交接给配送机器人 T10。配送机器人 T10 会按照最优路径进行送餐,最终实现服务的闭环。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

通用具身服务机器人与专用具身服务机器人的协同,必然会成为未来智能机器人发展的重要方向之一。两者结合后,能够充分发挥各自的优势,从而更高效、更灵活地执行任务。

总体来看,在机器人的内在方面,在机器人的外在方面,在各类自研软硬件技术方面,在机器人生态协同方面,从岗位化专用做到极致,到实现泛用性的高效迭代,在具身服务机器人该怎么做这件事上,擎朗已经走出了一条切实可行的新道路。

每天有亿条数据,还有数千万次人机交互。在这些背后,具身智能的商业化落地正在加速。

具身智能十分火爆,这使得所有机器人企业都面临着新的机遇和挑战。那么行业究竟会怎样发展呢?企业又该如何抓住需求呢?如何快速迭代产品技术呢?如何拓展市场呢?

擎朗认为,具身智能的发展必须先把“专用”这一环做好,而这也是具身服务机器人实现商业化落地的最佳途径。

李通提及,通用人形机器人的未来前景十分光明。擎朗也对这一方向表示认同。然而,当下数据不足这一状况,已然成为了行业的核心痛点。

通过专用机器人创造场景入口,这是第一步。然后积累数据来反哺技术。只有完成这两步,才能够进一步进行迭代,让具身智能拓展边界。具身智能拓展边界之后,就可以拉动更多专用设备部署,从而形成良性的商业闭环。

从行业的角度来看,擎朗的这种做法具有极高的参考价值。它在各个领域打造出了一群“专家机器人”,通过让机器人处于高度岗位化的场景中,从而能够海量获取高质量数据。接着,利用这些数据快速迭代模型和算法,进而不断提升机器人的泛化能力。

最终,无数细分领域的专家机器人的能力被汇聚起来。这样一来,真正泛用、通用的人形具身智能机器人,离我们就不远了。

未来,真正的“大管家”具身服务机器人,或许会以一个通用大模型当作大脑。各类优秀小模型,它们来自于各领域的“专家”,这些小模型能让机器人在处理各类任务时都能得心应手,并且专业高效。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

在与擎朗的 CEO 李通进行深入交流时,我们能感受到,擎朗对于通用具身智能未来的发展持积极乐观的态度。

擎朗从创业伊始,就始终期望打造出能够服务好企业与消费者的服务型机器人。在这条发展道路上,不断有新的技术相继涌现出来,从深度学习、强化学习,到如今的 AI 大模型、具身智能等,每一种新的技术都将成为擎朗优化机器人体验的有力工具。

在过去的 15 年当中,擎朗将专用服务机器人实现了产业化。擎朗让专用服务机器人实现了商业化普及。擎朗成为了全球最大的商用服务机器人企业。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

擎朗智能机器人生态矩阵

餐饮场景有擎朗部署的专用机器人,酒店场景也有,医院等场景同样有。擎朗累计部署的专用机器人数量超过 10 万台,这些机器人用于配送和清洁等工作。擎朗的服务网络覆盖了 60 多个国家和地区。

这样的积累很深厚,这正是擎朗能够在具身智能浪潮里快速跑到行业前列的原因之一,也是擎朗可以做好具身服务机器人的突出优势之一。

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

擎朗拥有十几年的服务机器人行业经验,在此过程中积累了海量的服务场景数据,这些数据涵盖了餐饮、酒店、医疗、工业等多种场景。而这些数据对擎朗具身多模态模型的能力提升起到了极大的促进作用。

擎朗通过各个场景的视觉、语音等多模态数据进行训练,使其多模态大模型具备优秀的场景感知能力和任务理解能力,而这是其他机器人企业所不具备的。

李通曾说,机器人不单单是效率工具,而且是数据入口。擎朗智能每天会产生超过数亿条的环境感知数据,还会有数千万次的人机交互记录,它拥有着全球最大的商用机器人场景数据源。

“专用机器人的价值不仅是完成任务,更是为通用化提供数据。”

阿里QVQ-Max来了!超绝视觉推理模型,会看网课学编程,免费可用

十余年来,在这期间,擎朗对商业服务场景中的诸多方面极为熟悉,比如客户需求、场景特点以及交互方式等。并且,擎朗会投入大量时间去了解客户整个流程的操作细节。

展望未来,AI 大模型的赋能持续加快,多模态感知技术不断加速迭代。具身服务机器人正加快迈向“通用泛化”。机器人能够通过组合模块化技能库来应对新任务,并且会如同人类婴儿一般,凭借感知运动经验自主构建对物理规律的认知。

擎朗已经实现了全场景的渗透,完成了全品类的布局,并且实现了全球化的拓展。它掌握着技术、市场和模式等多重优势,已经成为撕开万亿蓝海市场的核心力量。

结语:服务机器人赛道掀起具身智能浪潮,擎朗提前交卷

擎朗凭借海量真实场景数据生成的具身多模态模型,具备充足的软硬件工程化/产品化能力,并且经过了充足的技术商业化验证,这三个关键优势已成为其在具身智能时代的最硬底牌。

此外,擎朗智能具备开放生态与尖端设计的能力。如今,擎朗机器人已经完成了市面上多款热门 AI 大模型的接入,并且实现了应用场景的成功落地。旗下的机器人产品多次获得德国红点奖、德国 IF 设计奖等世界级的顶尖奖项。

当下商用服务机器人市场正处于关键的技术革新之年。国产化替代在加速,覆盖场景也在加速扩展。具身智能必定会成为全球商用服务机器人的核心角逐焦点。AI 会给服务机器人赛道带来哪些新的变化呢?又会有哪些产品会令人惊艳地登场呢?我们将拭目以待。

相关内容 查看全部