发布信息

2024 科创先锋大会:闫维新谈机器人在各领域的作用

作者:软荐小编      2024-11-14 21:02:57     195

机器人人工智能与物理世界交互的最佳选择之一,它们可以再现人工智能积累的信息和数据,并在生产、教育、装配、交互和危险场景等领域发挥作用。”上海交通大学博士生导师、上海人工智能研究院首席科学家、上海致远新技术有限公司联合创始人颜伟新在“2024年(第五届)科技创新先锋大会暨产业创新跨区域协同发展圆桌会议”。

2024澎湃科创先锋|闫维新:通用AI与机器人结合引领产业变革__2024澎湃科创先锋|闫维新:通用AI与机器人结合引领产业变革

颜伟新 上海交通大学博士生导师、上海人工智能研究院首席科学家

11月13日,2024论文科技创新先锋大会暨产业创新跨区域协同发展圆桌会议在上海成功举办。本次会议由澎湃新闻主办,南通市科学技术局、南通新闻传媒集团协办,上海临港集团、江苏省启东吕四港经济开发区特别支持。特别感谢阳光保险集团的支持。大会以“科技创新,共同推动质量提升”为主题,旨在汇聚政府领导、行业领袖、学术专家和科技创新生态链知名人士,共同探讨科技创新新路径。科技创新与产业协调发展,推动经济社会高质量发展。

2024澎湃科创先锋|闫维新:通用AI与机器人结合引领产业变革_2024澎湃科创先锋|闫维新:通用AI与机器人结合引领产业变革_

论坛上,颜伟新展示了人工智能技术的巨大潜力,分享了通用人工智能技术在机器人领域的最新应用成果,并探讨了机器人产业未来的发展趋势。他提到,人形机器人将具有人类形态,对智能有更高要求,是多交叉融合行为。对于人形机器人或机器人来说,涉及到电子、机械、硬件、软件、人工智能等,基于此,未来机器人产业的发展将带来行业的变革。

以下为演讲全文:

我跟大家交流一下人工智能和机器人。机器人是建立人工智能和整个物理世界的最佳选择之一。以前人工智能积累的知识可以通过机器人进行复制,并在生产、教育、组装、交互中进行处理,尤其是危险场景中的一些事情,很多人不喜欢,在危险环境下很难做。

以下是我自己的博士和博士生导师在机器人应用领域参与过的几个项目。这是最早与烹饪相关的机器人工作单元之一,即制作汉堡包。它通过轨迹规划完成整个工艺流程,并在整个过程中分析整个烹饪过程。分析后,它会浓缩几个动作的元素,这些动作可以由机器人再现。大约20秒即可制作一个汉堡。冬奥会的机器人餐厅也是类似的计划。当时我参与了汉堡、煎、蒸、烤等烹饪机器人方案的设计。当时的烹饪情况是根据表面情况来判断的。这也是使用传统工具制作炸薯条。就像人一样,原料出来后直接倒进锅里。没有办法应对紧急情况。此前人工智能还没有参与其中。在机器人餐饮领域,当时的机器人通用性有限,鲁棒性有限,无法处理很多突发情况。

人工智能实际上促进了人形机器人产业的发展。为什么人形机器人如此受欢迎?一是工业机器人、协作机器人关键零部件打下了坚实基础。二是大语言模型的出现使得人机交互成为可能。同时,这一思想为大样本、大计算能力下的具身智能垂直模型的出现奠定了基础,可以完成以前人形机器人难以完成的任务。它将成为未来产业重构的基础。我思考过一件事,那就是新能源汽车的存在是对原有汽车的增量和升级,而人形机器人则有望重塑整个产业链布局。

第一个是柔性制造方向,包括焊接、喷涂等,这些都可以在工业机器人上完成,但很多都和装配、柔性相关,枯燥的场景还有很大的空间。其次是特殊替补方面,这是我最看好的。我去了南方电网广州盾构机现场。广东不像上海那样是冲积平原,地质比较单一。但在广东,通过人口更换刀头时,一旦造成不平衡,很容易造成人员伤亡。危险场景替换是现有人形机器人或现有具有体现智能或远程操作的机器人最有机会的情况。三是教学科研。

现在已经是第四代机器人了。第四代通用机器人相当于在某些领域能够实现相对通用的泛化能力的机器人本体。人也不同。有的人像刘翔跑得很快,有的人跑得很快。是特别好。机器人本体也有不同的配置,但在某一类别上可以实现通用性。第二种观点是,未来人形机器人将部署在工厂中,现有工厂的工业机器人和协作机器人的智能化升级将比人形机器人更早实现,因为这种情况下只有感知、算法和后计算能力,它实际上可以完成许多以前难以完成的任务。因此,通用类人机器人和通用人工智能不仅仅赋予类人机器人,而是赋予所有具有操作能力、一定自主规划、自主决策、自主执行能力的机器人。

2028年之后,第四代机器人将有更大的发展。去年是仿人机器人元年,今年是小批量应用的推出。我们也在做一些实验,包括排序和PTC工作。在我们整个应用中使用更高的计算能力、更大的样本空间以及更丰富的垂直模型,我们将在2028年之后迈向第四代整体机器人的时代。

对于国内外机器人化的发展,我国做得很早。起初,我们以为人形机器人是用于科学研究的。后来我们发现花2万到3万美元完成一个人形机器人及其背后所体现的智能处理能力是可行的。在江浙沪基本上都能找到机器人所需的零部件,但在算力方面存在差距。与此同时,中国也有企业正在部署相应的算力。我认为这是我们在样品方面最大的优势。海量的应用空间,特别是江浙沪长三角应用的全面覆盖,可以为机器人应用落地提供大量机会。

人形机器人将具有人类的形态,对智能有更高的要求,并且是多交叉融合行为。对于人形机器人或者机器人来说,涉及到电子、机械、硬件、软件、人工智能。事实上,这件事以后不会再这样了。发展会带来产业变革,产业变革又会分为几个方面。

首先是认知能力,会变得越来越聪明。二是认可,高效高速开发能力、增强迭代能力、规模化制造能力和超低成本国产制造能力,在五个技术方面取得重大突破。 、计算、运行控制、能源、驱动以及整个结构,特别是我的本体。

目前,以to B汽车行业为例,一些复杂的场景仍然由人工完成。但现有的工业机器人基本不具备这种能力,包括整个机器人的自主决策能力,以及触觉和视觉的交叉融合感知能力。在这种情况下,汽车厂需要大量的此类工种,人形机器人就会有一定的空间。

我有一个想法。你总觉得我们的腿真的很完美吗?其实除了腿之外,轮子其实也非常完美。对于腿部来说,当外部动态特性较高、需要在较强负载下的抗干扰力时,需要进行刚柔耦合设计,最终完成机器人大脑。布局、小脑、脑干和大脑。脑干负责各关节速度环、电流环、扭矩环的控制。小脑负责运动控制、步态控制和上肢运动控制。大脑负责感知和决策。这样的设计,需要有终端侧的算力基础,而这正是目前国内所缺乏的。我们还需要努力去完成它。这种卡脖子的感觉很不舒服。

仿人机器人的计算能力包括电动关节、AI计算和超级计算中心。这是全产业链的全新布局。经过这个新的布局,我深入思考目前我的人工智能如何赋能人形机器人?一是灵巧的操作能力。如今的人形机器人看起来只是四处走动,但它们实际上能做什么呢?它需要工作,构建一个完整的平台,具有灵巧的操作能力和体现的智能。对于整个灵巧的操作能力来说,灵巧的手已经发展了很多年了。现在的灵巧手关键在于具体的配置。

后来我列了一个清单,包括任务清单,重点是家庭服务机器人,包括举、抓、压等几个动作来尝试。之后我赋能我的具身智能算法来完成我的整个感知,添加了很多传感器,它可以做出一些超人的动作。我们人类只能达到400到760纳米的视觉范围。该机器人可以感知红外和紫外光谱。第二件事是我们还可以在背后添加摄像头,所以在这种情况下我们可以感知整个场景。有可能在感知上超越人类的能力,同时在运动执行上超越人类的能力。

然后我成了一名厨师,我们完成了智能餐厅。我们结合传统烹饪,构建了一个人形机器人的应用场景。我们完成了几个烹饪过程,然后就是清洁部分。左边是我们对烹饪的全部理解。相关工具类的列表和整个操作都一一完成。为此,我们需要打造具身智能。具身智能必须完成碳基生命与硅基生命的结合。它的结合就是人机融合模式,用具身智能赋能人形机器人。这个时候我们需要有一个标准的数据采集平台,然后有整个训练集来采集人的动作和链接动作作为样本和模型建立,建立之后再进行重现。我们现在发现的一件事是,在训练一些特定任务时,一万级以上的数据可以大大提高任务完成的成功率,可以达到98%。然而,远程运动仍然处于被征服的过程中。

建立了数据采集平台之后,我们可以期待通用人工智能和通用机器人的结合,包括我个人,我参与的公司,以及我个人在上海交大想做的事情。第一个是我会搭建一个数据采集平台,它不是简单的远程操作,而是会将机器人捕捉到的物体的力反馈给人类。二是灵巧的双手,角度在20度以上。三是制作仿人机器人专用关节模块。之后,我将制作一些串联和并联混合体,包括与人类姿势不同的机器人。事实上,它已经开始了。明年之后,你可以看到我的研究方向还包括开放场景下的体现智能的研究,很多特殊行业,包括危险场景的处理,以及主被动混合模式的复杂地形应用。

相关内容 查看全部