发布信息

意图识别:从人类进化到AI技术,探索智能设计中的关键能力

作者:软荐小编      2025-01-20 14:01:25     99

意图识别是指理解他人或智能体的意图。它是人类有效沟通、融入社会的重要能力。经过数百万年的进化,人类已经具备了识别外部刺激意图的能力。现代研究表明,婴儿在14个月大时就已经能够识别他人的意图。研究还发现,意图识别能力的缺陷与自闭症等个体的沟通和社会行为异常显着相关。随着人工智能技术的快速发展,人类与智能体的交互越来越多,意图识别对于人类与智能体的有效沟通和和谐共处显得尤为重要。因此,意图识别逐渐成为学术研究的热点。据检索,1990年关于意图识别的研究论文有77篇; 2020年,这一数字增至2,251;到2023年,该领域共发表研究论文2,376篇。

本文将与读者一起探讨意图识别的基本概念,并介绍其在智能设计中的应用。

意图识别

意图可分为社交(如会议等)和私人(如个人驾驶等);意图也可以分为长期(如出行计划)和短期(如汽车刹车)。由于社会性和长期意图涉及多种因素,目前的研究主要集中在特定环境下,尤其是人机交互中的短期操作意图识别。

这种对短期操作意图的认可有两个重要特点:即时性和直接性。即时性是指从产生意图、计划到执行的时间间隔很短。直接性是指意图与操作者当前执行的任务密切相关。

1.SUT意图识别模型

为了识别复杂人机系统中的操作意图,例如飞行员驾驶飞机、火车司机驾驶火车等,我们构建了SUT(S,情况;U,用户;T,任务)意图识别模型。我们假设在人机系统中,整个系统存在一整套操作意图。通过对任务和情境状态的分析,逐渐收集操作意图集。最后,通过操作者意图识别,可以确定特定任务和情况下的操作意图。例如,飞行器的每一次操作,例如按下启动按钮,都对应一个操作意图。当所有的操作意图汇集在一起​​时,就有了一套完整的操作意图。当飞行器处于起飞阶段,即任务(T)起飞时,总体运行意图可以转化为起飞阶段的一组运行意图。如果飞机左侧刮来侧风,即情况(S)发生变化,则起飞时的一组操作意图相应地转换为应对侧风的一组操作意图。在此基础上,通过识别飞行员(U)的操作意图,可以确定起飞阶段和存在侧风时的具体操作意图。

在复杂的人机系统中,获取特定任务情境的操作意图总集和意图子集是一项复杂的系统任务,需要专门的任务和情境分析,包括工作域分析、操作策略分析、操作任务分析等。系统功能分配。此外,这些意图集之间的转换需要各种系统参数的自动收集和处理。

在工程实践中,SUT模型已应用于复杂人机系统的操作意图识别,并取得了良好的效果。例如,在传统的飞机显示器设计中,飞行员需要通过电子显示器找到菜单和选项来进行操作。借助意图识别机制,电子显示屏可以自动呈现飞行员所需的操作选项,无需搜索,实现了“按需显示-操作”的新信息显示模式。

SUT 意图识别模型提供了一种在复杂系统中解析大量人类意图的方法。通过分析任务、情况、当事人,将复杂的问题逐步简化,最终得到更完整的结果。在类似的系统中,也可以参考这种渐进分析思想来分析看似复杂的问题。例如,在人工智能翻译中,“你好”这句话的音译很简单,但其实际含义却涉及到语义分析问题。通过分析说话人的特征、所处的情境以及从事的事情(任务),可以获得更好的意图识别结果。

2. 操作者操作意图识别

在SUT模型中,操作者操作意图的识别是人机系统短期意图识别的重要一步。识别操作者的意图需要分析他们的外部行为、神经生理指标和环境线索。

外部行为特征包括操作者的操作信息和操作特征信息。操作信息是指操作者在人机界面上的操作以及机器系统记录的信息,如按键速度等。操作特征信息是指操作者在人机交互过程中的外部特征信息,如眼球运动轨迹、注视点、头部旋转角度等。这些行为信息需要通过专门的设备来采集,如眼动追踪系统、动作捕捉等系统等

利用外部行为特征可以更好地实现操作意图识别。例如,通过方向盘角度、转弯速度、转向扭矩、转向灯状态等特征参数,利用BP(反向传播)神经网络建立模型来预测驾驶员的变道意图。实验结果表明,该模型的准确率达到91%。此外,通过摄像头获取眼球注视特征、头部运动状态、面部视觉状态等特征信息,也能有效识别操作意图。眼睛注视行为是人类意向归因的关键线索之一。人类经常使用目光来预测和解释他人的意图。

肌电图、表面肌电图、脑电图等神经生理信号在操作意图识别中也很常见。在智能假肢和外骨骼机器人系统中,肌电信号得到广泛应用,可以直接反映肌肉运动倾向,分析运动意图。例如,有人设计了膝盖外骨骼。通过添加肌电传感器并与编码器和LBAK(指膝关节中心到脚踝的距离)传感器融合,运动意图识别的成功率从82.1%提高到92%。同时,识别时间缩短了27.1毫秒。

环境信息对于识别运营意图也非常重要。例如,在驾驶场景中,控制意图往往与道路环境相关。交通环境是激发或阻碍驾驶员变道意图的重要因素。

在实际作业中,研究人员通常采用多模态信息融合的方式收集操作者在作业过程中的外部行为、生理和环境信息,并在此基础上利用深度学习等算法构建识别模型。

怎样的沟通算有效沟通_中文意图识别_

智能设计

基于意图识别的智能设计可以自主感知外部信息并进行分析、处理和响应,从而极大地改善人们的工作、学习和生活条件。

1、人机系统

智能化设计的主要目的是提高系统效率和安全性,这是通过推送信息和提供辅助操作来实现的。

推送信息包括辅助信息和警示信息。辅助信息是指帮助操作人员更高效地进行操作的相关信息,如操作方法、操作内容、环境信息等。在交互显示设计中,系统可以直接推送操作者进行的相关操作信息,实现“按需显示-操作”的信息显示方式,甚至可以通过控制按键的高亮显示来推送操作路径信息。这不仅减少了操作时间,还有助于有效管理工作量。

预警信息是系统意识到存在风险时向操作人员推送的警告信息。目的是提醒操作人员提高警惕,防止发生事故。例如,当驾驶员的变道预测模型检测到驾驶员有意违反交通规则时,会自动发出警告,避免发生交通事故。

辅助操作方法有模糊控制和人机共享控制。模糊控制是最常见的智能控制策略之一。操作人员无需精确控制操作装置即可完成任务。例如,智能鼠标在识别操作者的操作意图后,会自动调整鼠标控制显示增益,以保证操作者的有效操作。当光标需要移动较长距离时,增益增大,操作者只需移动一小段距离即可到达目标点;精细定位操作时,增益减小,有利于精细操作。又比如,焊接工人远程操作智能机械臂进行焊接时,由于经验不足,很容易因抖动而出现锯齿状轨迹。识别工人的操作意图可以让系统协助工人按照预期路径完成焊接,显着减少轨迹上的缺陷。

人机共享控制权也是实现辅助操作的一种方式,当操作者进行不当操作时可以及时干预。

例如,当飞行员在飞行过程中出现不合理的操作意图时,座舱辅助系统会及时识别并向空管部门反馈,以采取相应措施,确保飞行安全。在紧急避障过程中,驾驶员容易因紧张而做出过度或过大的转向操作。当系统识别出紧急避让操作意图时,会及时干预,维持车辆行驶的稳定性。

2、智能化设计的应用

意图识别不仅应用于工作场景,也广泛应用于生活和学习场景。这些应用程序不仅具有操作性,而且具有社交性。

首先,意图识别已经广泛应用于人们常用的APP设计中。例如,在出租车应用中,出发点可以自动默认为 GPS 定位,目的地可以默认为常用位置。如果开发者更聪明,他们可以使用SUT模式来更准确地设置用户的起点和目的地。例如,如果你每天打车上班,地点和时间都比较固定,那么APP可以根据GPS定位和时间判断,自动设定出发地和目的地。

基于意图识别原理,我们设计了自适应动态手机电话本。当您去北京出差或旅游时,经常联系的朋友的名字会自动列在电话簿顶部,消除搜索的混乱。

这种基于意图识别的智能设计思想可以延伸到APP的整体框架设计中。我们曾经审核并更新过一个APP。原设计有数百个操作功能,用户需要通过菜单来查找功能。研究发现,用户常用的功能只有十个。在此基础上,我们改进了APP的交互设计,将这十个功能图标直接放在了首页。这样,用户就不需要进行搜索,提高了操作效率。然而,很多软件界面设计并没有考虑用户的操作意图。例如,在最新智能手机的“设置”功能中,界面呈现了一堆设置选项,用户需要找到所需的功能。如果你知道用户在“设置”中80%以上的操作只是为了连接局域网,你就会觉得现在的智能手机其实并不智能,没有体现出意图识别的优势。

除了软件界面设计之外,生活设施和环境方面也有很多智能化设计。例如,智能马桶通过人体手势识别技术自动打开马桶盖;机场车站、家庭社区通过人脸识别技术自动放行人员;学校教室和会议室的照明通过群体手势识别技术自动设置会议和PPT播放模式。此外,环境的照明、温度和通风设计还可以利用人体动态姿势和状态识别技术来调整各种微环境参数,以提高人们在环境中的舒适度。

随着科技水平的提高,特别是人工智能技术的发展,基于意图识别的智能设计将逐渐取代传统设计,一个新的智能化时代即将到来。

前景

首先需要说明的是,从SUT模型到操作意图的识别,再到智能设计,我们讨论的意图识别是机器(或智能体)对操作者(或当事人)意图的识别)。但交互是双向的,也就是说,操作者(或当事人)对机器(或智能体)的意图识别也是一种意图识别。我们称之为“代理的意图识别”。有效实现智能体的意图识别,是人类与智能体之间建立相互信任的基础,也是人类与人工智能和谐共存、协同发展的基础。

今年(2024年),在ChatGPT等生成代理引起巨大关注后,有人测试了人类与ChatGPT之间的沟通能力。结果显示,ChatGPT 在五项测试中的四项(包括错误信念和不尊重)中表现优于人类个体。此外,还有人提出了“人工智能商数”(AIQ)的概念。这个AIQ的水平直接决定了人类和智能体之间沟通的有效性。因此,我们需要加强对智能体意图识别的研究,以提高人与智能体之间的有效交互。

第二个问题是,如果智能体能够有效识别人类意图,我们是否可以接受这个事实?我想,能够给出肯定回答的人是很少的。每个人都需要隐私,而行为意图是最大的隐私之一。因此,在工作场景中,为了系统的效率和安全性,智能体应该有效识别人类的操作意图;但在其他情况下,例如生活场景,应该避免智能体识别人类意图。这个问题需要更多学科的参与和深入研究。

本文主要介绍机器或代理进行人类意图识别的技术,以及基于该技术的智能设计思路。我们相信技术进步需要更多的研究。我们现在所做的一切都是为了实现我们美好的愿景。 MI·色谱柱

主要参考文献

邓 Q,王 J,希勒布兰德 K,等。换道行为的预测性能:组合研究

驾驶模拟器中的环境和眼动数据[J]. IEEE 智能交通汇刊

系统,2019,21(8):3561-3570。

Strachan JWA、Albergo D、Borghini G 等人。在大语言模型和人类中测试心理理论[J].

自然人类行为,2024:1-11。

Khalil R、Tindle R、Boraud T 等。自闭症的社会决策:关于镜像神经元、运动控制、

与模仿行为[J].中枢神经科学与治疗学,2018,24(8):669-676。

Leonhardt V, Wanielik G. 基于驾驶情况和车道变换预测的特征评估

驾驶员行为[C]//2017第20届信息融合国际会议(Fusion). IEEE,2017:1-7。

Moon DH, Kim D, Hong Y D. 使用物理传感器和单腿肌电图进行意图检测

膝关节外骨骼[J].传感器,2019,19(20):4447。

秦晓,卢建国,陈C,等。人工智能商数(AIQ)[J].可在 SSRN 4787320, 2024 获取。

塞尔·J·R.意向性:心灵哲学论文[M]。剑桥大学出版社,1983。

王强,焦文,余瑞,等。基于人类意图识别的虚拟现实机器人辅助焊接[J].

IEEE 自动化科学与工程学报,2019, 17(2): 799-808。

Yott J,Poulin-Dubois D。婴儿的心理理论能力是否得到了很好的整合?隐含的理解

意图、愿望和信念[J].认知与发展杂志, 2016, 17(5): 683-698.

郑华,马S,方L,等。基于电子制动系统的制动意图识别算法

商用车[J].国际重型车辆系统杂志,2019,26(3-4):268-290。

鲁慧秋,赵峰,谢波,等。冰雪环境下基于神经网络的驾驶员换道意图识别[J].吉林大学学报(工学版), 2023, 53(1): 273-284.

刘华.基于自适应鼠标的指向任务效率研究[D].浙江科技大学硕士论文,2014.

本文来自微信公众号,作者:葛烈忠,36氪经授权发布。

相关内容 查看全部