新闻媒体大肆宣扬:
“2016 年,我们将转向聊天机器人,与过去 10 年从网络到移动应用的转变相比,这种转变将更具颠覆性,也更有趣。”
聊天机器人是“下一件大事”。
我们的期望太高了。业界认为,一个新的创新时代已经到来:是时候用机器来完成社交任务了。
为什么不呢?所有迹象都表明这将是一次疯狂的成功。
信息量太大了!对话式营销是新流行语!微信!中国!
令人烦恼、难以开发的应用程序的供应远远超过需求,而且这种趋势越来越明显。
聊天机器人是 2017 年 MWC 媒体报道的一大焦点。大会组织者表示:“品牌和企业必然会关注聊天机器人,在 MWC 上,人们已经看到了这一点。”
事实上,当时人们心中的主要问题不是聊天机器人是否能够从一开始就腾飞,而是谁将成为该领域的主导力量。
“是否会出现一个单一平台,主导聊天机器人市场和个人助理生态系统?”
一年过去了,我们仍然没有答案。
找不到它。
为什么?
我们说会有一个平台主导生态,但是现在生态都还没出现,你怎么去占领它?
又一轮炒作
聊天机器人是众多一开始轰动然后突然衰落的技术之一。
旧的炒作以一种熟悉的方式展开……
TechCrunch 写了一批文章。
预言思想领袖克里斯·梅西纳走上前来发表演讲。
硅谷对智能自动化垂涎欲滴。
聊天机器人正在入侵 Messenger。
Slack 实现了爆炸式增长,并设立了投资聊天机器人的基金。
期望、期望、更多的期望……然后失败。
我们原以为会发生范式转变,但事实并非如此。
应用程序运行良好。
我们太乐观了,现在我们感到困惑:
“这就是聊天机器人?这就是我们所承诺的聊天机器人革命吗?”
Digit 的 Ethan Bloch 总结道:
“我们是否可以说‘聊天机器人已死’,我不确定,因为我甚至不知道它们是否曾经存在过。”
Heap 产品设计副总裁 Dave Feldman 认为,聊天机器人不仅无法解决一个难题,而且无法解决几个难题。
文本、语音和 GUI:既定的历史
聊天机器人可以通过多种方式与人类沟通。其中最主要的两种方式是文本和语音。在计算机界面发展的早期,书面文字占据主导地位。
用户必须手动将命令输入机器才能执行。
随后,GUI(图形用户界面)出现了,至今仍在使用。我们周围都是窗口、鼠标点击、图标。最终,颜色出现了。
与此同时,一大批科学家正忙于开发数据的NL(自然语言)接口,这样我们就不必学习复杂而神秘的数据库查询语言。
还有一群科学家正在开发语音处理软件,有了它,你可以直接对着电脑说话,而不用打字。事实证明,这比大家想象的要困难得多:
“口音多种多样,有些人说话太快,有些人说话太慢,或者含糊不清,或者哼哼唧唧。”
有时人们说的是一件事,但你听到的却意味着另一件事。
接下来,科学家希望实现人与机器之间的双向交流。20 世纪 90 年代,有人开发了 VCR 系统。以下是对话示例:
用户:你好。
经纪人:您好,请问您叫什么名字?
用户:我的名字是 Candy。
经纪人:你好,Candy!
用户:请为我设置闹钟。
经纪人:什么时候结束?
用户:大约上午11点。
代理将闹钟设为上午 11:00。
很酷,不是吗?该系统可以与人合作,并且准确知道用户想要什么。
这是一个精心设计的系统,非常适合 VCR 对话,但它仅在特定条件下有效。
看看今天的聊天机器人,无论它们是使用文本输入还是语音输入,都面临着各种各样的挑战,必须在各种平台上运行时保持高效率和可靠性。
说实话,我们现在所要实现的目标和 30 年前所要实现的目标是一样的。
我认为人类犯了一些错误:
从聊天机器人与应用程序的对立角度思考
人们认为应用程序已经消亡,最终将被聊天机器人取代。
我们将它们相互对立,却没有意识到它们是以完全不同的方式设计并用于完全不同的目的,而这种误解正是推动聊天机器人发展的动力。
十年前,当应用程序刚刚出现时,人们也这样喊过,但应用程序真的取代了互联网吗?没有。
另一些人则认为,新产品和服务要想获得成功,必须具备以下两个条件之一:更好、更便宜,或者更快。聊天机器人真的比应用程序“更便宜”或更快吗?不,至少现在还不是。
它们是否更好是一个主观判断,老实说,即使是当今最好的聊天机器人也无法与当今最好的应用程序竞争。
没有人认为使用 Lyft 太复杂,也没有人认为通过应用程序订餐或买衣服很难。相反,使用聊天机器人做这些事情要困难得多,而且经常出错。
图像是聊天机器人失败的原因之一
如果它是一个优秀的聊天机器人,它可以像普通的应用程序一样有用。如果应用程序丰富、复杂、层次繁多,聊天机器人将无法与之竞争。
为什么?因为机器允许人类连接到大型复杂的信息系统。早期的图形信息系统是一项革命性的突破,它帮助我们“定位”这些系统。
如今的应用程序是经过数十年的研究和实验才得以实现的。我们为什么要抛弃这些呢?
如果我们不说“替换”,而说“扩展”,事情会变得更有趣。
当今最成功的聊天机器人体验就像是一种混合技术,将聊天嵌入到具有许多传统元素的更广泛的服务中。
例如,Penny 既提供基于聊天的建议和警报,也提供传统的帐户仪表板和交易列表。
例如,HubSpot Conversations 将 Facebook Messenger、聊天、社交媒体、电子邮件和其他消息门户合并到一个共享收件箱中。
Layer 为开发者提供了工具,帮助他们为移动和桌面网络开发个性化的信息体验,就像原生应用一样。
下一波应该是“多模式应用”,你可以用语音告诉机器你想要什么(比如告诉 Siri),然后你就可以获得地图、文本和语音信息。
为聊天机器人开发聊天机器人
我的产品真的需要聊天机器人吗?现有的平台是否足够?我们是否有耐心构建一个可以按照我的要求执行操作的聊天机器人?
对于很多公司来说,聊天机器人并不是正确的选择。在过去的两年里,我们看到了很多公司盲目使用聊天机器人来解决根本不需要聊天机器人的问题的负面案例。
纯粹为了自身利益而开发聊天机器人,让其自行运行并希望获得良好的结果根本不可行。
大量聊天机器人都是基于“决策树”逻辑开发的,当用户输入时,系统会捕获关键词,然后寻找预设的响应答案。
这样开发有一个好处:设计的时候需要考虑要处理什么情况,而这种方式可以很方便的列出各种情况。这个优点也是它最大的缺点。
为什么?因为这样的聊天机器人是创造者能力、专注力和耐心的体现,取决于创造者预测用户需求和输入的能力。
当使用不在“范围”内时就会出现问题。
最近的一份报告显示,Facebook Messenger 上有超过 10 万个聊天机器人,其中 70% 无法处理简单的用户请求。为什么呢?主要是因为开发者想缩小聊天机器人的范围,专注于某个领域,但还是失败了。
在开发 GrowthBot 时,我们希望它针对销售领域和营销人员,而不希望它成为一个通才。
请记住:让机器人做好一件事比让它做很多事做得不好要实用得多。
无法访问
如果开发者能力很强,几分钟就能开发出一个简单的聊天机器人。但如果你想让聊天机器人能够进行对话,那就另当别论了。虽然我们吹嘘人工智能取得了多大的进步,但要让人工智能像人类一样聪明,还有很长的路要走。
在理想情况下,NLP(自然语言处理)应该允许聊天机器人理解它们收到的信息。但 NLP 才刚刚在实验室中开发出来机器人聊天的软件叫什么,还很年轻。
一些平台提供了一些 NLP 功能,但即使是最好的平台也还处于起步阶段。看看 Siri,它只能理解你的话,但不能理解其含义。
Matt Asay 曾表示,由于该技术尚不成熟,因此带来了另一个问题:它无法吸引开发人员的注意力并释放他们的创造力。
“除非机器智能真正接近人类智能,否则消费者不会太感兴趣。要真正引起消费者的兴趣,你必须拥有足够先进的人工智能技术,让消费者觉得与机器人聊天很有价值。”
对话非常复杂。它不是一个线性过程。一个话题围绕另一个话题展开,根据情况进行调整机器人聊天的软件叫什么,可能会重新开始或突然结束。
当今的对话系统基于规则,无法应对无限的可能性。利用统计方法开发机器学习技术太过有限。总之,能像人一样交流的人工智能尚未出现。
与此同时,有没有可以引领行业发展的定制聊天机器人的“优质案例”呢?非常少。
戴夫·费尔德曼曾经说过:
“Slack、Facebook、谷歌、微软、Kik 等公司是否应该开发自己的聊天机器人并引领潮流?他们是否应该更积极主动地投资聊天机器人、建立孵化器、聘请导师教育参与者或提供工程资源?他们是否应该为知名合作伙伴提供资金支持?在我看来,是的,是的,他们应该这样做。对于平台来说,开发者就是用户。我们为什么要开发产品?我们为什么要这样开发?我们不能指望用户理解。我们必须向他们展示。”
不应忽视 GUI
以前,如果你想与计算机通信,唯一的方法就是在终端中输入命令。视频界面使用窗口、图标和鼠标来引导用户,这是一场改变信息处理方式的革命。
从文本转向 GUI 有充分的理由。从输入角度来看,GUI 输入更简单、更快捷。点击或选择比输入整个句子更可取(即使它是可预测和可纠正的)。在输出方面,一张图片胜过千言万语。
为什么我们喜欢用光学方式显示信息?人类是高度视觉化的动物。为什么孩子们喜欢触摸屏?这并非偶然。先驱们受到认知心理学的鼓舞,开发了图形界面,研究告诉我们大脑是如何沟通的。
对话式 UI 旨在复制人类喜欢的交流方式,但需要人类付出更多的认知努力。说实话,这实际上是在抛弃简单的东西,转而采用更复杂的替代方案。
是的,有些场景我们只能使用语言,但对于完成大多数任务来说,GUI 比对话式 UI 更高效、更直观。
人类喜欢与他人交谈