中国人工智能学会

Chinese Association for Artificial Intelligence

CIIS 2018 演讲实录丨朱小燕:人机交互中知识问题

发布时间:2018-12-12

由中国人工智能学会主办,广州易间网络科技有限公司承办的2018第八届中国智能产业高峰论坛11 月17-18日在成都完美收官,论坛在两天的会议里带来了多场精彩报告。

此次小编为大家整理的是来自清华大学教授,智能技术与系统国家重点实验室主任朱小燕主题为《人机交互中知识问题》的精彩演讲。 

12-1.jpg

朱小燕

清华大学教授

智能技术与系统国家重点实验室主任 

以下是朱小燕教授的演讲实录: 

今天的报告分三个部分——人机交互的内涵外延、人机交互中知识问题、如何在交互中应用知识。从内涵的角度,人机交互是认知智能展现的窗口;人工智能技术改变世界的途径,其中包括通过交互控制这种改变和提供人机互动的模态;人机交互是人工智能技术落地,改变我们生活和各种形态必要的而且是最重要的途径。只有通过人和机器的交互,才能控制人工智能带来技术上、生活上的各种变化,而避免人工智能“暴走”的风险。人工智能的外延角度,人机交互可以理解为落地的应用,最典型的是人机对话,如客服;其次有智能信息管理,例如语义信息查询等,在这个数字经济时代,信息智能管理或者是语义管理越来越重要;还有人机协同,比如辅助驾驶或者机器人助理,人们越来越感受到机器助理生活在你身边。代表性的有SIRI。还会有各种APP给你做查询、做规划、做方案等。 

知识相关问题可以分为两个方面,一是常识性知识;一个是领域相关知识。常识性知识中包括知识认知问题和建模算法问题。从认知角度上讲,做计算的利用知识,更多看到光明的一面。然而从社会学的角度有很多不同的声音(不是谁对谁错的问题)。 

12-2.jpg

下面这张图是多伦多大学Frank Rudzicz教授报告中的截图。SIRI实际的反馈,被认为是AI伦理问题的例子。因为这些例子批评SIRI,我认为是不公平的,SIRI不可能回答这种问题。因为,系统没有足够的知识支持她回答这么深层语义的问题。 

从算法的角度。大家都知道带来这次人工智能春天的主要是基于统计学的机器学习算法。然而统计学有偏差。如下图所示。

12-3.jpg

She is a doctor and he is a nurse这句话没有问题。但是,其内容可能会影响系统输出可信度,原因来自于训练语料。这是法律专家认为人工智能有性别歧视问题给出的例子。第二个例子是关于四川料理是不是辣的问题。这样的问题在机器对话中,往往叫做上下文不一致性问题。但是我认为这个是一个常识性问题。因为,不知道四川料理以辣为主的人,也会犯这样的错误。 

关于领域相关知识我想强调数据与知识库构建两个问题。现在是大数据时代,大数据的这一波热潮兴起在人工智能之前,包括移动互联网带来大数据时代,但是我们做知识相关实际项目时,它真的不见得是大数据,有时可能没有大数据。给一个例子如下图所示。

12-4.jpg

无法确定数据标注方法是最大的问题。 

另一个问题是知识图谱构建问题,其中包括如何构建、评价和更新知识图谱,和谁去做知识图谱构建这件事情。作为学术研究者,总觉得应该是企业懂业务的人构建知识图谱。但是实际上行不通,企业业务专家的业务逻辑和我们想建的知识图谱的逻辑不(完全)一致。因此,只有双方坐下来反复、深入沟通,才可能完成。 

知识应用有两大方向——建模过程中融入知识和在系统框架中利用知识。

在建模中如何融入知识,包括知识表示、知识推理影射,以及多路径融合和知识动态分析。这里介绍几个我们课题组博士生的工作。论文列表如下:

 12-5.jpg

举一个例子,TransG模型。目前最通用的知识三元组表示方法是用向量关系表示实体关系,一个头向量,一个尾向量,还有中间的关系向量。事实上,知识表达关系内涵特别丰富,例如,a part of这个关系,一个城市是一个国家的部分,一个椅子腿是桌子的部分.....用一个向量去表示是非常困难的。博士生所提出的混合高斯的方法可以比较好地解决这类问题。 

12-6.jpg

另一个例子是2013年发表在SIGIR的工作,讨论如何从动态变化的社交媒体内容上挖掘动态的、有时效性的知识。比如这是奥巴马,随着不同的时间在互联网上寻找他相关的最热的话题,对这个话题进行描述,展示相关内容。如下图所示。最开始就是奥巴马参加选举,有各种各样的话题。他连任时又有一些新的话题。这也是一个图谱概念,把知识跟互联网上的信息关联起,不停获取和更新知识。

12-7.jpg

在建模时融合知识的另一类工作是以生成模块为背景的工作。如: 

12-8.jpg

对生成语句的控制。“我非常饿”,在不同的情况下,可以给出不同的语句。这就是一种对机器的控制。我们希望机器人能被人控制的。对机器人的评价有“智能”和“智障”,有些用户说“我宁愿机器智障,也不想让他抽风”。因此,能够控制机器的输出,控制其语音行为、控制风险是非常重要的。 

另一个工作是情绪化对话生成。控制机器表达的情绪,让机器人可以更生动一些。也是通过控制机器的语言,进而控制其动作。另一个例子是个性化的对话生成。例如下图,这个宝宝叫旺仔,是一个3岁、喜欢玩游戏和弹琴的男孩。这个工作生成的系统可以控制输出内容,不仅仅是迎合用户的问题,而是有自己的基本原则。 

12-9.jpg

最后一部分是如何在系统架构中通过知识,迭代学习。还没有很好的论文发表主要考虑如何将环境数据、语义理解和知识图谱维护这三个环节联合建模。 

结论:知识是必须的,知识缺失的系统无法达成人类对智能系统的期待。知识是可用的,某种意义上已经能够支持开放领域、特定领域多种信息服务。知识相关研究远远不够,知识表示、知识融合、知识评估等有极大的发展空间。研究不是孤立的,知识的研究与多种信息处理技术息息相关。例如数据采集、语义计算、语义理解、推理等、等。简而言之“任重道远”。 

(本报告根据速记整理)

CAAI原创 丨 作者朱小燕教授
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会