中国人工智能学会

Chinese Association for Artificial Intelligence

CAAI人工智能大讲堂丨于剑:漫谈人工智能

发布时间:2018-01-22

2018年1月18日,由中国人工智能学会主办《人工智能大讲堂》第二期在北京开讲。中国人工智能学会理事、机器学习专委会副主任于剑教授带来以《漫谈人工智能 》为题的精彩报告。

本期听众面向300余位中小学校长(教育工作者),报告详细的梳理了人工智能的定义与人工智能的“三大流派”,通过分析指出现在人工智能面临的基本问题,为现场听众答疑解惑。

1516605365406220.png

于剑

CAAI副秘书长

北京交通大学人工智能研究院院长、二级教授

以下是于剑教授的演讲实录:

非常高兴有机会代表中国人工智能学会,向各位老师来讲一点人工智能的事情。刚才南方科技大学的陈十一校长给了一个非常高大上的报告,作为下一位的讲者,我压力山大。 毕竟,这也是我第一次做这种半学术性的报告,以前都是做纯学术性的报告。我尽量做好,如果做不好的话还请各位老师原谅。 首先说一下报告提纲,今天的报告分5部分,现在讲第一部分。

在讲第一部分之前,先说为什么要讲人工智能。 创新人才教育研究会为什么要请人来讲人工智能呢?实际上,这个问题刚才陈校长已经回答过了,这是因为现在已经进入了人工智能时代。下面做一个更详细的论述。

从国家政策来说,2017年7月20日国务院印发了《新一代人工智能发展规划》,国内国外一些国家像法国、德国、美国等也出台了一些政策。

从产业界来说,现在几乎所有的IT企业都宣称自己是人工智能企业了,像IBM,原先是做硬件的,现在都转型做人工智能了,原先的许多软件企业如百度、谷歌、微软等更是全面转型人工智能。

从实际产品来说,那就太多了,随便举一些例子,如寒武纪 1H8等AI芯片,百度Apollo计划开放自动驾驶平台等。 

甚至人工智能伦理也提上了议事日程,如2017年1月,提出了Asilomar AI Principles 23条。

为了说明人工智能的热度,我们放一张照片,这张照片说明人工智能不光是世俗人热,现在连修道者开会都要讲人工智能了。

说起人工智能的起源,这个报告并不打算追溯很远。现代AI的起源公认是1956年的达特茅斯会议。 达特茅斯会议,一共就10个人参会,开了两个月的会议,会议的成果就是AI成为了一个独立的学科。人工智能如何定义呢?常见的定义有两个:第一个是马文明斯基提出的,“人工智能是一门科学,是使机器做那些人需要通过智能来做的事情”。第二个更专业一些的定义是Nilsson给出的,“人工智能是关于知识的科学”。什么是知识的科学?就是研究知识的表示、知识的获取和知识的运用。

这两个定义这是我们最常见的AI定义。严格说来,人工智能到现在并没有统一的定义,但是在常见的这两个定义当中,专业人士更偏向于第二个定义。这是为什么呢?原因也很简单,因为第一个定义当中涉及两个未明确定义的概念,一个是人,一个是智能。什么是人?什么是智能,到现在依然是很难说清楚的问题。第二个定义只涉及一个未明确定义的概念就是知识。在人、智能、知识这三个概念当中,知识被研究的应该是比较彻底的,而且也是智能的基础。

所以一般来说AI的研究是以知识的表示、知识的获取和知识的应用为皈依,但是所有的学科都是以发现知识为目标的。因此相对于其他学科来说,AI具有普适性、迁移性和渗透性。一般说来,AI+某一学科就可以形成一个新的学科,比如说生物信息学、计算历史学、计算广告学、计算社会学等等。

因此,要研究人工智能就要研究如何定义知识。关于知识,在座的各位校长,不管是大、中、小学校长,可能都会说这我们知道。 可惜的是,知识定义起来也是一个很麻烦的事情。严格地说来,人们最早用的知识定义就是柏拉图的定义:就是被证实的,真的和被相信的陈述,简称JTB条件。可是非常不幸的是,这个延续了2500多年的定义,1963年被一个叫盖梯尔悖论的否定了,由于时间关系我就不展开论述了。可以讲一个故事,空地上的奶牛,通过这个故事你会发现柏拉图的定义不对。

这个定义不对之后,人们后来给出了很多知识的定义,到现在没有定论。但是,有一点我们是明确的,就是说知识的基本单位是概念,知识自身也是一个概念,这两句话看上去挺简单,但是实际上是非常难的一件事情,因为涉及自指的性质。但是如果真想清楚了,那么您就会对人工智能有比较深入的了解。

由于知识自己也是一个概念。 因此,现在人工智能的问题就变成了如何研究一个概念,如何表示一个概念,如何应用一个概念。 因此,将概念说清楚就非常必要了,对人工智能这也是一个至关重要的事。我们下面就来讲报告的第二部分, 概念的表示与指称。

这儿说的概念,指的是经典概念。如果说经典概念的话,各位老师可能本科毕业的多,这个应该都学过了。 我们简单回顾一下,一般说概念的经典表示有三种表示,第一种叫符号的表示:名字,这个概念叫什么名字,第二是内涵表示,由命题来表示,第三就是外延表示,由经典集合来表示。

举一个例子,素数。 其概念名在汉语中为素数,英语中称 prime number。其内涵表示是一个命题,即只能够被1和自身整除的自然数,其外延表示是一个经典集合,就是{1、2、3、5、7、11,13,17,…}。它的各个表示有什么作用呢?或者说概念有什么作用呢? 很容易发现,概念有三个作用或者功能。要掌握一个概念的话,这三个功能必须都清楚。

首先来看第一个功能,概念的指物功能。概念的指物功能就是指向客观世界的对象,表示客观世界的对象的可观测性,对象的可观测性指的是对对象对于人或者仪器的知觉感知特性,不依赖于人的主观感受。

举一个《阿Q正传》里的例子:那赵家的狗,何以看我两眼呢?这个句子中,这个“赵家的狗”就是指现实世界当中的一条真正的狗。

第二是指心功能。 概念的指心功能就是指向人心智世界里的对象,代表心智世界里的对象表示。 这里也给一些例子。 还是用鲁迅的文章。鲁迅有一篇著名的文章《论丧家的资本家的乏走狗》。 显然,这个不是现实世界的狗,只是他心智世界中的狗,即心里的狗,在客观世界,梁实秋先生显然无论如何不是狗。

最后一个功能是指名功能。 概念的指名功能就是指向认知世界或者符号世界表示对象的符号名称,这些符号名称组成各种语言。

这里一个最著名的例子是乔姆斯基的,“colorless green ideas sleep furiously”,这句话翻译过来叫做无色的绿色思想在狂怒地休息,这句话没有什么意思但是完全符合语法,这纯粹在符号世界里面说的,最近人工智能的小冰做了一些诗,其名句“它嫁了人间的许多颜色”,其实也没什么意思,就是语法正确,即指向符号世界而已。当然,有时,也有另外的例子,像 “鸳鸯两字怎生书”指的就是“鸳鸯”这个字组成的名字。最近,一首所谓的神曲《一人饮酒醉》也完全与客观世界不搭界,可以说是符号世纪里的呓语。

在现实生活当中,如果你了解一个概念的话,这三个功能是要都对才行。如果只对一个那是不行的。这里也给大家举一个很简单的例子,就是讲一个很简单的故事。我的一个好朋友叫马少平,他是清华大学计算机系的一名教授。他曾经给我讲过一个很有趣的故事。有天马老师出去开会,他自己一个人在一张桌子上吃饭,有人就过来问他说是什么单位的?回答说是清华大学的,那个人听了很高兴,就接着问,清华大学哪个系的?马老师说是计算机系的。那人说:“我认识清华大学计算机系的一个老师,不知您认不认识”,马老师就回答:“我在清华大学计算机系待了30年了,你说的老师我应该认识”,那个人很骄傲地一抬头,说:“我认识马少平”。 

这个老师认识马少平老师吗?他不认识,他不知道跟他说话的就是马少平。所以说,掌握一个概念需要三指都对才行。如果只能指名,不能指物,还是不能说认识这个概念。 

有了这三个概念之后,才能了深入解什么是人工智能的流派。现在讨论如何才能让机器具有人工智能的研究路线。 注意到人工智能也是一个概念,而要使一个概念成为现实,自然要实现概念的三个功能。容易看到,AI的指名功能对应的是符号主义,AI的指心功能对应连接主义,AI的指物功能对应行为主义。 下面, 稍微给一点详细的论述。

什么是符号主义?符号主义的代表人物是Simon (司马贺)与Newell, 他们提出了物理符号系统假设,基本的意思是,只要在符号计算上实现了相应的功能,那在现实世界就实现了对应的功能,这就是所谓的物理符号假设,是智能的充分必要条件。因此,只要在机器上正确了,现实世界就正确了。 说的更通俗一点,指名对了,指物自然正确。

在哲学上,关于物理符号系统假设,也有一个著名的思想实验,就是图灵测试。 图灵测试要解决的问题, 就是怎么来判断一台机器是否具有智能。 

图灵设想的思想实验如下: 一个房间里给一台计算机,一个人,这两个人都是通过一台打印机跟外面联系。外面的人就通过打印机来向屋里的计算机和人提问问题。 屋里的计算机和人分别来回答,计算机尽量模仿人。所有的回答都是通过打印机用语言描述出来。 如果屋外的人判断不出来哪个是人哪个是计算机,就算这个计算机具有智能。 

显然,上述测试都是在符号层面进行的,是一个符号测试方式。 这个测试方式具有很大优点。为什么?因为智能的内涵定义实际上是很难给出的,如何判定是否具有智能也很困难。 但是有了图灵测试之后,我们就可以将研究智能的重点放在智能的外在功能性表现上,使得智能在工程上看似乎是可以实现和判断的。

图灵测试将智能的表现完全限定在指名功能里。我刚才已经举了一个例子,只在指名功能里实现了,似乎也不能叫实现。实际上,根据指名与指物的不同,,有人专门设计了批判图灵测试的思想实验。

这个人是一个哲学家,叫Searle,他提出了著名的中文屋实验,专门用来驳斥图灵测试。

其实验设计如下: 一个人住在一个房里,这个人只懂英文,但是在这个房间里有一个构造好的计算机程序,这个计算机程序可以回答任意中文问题,同时这个房间有一个窗口可以递出递入纸条。通过这个窗口递入中文问题,屋里的这个人根据这个计算机程序, 输出相应的中文答案出来。 显然屋外的人会认为其精通中文,但实际上,其对中文一无所知。

这就是所谓的中文屋实验。 中文屋实验明确指出,即使符号主义成功了,这全是符号的计算跟现实世界也不一定搭界。 完全实现指名功能也不见得具有智能。这是哲学上对符号主义的一个正式批评。

虽然如此,符号主义在人工智能早期研究中, 依然扮演了重要的角色。 符号主义早期工作的主要成就在机器证明和知识表示上。机器证明方面,王浩、吴文俊,做出了很重要的贡献。知识表示最重要的成就是专家系统和知识工程,最著名的学者就是Feigenbaum。 如果沿着这一条路就以为可以实现智能,显然是有问题的,日本第五代智能机就是沿着这条路走的,其后来的失败现在看来是完全合乎逻辑的。

具体说来,实现符号主义面临的挑战是什么?面临的挑战主要有三个。第一个是面临概念的组合爆炸问题。因为常识难以穷尽,推理步骤可以无穷。 第二是命题的组合悖论。两个都是合理的命题,合起来就变成了没法判断真假的句子了。第三个也是最难的,经典概念在实际生活当中是很难得到的,知识也难以提取。上述三个问题直接导致了符号主义后来的失势。

下面看人工智能的第二种主义。 就是研究概念的心智表示,即如何在计算机上实现心智表示,这就是所谓的指心了,连接主义主要关注于这一点。学派代表有McCulloch,Pitts,Hopfield等等。 在2016年微信上有一篇很火的文章,讲所谓的大脑语义地图。 其主旨是: 概念都可以在每个脑区找到对应的表示区,确确实实概念的心智表示是存在的。按照这条路,如何实现AI呢?怎么实现我们先不说。 对于这条路线,哲学家普特南也有一个思想实验对其批评,这就是著名的缸中之脑实验。

其实验描述如下: 一个人(可以假设是你自己)被邪恶科学家进行了手术,把脑切下来,放在存有营养液的缸中,脑的神经末梢连接在计算机上,这台计算机按照程序向脑传递信息,对于他来说,人、物体、天空都存在,神经感觉等等都可以输入,这个脑还可以被输入、截取记忆(截取掉大脑手术的记忆,然后输入他可能经历的各种环境、日常生活),输入可能经历的各种环境生活,甚至可以被输入代码,‘感觉’到自己正在阅读这一段有趣而荒唐的文字。

缸中之脑实验实际上明确说明了,即使连接主义实现了,指心没有问题,但指物依然存在严重问题。因此,也不见得具有智能。 

虽然如此,连接主义是目前最热的一条AI实现路线。刚才陈校长已经讲过,从神经网络发展到深度学习,AlphaGo战胜了李世石,之后又战胜了柯洁。应该说,深度学习的研究成就取得了工业级的进展。这一条路线的麻烦是,人脑如何表示概念的机制并不清楚,人们对于人脑中概念的表示形式、表示方式组合方式等等完全不知。 现在的神经网络与深度学习实际上与人脑的真正机制距离尚远,并不是人脑的根本机制。

下面再来看指物,就是所谓AI的行为主义。在一条路线里,假设智能取决于感知和行动,不需要知识、不需要表示,不需要推理。就是指物,只要能表现出来就可以了,学派代表作就是Brooks智能机器人。

对这一主义,哲学家也设计了一个思想实验来进行批评,就是所谓的完美伪装者和斯巴达人。 完美伪装者和斯巴达人的表现都与内心没有联系。 这样的智能如何测试?

对于行为主义路线, 其最大的困难, 可以用莫拉维克悖论来说明。对计算机来说,困难的问题是简单的,简单的问题是困难的,最难以复制的是人类技能中那些无意识的技能。 目前在模拟人类的行动技能方面面临很大挑战。有些人说,我们网上看到有波士顿动力机器人造人型机器人后空翻。但是其有一个很大的缺点就是能耗过高,噪音过大。 原先大狗机器人是美国军方订购的产品,但是军方无法使用的,因为开动的时候十里之外都能听到开动的声音,这样军方怎么使用?这样成了一个活靶子了。

现在说一下人工智能的发展趋势,我们说人工智能的发展趋势说人工智能三大流派。符号主义说,实现指名功能就够了。联结主义说,实现指心功能就够了。行为主义说,实现指物功能就够了。 但是,这三者成立的前提是指名、指物、指心等价。

但问题是这个前提成立吗?早期的AI假设是等价的。由于早期的AI使用的是经典概念,而经典概念有5个假设:第一假设概念的内外名一致。第二,概念的外延表示存在经典集合表示。 第三,概念的内涵表示存在命题表示。 第四,概念存在唯一表示,即同一个概念的表示与个体无关,每个人表示这个都是一样的。 第五,概念的内涵表示与外延表示指称等价。明显看出,在上述五个假设之下,经典概念的指心、指物、指名功能完全等价。

但是,日常生活中使用的概念,并不能保证其指心、指物、指名功能等价,经典概念的5条假设一般都不再成立。 下面给出一个例子说明日常生活中概念的指名指物功能并不等价。

微信上曾经传过一个著名的段子: 一个人说手头有一个亿,谁有项目通知一下,一起投资。 不然,再晚一点,就洗手不干了。 听的人以为其是指物,真的有一个亿的资金。 而实际上,这个人只是手头上写了三个字“一个亿”而已。在这儿纯粹指名,它指的手头一个亿仅仅是符号“一个亿”而已。这个段子显然利用了概念的指名与指物不一定不等价的性质。 

曾经有西方一幅著名的绘画,画面上画了一个烟斗,题字却说这不是烟斗。 在此,其显然是想说明,符号与实物不同,即指名与指物不等价。 在现实生活中, 我们也可以发现指名与指心不等价的例子。

综上所述,概念的指名、指物与指心功能,这三者在生活中并不等价,因此,单独实现概念的一个功能,并不能保证有智能。因此,现在的人工智能进展也已经不再单独遵循一个学派了。单独遵循一个学派不足以实现人工智能。 现在的AI发展都是综合的。 从专家系统发展起来的知识图谱已经不完全遵循符号主义的路线了,无人驾驶技术更是突破AI三大流派限制的综合技术。 这些限于时间关系,此处我们就不多说了。正如前面的陈校长所说, 新一代人工智能将带来社会的第四次技术革命。 

在报告的最后部分,来补充一点人工智能的常识。应该说目前的人工智能还是有很大的缺陷。 因为其使用的基本还是经典概念。 而经典概念的基本假设还是指心、指名与指物等价,这与人类的生活常识严重不符。我们现实生活当中概念的指名指物指心是不等价的, 如何突破上述框架还是一个非常大的问题。在上述框架下机器有时显得极其智障,缺乏常识、缺乏理解能力,有时严重缺乏理解能力,这点特别体现在人机对话系统上,表现为其对话黏度需要提升。

除此之外,还要告诉大家一些常见的人工智能错误。 经常看的一些文献、报告,谈到所谓的通用人工智能,强人工智能,人类级AI,超级人工智能。 应该说,这些概念都是错误的。

为什么说这些概念是错误的?很简单,只要假设上述的一种人工智能实现了。 只要实现了,这些概念立即面临逻辑悖论。如果还不清楚的话, 就想一想,是谁实现了它们。 如果是人实现了它们,它们不是已经智能超过了人或者至少与人一样了吗?最近,南京大学的周志华老师写了一篇文章,《关于强人工智能》。 有兴趣的老师,可以看看。 

本质上,智能本身是有层次的,在下围棋上Alpha Go已经是独步天下了,但是不能说其智能水平比Alpha Go的制造者还高。 如果这样,还不能推出来所谓的通用人工智能,强人工智能,人类级AI,超级人工智能是错误的话。 在《集异璧之大成》中有一个极端的AI定理,就是所谓的泰斯勒定理:“人工智能是尚未做到的东西”。 做到的人工智能,都不是智能,如何超过人类或者与人类一样?

为什么必须批判强AI?因为他们作为历史名词还没有退出历史舞台,具有极大的欺骗性,不仅误导了一般人对于人工智能的认知,甚至在部分研究者、部分政府研究报告里还有市场。下面举几个最近的例子,如《2017中国人工智能趋势报告》,《Perspectives on Research in Artificial Intelligence and Artificial General Intelligence Relevant to DoD》,等等, 有兴趣的话,网上还可以搜索一些。如果知道强人工智能不能成立,所谓的女机器人索菲亚欺骗事件就不会发生。 

最后说一点,今天毕竟是一个关于教育的会议。 人工智能与教育有什么关系? 实际上人工智能对教育提出了新的要求。为什么?这是因为在人工智能时代,一个最明显的特征就是落后就要挨打。 AI时代与非AI时代具有巨大的代差,其差距可能远远大于冷武器与热武器时代之间的差别。弥补AI时代与非AI时代之间的代差唯一的要求是提高人类自身的知识水平, 特别是关于AI的知识水平。只有不断提高自身的知识水平,才能使自己不落后于这个时代。这对于中小学教育也提出了新的要求。

谢谢大家,我的报告到此结束。

(本报告根据速记整理)

CAAI原创 丨 作者于剑教授

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会