中国人工智能学会

Chinese Association for Artificial Intelligence

2016“探寻大师足迹”系列第一站 演讲实录丨钟义信:弘扬 Simon的源头创新精神开拓“AI”的新理念新路径

发布时间:2016-06-20

33.png

钟义信

CAAI第四、五届理事长

北京邮电大学人工智能学院教授

以下是钟义信教授的演讲实录:

各位老师、各位同学,非常高兴今天在这样一个日子、在这样一个地方,跟这样一批人来互相交流一下,怎么样来学习HerbertA.Simon的创新思想、学术思想,来促进我们自己的研究工作。所以我的研讨题目叫做“弘扬Simon的源头创新精神,开拓AI的新理念新路径”,我想这也是我们今天这个研讨会希望去理解的这么一个问题。也许今天不可能在会场上就把这件事情做的非常完美,但是我们未来还会沿着这个方向继续前行。

这个PPT有两部分,一个是概说,一个是详解,今天讲的是概说。如果各位对详细的情况有了解的愿望,可以看看后面的详解。当然,详解也还是比较简单,因为问题本身比较复杂,所以用PPT来表现总归是有局限。我们今天简单的来谈一下怎么样来学习他的精神。另外顺便有一个小建议,Simon这个名字的翻译是否可以规范一些?西方人有另外一个名字Simmon,这才是西蒙;而Simon应该是塞蒙。这是中文翻译的不同。

一、Simon学术思想的精髓是“源头创新”

我个人理解,Simon的确是一个非常全面的学者,维纳曾经推崇过一个非常有名的人,叫莱布尼兹,维纳认为控制论的守护神应该是莱布尼兹这位德国的科学家,他是非常全面的。Simon也是非常全面的,刚才几个报告都已经讲的非常清楚,我把它稍微的浓缩一下。我觉得最重要的,也是对我们最有启发的,是他的源头创新精神。这就是说,你要研究任何问题,不能够仅仅在发展过程当中的某一个枝节、某一个点去做创新的研究;如果你想要做创新研究,你就必须从头,从源头思考起。这也是今天我对我们大家交流的一个建议,就是要从源头来把握所研究的问题。这个道理很简单,前人做了很多创新的工作,都是在那个历史条件下,后来历史又前进了,我们的认识又发展了、深化了,所以当我们去研究这个问题的时候,前人得到的结果有许多是值得我们继承,一定也有不够的地方;否则就不用我们今天的人去研究了。所以,“源头创新”不是一个时髦的说法,而是今天我们的研究必须要思考、必须要实践的问题。而Simon给我们的最重要的启示,就是他的“源头创新”精神。

比如,刚刚好几位报告人都提到,Simon最重要的一个贡献就是提出了“物理符号系统假设”。在这之前没有人提出过这种理念。机器的智能跟人的智能到底有什么样的关系,如果没有物理符号系统假设,就想不到怎么样把人的智能跟机器智能在符号处理这个意义上联系起来,这是开山之作,是开创性的一种贡献,开辟了一个大的领域。事实证明这几十年发展下来,就在物理符号系统假设基础上,把人工智能往前大大推进了,所以这是一个源头创新的成果。我听过他的一个报告,他提出:手段和目的要放在一起来分析,才能保证你这个机器做的是不是能够得到预期的目标。就是说机器的手段要跟最终的目的联系起来,看看它的行为、看看他的性能跟目的相比一致不一致,如果不一致有误差就要去改进,这个办法就变成了人工智能软件编程的一个基本的方法论。当然,他还有更多成果,我认为这两个都是他源头创新的成果。

二、今天人工智能的研究特别需要“源头创新”

这种源头创新的学术思想或者精神,对我们今天面临的人工智能研究这个现实来说,非常的需要。也就是说,到了这个时候,我们也要对发展到今天为止的人工智能理论与技术用源头创新这个思想去重新的审核一下。为什么呢?因为研究人工智能一直到现在为止基本上用的方法论是对复杂的系统一定要把它“分而治之”,如果整体解决有可能太困难了,物理上的困难、数学上的困难、分析上的困难,所以你要把它分成比较小的一些部分,每个部分就会显得比较简单,然后把一个一个都解决了,合成起来可能就是原来的系统,这是物质科学最精髓,也是对这几百年科学技术发展有非常全面贡献的这样一个方法论。迄今,人工智能的研究者也是按照这个方法去做,人工智能的研究者们就把复杂的智能分解成三个方面去做,第一方面,人的大脑是最聪明的,万物之灵,所以一个就是从结构上去看看这个大脑究竟是怎么回事,这是分出来的一方面。第二方面,看看他有些什么功能,把功能实现出来就可能出现人的智能。第三方面,如果结构太复杂,我们就模仿他的行为,什么样的环境刺激会产生什么样的行为反应,把行为作为人工智能的突破口。智能研究的结构主义研究、功能主义研究、行为主义研究,是到现在为止人工智能全部的研究成果。

这样三种方法得到了非常多的成果,比方说结构主义,模仿大脑神经网络,人工的神经网络取得了很多成就,在形象思维方面,最近这些年的深度学习基本上是建构在深度神经网络的基础上的。功能主义,刚才讲的物理符号系统的假设主要是研究了人脑的功能、机器特别是计算机的功能,发现人脑与计算机有很多一样的功能,所以就变成了功能主义的一个人工智能的理论。这个理论的成果当然更多,1997年深蓝专家系统就打败了当时的国际象棋的世界冠军,今年又有AlphaGo在围棋上打败了韩国的九段围棋一个非常优秀的选手李世石。行为主义也有很多成果。所谓行为主义,就是有什么样的刺激就给出什么样的行为反应。起初比较简单的Agent就是这样做的,比较初期的机器人也是这样做的.如果一个机器人的名字叫“张三”,那么当你喊他“张三”的时候,它就会答应,因为“张三”这个刺激和它的名字匹配了,它就会产生响应。

这三种方法成果都非常大,但是,今天为什么要重新从源头上去再思考?就是因为这三种方法各行其是,形成了鼎足三分的态势却没有找到互相之间的联系、互相之间的内在关系,不能形成合力。三个方面都非常好,就是不能够形成一个统一的方法和理论。这就是一个问题。既然三者的目标都是研究智能,你从机构上去研究、他从功能上去研究,第三个人从行为上去研究,为什么不能够变成一个整体、变成一个和谐的合作体,这就说明有问题,这种现象本身说明方法甚至方法论上存在问题。

方法论存在什么问题呢?问题就出在“分而治之”。把复杂的智能问题分解为结构方面、功能方面、行为方面,隔断了智能系统内在的信息联系,各自往前发展,对其他两个都没有给予足够的关注,而且也很难关注,因为结构跟功能不是一一对应的,结构功能跟行为也不是一一对应的。

到今天为止,在人工智能研究领域,“鼎足三分”还是主流,只有少数人注意到了这个问题,他们认识到,应该把这三个方法有机的整合起来、集成起来。

这就是20世纪90年代出版的两部重要的著作,,一本书是1995年出版的《Artificial Intelligence:A Modern Approach》,是Russell和Norvig写的,后面这位是谷歌的CEO。书的标题是“人工智能”,副标题是“一种新的路径(或者一种新的方法)”,他们认为原来三种路径(方法)各做各的不能够集成,是一个问题,所以他们就提出新的方法去集成。这本书英文1000多页,后面的参考文献1000多篇,这么大规模,真的是长篇巨著!我读的书当然不算多,但是我读过的书当中没有一本赶得上这部书。这本书在世界上影响特别大,有90多个国家900多个大学用这本书作为人工智能的教材,可见这个思想,就是要把三个不同的发展方法集成起来的思想,受到多么普遍的关注。不过如果你仔细看这本书,它并没有真正的整合起来,是用Agent这个载体把三个研究成果都放在这个载体上,并没有找到他们内在的联系,只是一种简单的拼接。过了几年,到了1998,年一个比较老资格的人工智能学者叫Nilsson,也写了一本书,书名就是《Artificial Intelligence:A New Synthesis》,它也主张要用新的集成方法把三种方法沟通集成起来,形成合力。不过,它同样停留在简单的拼接水平上。所以,这本书和前面的书可说是异曲同工。

今天面对这样一个形势,我们就需要Simon的源头创新精神。

三、重审人工智能的基本问题

为了去做这个源头创新,我们要重新思考一下、重新观察一下什么叫智能?什么叫人的智能?自然界的各种智能当中,目前的认识是人类的智能最复杂、也最高明,所谓万物之灵。我们来看,人的智能可不可以这样理解:智能一定是在环境的作用下,人跟环境相互作用,不断的去学习,不断的去进化,在这个过程当中展开了智能的活动。反之,如果没有这种主体跟客体的相互作用,如果一切都是十全十美,如果不需要做出任何的改进,那就不需要思考、不需要学习,也就不需要智能。所以,一定要在主体跟客体相互作用过程当中来考察智能才有意义。

在这个模型里,我们用一个综合知识库来表示主体的特性,其中有两个特性,一个是有知识;一个是有目的。“目的”这个问题,我觉得是极其重要,目的比知识还重要,没有目的也就不知道怎么样去做,就不能积累知识。所以一切系统如果没有目的,一定不是智能,或者智能一定不会高。所以,我们表征人类主体的特性,用目的跟知识来代表。至于外部环境,就用环境中的客体或者环境中的问题来表征,客体比较具体,问题可能是抽象的表述,不管是抽象的、具体的,都是外部环境对主体的一种作用。

人类的智能系统模型的详细过程比较复杂,我们大概来不及说,时间不够。下面,就快速地浏览一下这个模型。

首先,要感知外部客体产生的信息是否存在,而且,这个信息对我这个主体目的而言有用没用、有关系没关系,如果没关系就不理他,有关系就接收进来加以考虑。所以第一个环节是信息的感知。感知感知,就是用感觉器官感受到它的存在,知道它对我的关系,有关系,所以把它接收下来。在感知之前物体产生的这个信息,我们把叫做本体论信息,之所以叫本体论,因为这个信息不以主体的主观意志为转移。认识主体感知到了接受下来,认识主体就产生了新的信息,这种认识主体所产生的信息就叫做认识论信息,这个认识论信息是认识主体可以调整的。

对于认识主体与环境客体的相互作用来说,光知道有信息存在当然不够,所以主体要通过认知,要通过人的思维认知去把这个认识论信息转换成为知识。从信息转换为知识,当然很复杂,但是模型就是这样的,一个方块就代表了。有了知识,认识主体就知道所面对的这个客体是什么意思了,或者知道这个问题是什么意思了,就能够从本质上理解这个客体或问题,而不是表面的理解。感知是表面理解,认知的结果是深刻的理解、本质上的把握。但是,对于主体客体的相互作用而言,只有认识还不够,主体还必须要有办法去跟它打交道,去相互作用,所以,模型中还要有后面用黄色覆盖的这个部分,这部分更复杂,包含了基础的意识,包含了情感,包含了理智,而且要进行综合决策。如果大家有兴趣,将来我们找别的机会再来详细的讨论。今天我们就只是指出:这个复杂的模块最终得到的结果是跟这个客体打交道的一个策略,叫做智能策略,这个策略之所以叫智能策略,就是因为,第一,它要能达到主体所期望的目的,主体之赢,主体赢在“达到了目的”。第二,这个策略实行的结果不会破坏环境,因为这个策略是从知识提炼出来的,接受了知识的约束,知识就是客观规律的一个表达。所以这种策略既不会损害环境,又能达到主体的目的,这就是主体、客体双赢。这样就通过执行器官把智能策略转化为智能行为,去跟这个客体、跟这个问题去相互作用,试图解决问题。

当然,是否解决了问题?这就要看效果。如果解决了,达到了目的,就可以结束;一般而言,由于问题和环境都比较复杂,不可能一个回合就解决问题,一般在求解的结果和预设的目标之间都会存在误差。有了误差以后,就要把这个误差作为新的信息,反馈到模型中的感知环节,重新走刚才的过程。这就是刚才李衍达院士报告种指出来的非常重要的问题-学习、优化、进化。有误差进去以后要补充新的知识,要修改原来的策略,这样一来如果效果好,就把这个新的知识、新的策略返回到知识库里头,改变知识库的知识结构,甚至于改变相应的生物结构,这样才可能在认识客观世界和改造客观世界的同时改造和优化了自身的思维能力。所以,这样才能够进化,才能够越来越好,这样越来越好最终能够得到符合目的要求的这么一个求解方法,这就是我们的智能模型。

四、重审人工智能得到的重要启示

这个智能过程给我们有几个启发和发现,这写启发和发现对我们从源头思考和创新人工智能应该有宝贵的价值。

第一个发现,智能原来是“信息的生态演化产物”。

你看,模型过程的源头就是本体论信息以及本体的信息变成认识的信息,没有这些信息就不可能有智能,这是一个非常重要的结果,智能不是别的什么东西的结果,而是信息产生的一种结果。是信息的什么样的结果?是信息演化的结果,如果不演化、不转换,进来是那个信息,出来还是那个信息,不能变成智能策略,哪有什么用?所以,信息一定要演化,而且是生态演化。既然是生态演化,就不能像Shannon信息那样把把生态演化的源头信息切割成为语法信息、语义信息、语用信息、而且把语义信息和语用信息丢弃,这样做的结果就破坏了信息的生态过程。生态的演化,就必须是生命体整体(语法信息、语义信息、语用信息三位一体,也就是“全信息”)的演化。这是一个非常重要的启发。

第二个发现,生态演化的要害是演化的机制。

刚才讲,智能就是信息(而且是全信息)生态演化的结果。那么,怎么样演化才能保证演化出智能呢?显然,这个保证来源于演化的“机制”,而不是“结构”,也不是“功能”,更不是“行为”。我不是说不需要结构、不需要功能、不需要行为。当然要。但是,对于信息经过生态演化生成为智能来说,决定性的保证就是演化的机制。系统的结构、功能、行为都有用,但是,它们都不是最根本的东西。最根本的东西是机制,按照什么机制才能把信息演化成为智能策略和智能行为,这才是最根本的问题。

结构跟功能,对任何一个系统来说,都是为系统的机制服务的:确立了系统的工作机制之后,再去寻找:什么样的结构能够支持这个机制,什么样的功能才能够支持这个机制,所以机制是核心、机制是关键、机制是要害。至于行为,是实现这个机制必然会产生的一些外部表现而已。所以这个关系很要紧,机制是最重要的,统管全局的,比结构、比功能、比行为更具本质意义。

将来,人工智能基本范式应该是这样的:首先给定要解决的问题,提供与问题求解相关的知识,预设求解问题的目标,给定这三个条件之后,就可以按照所确立的机制把信息一步一步演化成为智能策略,解决问题,达到目的。这应该是人工智能的基本范式。

第三个发现,这个生态演化的机制就是“信息转换”。

完整的信息转换就是“由本体论信息到认识论信息的转换,由认识论信息到知识的转换,由知识到智能策略的转换,以及由智能策略到智能行为的转换”。它由环境客体的本体论信息开始,直到生成主体作用与客体的智能行为,完成主客想化作用的一个回合。本体论信息是外界环境的客体(或问题)产生的,认识论信息是主体从本体论信息经过感知而生成的,经过主体的认知变成知识,进一步变成智能策略。后面由智能策略到智能行为的转换比较简单,这里就不写出来了。把本体论信息变成认识的信息这个转换过程就是主体的感知功能,把认识论信息转换成知识的转换过程就是主体的认知功能,在这个基础上,在目标的指引下,把认识论信息和知识转换为智能策略的过程,就是主体的决策功能。所以,这是所有智能系统工作机制的核心,叫做共性的核心机制。

如果把智能系统得共性核心机制表示得更简洁一些,就可以把它写成“信息-知识-智能”转换。这是从智能生成过程的源头开始,全面考察人类智能生成过程原型之后,所得到的重要结果。

五、机制主义人工智能路径及其意义

根据这些重要的发现,我们提出了一个全新的人工智能研究路和理论,叫做“机制主义的人工智能方法和理论”。表征机制主义的人工智能方法就是:首先要得到相关的信息,然后把它转换成知识,再转换成智能策略,最后转换成智能行为;如果存在误差,就把误差反馈回系统的输入端,通过学习补充新的知识,修正原来的策略、实现系统自身的进化。

当然,知识的成长过程当中会经历几个阶段,第一个阶段,一定是经验性的知识;第二个阶段,通过一定的检验修正,成为规范性的知识;第三个阶段,经验性的知识和规范性的知识经过普及化,可以沉淀成为常识性知识。由于存在这样三个阶段的知识,机制主义的人工智能也就可以分成三种基本类型:(1)A型,就是利用经验性知识,得到经验性的策略;(2)B型,就是利用规范性知识,得到规范性的策略;(3)C型,就是利用常识性的知识,得到常识性策略。

关于常识性知识,这里补充说明一下。一方面,人们从经验性的知识可以得到常识性知识。比方,太阳总是从东边出来、西边落下,这就是个常识,这是这人们从经验种得到的常识。人们观察多了,知道这个现象是一种知识,是经验性的知识,但是更典型确切地说是一个常识型的知识。另一方面,人们从规范性的知识也可以得到一些常识性知识。比如说,我们知道两根平行线永远不相交,这是几何学的知识,属于规范性的知识。但是,这个几何学的规范性知识经过普及教育,受过基本教育的人就都承认、都认识、都接受这个知识,所以也变成一个常识。

总之,由于知识存在三种基本形态,机制主义的人工智能也就存在三种实现的形态或者说三种基本类型。结果,我们就可以发现一个很有意思的关系(见PPT中的表格)。

(1)关于人工智能神经网络:结构模拟的的人工智能研究发现,大脑皮层是由大量的神经元互相错综复杂地连接形成一个大规模的神经网络,因此就建构了各种人工的神经网络来模拟智能。这种人工神经网络就是利用经验知识来形成经验性的策略,因为人工神经网络一定要通过大量的案例来训练,刚才有嘉宾讲到的Learning from Examples,其实,讲的就是从大量实例的训练中归纳得到经验性的知识。可见,人工神经网络是A型机制主义人工智能方法的一个实例。

(2)关于专家系统:物理符号系统到20世纪70年代以后就演变成为专家系统,专家系统就是B型机制主义人工智能方法的实例,因为专家系统知识库里装的知识都是规范性的知识,利用这些规范性知识去推理,得到规范性的只能策略。

(3)关于感知-动作系统:刚才提到的早期Agent和早期的机器人都属于这一类,它们是C型的机制主义人工智能方法的特例。它们的工作特点都是:一旦感知发现某种类型的刺激,就根据常识性知识去触发相应的常识性策略动作,来作出响应。

总起来看,原来人工智能的这三条研究路径(结构模拟、功能模拟、行为模拟)不能形成合力;现在,在机制主义的人工智能的这个方法里,这三种方法却成为了机制主义人工智能理论的三个实例。而且这三者是可以互相沟通的,不再是“各行其是,鼎足三分”:经验知识可以经过验证变成规范性的知识,这两者又可以经过普及化变成常识性的知识。所以这三种人工智能的研究方法不再是互相独立的,而是互相有机地内在地联系在一起了。这样,就是把人工智能原有的三种研究方法都在机制主义这个理论框架下各自找到了自己的位置,而且可以互相转化。原来鼎足三分的三种人工智能研究方法终于在机制主义人工智能方法中实现了有机和谐的统一,这就是一个非常重要的进展。这是在Simon所遗留给我们的“源头创新”思想启迪下所得到的一个重要创新成果。更有意义的是,机制主义方法不仅和谐地统一结构主义、功能主义和行为主义的人工智能研究方法,而且也为高等人工智能的研究奠定了坚实的理论基础。所谓“高等人工智能”,是指“能够实现基础意识、情感、理智三者综合决策的人工智能”(见PPT的模型),它能在更高的水平上解放人类的一般体力劳动和规范的智力劳动,实现社会更有效更健康更和谐的发展。

最后,也是最重要的,机制主义人工智能研究揭示了一个非常重要的新定律,这就是“信息转换与智能创生”定律,这个定律非常有意义,把这个定律跟物理学的两个定律联系起来就会更明白。物理学有两个定律,一个是关于物质资源的定律、一个是关于能量资源的定律。具体地说就是:“质量转换与物质不灭定律”和“能量转换与能量守恒定律”。这两个规律使我们对物质世界有了规律性的认识,知道怎样对待和处理物质资源和能量资源。但是,人类拥有三类资源,物质、能量、信息。现在,我们也得到了信息领域的定律,就是信息转换与智能创生。它启迪人们:信息转换的结果不是告诉你信息守恒不守恒,而是要创生出解决问题、达到目的的智能策略,并把它变成智能行为,去改变世界。这样三个定律联系在一起,就使我们不仅能够有效的来认识客观世界的基本规律,而且能够以智能的方式和智能的水平去改造客观世界,同时在这个过程当中也改造我们自己,使人类自己的能力不断得到进化和提升。

六、简短的结语

以上这些结果,就是弘扬Simon的源头创新的思想,重新审核我们人工智能发展到今天的状况,从中得到的一些启发和得到的一些初步的结果,对不对?请大家一起来批评。

(本报告根据速记整理)

CAAI原创 丨 作者钟义教授

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会