中国人工智能学会

Chinese Association for Artificial Intelligence

CCAI 2016 演讲实录丨陈小平:AlphaGo到底赢了谁

发布时间:2016-11-08

11月6日,近千位国内智能领域的著名专家、城市学领域的专家学者、城市管理者、媒体、企业家齐聚2016中国(杭州)人工智能产业论坛,展开一场别开生面的人工智能主题演讲。

以下是陈小平教授的演讲实录:

大家好,我的题目是《AlphaGo到底赢得谁》,赢的是二元方法论,二元方法论导致人工智能有新的阶段,我的报告每次都不一样,今天到第9版,早期第一版到第二版,是2009年到2014年,早期的版本主要是在国外讲的,那时候想说没什么人关心,今天到这看,这么多领导、学者都这么关心,我觉得这是非常好的现象。我主要讲这几个方面,都比较简单,一个是人机大战现在半年多了,我们冷静下来看一看,到底是人机大战还是机器大战呢?第二个方面,我是做机器人的,机器人的智能从现象来刻划,就是不可预测的变异场景。第三个问题,不可预测的场景到底有多难?难的原因在哪里?我们过去做了这么多年的计算、智能,我们都会约束了,这叫“图灵计算经典编码原则”,这个原则不仅限制了人工智能,而且所有传统的人造物都尊重这三个原则,历史上所有的人造物尊重三个原则,我们要突破的话是非常难的,如果要突破是人类历史上非常大记录。

微信图片_20210823143108.jpg

陈小平

中国科学技术大学机器人研究中心

人工智能研究中心主任

下面简单汇报中科大的工程。首先回顾人机大战的历史,最早是西洋跳棋,从1956年到1965年,只懂规则,会学习。过了三年战胜了州冠军,再过三年,对阵世界冠军,连输四局。后来的进展就不大了,有比较大的突破是在国际象棋上,他从1985年到1997年,做了12年,国际象棋还是相当复杂,从专业的角度,用两种指标来衡量博弈的复杂度,并不准确,一个是状态空间复杂度,是10的46次方,还有一个是博弈树复杂度,是10的123次方。1997年的“深蓝”战胜了十年世界棋王,前瞻至少14步,多的时候可以前瞻80多步,前以后要评价有一个可能的棋局,然后选择一个对自己最有利的。平均是35种走法,大概是4乘以10的21次方,这个还是太复杂了,用人工智能“剪枝”技术减少到600亿个,利用高性能计算每秒判断2亿个,用5分钟就可以了,所以有赢了。1997年的时候大家对下棋不关心,因为中国香港回归。我总结了是“人工智能+专家+高性能计算会超过顶级专家”。还有一个工作,是西洋跳棋,从1989年到2007年做了17年。状态空间复杂度是5乘10的20次方。1994年Chinook与世界冠军Marion Tinsley战平,后来Tinsley去世了,就失去了对手。后来2007年Chinook可实时找到最优解。有什么意义?它和“深蓝”比有什么推进?它战胜的不是某一个人类的世界冠军,它是所有可能的世界冠军,这个冠军和另外一个冠军谁强?可能以后的冠军更强。其实这个结果在某种意义上是非常有号召力的。

今年到了围棋,围棋的复杂是10的172次方,博弈树复杂度是10的300次方,是非常复杂,AlphaGo战胜了李世石。AlphaGo的团队目标是什么?我们是从学术的角度来分析的,它的目标是什么?它战胜人类呢?我们认为不是,西方人普遍认为,19年前深蓝已经战胜了人类。AlphaGo和李世石下棋的目的是挑战主流人工智能。人工智能技术下不了围棋,所以围棋这个事,对西方人来说不代表人类,但是代表人工智能的挑战性。另一方面,AlphaGo的做法与人工神经网络为基础的学习,再加上搜索,这种做法在人工智能的很多年受到了压制,这下是彻底翻身了,现在是再也压不住人工神经网络了。从他们最初的学术角度说有这样的动机,当然这是发生以后,美国的反应非常快,现在不是一个纯粹学术的市场了。

我们剖析AlphaGo的原理。简单地说,它有两个所谓的大脑,就是两个神经网络,我们要注意这两个网络是AlphaGo是自己设计的吗?不可能,是设计者设计的,这点我们要重视。这两个网络设计非常有讲究,这些都是设计者决定的,设定好的最初这两个网络里的内容很少,就利用深度学习的方法训练它,用强化训练的方法自我训练,就变得非常强。人工智能方法论对比一元方法论,核心只有一个,就是人工设计,现在AlphaGo所揭示的新的人工智能方法论有两个核心,这两个核心谁比谁强都不好说,所以我叫它“二元方法论”。在某些大规模复杂问题上,人工智能系统研发的二元方法论超越了传统的一元方法论。所以这里面没有谁战胜谁,只有某个阶段谁超越谁。

11.jpg

现在很多人觉得最难的棋都赢了人,人就没戏了,人基本上处于下风,其实不是这样的。比下棋更难的问题,我们回顾一下,1961年工业机器人量产。智能机器人有感知有行动,另外,它需要世界模型支持它的决策,这个任务是也规则化的。存在大量的不可预测的变异场景,出现什么情况根本想不到,导致环境和世界模型脱节,这样机器人的行动,就不知道要做什么行动了。AlphaGo下棋都赢了,为什么这个问题不能解决,所有复杂的问题抽象到一个模型,就是不可预测的,变成一个场景。机器人的核心是计算机,计算机就是图灵机,图灵机是有磁带、有输入输出。图灵机,可计算的都是图灵机可计算的,这就厉害了。同时图灵既是计算机之父,又是人工智能之父。


我们从机器人的观点发现行动是发生在机器人内部的,机器人的行动发生在现实世界,感知和人机交互对应信息输入输出。关键在于编码,什么是编码?计算机上要输出字母,那就变成二进制的编码,A是这么一个编码,B也是这么一个编码,所以计算机里头没有字符,没有计算机编码。具体怎么处理呢?实际上是通过图灵机,图灵机最厉害的就是这个,它有通用的程序,要应用的程序输入到磁带上,模拟输入的应用程序,完成应用程序的计算。那么图灵问题应该这么说,凡是可计算的都是通用图灵机可计算的,这里面有更深层的东西,一个是应用的编码,包括应用的程序和数据的编码,还有一个是通用模拟程序和数据的编码,这个叫系统编码。估计到最后,通用图灵机归结为两个编码,两个编码是怎么回事?这个可以研究很长时间,我们总结以后总结出了三条原则:第一,约定的强制性。两个编码最后导致三个结果,第一个结果是约定的强制性,人机交互必须遵守这个约定,不遵守的话,产生的后果自己负责。第二,约定有效性。如果满足第一个原则,另外环境也满足产品的出厂要求,比方说温度等等,这样的机器一定能完成预定的功能。第三,语义的封闭型。这三个原则有作用?第一,人机交互约束条件,第二,机物关系、机器性能。第三,经典计算的基础。我们说几个例子。电子数字计算机及产品和服务,我们研究之后,它是严格遵守图灵计算经典编码原则的。符合原则一的话,少数几个条件符合产品的要求,计算机一定能够正常工作,得到你要的结果。第三,语义的封闭性,系统程序和应用程序都是语义完全定义的。

下面我们看到围棋、国际象棋、西洋跳棋,这些也是满足的,完全遵守图灵计算经典编码三原则:约定强制性、约定有效性、语义封闭性,不存在不可预测性,博弈的规则是经典编码原则的推论,反过来是不成立的。

第三个例子,铁路客运系统,高铁很复杂,“行动”在现实世界中发生,存在不可预测的变异场景。原则一是有效的,原则二和三是近似有效。

下面看几个反例。第一个就是人,人不遵守原则,现实世界中人不遵守原则。第二个原则不成立,人不是所有环境下都能工作,在不满足约定的环境他也能工作。还有编码的语义也不是的。三个新的原则叫“超级编码原则”。

第二个,“像人一样”的机器人,人不遵守三项原则,“像人一样”的机器人也不遵守。

第三个,个人服务机器人,是遵守经典原则还是超级编码原则?有两种观点:一种,个人服务机器人必须超越经典编码原则。第二种,有可能存在既能满足经典编码的原则。

智能机器人出路是两种挑战:工程挑战、科学挑战。工程挑战是妙用经典编码,科学挑战是超越经典编码。工程挑战是一事一议的,科学挑战是一通百用。历史上从来没有任何人造物超越图灵计算编码计算三原则。

下面简单讨论人造物。历史上出现的人机交互的人造物都是符合图灵计算经典编码三原则。图灵计算经典掩码原则是人与现有人造物之间的技术界限。我们要突破经典编码原则就是破传统人造物的历史人造性。

这些是理论思考,具体我们做什么呢?我们从1998年开始做机器人,做了10年之后开始做有创新的东西,我们的原理是几条:第一,我们放弃基本原则一,我们改进原则二,我们把它放宽,另外语义的封闭性我们是彻底抛弃的,我们提出了新的原则,就是基于宽松型定义的编码体系。

现在可佳机器人怎么解决问题:自然语言对话获取用户需求;根据用户需求获取外部知识;自然语言理解、知识提取与转换;针对用户任务自动规划,生动行动计划;不成功是返回2。

难点有这么几个,用户需求有冲突,执行过程有变化,这个就是环境有不可预测性,下面把这块给剪掉了。机器人初始知识不完备的,可以在网上获取知识。另外一个,利用及其们本地知识和新获取的外界知识,自主进行机器人任务规划与推理。同时对变化的环境进行实时检测和建模。

这个是2010年10月做出来的,这个做得挺好的,能不能进入家庭?还有很多挑战,不可预测的变异场景。这种服务机器人要进千家万户,卖一个产品,不可能进到家庭去调。变异场景最后导致的是什么?图灵计算编码三原则,要么把这三原则改了,要么近似满足这三原则。

最后总结一下,AlphaGo的获胜显示二元方法论超越了一元方法论,所以人工智能进入了新的阶段。我们不能再光想着人工智能信息,也不能光想着机器学习。图灵计算经典编码原则本来是计算机行业的主流工程方法论,但是现在它跨行业了,适用于所有的人造物,这个太厉害了,一定要突破它。突破是两个方面,一个是超越经典编码,一个是巧用经典编码,无论哪一个都意味着重大的突破。谢谢大家!

(本报告根据速记整理)

CAAI原创 丨 作者陈小平教授

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会