中国人工智能学会

Chinese Association for Artificial Intelligence

CIIS 2016 演讲实录丨林建超:从“围棋脑”到“指挥脑”的跃升

发布时间: 2016-11-08

11.png

林建超

原中国人民解放军总参谋部办公厅主任、中国围棋协会副主席

以下是林建超的演讲实录:

尊敬的各位领导、朋友们,大家下午好!我们听了李院士和吴校长从技术发展的角度,下面我们换一个视角,从战略视角来看人工智能的发展,它的背景和它所带来的战略层面的变化。从战略视角看人机大战,是我们这个话题的起点,AlphaGo人机大战已经过去10个月了,但是我们依然感到这场大战不仅硝烟为散,而且来愈演愈烈,方兴未艾。围棋人机大战的实质究竟是什么?美国人搞这个东西,他最深层的目的和功能是什么?我们可以从几个角度来看。第一,从经济角度来看,AlphaGo人机大战具有这样五个特点:突然性、标志性、理论性、非对策性、快速增长性。刚才所说的突然性,是指的AlphaGo设计团队在这场大战的操作上采取了战略武装,某种程度上说得成都点就是战略祭奠。2015年11月,在北京举行了首届世界计算机围棋大赛,但是谷歌没有到场,在这之前的一个月,AlphaGo刚刚战胜了欧洲的围棋冠军,那么对于这场胜利,谷歌没有做任何宣传,而且严密地封锁了消息,所以他们在和韩国围棋协会签定协议的时候,他们依然以为AlphaGo只具备战胜围棋职业二段水平的能力,这就使中国、韩国、以及别的国家都造成了严重的错害。所以采取的战略上的伪装和欺骗手段是相联系的。它具有不对称性,首先李世石并不是当今世界围棋的最高手,他曾经是,这在围棋界非常清楚,他在科协的胜率不到三分之一,所以他自己明确地说,我不是人类最优秀的围棋手,而对李世石这样一个棋手,AlphaGo在当时本质上还是一个计算机的集群,它还没有达到完全的单机版,更不要说达到围棋手或者说是围棋机器人。那么它的快速增长性是非常使人吃惊的,和李世石对弈的是三个月之后,是18版,18版战胜13版,他们一开始就在内部宣布,李世石没有获胜的可能,或者说获胜的几率是0,而整个围棋界浑然不知。19版已经达到了可以让18版4个子的水平,在现有阶段,人类的围棋手要战胜AlphaGo,客观上是没有可能的。从商业角度看,这是一次宣誓性商业炒作行为,是非常成功的,带来了巨大的广告效益。


从科学角度看,是一次试验和测试性科学实践,是对基于海量数据形成的深度学习神经网络,是一次实战测验和检验。总体看,当然实现了人工智能的最大突破,但是局限性仍然是非常明显的。李院士说到,它存在复杂特殊情况下的算法缺陷,在第四盘,李世石偶然获胜的旗局中,这个棋,李世石是走的偏招,但是这个招,我们从实际结果看,AlphaGo是上当了,造成了它的“自杀性”行为,叫做情绪的崩溃。把它用人类的状态描述,偶尔走出极端不合理的棋,这都是它在进行胜率不足所表现出来的状态。所以我们说它有很多的缺陷,它还不具备现场的认知能力,它也没有观察对手,对手在观察它。


我们看一下围棋人机大战的背景,值得高度关注的是什么?就是谷歌公司AlphaGo开发与正在两个方向推行的美国国家战略有密切的联系。首先,美国正在大力推进的从大数据到决策智能化发展有密切联系,从2012年到刚刚结束的10月,美国总统科技办公室发布了大数据政策性文件,其中在2012年发的文件,已经包括了军事政策系统的智能化,而且提出了他们的计划可以称为脑计划。同年,美国国防高级研究计划局,发布了用大数据支持决策的报告,明确提出了如何从大数据和复杂图像中得出最佳决策等等问题。2015年11月,美国国防部成立了数字防御部门,设立了国防部数字创新顾问委员会,我们大家不知道的是这个委员会的主席就是谷歌的大老板,埃里克•施密特。所谓第三次抵消战略,是带上世纪50年代、70年代,针对前苏联进行的两次以质量抵消数量规模优势的战略之后,很明显,提出的一个新的抵消战略,内核和主旨是发展颠覆性先进技术武器,抵消主要对手的增长优势,特别是破解对手的“反进入区域拒止”能力,构建新型复合威慑战略和全球监视一体打击。2014年8月5号,美国国防部常务副部长在美国国防大学的演讲中,首次提出了美国应该实施历史上的第三次抵消战略。沃克提出的第一个关键技术领域就是“深度学习系统”,而他的讲话是在AlphaGo和李世石人机大战之前。据此,我们判断,这次AlphaGo亮相的人机大战,目的不只是在围棋,是美国软实力的一次亮相,是对深度学习系统能力和智能化决策效果的检验测度,是一次典型的美国版的军民融合,是美国实施第三次抵消战略的一个技术牵头。围棋人机大战对与指挥决策智能化有什么冲击和影响,围棋和指挥决策相似度太大。这次实践表明,人工智能进入指挥决策领域已成必然,围棋人机大战的结果告诉我们,人工智能的迅速发展已经具备了进入现实的可能性,我们不能麻木回避,新一轮的世界军事革命已经开始了新的聚焦,由新型网络化革命上升为思维领域智能化领域的趋势已经开始形成。那么支撑美国第三次抵消战略的五个关键领域,全都和人工智能有关。也就是说,AlphaGo不是一个光光拿来玩的游戏,虽然我们对它感兴趣,很大程度上是游戏,但是要看到,它的背后有一个整体性的战略谋划,而它带来的影响不是在技术层面,而是在战略威慑和挑战上。其次,人口职能核心技术的发展,对指挥决策带来革命性的变化现在已经表现出来了,目前还不完全是技术发展的认识问题,在我们的领导决策层,对这个问题仍然有很大的争议,甚至还有很多的疑惑。


那么这次人机大战带来的冲击表现在这几个方面:


第一,人工智能不可能具备思维的观念可能就此改变。这个问题在理论界、领导层还有激烈的争论。争论在什么地方?刚才李院士讲到了,有学者已经提出了机器智能思维问题,已经有65年了,但是现在对人工智能的思维问题还存在争论,这个争论主要是我们长期认为思维是人脑的属性,到现在我们的哲学教学中仍然是这样讲的。那么就出现了过程主义和结果主义的两种争论,过程主义认为不是人脑就没有思路,结果主义认为主要通过计算的过程,达成的结果举行人类思维的程度或者是超过,那么应当承认它是思维。人工智能的可思维端倪已经非常清楚了,也许现在的不争论就把这场争论彻底划上了句号。


第二,人工智能只能起辅助决策的观念可能会改变,人工智能思维成为主角或者与人并行主角的可能性已经显现。有现实能力问题,也有我们的思想观念问题,更主要的是现实的技术可能性。


第三,人工智能不可能超过人类思维的观念可能会改变。人的优势固然存在,但是机器的优势也非常明显,这个现实带给我们的思想观念有很大的冲击。


第四,人工智能只能模仿人类,而人类不能向机器学习的观念会改变,人类和机器共同学习提高成为发展趋势。


第五,人与智能化机器只能是主辅关系的观念可能会改变。


22.png


可以肯定地判断,随着科技的发展,人工智能进入战争设计、战役方案、规划评估等等关键领域,人机融合的模式成为未来指挥决策的基本形态,这个趋势也已经非常明显。再者,AlphaGo研制过程和方法对指挥决策领域中人工智能的开发具有很大的示范性意义,这场人机大战之后,直接的结果是出现了世界范围内人工智能发展的热潮。在中国,据我们所知,几乎所有的学术领域都召开了研讨会,我们专门还呈报了《围棋人机大战对指挥决策智能化的挑战与对策》的研究报告。


第二个大问题,我们还要在设计一下“围棋脑”的核心技术突破,根据我们与中国人工智能专家的讨论,这段时间以来进行了反复的研究和探讨,得出了以下的认识:AlphaGo核心技术的突破,第一个特点就是按照人的思维路线来确定新的起点。在此之前,人工智能围棋有很多早期产品,可以说世界各主要围棋国家都在从事这方面的实践,但是就从2006年以后,这些早期的围棋智能作品主要还是采用蒙特卡洛树搜索方面,利用这种方法得出决策。这一年是之前十年早期人工智能围棋的主要特点。这有一个明显的缺陷,这个缺陷我们人工智能的围棋专家概括为,必须经过“冷启动”,所谓“冷启动”是什么?就是你面对这样一个对弈的局面,所有的着法要从头开始搜索和评估,这不仅降低了效率,需要非常大的采样才有可能实现。而我们观察围棋职业棋手的博弈解决方法是什么?也就是人的围棋博弈的思维路线是什么?他概括为八个字:棋感直觉+搜索验证。棋感直觉就是不经过思考就很快地出现直接想法、感觉和信号。所谓搜索验证是什么呢?就是核实直觉是不是存在偏差的一个充分条件,是为直觉建立真实性、可靠性的过程。AlphaGo的核心技术思想,完全类似于围棋职业棋手的解决方法。第二个特点,是以神经网络加树搜索为核心的技术突破。那么它通过深度学习神经网络获得棋感直觉,包括增强胜负棋感直觉。深度神经网络所获取的棋感直觉是数据驱动的,需要大规模地计算资源配置进行训练,使用了3000个GPO,比之前提高了很大的倍数。


AlphaGo的落子棋感和胜负棋感需要通过严格的数学模型和计算方法进行验证,同时由于形成了落子棋感和胜负棋感,还提高了计算效率。


AlphaGo技术突破有什么通用意义?它的核心技术突破的实质上是人工智能中的认知智能的瓶颈,那么人工智能可以说是包括了计算智能、感知智能、认知智能三个层次。


AlphaGo表现出了在认知能力方面的三个优势:

第一,掌握了人类围棋竞技的规律。

第二,它形成了棋感直觉。

第三,它在某些方面超越了人类已有的博弈方法。它的这种技术突破对其他指挥决策类的人工智能发展就具有了普遍意义,我们可以看一下,在这之前出现的“深蓝”例子,“深蓝”在人工智能的发展上,我们客观地说,它实际上还是建立在计算智能的基础上,还达不到认知智能的层次。受“深蓝”的启发,2007年美国的DARPA开发的战术级军用指挥控制系统“深绿”,原计划3年完成,结果3年后不但没有完成,而且已经完全停了,到现在还没有解决,为什么?对于瞬息万变的战场感知、理解、判断、决策、表述、应变、验证等属于认知层次的难题靠暴力搜索,靠“深蓝”的计算智能无法解决。而且它还有一个误区,形象地说,是“前不靠村,后不着店”的指挥控制系统。现在AlphaGo所具有的认知智能,通过深度学习网络来展现处理,这就给了人们新的启发。也就是说,要解决指挥决策方面的智能化发展,必须要走以深度学习和神经网络为主脉的道路。也就是说,AlphaGo所具有的通信意义和价值就在这一点。


第三,我们看一下,智能化“指挥脑”建设面临什么样的挑战和我们应当采取什么样的对策。习近平总书记反复讲,要试试创新驱动发展战略是使先新的跨越式发展,要弯道超车。当前世界主要强国把人工智能技术作为21世纪重要的发展趋势。人类已经经历了五种形态的军事革命,第一,我们称为金属化军事革命,它是解决作战工具的强度和摧毁力问题。第二个是火药化军事革命。在这两个军事革命面前,中国都不落后,一直到明代。第三个,机械化军事革命。这个带来的是自动化、机动力、打击强度和进度。机械化军事革命,中国彻底落伍了。第四,核能化军事革命。这是从上世纪40年代开始的在主要大国范围内发生的军事革命,包括核武器、核动力、核能源,有了非常长度的发展,带来了极大的复杂性,这是特殊形态的军事革命。第六,信息化军事革命。这个正在进行,还在发展。信息化军事革命突出的特点就是网络化、自动化、精确化。信息化的发展使整个战争的面貌发生了变化,它是人类工业革命带来的巨大成果和表现形式。现在面临着第六个形态,智能化军事革命。智能化军事革命可以做出很多概括,无人化作战平台、智能化指挥决策、作战云融合支撑,所谓作战云是美国空军在2013年首次提出的,是指在作战区域内所有的作战要素和指挥要素实行集成,我们可以把它形象地说,我想国平书记在博览会上倡导物联网和云计算,实际上所谓作战云就是在作战领域中的物联网+云计算。自助式技术保障,我们的很多诊断、医疗等等,像这样的作战保障,过去完全靠人力,白求恩就是最典型的例子,我们这方面会大量出现自主式的形态。机器人作战编队,这已经比较大范围出现。美国在伊拉克、叙利亚、阿富汗的战场实验中,都大量使用了无人机的机器人作战编队所形成的雏形机器人军团,将来编程、指挥、道德底线等等问题,现在都成为军事领域中的重大战略性问题。


历史上的军事革命发展不是平衡的,由于发展的不平衡性带来过三次明显的战争代差:

第一,冷兵器和热兵器战争的代差。

第二,轻武器和机械化作战的战争代差。

第三,机械化与信息化的战争代差。现在我们面临着可能到来的第四个代差的到来,智能化与信息化的战争代差,这是我们要坚决避免的局面,如果这代差来了,这对人民的安全、国家的命运是巨大的挑战。


下面我们从“围棋脑”角度看它和智能战争的联系,联系的对象就是“指挥脑”,“指挥脑”是智能化战争的核心,所谓“指挥脑”是智能化战争的概念。只运用军事指挥决策领域,以深度学习精神网络和树搜索进行为重要支撑,具有自主意识、判断、决策能了人工智能计算机系统。为什么智能化战争的核心是“指挥脑”,这是因为在智能化的状况下,有这因一些典型的现象,就是大数据处理,超复杂感知,高精度决策,无人机管控,不仅是空中的,是包括所有的无人机平台,不间断指挥,都要以来“指挥脑”。智能化战争对人的精神压力极其巨大,所以我们要实现这样的指挥,指挥的又是这样的作战力量,那么我们需要智能化的“指挥脑”。所以我们得出这样的结论:智能化的作战平台需要智能化指挥平台,智能化作战力量要求智能化的决策机制,智能化作战央视对应智能化的思维方式。


第一,我们看一下同“围棋脑”到“指挥脑”的跃升。我系统地梳理一下围棋和战争对抗之间的差别,据我所知,可能是第一次这么彻底地梳理出来,一共是十个差别:第一,完全信息博弈与非完全信息博弈。完全信息博弈和非完全信息博弈是两种完全不同的博弈形态,围棋人机大战之后,我们有一些人很轻浮地说了这么一句话,说AlphaGo有什么了不起,和邻家大妈打麻将似的,它打不过我们的,麻将虽然是简单的活动,它需要的智慧不要说和机器比的,和围棋是天壤之别,但是它有博弈形态的问题,围棋是完全信息博弈,而麻将是非完全信息博弈,这两者的差别是存在的。


第二,单一目标与综合目标博弈。围棋很简单,我的地多,我的交差点多就胜利了,战争不行,甚至在战场的胜利都可能等同于失败,这就是战争是达到政治目的的手段,战争是一个非常复杂的综合性目标博弈,它的目标都不一样,怎么可能和围棋这种单一目标决策相比较?


第三,明确规则和不明确规则博弈。围棋的规则非常明确,虽然有中国和韩日围棋规则上的某些差别,应该说中国的围棋规则更合理一点,AlphaGo是采取的中国的围棋规则。这么明确的围棋规则,博弈中双方就是有据可查、心理踏实,但是战争不一样,战争没有明确统一的规则,我们经常讲非对称作战、超线战等等,就是不规则作战,你打你的,我打我的,打得赢就打,打不赢就跑,战争中的不明确规则造成了计算机智能化指挥的非常大的困难。


第四,单一要素和复合要素的博弈。黑白两色的棋子,材质和内涵都一样,并无要素组合的差别。战争不行,战争的要素是极其复杂,深不可测。比方说,按照统一中的兵力兵器火力计算,很多时候不可能战胜敌人,但是这里面有一个几乎不可量化的东西,战争性质、人心向背、官兵的战斗士气、指挥员的聪明才智等等,这些要素结合起来形式战斗力,而围棋不是这样的,所以要素完全不同。


第五,封闭空间和开放空间博弈。棋盘是封闭空间,而战争没有任何限制,任何的地域,只要战争需要都可以作用战争领域,而棋盘  就是封闭的,19×19是从一开始就定了的,所以这两者之间有巨大的差异。


第六,平面战场与立体战场博弈。我们知道围棋就是一个平面博弈,而所有的战争,从出现火药开始就已经不是名面的了,这么多的作战领域,高度立体化的战场,现在甚至进入到了第六个战场领域,就是思维领域,所以这个很复杂。

第七,固定局面与非固定局面博弈。围棋下了棋就固定了,举棋不悔,而战争不同,不管是胜还是负,这个局面随时可能发生变化,所以说兵无常势,这是从古到今的军事规则。


第八,单级决策与多级决策博弈。围棋的棋手既是指挥员、还是参谋,军事是从上到下非常复杂的指挥体系形成的,所以指挥要考虑这些要素。


第九,充分样本与稀缺样本博弈。这是一个非常重要的特征,围棋的棋谱就是围棋博弈的样本,从古到今到可以保留下来,中国拥有世界上最古老的围棋系统,我们叫做最初的样板,战争不同,它要获得几方的样本,不同的级别有不同的样本,要获得敌方的样本,除非把它打败了,你才有可能了解战争样本,那么没有样本,怎么来做智能化的系统。


第十,智力游戏与国家命运博弈。


 “指挥脑”的发展现状,总体上处于弱人工智能向强人工智能过度阶段。弱和强是非常相对的概念,需要解释,最新出的美国人工智能政策报告把它明确定义为弱人工智能即特定领域人工智能,强人工智能具有一般认知功能的人工智能,强人工智能的到来,这次美国国家科技委员会结论是:未来几十年还看不到希望。那么目前,“指挥脑”的主要方式包括三种:第一种叫辅助式,就是根据需要提供参谋反。第二,嵌入式。第三,自主式,可以独立感知和决策。那么主要的载体,这些载体的水平目参差不齐,而且完全差强人意。第一个,战略战役模型,第二个,作战试验系统,第三个,兵棋推荐系统,第四个,模拟训练系统。


“指挥脑”怎么来建?我们有这么五条路径:


第一,必须以数据样本为基础,AlphaGo提供的最成功的经验就是这帮人是真刻苦,他们用的两年时间,不光光是能够形成自主深度学习的神经网络系统,更重要的是这些人的刻苦精神很值得我们学习,他们收集了如此多的围棋样本,但是,它还同样地在这些样本的基础,在形成了精神网络之后,又不间断地对AlphaGo进行训练。所以在人机大战期间,中国有记者采访他,他说了这样一句话,我们正在悠闲喝咖啡的时候,AlphaGo正在刻苦训练,由于它掌握了大量的数据样本,所以它的基础非常扎实。


第二,以深度学习为主脉络。


第三,以超级计算为支撑。现在我们国家的超算能力在世界上已经领先很多年了,我们现在用的应用系统,在超级计算能力方面我们是世界冠军的地位,是12亿亿次计算,下一次已经公开了,下一步再提高10倍,是100亿亿次计算,有这样强的计算来辅助攻关。


第四,以实用项目为抓手,现在做的内容基本上还是能够在战场上看得见、摸得着的,包括美国。比方说智能雷达,侦查到对方的频率信号后,自动跟踪处理,把它称为智能雷达,包括网络对抗。


第五,以辅助决策委重点,应该说是现在的发展方向还是人机协作。


“指挥脑”发展趋势是什么?总的说是“半人马”概念,目前有很多有希望的项目,或者叫做研究的发展方向。第一,混合式战场感知。包括概率的推理,小样本的学习,包括沃森语言系统,也包括树搜索的技术,很大的可能是要用混合式的手段来结果战场感知问题。第二,拟人化的人机交互。基本可以理解为指挥员的意图通过草图、口令、手势、接口传达给机器,提供决策支撑。我们可以想到海关战争的实例,一位上将在战争快事前在香烟纸上画了草图,整个海关战争,用的是矩阵方法,根据这个草图,美军做了半智能化的兵器系统进行了多次推演。拟人化的人机交互,可能是主要智能方式。第三,数据化的自主决策。指的是作战平台,很多作战平台根据事先布置的任务,可以从感知到处理到实施的自动化过程。最后,作战云指挥集成。在整个的指挥系统中,把和作战相关的指挥要素集中起来进行最高效的处理。


当前我们面临的形势是三句话:机械化尚未结束,信息化正在追赶,智能化已经来临。我们必须要认清趋势,明确定位,要把发展智能化的作战平台和指挥平台纳入规划,融入实践、投入资源、控制队伍,军民融合,按照习近平总书记讲的,要握指成拳,迎头赶上。


今年5月,美国国家科技委员会成立了机器学习和人工智能分委员会。20多天前,2016年10月12日,美国总统行政办公室,美国国家科技委员会发布了《为人工智能的未来做好准备》的政策报告。我们的对手已经如此,我们必须要以更大的使命感、责任感、紧迫感加强这方面的工作,来为我们国家的发展和安全提供更充分的保障。


今天参加报告会的有各级领导,有科学家,有各领域的专家,也有我们的大学生朋友们,特别是年轻的朋友们,我们希望在人工智能的发展方面,我们要拓宽思路,不仅从技术的层面,而且从战略层面认清这件事的特殊重要性,为我们国家的人工智能发展做出自己的贡献。谢谢大家!

(本报告根据速记整理)

CAAI原创 丨 作者林建超

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会