中国人工智能学会

Chinese Association for Artificial Intelligence

CIIS 2016 AlphaGo开启通用智能时代论坛实录丨Panel 嘉宾现场互动交流

发布时间:2016-09-28

11.jpg

从左至右:主持人CAAI常务副理事长、北京邮电大学教授杨放春, 中国围棋国手、世界冠军孔杰,中国围棋协会主席王汝南,CAAI理事、北邮计算机围棋研究所所长刘知青,清华大学博士后刘春芳

我们台上这四位嘉宾有两个是下棋的,两个是做人工智能的。所以我一直把下棋,就是从我们下棋的看AlphaGo,看它是个黑客。搞人工智能的可能多多少少还知道一点,我觉得你们也不见得它是一个白客,多多少少知道一些算法。如果大家有问题可以举手,没有问题我就问我的问题了,我觉得刚才已经讲到了就是AlphaGo在下的时候也有混招,比如专业棋手赢的那一盘,是AlphaGo没有下好。我想问问人工智能的,你们认为怎么会出现这种情况,按照道理说它应该按照它的确定性的算法往下走的。

刘知青:根据他们团队说,他们当时的评估还是有缺陷的,没有看出那步棋的预计性。它后面连续下了三五步棋,当时评价就是这样。

主持人:那换句话说跟死机差不多。

刘知青:对,虽然有盲点,但是它没有意识到。据AlphaGo的团队后来去美国的比赛会和欧洲的比赛他们透露了,这个地方他们修补了。

主持人:那就是如果再出现这种情况,就不可能是这样的了。

刘知青:对,就是如果再出现这样的情况就不会这样了。那个地方是由于价值网络的缺陷,现在已经弥补好了。

主持人:其实包括从下棋的角度来说,刚才说到二路被扳头,职业棋手肯定是不会这样走的。我一直觉得下棋除了技术之外,还有一个艺术感,还有点文化。就是让你们职业棋手来说,你从艺术和文化角度来说。

王汝南:我刚才看了,即使它这么下我也不会向它学。我们围棋从人文的角度讲,我们有一个交流和享受的问题,有一个心情愉快的问题,如果这样搞的话,根据我们围棋的感觉会觉得很难受。这样下棋不会很痛苦嘛。所以我们人跟机器下在这方面就有这种感觉,它不知道难受,我们人有知道难受。

主持人:是的,但是赢棋还是最主要的。

孔杰:确实是,从艺术上来讲我个人也觉得,还是以前的那种,就是日本为主时候那个棋的观赏性更强。还有李昌镐他的棋艺术性稍微差一点,以前的棋手非常注重美学的这种形状,而且有的时候他会觉得这个棋必须这样下,即使我输了,我也得这样下。确实有这个观点在里面。但是后来韩国棋手崛起了,韩国围棋就是注重效率。AlphaGo的招法就是注重效率,但是理论上来讲,任何的棋最终还是围绕一个这个棋的效果,而且棋下面也是根据不同的局面,现在AlphaGo也并不是任何局面都是这样的,它只是有些局面是这样的下。但是从围棋的观赏性来说因为它的竞技性强了,有些高手的思路也不能完全的理解。现在得有些围棋的招术和思路大家不一定都能明白。所以随着围棋竞技水平越高,他理解的程度就会有差别。

王汝南:最终,因为现在这个是新出现的AlphaGo围棋,是新出现的。最终我认为能找到一个契合点。就是对它的这个判断,不断的经验积累,最终我认为一定能找到一个契合点,可能我们过于强调观赏性,和过于强调胜负,这两者一定会有一个更好的契合点。这个就是将来我们人类可能要提高的过程,我刚才说了,要借助于AlphaGo它作为一种手段,可能会把我们围棋的欣赏会提高。

孔杰:比如刚才我跟大家说的那几盘局面,后来大家慢慢下的也少了,最终后来验证了就是这个棋还是不怎么好。

提问:刘老师我想问您一个问题,刚才我看了这个AlphaGo的分析胜利的方法,会不会得出这样一个结论,就是AlphaGo是不是遇强则强,遇弱则弱?如果是这样的话,是不是说明AlphaGo的武功已经深不可测了?

刘知青:说白了就是它会手下留情吗?我觉得它还没有这种灵感。如果对手比较弱的时候,它未必能下出最优的棋,因为这个最秀怎么看,人类认为的最秀就是能赢你多少步。但是机器它并不是以赢你多少步为目标,它是以赢你为目标,而且是稳稳的赢你为主,它不下危险棋。换句话说只有最高水平的棋手跟它对弈的时候,才能把它的真正的实力体现出来,你说的非常对。就是说他遇弱他不会把最强的水平体现出来,与一个相对比较弱的起手来说它随便怎么下都可以,你要想看到AlphaGo最高的水平,必须有一个跟它匹配的对手才能可以,而且还不是它自己,你必须跟它水平一致,水平相当,而且风格不太一样的棋手,才能真正把它的水平充分体现出来。现在我觉得可能还没有这么一个对手把它展现出来。这个东西吃不吃你对于它来说都没有任何的意义,吃你一个两个字,吃你多少,对人有意义,我要吃你一个多少子,给你一个气势上的压倒,机器没有这个意识,它能赢怎么赢它会以风险最小的来赢。比如我们看到李世石最后不行的时候,那个机器就不可能这样做,它不会做任何变化来影响这个结局,就是它没有吃大龙的目标,它没有赢你20步的目标,它就是要稳稳的赢你。而且机器它往往是这样的,就是赢你半步,这样才能百分之百的赢你。所以它的目标跟人的目标是完全不太一样的。

提问:我想提一个问题,我们人类的思维认为正确的东西,输入到智能机器里面去,智能机器也是不是始终认为人类的观点是正确的?第二个问题就是人类是不是能够始终控制智能机器?

主持人:其实我们人工智能里面分两派,一派叫联结主义就是像神经网络,一派是实派主义。一派就是推理出来的,但是联结主义的神经网络我自己的认识是不确定的。就是我们人虽然做了这么一个网络,最后这样一个算法,大数据学习,调了参数,最后怎么做出来的结果,这个会超出我们人类的结果,人类补知道,到现在为止都是不知道。所以它跟那个老中医专家系统一样。我们也在探讨看看它里面到底是怎么做的。第二个问题你刚才说的这个问题,这一直是很大的题目,就是人是不是能最后控制机器,控制不了就麻烦了。但是这个似乎比较遥远,现在也有很多大的科学家,说的很恐怖,说这种威胁论。但是我觉得这个还早。因为我们人工智能领域来看真的还早。比如AlphaGo咱们19路是这样的,21路你下下看,因为他没有这些训练,它只会下19步棋,但是人不是这样的。要做一个全能的人工智能机器人像人类那样全能可能还早。

提问:你们认为现在AlphaGo体现出来的这种智能水平,就是突现出来的,比如说系统里面部分的,还有一个就是生物的细胞内,生物的个体这种功能。就是一种叫做涌现或者突现,就是机器是不是也具备这种功能。

刘知青:在这个意义上是这样的,不是逻辑给出来的,不是通过规则逻辑形式化的东西,在某种意义上是一种涌现的过程,而且这种涌现的过程,我们叫做它是收敛的,一开始还不是很稳定的,就是说它里面就是还没有到达涌现的情况,但是当有足够大的数据量的时候,和足够深层神经网络的时候,这个训练结果就会涌现这个智慧。

提问:但是到自我意识呢?

刘知青:离自我意识还比较远。昨天大会上专家也有说到这个问题,即使没有自我意识,如果机器方方面面都比人强,虽然它没有自我意识,还是受你支配的,但是人能做的事情非常狭小了,车也不开了,翻译也不翻译了,棋也不下了,那我们能做什么呢?

提问:能不能下棋方面有没有通过图灵测试呢?

刘知青:这个有一定的常识,比如爸爸抱不起孩子,因为他太重了,这个他指的是谁?这个很明显指的是孩子,但是我换句话说爸爸抱不起孩子,他太虚弱了,这个他指的是谁?这个他就是指的爸爸。你就需要一定的常识才能够理解这句话,所以图灵测试可能更接近于对人的生活多少场景常识的积累。但是机器还是相对比较封闭的自我空间,但是人类的生活场景就多了,所以这个让机器去理解人类这个是比较长远的。

提问:关于机器神经网络系统的智能是凸现的,我也认为它不可能是凸现的,因为我是做这个技术的。就刚刚有说的正确的价值观,正确不正确是人类确定的价值评价,那个是人给它定的,至于走哪条路可能有很多种,但是最后要达到的那个全局的胜负,那是人给它定死的,这是跑不掉的。第二点就是你是经过大数据训练的,它是一个在全部的可控范围内产生的结果,只是路径的不同。所以这个正确与否是人类给它规定的,从这个地方要到这个地方去,可以绕一圈,也可以直线走,这都是容忍范围内的。说到刚才那个问题,就是如果说遇强则强,遇弱则弱。可能遇强的时候我发现只有三个好点可下,遇弱的时候可能有十个好点可下,这时候可能就像我们导航那样,我可能选择路径最少等等,可能它就选其中一个。所以我觉得是这样的。

提问:我有两个问题想和王老和孔杰先生聊一下,就是你们觉得AlphaGo有多远可以作为一个常规的手段,比如中日韩的围棋国家队作为一个常规的训练手段通过这种人工智能,如果作为一个常规手段,有没有可能打破当前中日韩这种围棋在世界领先的格局,比如让欧美这些国家也能够达到中日韩一较高下的这种情况?

王汝南:我想可能要做出来单体的机器的时候才能够达到,所以这个只是测试。什么时候单体机器人能够单独运用了,到那个时候的话,因为欧美围棋要提高高度,是两个问题,第一个就是你有没有对手,第二个就是对手的水平低,就是这两个制约了。如果这两个条件都解决了,机器水平很高,那欧美选手可能选手就要达到一个高度了。当然我刚才也说了未来职业高手怎么样运用机器能够把我们的水平再提高一步,在这个过程当中可能我们又会比他们,你原有的基础高,同样用一个仪器,可能效果达到的还是水平高的选手会更好。

孔杰:确实要运用到国家队的时候会涉及到两个问题,不光是国家队,比如以后少儿围棋的比如能不能跟人工智能学,它能不能教你,你在网上很方便,如果普及这个成本就会更低,这个主要涉及到成本的问题。如果真正能把成本降下来的话。人工智能发展也涉及到成本,说什么光纤将来的价格更低才能普及。现在人工智能的成本我们现在所了解只是下围棋的水平,它现在是一个什么水平呢,如果当人工智能跟你水平差不多,如果老是不断的进步,这个就难以想象了。所以说这个东西也不好说它什么时候能遇到一个瓶颈期,刚开始它肯定进步速度很快。在之后它可能有一些招法它自己去创新了,这是另外一个问题了。

提问:机器不可能让你四个子,而且它一定会有一个瓶颈,就是让到它不能再让了,它不可能无止境的下下去。您认为机器最多能让现在的高手两个子三个子,不可能无止境的让下去。

王汝南:这个问题其实它的软件对软件上让四个子可能是可能的。但是要碰到我们人,让人我们四个子这个是不可思议的。再一个我认为他搞这个东西,人家是有目的性的,达到一定高度的时候,我估计他这个团队人家要把注意力转移到通用的运用上去了。他也不可能永远搞十年搞这个围棋的,所以无限制让我们人类多少子这个也是不可能的。如果现在他能让我们三个子的话,它肯定就是围棋上帝了,我认为让两子还不敢说不可能,但是科学这个东西是颠覆性的,我也不敢说有多少。

提问:首先感谢几位老师和专家,我比较赞同王老讲的,我想问校长一个问题,就是说这个AlphaGo和我们人类其实都是基于大数据,高智能计算深入学习的,但是人工智能这块它的教育速度,就是它自身修缮的能力发展是非常快。怎么样在人工智能这块把它的这种学习的模式,转化为我们人本身,因为我们现在的思维都是一种定向的思维,其实它也是既有思维也有计算能力,就是说怎么样把这块进行转化。第二个问题我想问一下孔杰老师,我们的围棋是中国传承文明的东西,而且围棋的市场也比较大。人工智能对围棋市场,这个市场包括专业团队,包括文化培训的市场,这个会产生什么样的冲击?

主持人:我先试着回答第一个问题,不一定理解的特别准确。刚才说是把人工智能比如说这些技术的发展反过来怎么对人的思维和学习提高,我觉得是这样,现在我们的人工智能技术是要替代在某一个方面,要超过人,目前是这样的。不光说下棋,还有驾驶,都是要超过人的。但是不一定是按照人脑这种思维方式再处理,它是用到专用的什么技术,只要超过人就可以了,这是一个分支。还有一个分支就是专门研究人大脑是怎么工作的,这个也有研究,可能是研究通用的人工智能技术,利用人脑的方式,可能不光是神似了,可能也要形似。但是我觉得在AlphaGo这个方向还没有这个必要性,说AlphaGo如果它的技术超过了人,怎么样让人去学它,然后怎么提高自身,没有这个,因为它走的路径是不一样的,虽然我们都叫神经网络,但是人的所谓神经元网络,但是它里面还有很多生物的,化学的作用,电讯号。AlphaGo只是用人的概念,用计算机的方式去学习的。昨天科大迅飞的速记,有可能速记员的速度不如它的速度快,你的准确性也不如它。但是要完全出现一个完整的人那样,一个三岁的小孩可能知道很多方方面面的事情,而一个人工智能只是单方面的超过很多成年人,但是很多方面不一定都是这样。

孔杰:第二个问题,因为谷歌他本身研究这个东西,也不可能长时间的把这个人工智能提高到一定的高度。所以说涉及到对围棋整个行业和产业有什么影响,我现在觉得应该说还是非常有限的。除非等人工智能特别发达,各行各业都已经渗透进来了,比如它的软件成本都已经降到很低了,然后才能普及到比如像围棋的教学,或者在国家队这方面的训练,还是涉及到一个成本的问题。

主持人:我觉得AlphaGo下棋真的不是很漂亮,像那盘棋局部都是李世石占优,但是从全局看还是李世石吃亏。

王汝南:按照我们一般讲本来那个间冲就是很好的,所以是两个方面:一个是判断的问题,就是我们按照原有的判断和想法,认为每个局部里面都可能是不占便宜,但是全局赢了。第二个就是说AlphaGo围棋,它是根据一个总的胜负的概率来说的,我们人在这个过程当中不可能,我们只是运用一种判断的感觉或者直觉觉得我这盘棋的优势。但是是不是有51%的胜率或者51%或者53%,就是现在我们的职业棋手也很难说准,但是AlphaGo那个判断就是对,可能就是需要我们等到它这些东西都出来,我们现在对它知道的很有限。它来三盘棋,这些都不能够反应它真正的全貌,也不是我们能够充分分析它的弱点的地方。我认为这个还需要更多的信息,而且我们可能还要有一个团队。所以我刚才说了,你可能要有资金的投入,我们就是研究它到底优点在什么地方,弱点在什么地方,到那个时候我们才能够真正的说,将来真正要对抗,当然继续发展的话,如果它不继续发展,即使现在跟它对抗,可能我们人也要等条件,过去因为我们怎么都赢它,李世石认为根本没有条件的。现在已经证明了不是这样的了,将来可能就要谈条件,比如人我们什么情况下才合适,那个时候我认为才叫公平的竞争。当然我们也不认为公平竞争我们人就能赢它,就是赢和公平竞争是两个问题。所以刚刚说的这些都是未来我们也是面临的一个课题,包括市场的发展,这个市场对围棋的影响既有正面的也有负面的,也不要说全是负面的。负面的就是孔杰也没有什么啊,这种神秘感,偶像感会有一点减弱。但是有一个很大的优点是什么呢?就是让更多的不懂围棋的人都知道了,因为西方人对围棋是不太了解的,对东方文化总的来说西方文化他自己摆在制高点,他认为可能你们东方文化都是小儿科,起码在这个领域,或者这种游戏或者智力的领域他认识到了这个围棋。就像我们国内一样,这个AlphaGo围棋出来以后,知道围棋的人更多了。

提问:棋好看不好看,这个是可以改变的。

王汝南:美丑是可以改变的,这个肯定是会随着时代改变而改变,但是还是应该有一定的人们共识的东西。如果你都是预行三角,因为我们对围棋一个最大的认知就是子大小没有,但是子的效率是我们追求的,所以这一点上大概我们没有什么问题。中国文人过去下围棋,我以为他不是完全追求胜负的,你看那些文人诗词写的围棋的描写,他不是以胜负来描述的。所以将来我们的大众围棋,或者我们过去的文人围棋,没准将来我们人类的竞技围棋和机器的竞技围棋可能也是不一样的。

主持人:最后一个问题,我们请大家预测一下,我们老是觉得AlphaGo战胜了人类棋手。我们刚才也说了AlphaGo后面站了一堆人,而我们棋手只是一个人。我们想如果我们棋手后面也是也是一堆人,我们能赢吗?

王汝南:不能赢。我们没有一个人能把我们十个人的脑子集中起来。所以十个人研究的东西,其实没有电脑它的那种计算和选择好。所以这个问题,这个一定会有好处的。还有一个就是选择上也有好处,所以这个规则就要变了。有可能不是你一个人,下一步棋,我们后来就研究半天,半天以后我再跟你下,不管你机器五秒下完我不管,你五秒下完我就回去了,我们人在一起商量商量。李世石那盘输的棋来说,它只要后台一看胜率只有20%或者30%以后,它那个招法,就是它一觉得不到50%的胜率,它可能就不走那一步了。所以机器它还不是像我们人是活的。

孔杰:机器通常是计算后28步,如果我们28步以后可能它就计算不出来了,可能后面的计算就会出现问题了,然后它一下子就不知道怎么下了,然后后面就乱了。这个也暴露出了它的一个问题,就是在计算上。如果时间有限的话,很多人在一起商量,每个人都一个建议,这样也不一定能下得好。除非你要是说像王老师说的,没有时间限制,比如我们五个顶尖高手在一起商量,我们慢慢通过不断的拆路,这样可能会建议出一个好的方案。

主持人:其实还有一招,现在AlphaGo它肯定不会针对谁来下棋的。但是我觉得如果AlphaGo确实太强的话,我们人类还有一招,跟计算机打交道经常有一个叫黑客,我们专门找一帮人,研究AlphaGo有什么毛病,然后我们人类去抓住它的毛病,因为任何软件到现在为止都是十全十美。所以那一盘李世石赢的那一盘正好是碰到了那个缺点。

感谢大家,我们也希望以后能更多的相互相容,然后把中国围棋搞上去,其实中国围棋已经很好了,不好的只是足球。希望在跨界过程当中,我们把这个水平做的更高。现在主要是中韩,我们希望以后能够大面积的等级分也好,能够大面积的超过韩国。谢谢大家。

(本报告根据速记整理)

CAAI原创 丨 作者系上述嘉宾

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会