你知道李世石输了,可你知道Alphago是怎么赢的吗?

【创客100编者按】昨天办公室的同事都在热切地关注着一场人机大战,听说是有一个叫做阿尔法狗的人工智能和世界围棋高手,韩国欧巴李世石对战。第一反应就是很多年前的深蓝对战人类。这次还是一样,人类又再次被打败。为什么这只阿尔法狗会这么厉害呢?

昨天,小巴发现办公室小伙伴都在关注李世石和Alphago的五番棋大战Round 1。下午,优势几经换手后,李世石输了。

办公室小伙伴有的支持李世石,有的支持Alphago。李世石的“棋盘宿敌”古力九段说,根据他以往打交道的经验,李世石的调整能力很强,而且今天的白棋相比于昨天的黑棋更胜一筹。而同样有人认为,Alphago在第一局就证明它的能力,有着自己完美的的棋盘逻辑,赢下了第一盘之后,没有理由会输第二盘。

不管如何,小巴对于计算机能够在围棋上打败人类最顶级棋手感到吃惊,这或许真的是划时代的一天。

更好奇的是,Alphago到底是如何击败李世石的?

为什么对计算机来说,围棋好难好难?


李世石和Alphago对弈现场

下过五子棋的小伙伴应该知道,先手的人有必胜的一套走法,因为先手的人可以将后手的每一步都计算在内,并顺利达成胜利。其实所有的对弈类棋盘游戏道理都一样,在理论上存在一种必胜的走法,只要把每一步对方的下法都估计在内,就可以选择一种最优解并且获胜。19年前,IBM的计算机“深蓝”就用类似的方法战胜了当时的国际象棋第一人卡斯帕罗夫。

可是,对于围棋来说,这就不太行得通了,因为围棋更复杂。如果把每一步的所有可能下法都算在内,小巴数了数,大概有10的360次方(没错,就是1后面跟着360个0)种可能,比全宇宙所有微粒子加在一起的数量还要大。

这样下好费脑,人类肯定是做不到了,一般人算几步估计就脑死机了。计算机也好不到哪里去,肯定没算到一半也死了,只能一边冒着烟一边随意落子。

人类是如何避免这种作死的暴力棋法?


李世石和Alphago对弈海报

从计算的意义上而言,人类下围棋其实是偷懒的,每一步落子的过程大概是这样的:

第一步,看清棋盘全局,在棋盘的边、角或中腹等部分,初选出几个可落子的点;

第二步,分别预计对手的几种应对方式,估计落子后的形势和赢面,选择其中最有利的一种走法。

所以,人类下棋方式其实是计算能力不够的时候,一种有限理性的妥协。人类所凭借的 “棋感”,有的时候是直觉,有的时候是经年累月由历史经验所得出的定式——即经过前人验证的局部最优解,不管入门级别的业余爱好者,或者李世石这样最顶级的棋手,都是如此。

Alphago去年战胜欧洲围棋冠军樊麾,昨天击败李世石,下围棋的手法和人类完全没有什么两样,秘密就在于它也具备了这种“棋感”。

Alphago如何“聪明”得像一个人?


李世石和Alphago之父哈萨比斯

其实,Alphago之所以在下棋的时候“聪明”得像一个人,就是因为它拥有几项类似于人类大脑的功能,从而可以模仿人类下棋的步骤。

首先,它拥有一个数据库,里面有十几万份人类6-9段职业棋手的对弈棋谱。Alphago从中模仿人类常见的落子方式,根据谷歌透露的数据,模仿的准确率达到了57%。也就是说,单单这一项功能,就可以使Alphago在一步的选择上有57%的概率与人类高等级职业棋手相同。这是“模仿大脑”。

其次,它可以自己与自己对弈,根据选择“模仿大脑”计算出的下一步落子的不同选择,不停往下落子,直到分出胜负为止,根据结果反馈“模仿大脑”,从而优化棋路,这是“学习大脑”。如果两台Alphago对弈,有一台直接使用来源于“模仿大脑”的落子选择,另一台选择经过“学习大脑”优化的棋路,后者的获胜概率达到80%。

最后,它还有一个“局面判断大脑”,用以判断当下局势的赢面,准确率也接近80%。

Alphago拥有了这几项功能后,就可以实现上面提到过的人类下棋的模式了:

第一步,根据棋局,快速使用“模仿大脑”选出一步棋(往往也是多种选择);

第二步,每一种选择,都使用“局面判断大脑”,判断落子后的局面,再往后模拟一步。

将基于模仿人类选择出来的多种可能性都计算过之后,Alphago会选择那种赢面最大的方式。

这也是一种在有限范围以内的理性解法,模拟了人类的习惯,很多很“傻”的下法就会自动被排除。它的学习迭代方式,和人类相似,就像人类碰到了火觉得疼,所以不再碰火,或者吃到食物觉得美味,所以下一次也会再吃一样,都是由经验的反馈所驱动的。

很快,人类下棋都比不过计算机了?


世界围棋冠军李世石

从此前Alphago 5:0完胜欧洲围棋冠军、职业二段棋手,世界排名top1000的樊麾,以及人机五番棋第一局击败前世界围棋第一人、当下排名第5的李世石,我们有充分理由相信,Alphago在围棋上的能力,已经达到了相当高的水准。


而了解了Alphago的学习能力原理后,不管五番棋大战结果如何,我们大概可以这样预测:很快,Alphago学习了更多的棋谱,数据处理的能力得到进一步提升之后,棋力达到了人类的最高水平。又因为计算机没有情绪和生理问题,在所有对弈中,它都可以“把自己拉到与对方同一水平线上,然后用丰富的经验打败他。”

所以,此前搜狗CEO王小川预测:不仅仅是围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。

比肩人类的人工智能是否即将出现?

李世石、哈萨比斯和谷歌董事长埃里克

人工智能其实早已出现在人类生活中,比如常见的吸尘机器人、Siri的语音回复、人脸识别等等。但它只会做一件或少数几件事情,只能解决已经出现过的问题,这其实是弱人工智能。

而人类称为独一无二的智慧生命,不同于机器的区别就在于学习和自我迭代的能力。

Alphago展现的模仿和学习能力,让小巴相信,不用太久,具有解决从未遇到过的问题的能力、在各方面都能和人类比肩、可以视为与人类相等的智慧生命的高级人工智能就会出现。【责任编辑/凡人】

创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。
相关文章
你知道李世石输了,可你知道Alphago是怎么赢的吗?
你知道李世石输了,可你知道Alphago是怎么赢的吗?