“AlphGo Zero”为什么青出于蓝——对比人类和AI的思维方式

2016年阿尔法够横空出世，战胜了人类的最强棋手李世石，虽然还输了一局。2017年初“Master”在网上横扫人类高手取得六十比零的战绩。实际上2017年的“Master”不再是阿尔法狗的升级版，而是完全用了新的学习模式，开发者深度思维公司叫它“AlphGo Zero”，就是“阿尔法零”。

“阿尔法零”和阿尔法狗最大的变化就是不再调用人类棋谱参考人类的经验，而是完全用自我对局的方式进行学习，3天时间里左右互搏了490万盘就超过了阿尔法狗的水平。

阿尔法狗开发者哈萨比斯

那么秘诀何在呢？我们要从对手和人类的思维方式说起。

上一篇我就说了阿尔法狗和人类相比最强的地方在于大局感。AlphaGo自战第一局研究——我眼中的“阿尔法狗”围棋

很多人肯定对此不以为然，认为阿尔法狗最强的是计算。其实大局感本身也是一种计算，只不过更多的侧重于点目，形势判断、分析得失，对比结果。从这个意义上讲，大局感是可以量化的！

然而我们人类的大脑在计算局部变化时也许跟阿尔法狗还是有可比性，但在判断全局比较各种结果时就不行了。下过围棋的人都知道棋手在面临读秒时最困难的往往不是战斗，而是判断，而是收官。因为战斗往往是直线型的，目的非常明确，把一个图算到底。而形势判断或者大局的选择则难得多，要同时对比很多个图。人类的大脑无法分身进行多线程的比较计算，而这个正是AI擅长的，在一瞬间对比50个图的得失和微妙区别人类做得到么？而AI却非常轻松。所以阿尔法狗真正碾压人类的是计算量巨大的可量化的大局感！

柯洁

我们人类传统的大局感是什么呢？有人以为大局感就是一些大场和“天王山”，其实这充其量是“布局练习”。真正的大局观是贯穿全局的。很多人把大局感误以为是一种感觉、一种构思，侧重于艺术化的东西。实际上大局感也是一种计算，是一种经验的归纳和提炼。人类为了弥补自己在大局计算上的弱点另辟蹊径，认真研究了许多理论，总结了许多棋型，从而归纳出什么场面下可以走，什么样的变化必然吃亏，比如常说的“中腹开花三十目”。

我们人类的顶尖棋手比如吴清源大师，在时间计算能力有限的情况之下，利用自己的经验和直觉在一刹那进行判断，走出了“神之一手”！这是人类一种了不起的能力！如果人机同时限制计算量只靠直觉的话，我绝对看好人类！

如果说阿尔法狗超越人类在于可量化的大局感，那么“阿尔法狗零”超越阿尔法狗并不说明人类思维方式的错误，只是说明人类的思维方式不适合AI。阿尔法狗学习了许多人类的知识和经验，但这些经验都是以人类大脑的计算能力学习方式为基础的。

考虑到一个人一生下棋有限，高手能下上万盘就了不得了，但AI的一天就能自我对局一百万盘。而且人类顶尖棋手不过百年，（100岁的吴清源大师是有史以来最长寿的棋手可谓功能圆满）而下一代顶尖棋手又要从头开始，有一个归零的过程。但阿尔法狗不需要。反之，你让阿尔法狗每下一万盘棋就清零重来，它还能有这么厉害吗？

昭和棋圣吴清源

所以人类的围棋经验不适合阿尔法狗。

举个例子

人类马拉松选手和赛车手一起参加拉力赛。马拉松选手最重要的经验是调整呼吸，而赛车手只要猛踩油门就行了，不是一回事呀！你让赛车手去找长跑选手取经，还不如让他自己开着车瞎练呢！这就是“阿尔法狗零”比阿尔法狗更厉害的原因。因为他完全抛弃了人类的思考方式。直接用赛车手的方式去开车，当然比让他坐在车上调整呼吸好。

人工智能对局还有一个特点就是频繁的弃子转换和打劫。其实人类高手也有这个特点，比如吴清源经常进行转换，聂卫平喜欢打劫。就像上面我说的，人类高手主动采取这种战术，是因为他们的大局判断直觉棋感都要比对手出色。而随着商业比赛的流行，人类围棋对局时间越来越短。从最早的不限时，一盘棋能下几个月，到吴清源时代下几天，到日本的两日制，到现在的30分钟快棋。

人类的围棋战术也发生了很多变化，不再走得这么自由奔放。而是许多地方经验优先，其实是为了节省时间。人类也不再进行频繁的弃子转换和打劫，并不一定是水平下降，更多地是时间有限以及为了更稳妥地战胜对手，也就是说时间限制了人类水平的发挥。而在这个问题上AI因为能同时进行多线程计算，时间几乎是无限的，因此AI在这个需要大量时间的项目上极为出色。比如我们看AlphGo Zero自我对局的第二局，全局都是在弃子转换打劫中度过的。

人类的大局感，本质也是一种计算。是点目、形势判断、分析对比的综合。

人类高手的大局感更多是经验的提炼和总结，利用直觉在一刹那做出判断，这是非常了不起的能力。

AI在大局的判断上只要进行多线程多图计算比较就可以完成，而人类的大脑显然没那么容易。

“AlphGo Zero”为什么青出于蓝——对比人类和AI的思维方式

AI能频繁的进行弃子和转换，是因为能够随时进行大量的计算和判断。而人类没有这么强大的能力，因此也不会采取这样自由奔放的战术。

阿尔法狗零比阿尔法狗更厉害并不证明人类思维方式的错误，只是由于AI和人类计算模式的不同。就像我说的赛车手只要猛踩油门，不必再去调整呼吸一个道理。

“AlphGo Zero”来了，但这不是围棋的末日，而是围棋新世纪的开始。我们将在棋盘上以欣喜的心情观赏着“神之一手”。

我们人类的围棋大师卓越的技艺一点也不会因为AI的强大而贬值，反而更加珍贵，更加令人神往。在人类短短的一生中，在有限的对局中，竟然也能下出这样的“神之一手”。凡人竟然也如此接近围棋的顶峰。

现在回过头来反观吴清源大师，绝对是人类中最伟大的棋手，也许是最后一位。他已成为围棋界的里程碑，他就是我们人类围棋世界的金字塔！阿尔法狗只会证明吴清源的才华，帝国大厦无损金字塔的伟大。

毕竟，围棋是我们人类的游戏。至少在目前为止，我们胜利后的欢乐和失败后的沮丧，还不是阿尔法狗所能具有的。这个就已经足够了。

这是围棋世界的阿尔法狗吗？

五千年的时间俯瞰着我的脸。

一千年，在你眼中，只是短短的一天。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。