打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
有没有必要和可能研发出令AI无法战胜人类的新围棋?(中)

前文里讲过,围棋的原始本质并非浪漫的人文艺术,而是一种数学求解,即对策论问题的求解。所以,暂且先不考虑目前阶段计算机语言的能力问题,也就是说,先不考虑能否像人类教会了阿尔法狗下围棋那样,目前的计算机语言是否也能让电脑“懂”新围棋,而是仅仅考虑电脑“懂”了新围棋之后,是不是就能像阿尔法狗下围棋那样也依然下得很好?

换而言之,新围棋真正想为难的对象应该是电脑而不是编程人员,所以新围棋的本质应该也可以还原为数学问题的求解,这样的话,编程人员总会有办法让电脑理解新围棋。

从这个思路延伸,问题就可以转化为:有没有一种完全信息博弈,特别是零和类型的博弈(即一般情况下都会分出胜负),即便可以完成数学建模,却仍然无法从数学上求得普通最优解或普通次优解?

当然,这里说的最优解或次优解可能是确定解,比如落子坐标,也可能是概率解,就好比阿尔法狗或“绝艺”对于围棋棋盘态势给出的“胜率”,只不过后者更复杂一点,还有可能涉及到一个可否判断的问题(见下文)。

所谓普通解的意思,一般而言,则是指一个数学问题的公式解,或叫数学解,即通过数学性质的方法找到的解,但从更严格的意义上,最好的称呼应该是逻辑解,即以人类的逻辑思维能力能够理解的求解方式和过程所获得的解。

比如说,当初计算机给出的对四色定理的证明,其实本不应该叫数学解,因为和传统数学的解法相差太多,但是肯定依然是逻辑解,否则数学家和程序员根本无法编程让计算机去完成设定任务。

又比如说,一元五次方程就没有公式解(即普通解),或者也可以说,它即使有解,大概也不能算数学解,因为不是按照普适性的公式求出的,但是也不能排除又出来一个拉马努金式的数学鬼才,一下子就凭某种神秘直觉猜出了它的解。

由此可见,只要让电脑理解新围棋的底层逻辑仍然必须依靠数学建模,那对新围棋数学建模之后,模型中必须要处理一种非同一般的数学难题,而这种难题又没有普通解,否则新围棋就不可能达到它的目的,也就是让AI虽然能学会但仍然无法战胜人类棋手。因为很明显,如果只是去求解普通的数学问题,具备超强运算能力的AI不可能比不过人类。

只不过,从目前人类顶尖棋手与AI的对弈结果来看,在边边角角等等局部区域的计算中,如果不考虑计算速度,而是仅仅考虑计算的精度,那么人类顶尖棋手与AI的差距并不大,个别情况下甚至人类顶尖棋手下出的鬼手还有可能在AI的预料之外。但是在中腹之类空旷地带,AI的判断力与计算力则是人类顶尖棋手根本无法企及的,也就是说,越是面对棋盘上“虚”的地方,人类反而越不如AI。棋谚“高手在腹”大概也需要从这个角度来理解,只不过古人不可能想到,后世真正的绝顶高手反而没有“手”。

所以,如果与AI拼计算力,人类棋手再天才也没有用,因此,要想让人类在新围棋中战胜AI,唯一的可能性就是,在新围棋的底层逻辑中,让AI遇到一种数学问题,而这种数学问题本身就并不存在普通最优解或普通次优解,或者说人类和计算机都不可能求得它的普通解,再次一等的情况是,就人类目前掌握的数学知识而言,还无法找到它的普通最优解或普通次优解。

因此,对于新围棋的根本目的来讲,最好是给计算机做新围棋的数学建模时,就需要在里面预设一种数学难题,这种难题从数学上就可以证明并不存在普通最优解或普通次优解,也就是说,即使可以给计算机进行新围棋的数学建模,也依然无法通过电脑运算就完成求解,这样的话,这种新围棋就有可能让电脑永远无法战胜人类。

当然,如果从数学的角度,严格一点来讲,一个数学问题有没有普通解的存在 ,和能不能找到它的普通解,大概还是不完全一样的,但是这里就不那么较真儿了,姑且都称之为数学问题的无普通解。

所以,从数学的角度举例来说,假如新围棋的本质最后还原为数学问题求解,而且其中某类步骤是对一元五次方程求解,那就有可能为难住电脑,因为,至少到目前为止,我们都知道电脑有算力,但是似乎还没有听说过电脑像拉马努金那样有神秘直觉,甚至直觉究竟是什么,人类目前可能也还说不清楚。

当然,上面仅仅是举例,所以并不是说新围棋的本质还原中就一定需要包括一元五次方程求解,实际上,一般来讲,棋类AI的底层逻辑基础大概率是离散数学这种类型,可能用不到求解方程式。

但是本质上来讲,任何类型无法求得普通解的数学问题,都可能是新围棋的底层逻辑基础。

需要强调一下,一个数学问题没有普通解,并不等于它没有解。就像前面提到的拉马努金,他的遗稿中就有很多结论,其中有些是错误,也有不少是正确的,但是这些正确的结论,因为拉马努金没有在遗稿中告诉我们他是如何获得的,所以有时就连数学大师哈代,也猜不出它的推导过程,而拉马努金在生前也曾经半开玩笑地说过,有些数学结论是印度大神托梦告诉他的。

人类的有些天赋在AI面前其实没有什么用,比如坂田荣男那样的围棋大师有计算力方面的天赋,但是这种计算力天赋再强,也远远无法和AI抗衡。但是也有些人,可能就像拉马努金一样,有某种神秘的直觉能力,AI还在那里计算求解,他则瞬间就发现了答案,这种直觉天赋在AI时代可能更重要,我们甚至可以说,新围棋如果要比传统围棋更体现出“艺术性”,就必须更有利于让人类展现出这种天赋。

当然,对于新围棋的研发人员来讲,首先需要考虑的应该还是AI的底层逻辑,也就是先进行数学建模和编程,然后通过解释或编译让计算机理解,最终再通过计算机把新围棋的游戏过程展示出来,至于新围棋究竟有没有“艺术性”,只可能是不断地通过试错调试才能知道的。

当然,也不一定从头到尾都只是进行逆向工程,,也可以同步设计新围棋的棋盘和游戏规则,然后数学建模去看看能否在里面发现没有普通解的数学难题。这是一种双向的研发思路。

两种研发思路很难说那种更好,因为很明显,先数学建模的优势是,我们可以提前在模型中塞进去一类没有普通解的数学难题,但是这种办法的困难在于,我们也没有把握知道,底层逻辑通过计算机还原为直观状态后,究竟是不是能让人类轻松学会的游戏。

反过来,先设计棋类游戏的优势当然也很明显,那就是它肯定能让人类学习和掌握,但是弊端也同样明显,那就是我们无法从游戏的表面就知道它的底层逻辑是什么,所以就要对它数学建模,但是建模之后很可能会发现,模型中并不包括没有普通解的数学问题,这样去设计棋类就可能是在希望瞎猫碰上死耗子。

所以,数学建模和棋类设计或许可以考虑同步进行,虽然它们的方向相反,一种是从抽象还原为直观,一种是从直观还原为抽象,但是同步进行,也许成功的概率会大一些。

不过,我在这里没有能力也没有必要去细谈新围棋的数学建模和逆向工程,所以只是先抛砖引玉,从同步设计棋类的角度,提供一些大致思路供感兴趣的相关人士思考。

一:单纯扩大围棋棋盘的路数肯定是不行的。有些人觉得,要让AI无法战胜人类,需要把现在的19路乘19路的棋盘改为25路乘25路,认为棋盘变大了,AI就不灵了。这往往是误以为AI是以穷举法在思考,但是实际上,AI的深度学习和穷举法完全不是一回事。

对于计算机来讲,穷举法的本质是一种比较特殊的机器学习,普通机器学习数据少,效果差,但是穷举法数据多,如果不考虑时间成本,也可以效果好。但是如果考虑时间成本,就只能采用深度学习方法,虽然也是数据较多,但又不至于太多,而且因为对数据特征的提取更高明,所以可以在有限时间内达到最好效果。

打个比方来说,我们可以用十万个触感钝化的盲人去摸一头大象,然后用十年时间不断拼接十万个粗糙的描述,最后得到对大象的全貌还原,也可以用一千个触感灵敏的盲人去摸大象,然后用一年时间拼接描述后得到全貌还原,两者相比,前一种接近于穷举法,而后一种就接近于深度学习。

也就是说,目前的AI由于采用了深度学习的方式,因此虽然处理的数据量也的确比过去的机器学习要多,但是分析数据的能力也更高,所以它们的工作效率高,效果好。这也就是数据量大不再能难倒计算机的一个重要原因。

所以扩大棋盘,增大AI的处理数据量,并不能解决什么根本问题,也许在比较短的一段时间内有点作用,但是一旦AI的自我对弈突破一个节点,这种改动就会变得毫无意义,相反倒是可能让人类在AI面前更容易输棋。

实际上,我们可以从集合论的视角来看待棋盘路数问题。纯理论的层面来讲,我们的确可以无限增加棋盘的路数,使得以后更先进的,哪怕是具有了穷举计算能力的电脑,它的计算量在短时间内也跟不上,但这可能还是未必能解决根本问题。因为很简单,人类的计算力也更不可能跟得上,但是在大家都跟不上的情况下,计算机却可能依然具备另外一种优势,那就是判断力优势。

这是因为,前面已经说过,计算机的神经网络分两部分来工作,一个策略网络(policy network)负责落子策略,另外一个价值网络(value network)负责判断全局优劣。当然,前面提到过,如果完整地讲,围棋AI要顺利工作,还要依靠蒙特卡洛树搜索,但这里就不详述了。

人类棋手下围棋,下到一定时候就会去“点目”,也就是看对弈双方谁围的空地多,然后判断出形势优劣,从而决定自己的下法。但是围棋AI把形势判断替换为胜率判断,实际上,从逻辑上来讲,更简单更科学。

不妨举个例子来理解这一问题。

让张三和李四从哈尔滨同时出发,目的地是昆明,除了两条腿,不能利用别的交通工具。途中有时会遇到大道,也有时会遇到河流,还会有悬崖边的羊肠小道在面前,而且往往是两三种选择同时出现,考验着张三。

那么,张三需要随时掌握自己与李四分别距离昆明的里数吗?

其实不一定,比如说,如果羊肠小道和河流必须二选一,而张三率先选择了只能容得下一人通过的羊肠小道,把游泳渡河的选择留给了李四,而李四渡河时大概率会淹死,那张三的胜率就接近百分之百,距离判断就可有可无了。

很显然,里数判断(或者叫距离判断)类似围棋中的形势判断,当代的围棋AI为了便于人类直观理解棋局,往往仍然是给出“目差”提示的,但是从本质上而言,胜率判断才是AI工作的底层逻辑基础。

上面的例子有点夸张,但是从理论上来讲,说明了AI下围棋和人类下围棋的思考差异。

一般来讲,人类围棋高手在中盘临近结束,快要进入收官的时候,所做的形势判断可能不如AI的胜率判断精准,主要的一个原因就在于,在人类棋手的形势判断中,对于棋的厚薄如何折算成目数很难处理得很完美,而AI对于棋的厚薄与胜率的换算,可以非常的严谨精细。

因为对于这种换算,AI依靠的是量化数据,这种量化数据的可靠度依赖累积存储和即时搜索来保证,而人类依赖的是经验和直观感觉,前者是底层逻辑思维,后者是表象思维,所以计算机的思考肯定更加“深刻”。

那么,不妨反过来想一下,能不能让计算机的思考也“深刻”不起来呢?

换句话说,计算机的“深刻”是基于什么前提?新围棋的设计能否破坏掉这种前提?

我们知道,从AI的角度,张三选择羊肠小道,是确定自己的策略,同时也相应影响到对手李四的策略,同时,判断李四大概率渡河会淹死,相当于是AI价值网络的全局胜率判断,但是有一个大前提,不管是选择还是判断,张三都需要有能力做出,如果张三就是一个幼儿,很可能除了哇哇大哭,什么也干不了。

也就是说,从AI的角度来讲,羊肠小道算是一种普通解,李四大概率会淹死是一种判断,前者和后者都必须能被知道,AI才能顺利工作。

现在的围棋AI之所以厉害,是因为前者总是有普通解的,而后者总是可判断的,所以,新围棋的博弈变化形态数量变得再多,哪怕无穷多,但只要仍然是可数无穷集合,那就还是具有可判断性,也就是说,单纯地扩大棋盘路数,哪怕使得数量集合变成无穷大,也改变不了集合的性质,这样的话,并不能让AI的胜率神经网络彻底失灵,除非在规则设置上,让这种数量集合变成不可数无穷集合,那样的话,倒是很可能产生不可判断性,这就需要我们的思考重点不是放在改变新围棋的区域大小,而是要思考能否通过改变它的某些区域性质,增加博弈态势的不可判断性。

其实,单从数学上来讲,只要弯曲两个坐标轴(在现实中,对于电子棋盘这也并不难做到,对于实物棋盘则恐怕有相当难度,这里先不考虑现实中的制造工艺成本),利用同胚映射的特性就可以定义出一个无穷点,但这样构建的集合应该是一个广义实数集,不大可能具有离散的性质,而新围棋数学建模后,它的底层性质基本上应该还是离散的,否则可视化还原后很难体现为一种棋类,所以一个离散集合内如何添加进具有无穷属性的元素,能否添加,我就不懂了,需要请教数学专业人士,但是一旦还是弯曲坐标轴,显然就有改变棋盘形状的可能。

二,哪怕不考虑添加无穷属性,围棋棋盘的形状仍可能有改变的必要。我们都知道,在图论当中,有些数学难题,对于电脑来讲,运算解决也是很耗时费力的,比如对于著名的四色定理的证明,而智力竞技游戏往往需要给对弈双方设置时间,哪怕现在日本的围棋比赛,也不可能还像旧时代那样,一打挂就拖拖拉拉地下上一个礼拜甚至更长时间。

由于棋盘上的交叉点本来就可以理解为图论当中的节点(Node),而棋子与棋子之间的相邻关系也可以与图论中所要研究的“边”(Edge))契合,各类死棋和活棋构成的形态大致也对应图论中所谓的“图”(Graph),所以,不排除新围棋的数学建模中包含某类图论问题的求解。

实际上,计算机算法本身是利用了图论知识的,但那是从另外的角度,和我们要完成的任务关系不大,或者说目的正相反,我们现在利用图论来设计新围棋,是想增加计算机的运算难度和时间。

正是基于这种原因,围棋棋盘的形状倒是或许可以改变,比如变成内圆外方或外圆内方以及形形色色的形态,这种棋盘其实在现实中也存在,一般被称为广义围棋棋盘。比如,有的广义围棋棋盘的形状近于中国地图或世界地图。

但是,在可以下网棋的时代,改变棋盘形状还可以理解为动态改变电子棋盘的形状。这样就不仅仅是让新围棋的底层逻辑基础中包括对某类图论问题的求解,以便AI在有限时间内无法及时找到普通最优解或普通次优解,而是可能对人类还有别的帮助,在本文的第三篇中将会再细说这一点。

三,可以考虑增加不同颜色的棋子,比如说,让甲方有白蓝两种棋子,乙方有黑红两种棋子,蓝子和红子可以在某种特定区域内或在某种特定情况下使用,甚至容许蓝子和红子在某些特殊情况下可以移动。这样做的目的,实际上等于增加数学建模中的变量,也就为电脑求解增加一点难度。当然,关键还是看数学建模之后的求解是不是很难找到普通解,否则也有可能适得其反,让人类更难战胜AI。

增加棋子的颜色数量和功能,表面上看去,也许会对蒙特卡洛树搜索增加一点难度,但是这点难度提升对于计算机来讲并不关键,而且我们的目的绝不是让计算机学不会落子和走子,我们是要它能学会下,只是下不过人类高手而已,所以没必要干扰它的模拟落子过程,否则新围棋AI有可能过于蠢笨,连棋子都落不下去,那就从一个极端走到了另一个极端。

实际上,不论是增加棋子颜色,改变棋盘形状(其实,改变形状的同时也就可能相应改变了路数),以及添加和改变某些游戏规则,根本目的是想阻碍神经网络的求解(不论是求策略解还是判断解)能力,换而言之,是要让新围棋具有真正的“艺术性”,因为很显然,可以一步步按照逻辑求解出来的东西,似乎仍然属于科学,并非称得上“艺术”,只不过,这些思路也可能不起作用。因为,不论搞得多么复杂,只要下棋仍然属于一种科学过程,人类就没有可能赢得了AI。

换而言之,新围棋的下棋过程最好不是一种科学过程。否则,即便今天的计算机由于运算速度或算法等问题,也许很短时间内无法战胜人类,但是早晚仍然可以打败人类。

为了说明这一点,我们先要从什么是科学过程说起。

什么是科学过程呢?

科学过程就是可重复验证结论的过程。

比如说,甲乙二人下第一盘棋,甲赢了,假如两个人再下第二盘、第三盘,只要双方招法每一步仍然完全一样,那第二盘、第三盘,乃至不论再下多少盘,也仍然还会是甲方赢棋。

如果甲乙双方下不同盘棋,每局双方每一步招法完全一样,但是输赢结果却可能互换,那显然,这种下棋过程就不是科学过程。

因为AI在短时间内的自我对弈数量就可以是海量的,所以,很显然,只要新围棋对弈仍然是一种科学过程,那么AI神经网络确定策略权重和全局胜率仍然并非什么难事。

现在我们不妨想一想,新围棋对弈有没有可能不是一种科学过程?

(待续)

备注:盛世益隆,杜肃亦增,而文水之雅量则未必常有,故为防失联,请长按或扫描如下二维码添加作者个人微信号。此号仅供已经关注本公众号的读者备用,日常情况下恕不寒暄问候亦不闲聊,还望大家谅解。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
科技 | 在李世石之前,人类棋盘“沦陷史”
当机器会学习能成长 人类下个被击败的领域会在哪?
淘汰中医,只能寄希望于它了吗?
用数学方法学围棋 | 玩转围棋中的数学6(下)
忠粉一千,养你一生(004):哈萨比斯
从"深蓝"到 AlphaGo丨AI 在游戏领域的升级打怪之路
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服