打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
围棋AI是如何完美破解模仿棋的?

柯洁说,“看到了AlphaGo破解模仿棋的,真厉害!”。这引发了不少人的兴趣,想知道AlphaGo是如何破的,但柯洁没有提供细节。最近一个叫BensonDarr的新AI,可能演示了这种完美破解。

围棋的模仿棋,在职业棋手对局中并不罕见,日本九段藤泽库之助就喜欢下模仿棋。柯洁对AlphaGo三番棋中,也出现了柯洁是否应该下模仿棋的讨论。哈萨比斯说AlphaGo应该能对付模仿棋。而柯洁最终也没有下模仿棋。

围棋模仿棋分为执黑模仿,和执白模仿。拿黑棋先下的人就下天元,然后模仿对方。但是在现代的分先对局中,黑方有贴目,一直模仿下去黑棋一定会因为贴目而输掉。实际不需要破解就不成立。

这是周俊勋执黑对Master,黑1下天元,然后一直模仿到69手。但是此时黑1这个子效率低下,并不成功。黑71变招,很快就不行了。

现在说对AI的模仿棋,一般都是人类棋手执白模仿AI。

例如柯洁曾经对绝艺14连败,后来发微博说终于用模仿棋终结了连败,就如上图。这时的绝艺不会对付模仿棋,AI也普遍拿模仿棋没办法。

执白模仿的原理是,对方的招就算再厉害,我复制就有同等价值,如果能维持到局面缩小,7目半或者6目半的优势就足以让白方获胜了。

而人类高手,已经总结了几种破模仿棋的办法。一种是做出征子,双方都征,在中央碰头,先下的就能获胜了。一种是在中间下棋,子贴着子走,如果对方模仿就会互相包围,最后自己先提。下图是日本动漫画《棋魂》中的局面,塔矢亮就是用这个办法破解了业余对手的模仿。

但是对AI来说,要实现这种比较复杂的办法,难于编码,也比较困难。因此从DeepZenGo开始,AI们普遍用了一种简单的处理办法:执白被模仿不用管,如果执黑前10手发现对手模仿,就在第11手占天元!

上图是CGI执黑对柯洁。柯洁又用模仿棋对付AI,CGI到第11手的时候发现被模仿,就不顾一切占了天元,这样对手就没法模仿了。

这个办法对付一般对手是可以的,没法模仿以后,对手只能拿出真本事,于是实力差距就出来了。但是,黑棋不管局面如何,第11手强占天元,基本是一手低效的棋,可能丢失了先行优势。如上局,柯洁就评价说,黑天元是败招,后面下成下图黑大败。

因此,黑棋第11手(或者更多手后)强占天元,不是一种好的破解方法。虽然对手没法模仿了,但也达到了“减少黑棋先行优势”的战略目的,黑棋并不是完美破解。

上图的“符合预期”是绝艺模仿Master做的升级版本,非常厉害,对人类棋手一直不败。柯洁又拿出模仿棋来对付它,符合预期也是第11手占天元破模仿棋。此局后面几手甚至出现了AI反过来模仿柯洁的搞笑局面。本局柯洁最终获胜,是人类棋手对它的唯一胜局。绝艺升级版甚至能让顶尖高手二子,却显得不会破模仿棋。

从AlphaGo Zero公布的行棋和训练原理看,它追求自然提升,一切以胜率为导向,不要人类干预。其实人们可以推出,完美的AI不会象下面这样破解模仿棋:

1. 不是早棋占天元这种破解,这既不自然,占天元也会降低胜率,不是优美的办法。AI用这种办法破解,人类棋力有差距还是会输,但不会是让柯洁说“真厉害”的完美破解。

2. 早早到中间行棋营造对杀局面也不自然。如果到中间行棋会降低胜率,AI不会考虑这种下法。

3. 制造征子也不太自然,AI随机选择差不多的分支选项,不会有意导向征子。

每步都追求胜率的AI应该用一种自然的办法破解模仿棋:

1. AI执黑下的每一步都是提高自己的胜率,不会降低本方胜率。

2. 对手脱离模仿,不能提高自己的胜率(否则AI等于前面下得不好,让对手取得了优势)。对手只有继续模仿维持一定的胜率。

3. 棋越下越多,AI的黑棋胜率越来越高,对手白棋却没有办法,越陷越深。

4. 这时棋会发展到中间,黑白棋块终于碰上了,而黑棋可以先下天元,在杀气中取得胜利,白棋胜率会剧降到接近0。

5. 于是白棋只好强行脱离模仿,接受胜率大降的现实。

上面的过程才是理论上AI对模仿棋的完美破解,非常自然,黑方胜率一直提高,对手根本无机可乘。既没法从脱离模仿中受益,也会在后期的中间对杀中堕入深渊。面对这样的AI,对手执白只有早早脱离模仿,模仿越多越吃亏。这才是“完美破解”的意思。

野狐围棋平台上的BensonDarr就数次展示了这种破解。BensonDarr很可能是IT大公司用大量GPU资源模仿AlphaGo Zero训练的AI。

如上图,BensonDarr面对模仿就一着着地下,并不急于占天元。对手一直模仿到了140手,找不到脱离模仿的时机。这时黑141冲,如果白也在对称位置冲,那黑白中间两块对杀,最后结果显然会是黑棋在天元下子,提掉白棋,获得大胜。白棋只有终止模仿,可是141的关键位置被占气太紧,怎么走都不好了,没几手就败下阵来。

如图,双方模仿至87手(左下角和右上角小有区别不是关键)。但是白不敢在87的对称位模仿了,否则黑占天元,白下的这个子就成了送死,或者成为孤棋被攻得很惨。

如图,BensonDarr又慢慢将棋块发展到中央。如果白棋继续占对称点,则黑先冲断后占天元,黑的子连接良好,而白子却会被分开,下成下图这样。

如果下成这样,黑6终于占天元,就会发现,白1没有出路了,黑与1对称的子却连成一团没有事。而且白上面到中间的大块很危险,黑对称的这块却没有问题。

因此,柯洁看到了AlphaGo对模仿棋的完美破解,可能就是这样的:白棋发现胜率越来越低,却没法脱离模仿,直到陷入深渊

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
AlphaGo大局清晰占主动 柯洁孤注一掷图谋大龙
【经典对局讲解】国手山脉杯2018决赛 - 朴廷桓 执白 vs 王元均 | 一盘完胜终结了黑马的狂飙...
为什么说柯洁与阿尔法狗的第二局棋特别精彩?
陈经:人机大战首局柯洁“憾负”AlphaGo的看点
【实播】人类围棋与AI最后一战的深度步骤解析,AlphaGo是如何一步一步把柯洁带进圈套的
棋闻详情年 | 探讨AI犯错棋型有哪些?(五)(终结篇)作者:时年1年前  16  3818这回
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服