围棋AI是如何完美破解模仿棋的？

柯洁说，“看到了AlphaGo破解模仿棋的，真厉害！”。这引发了不少人的兴趣，想知道AlphaGo是如何破的，但柯洁没有提供细节。最近一个叫BensonDarr的新AI，可能演示了这种完美破解。

围棋的模仿棋，在职业棋手对局中并不罕见，日本九段藤泽库之助就喜欢下模仿棋。柯洁对AlphaGo三番棋中，也出现了柯洁是否应该下模仿棋的讨论。哈萨比斯说AlphaGo应该能对付模仿棋。而柯洁最终也没有下模仿棋。

围棋模仿棋分为执黑模仿，和执白模仿。拿黑棋先下的人就下天元，然后模仿对方。但是在现代的分先对局中，黑方有贴目，一直模仿下去黑棋一定会因为贴目而输掉。实际不需要破解就不成立。

这是周俊勋执黑对Master，黑1下天元，然后一直模仿到69手。但是此时黑1这个子效率低下，并不成功。黑71变招，很快就不行了。

现在说对AI的模仿棋，一般都是人类棋手执白模仿AI。

例如柯洁曾经对绝艺14连败，后来发微博说终于用模仿棋终结了连败，就如上图。这时的绝艺不会对付模仿棋，AI也普遍拿模仿棋没办法。

执白模仿的原理是，对方的招就算再厉害，我复制就有同等价值，如果能维持到局面缩小，7目半或者6目半的优势就足以让白方获胜了。

而人类高手，已经总结了几种破模仿棋的办法。一种是做出征子，双方都征，在中央碰头，先下的就能获胜了。一种是在中间下棋，子贴着子走，如果对方模仿就会互相包围，最后自己先提。下图是日本动漫画《棋魂》中的局面，塔矢亮就是用这个办法破解了业余对手的模仿。

但是对AI来说，要实现这种比较复杂的办法，难于编码，也比较困难。因此从DeepZenGo开始，AI们普遍用了一种简单的处理办法：执白被模仿不用管，如果执黑前10手发现对手模仿，就在第11手占天元！

上图是CGI执黑对柯洁。柯洁又用模仿棋对付AI，CGI到第11手的时候发现被模仿，就不顾一切占了天元，这样对手就没法模仿了。

这个办法对付一般对手是可以的，没法模仿以后，对手只能拿出真本事，于是实力差距就出来了。但是，黑棋不管局面如何，第11手强占天元，基本是一手低效的棋，可能丢失了先行优势。如上局，柯洁就评价说，黑天元是败招，后面下成下图黑大败。

因此，黑棋第11手（或者更多手后）强占天元，不是一种好的破解方法。虽然对手没法模仿了，但也达到了“减少黑棋先行优势”的战略目的，黑棋并不是完美破解。

上图的“符合预期”是绝艺模仿Master做的升级版本，非常厉害，对人类棋手一直不败。柯洁又拿出模仿棋来对付它，符合预期也是第11手占天元破模仿棋。此局后面几手甚至出现了AI反过来模仿柯洁的搞笑局面。本局柯洁最终获胜，是人类棋手对它的唯一胜局。绝艺升级版甚至能让顶尖高手二子，却显得不会破模仿棋。

从AlphaGo Zero公布的行棋和训练原理看，它追求自然提升，一切以胜率为导向，不要人类干预。其实人们可以推出，完美的AI不会象下面这样破解模仿棋：

1. 不是早棋占天元这种破解，这既不自然，占天元也会降低胜率，不是优美的办法。AI用这种办法破解，人类棋力有差距还是会输，但不会是让柯洁说“真厉害”的完美破解。

2. 早早到中间行棋营造对杀局面也不自然。如果到中间行棋会降低胜率，AI不会考虑这种下法。

3. 制造征子也不太自然，AI随机选择差不多的分支选项，不会有意导向征子。

每步都追求胜率的AI应该用一种自然的办法破解模仿棋：

1. AI执黑下的每一步都是提高自己的胜率，不会降低本方胜率。

2. 对手脱离模仿，不能提高自己的胜率（否则AI等于前面下得不好，让对手取得了优势）。对手只有继续模仿维持一定的胜率。

3. 棋越下越多，AI的黑棋胜率越来越高，对手白棋却没有办法，越陷越深。

4. 这时棋会发展到中间，黑白棋块终于碰上了，而黑棋可以先下天元，在杀气中取得胜利，白棋胜率会剧降到接近0。

5. 于是白棋只好强行脱离模仿，接受胜率大降的现实。

上面的过程才是理论上AI对模仿棋的完美破解，非常自然，黑方胜率一直提高，对手根本无机可乘。既没法从脱离模仿中受益，也会在后期的中间对杀中堕入深渊。面对这样的AI，对手执白只有早早脱离模仿，模仿越多越吃亏。这才是“完美破解”的意思。

野狐围棋平台上的BensonDarr就数次展示了这种破解。BensonDarr很可能是IT大公司用大量GPU资源模仿AlphaGo Zero训练的AI。

如上图，BensonDarr面对模仿就一着着地下，并不急于占天元。对手一直模仿到了140手，找不到脱离模仿的时机。这时黑141冲，如果白也在对称位置冲，那黑白中间两块对杀，最后结果显然会是黑棋在天元下子，提掉白棋，获得大胜。白棋只有终止模仿，可是141的关键位置被占气太紧，怎么走都不好了，没几手就败下阵来。

如图，双方模仿至87手（左下角和右上角小有区别不是关键）。但是白不敢在87的对称位模仿了，否则黑占天元，白下的这个子就成了送死，或者成为孤棋被攻得很惨。

如图，BensonDarr又慢慢将棋块发展到中央。如果白棋继续占对称点，则黑先冲断后占天元，黑的子连接良好，而白子却会被分开，下成下图这样。

如果下成这样，黑6终于占天元，就会发现，白1没有出路了，黑与1对称的子却连成一团没有事。而且白上面到中间的大块很危险，黑对称的这块却没有问题。

因此，柯洁看到了AlphaGo对模仿棋的完美破解，可能就是这样的：白棋发现胜率越来越低，却没法脱离模仿，直到陷入深渊。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。