打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
阿尔法元100:0战胜哥哥阿尔法狗,背后却是让全人类惶恐的故事

去年,AlphaGo Lee 打败了李世乭;今年,AlphaGo Master 打败了柯洁,我们已经被计算机围棋吓了两跳。但是,最近,AlphaGo 的弟弟 Alpha Zero,也即是阿尔法元,以 100:0 的成绩打败了哥哥阿尔法狗。

1、阿尔法元成为最强大的围棋程序

之前的阿尔法狗都利用人类数据进行培训学习,他们被告知人类在什么地方下什么棋子,学习了人类所有的棋谱。

而阿尔法元不依靠任何人类数据,而是自我学习:它仅仅被告知如何从零开始学围棋的原理,然后加入了若干种算法。

人们一般认为机器学习就是大数据和海量计算,但是阿尔法元让科学家们意识到,算法比计算、数据更加重要。要知道,在阿尔法元上使用的计算,要比在阿尔法狗上使用的少一个数量级,但是,运用了更多的算法,这就使得阿尔法元比阿尔法狗更加强大。

阿尔法元诞生之后,能力日渐增强,在第 3 天,就以 100:0 的成绩打败了战胜李世乭AlphaGo Lee;到 第 21 天,打败了战胜柯洁的 AlphaGo Master;到第 40 天,就打败了过去的所有阿尔法狗,这是连科学家自己都惊艳的成绩。

2、从穷举法到神经网络

在人机国际象棋中,计算机使用的是暴力穷举法。穷举法又称为枚举法,它的基本思想是根据题目的部分条件确定答案的大致范围,并对在此范围内所有可能的情况都逐一验证,看是否符合题目条件,直到全部情况验证完毕。如果某个情况刚好符合,那么它就是答案;但是如果没有条件符合,那么这个题目无解。

但是,在围棋中,这个方法被人们否定了。因为围棋每走一步,就会有 19 X 19 种可能性,即使是对于计算机,运用穷举法的计算量也太大了。

后来,有人提出将卷积神经网络(Convolutional Neural Network,简称 CNN)运用到围棋中。CNN 是近年来引起广泛重视的高效识别方法,由于它可以避免对图像的复杂前期预处理,能够直接输入原始图像,所以在大型图像处理方面表现十分出色。计算机直接学习棋盘图像,大大提高了运行速度。阿尔法狗就是运用的这一种算法。

3、人类阻碍了机器人?

阿尔法狗用了 40 层策略网络和价值网络:前者用于分析局面,预测下一步行动,帮助缩小选择面;后者则用于评估这步棋的胜率值。同时,快速走子系统也在运行,以在稍微牺牲走棋质量的前提下,提升运算速度。最后,再用一种搜索算法把以上三者连接起来。

但是,阿尔法元则直接去掉了快速走子系统,策略网络与价值网络也被结合到一起,关于人类围棋知识的系统基本都被删掉了。因此,在自我对弈初期,阿尔法元常常会出现一些很诡异的棋局,但是这也让它在后期会出现很多出其不意的方法。这让很多钟情于大数据的科学家都开始失落,因为阿尔法元似乎印证了是人类的思维在阻碍机器人的发展。

但是,仅仅凭此就断定人类阻碍机器人还为时过早。毕竟,围棋是一种充满了数学计算规则的游戏,而这正是计算机的强项;若是在其他更为复杂的环境下,这种单一的数学规则反而会受到局限。

我们也不用怀疑人类的围棋水平,毕竟,这些机器人,并不仅仅是为了下围棋而诞生的,科学家是为了把这些技术运用到其他领域而进行的初步尝试。仅仅因为机器人战胜人类就怀疑围棋,那么,下围棋的乐趣也不复存在了。你觉得呢?

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
围棋三手与更高手
假如AlphaGo炒A股——你有算法,我有内幕
井底望天:无师自通AlphaGo Zero,是否让“人类已多余”?
诗歌和围棋有什么不同:机器人小冰启示录
阿尔法元(AlphaGo Zero)能够完全自主学习并超越人类,会对人类产生威胁吗?
2016年高考作文重点话题之六:|拥抱人工智能,科技创新的春天or挑战
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服