阿法狗基本工作原理及意义初探

编者按：

很多年后，在炭基文明历史数据库里，阿法狗在西元2016年3月击败人类超一流棋手李世石的故事一定会是一段被频繁引用的资料。在这场战斗中，石头无力破局，天网一鸣惊人，史称“石破天惊”。自此，AI（人工智能）的发展把人类历史撞了一下腰，翻过拐点绝尘而去。AI 应用以飞快的速度渗透到人类生活的每个方面。一切都不一样了。

这篇论文将试图用劳动人民热爱的低俗手法，介绍这一划时代里程碑的基本工作原理和它的历史意义。

阿法狗不就是一个比以前水平高一些的下棋程序吗？还能当饭吃啊？值得这样得瑟吗？你个程序员不装X会死啊？很多群众愤怒地指出。

阿法狗还真不是一个高级下棋程序那么简单。和十几年前在国际象棋上战胜卡斯帕罗夫的程序“深蓝”比，阿法狗有相似的地方，但更有质的区别。

先来看相似之处。要下棋，必须得会判断棋局的优劣：随便给一个棋局，你能说出来是黑棋还是白棋占优吗？优势有多大？有了这个技能，棋手才能在不同的走法中选择对自己最好的一个。深蓝和阿法狗，都是用一种叫“棋局估值函数”（position evaluation function）的算法来估计一个局面的好坏。

但是它们的实现方法完全不同。

深蓝的作者，用了很大的力气，手工去调节这个估值函数。他们把很多象棋专家的经验整理出规律，再手把手地教给深蓝。这些经验，是特定针对国际象棋的，换一种棋（比如五子棋或围棋）就完全抓瞎了，又得重起炉灶。这种填鸭式的做法，不具有通用性。而且，围棋的复杂性，比国际象棋不知道高到哪里去了（大家知道，围棋可能的变化，超过宇宙中所有原子个数的好多好多倍）。要想凭这种方法在围棋盘上和人类高手谈笑风生，实在是图样图森破了。

阿法狗走的是通用学习的道路。它的估值函数，不是专家攻关捣哧出来的。它的作者只是搭了一个基本的框架（一个多层的神经网络），除了围棋最基本的规则外，没有任何先验知识。你可以把它想象成一个新生儿的大脑，一张白纸。然后，直接用人类高手对局的3000万个局面训练它，自动调节它的神经网络参数，让它的行为和人类高手接近。这样，阿法狗就具有了基本的棋感，看到一个局面大致就能知道好还是不好。

你抓住关键了吗？这种做法，只要有海量的训练数据，不需要人工的干预，相当于机器自动从数据中总结提取专家经验。如果换一种棋，也可以这么搞。这比人工取精^H经，不知道高到哪里去了（这真是一句名言啊，我忍不住又引用了一遍）。

传说中的股票及股指期货T+0交易训练营（第五期）

上课地点：上海

培训时间：2017年1月14—16日

来源：老万故事会作者：老万

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。