从“互联网思维”到“大数据”到现在的“人工智能”,高潮一波接着一波。潮水过后中,大家都假装什么事情没有发生过。皇太极煎饼到什么牛腩,冷暖也许只有他们自己知道。
这一波的AI浪潮更甚,之前无论如何喧嚣,基本也就在互联网圈内,最多涉及一些传统行业的大佬,担心被互联网革命。这样人工智能(AI)不一样,几乎街头巷尾,从精英阶层到下里巴人,言必谈AI,相关不相关的行业,送一个外卖,都说自己有多少人工智能技术。好吧,如果拟合一些数据,算一算距离,有一些调度就算AI,那其实应用了计算机的行业,都可以算智能吧。
至于这风是怎么刮起来的,恐怕很难说清楚,但一个很明显的催化剂,肯定是alphago无疑。围棋作为四大文化琴棋书画之一,就算不一定会下,那应该没有人不知道。因为它变化无穷,搜索空间大,在当前算力下无法穷举破解,自然被认为在目前的计算水平下,机器是无法战胜人类的。然而韩国的李世石败了,然后柯洁也败了,败得非常彻底和干净。
人类在围棋界最后的荣光没有了,google的deepmind进行了一次极好的营销和展示。然后“世界末日论”就来了,支持者不乏大佬中的大神,像理论物理学家霍金,特斯拉创始人埃隆马斯克等,加上文人墨客风花雪月的描述和媒体的推波助澜,AI浪潮就这么来了。
看标题知道我是来泼冷水的,或者说是来讲实话的。AI是取得一些进展没错,所以还沦落不到像比特币这般“皇帝的新装”,但真的被误读和夸大了。
AI这波的核心是深度学习,简单说的,就是深层次的神经网络,按定义的话,只要有多于一个隐层,就可以叫深度神经网络。这不是什么新概念,上个世纪就有了,只是当年计算量太大,也没有海量数据,没啥用,加之是黑箱,无法解释,理论上也是完备,成功率也不及同时代的SVM等算法,就被冷落了。
(掐头去尾,中间的都叫隐层(hidden layer))
上面各层的每一个“神经元”都有连接,就叫“全连接层”。这次有一个小改良(其实也是早在2005年的事情了),就是呢,不全面连接了,每次排过一个“小窗口”,这也是“卷积神经网络 CNN”这个名字的由来(就是矩阵做内积)。
这样做,带来如下好处:
1,所需要的连接的权重少了好几个数量级,计算量就小了,训练过程就容易了。
2,更重要的是,卷积具备了抽取高维特征的能力。打个简单的比方,我们靠非常近去看一张图片,看到的是一个个像素,看不明白图片上是什么物体;但当我们拿远了,一眼扫过去,可以看到构图,比如说这里是边界,这里是眼睛等,大致就是这个原理,每一层都是对上一层进行的抽象。
这里带来一个进步或者说最大的好处,是区别于传统机器学习,不需要再提取特征了。传统机器学习,比如决策树也好,SVM也好,最大的工作量其实在于“特征工程”,特征提取得好,效果自然就好。自然像下图这样的图片,特征是没法描述的,CNN最大的好处是,不用提取了,或者说是在深度网络的学习过程中提取的。
alphago把棋盘当作图片,用卷积网络进行深度学习。这里不展开所谓“两个大脑”及“蒙特卡罗树搜索”。这些也不是deep mind的原创。
这里想探讨的是,就算打败人类世界冠军的alphago,有所谓的“智能”了吗?
1,机器现在会“思考”了吗?
2,机器有所谓“直觉”了吗?
3,alphago的本质
人类会有直觉,所谓的“棋感”,就像股市那些操盘手说的“盘感”。好像说不清,道不明,却又似乎真实存在着。本来大家还可以半忽悠骗骗别人,骗骗自己。这下好了,alphago把这个遮羞布扯下来了。
最初的我反应是:alphago产生棋感了?就是那些文人墨客渲染的“大局观”。还好deepmind的无私,论文啊,数据啊,都公开了,github上还有一个第三方团队按这个原理实现了代码。从论文到代码,我研究了几轮,没发现啊。
真实的情况其实是哪有什么直觉和盘感,只是大脑的神经网络经过大量的训练,权重调整之后形成了一些定势,潜意识。在你好像未经思考的时候,会根据环境做出一些还不错的反应,而自己还不自知,没有去量化而已。
对于量化,这里做一个大胆的推论,一切不可量化的东西都是伪科学,因为科学的定义是可以证伪,不可以量化就不可以衡量,更无法证伪。所以,不要相信什么十年操盘手的盘感,都是骗人的,要相信量化。
这一波AI的本质是什么?也就是深度神经网络的本质是什么?统计!分布式统计,通过大量样本的有监督训练,把高维非性线的映射关系,保存在大量的权值里,如此而已。不好意思,这些工程师动辄几十好几百万的年薪,很抱歉说大家的工作就是几个矩阵乘来乘去,然后反向求个导,大家估计不愿意听。但这是事实。像SVM等传统机器学习算法的理论远比深度神经网络要复杂。要理解深度学习,大学的微积分(主要是求导),线性代数(主要是矩阵),然后概率论就足矣了。
你会问,就这么简单?!对,看本质就是这样。因为图片包含了识别图片需要的所有信息,所以在图像识别领域,深度学习的统计力有看似有质的飞跃。然并卵。对于自然语言的处理,全世界范围内举步维艰。你可能反驳说翻译很有进步啊,对,翻译是seq to seq的问题,本质上机器没有去“理解”内容,就是两个RNN序列对序列的输出,按概率最大化的标准,压根不管你输出和输出是什么。
说了这么多,不是想否定AI。其实AI很好,或者说人类这个愿景很好。但现在还差太多,“有多少人工就有多少智能”,“人工智障”可能更加准确。至于马斯克为何频推“末世论”?
有时候,这也许也是一种商业模式和逻辑。
1,人类面临一个危机。
2,我们需要寻求一个方案。
3,我有一个方案,解救天下苍生,然后名利双收。
比如马斯克干过的事情:
1,人类面临一个危机:石油等能源污染,会枯竭怎么办啊,那我们文明怎么办,还不世界末日啊。
2,我们需要寻求一个方案: 一定要清洁可再生能源,比如电能源。
3,我有一个方案,解救天下苍生,名利双收。然后有了特斯拉。
这次:
1,人类面临一个危机:AI要毁灭人类啊,终结者啊,天网啊。
2,我们寻求一个方案:AI道德,标准委员会...
3,我有一个方案,解救天下苍生,名利双收。OpenAI诞生了。
那霍金老爷子呢?他应该不会那么功利了吧?这个确实不知道,也许他老人家的时间维度和我们不一样,那是宇宙尺度,动不动就上下几百上千年,弹指一挥间的事情。对我们凡夫俗子而言,确实多虑了。
Ng说得中肯,“我们担心AI毁灭人类之前,先教好它识别一只猫吧”。
关于作者:魏佳斌,互联网产品/技术总监,北京大学光华管理学院(MBA),特许金融分析师(CFA),资深产品经理/码农。偏爱python,深度关注互联网趋势,人工智能,AI金融量化。致力于使用最前沿的认知技术去理解这个复杂的世界。
联系客服