打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
关于深度学习,这可能是你最容易读进去的科普贴了(六)
36氪的朋友们 · 2016/03/15 12:03


编者按:本文作者王川,投资人,中科大少年班校友,现居加州硅谷,个人微信号9935070,微博 @ 硅谷王川。36 氪经授权转载自其个人微信公众号 investguru。查看本系列文章点这里

一、

计算速度和数据规模的大幅度提高,也引导出更多算法上的改进。

在网络构架上,一些算法更多地借鉴人脑认知的成功经验: 多提高效率, 少做无用功。多闭目养神,少乱说乱动。 多关注主要矛盾,少关心细枝末节。

2003年 纽约大学神经科学中心的 Peter Lennie 在论文中指出,人脑的神经元,一般最多 1-4%的比例, 可以同时处于激活状态。比例更高时,大脑则无法提供相应的能量需求。

神经网络的模型中,通过所谓激励函数(activation function), 根据上一层神经元输入值来计算输出值。

最典型的传统激励函数,sigmoid function,输出值在 0 和 1 之间,也就意味着神经元平均下来,每时每刻都在使用一半的力量。


这种高强度能量需求,对于普通生物体而言,是无法持续的。

一个有意思的比方是鳄鱼。真实生活中的鳄鱼,和动物世界的纪录片中纵身一跃,凶猛捕食的形象大相径庭。

鳄鱼 90%的时间是一动不动的,(一个近距离观察者常会把它误认为是石雕)剩下 5%的时间用于求偶交配,5%的时间用于觅食。


鳄鱼的低能耗绿色生活方式,使它成为两栖动物界的寿星。虽然野生鳄鱼的平均寿命缺乏严格科学的统计,但是被捕获后人工饲养的鳄鱼中,有不少个体,记录在案的寿命超过了七十岁。

二、

2011 年,加拿大的蒙特利尔大学学者 Xavier Glorot 和 Yoshua Bengio 发表论文,“Deep Sparse Rectifier Neural Networks”。(深而稀疏的修正神经网络).

论文的算法中使用一种称为 “修正线性单元”(REctified Linear Unit,又称 RELU)的激励函数。用数学公式表达:rectifier (x) = max (0, x ).


对于 RELU 而言,如果输入为负值,输出为零。否则输入和输出相等。

换而言之,对于特定的输入,统计上有一半神经元是没有反应,保持沉默的。

使用 RELU 的含有三个隐层的神经网络模型,被用来测试于四个不同的经典的图像识别问题。和使用别的激励函数的模型相比,RELU 不仅识别错误率普遍更低,而且其有效性,对于神经网络是否进行 “预先训练” 过并不敏感。

RELU 的优势还有下面三点:

  1. 传统的激励函数,计算时要用指数或者三角函数,计算量要比简单的 RELU 至少高两个数量级.

  2. RELU 的导数是常数, 非零即一, 不存在传统激励函数在反向传播计算中的"梯度消失问题".

  3. 由于统计上,约一半的神经元在计算过程中输出为零,使用 RELU 的模型计算效率更高,而且自然而然的形成了所谓 "稀疏表征" (sparse representation), 用少量的神经元可以高效, 灵活,稳健地表达抽象复杂的概念.

(未完待续)

本文来自读者投稿,不代表 36氪 立场,如若转载,请注明出处:http://36kr.com/p/5044543.html

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
王川: 深度学习有多深? 学了究竟有几分? (六)
浅谈神经网络:神经网络是一种基于大量处理器相互连接构成的计算模型
深度学习中常见激活函数以及什么时候该使用激活函数
透彻理解深度学习背后的各种思想和思维
TF之DNN:TF利用简单7个神经元的三层全连接神经网络【2-3-2】实现降低损失到0.000以下
基于CNN卷积神经网络的目标识别算法matlab仿真,测试mnist数据库
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服