本教程不得用于任何形式的商业用途,如果需要转载请与作者SCP-173联系,如果发现未经允许复制转载,将保留追求其法律责任的权利。
如果您是高校学生或者高级研究人员,并且实验室或者个人资金充沛,建议您采用如下配置:
如果您是仅仅用于自学或代码调试,亦或是条件所限仅采用自己现有的设备进行开发,那么您的电脑至少满足以下几点:
NVIDIA GT 910
、NVIDIA GTX 450
等等。HD5000
,ATI 5650
等类型的显卡,那么您只能使用CPU加速NVIDIA GTX 1080
,NVIDIA GTX 1070
等),您只能在之后的配置中选择CUDA 8.0
linux有很多发行版,本文强烈建议读者采用新版的Ubuntu 16.04 LTS
一方面,对于大多数新手来说Ubuntu具有很好的图形界面,与乐观的开源社区;另一方面,Ubuntu是Nvidia官方以及绝大多数深度学习框架默认开发环境。个人不建议使用Ubuntu Kylin,之前提出有部分信息表示,中国官方开发的这个版本有部分功能被“阉割”,你懂得。Ubuntu 16.04 LTS下载地址:
http://www.ubuntu.org.cn/download/desktop
通过U盘安装好后,进行初始化环境设置。
终端
输入:# 系统升级>>> sudo apt update>>> sudo apt upgrade# 安装python基础开发包>>> sudo apt install -y python-dev python-pip python-nose gcc g++ git gfortran vim
终端
输入:>>> sudo apt install -y libopenblas-dev liblapack-dev libatlas-base-dev
如果您的仅仅采用cpu加速,可跳过此步骤- 下载CUDA8.0
下载地址:
https://developer.nvidia.com/cuda-downloads
之后打开终端
输入:
>>> sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb>>> sudo apt update>>> sudo apt install cuda
自动配置成功就好。
终端
输入:>>> sudo gedit /etc/bash.bashrc
在bash.bashrc
文件中添加:
export CUDA_HOME=/usr/local/cuda-8.0export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
之后source gedit /etc/.bashrc
即可同样,在终端
输入:
>>> sudo gedit ~/.bashrc
在.bashrc
中添加如上相同内容(如果您使用的是zsh
,在~/.zshrc
添加即可)
终端
输入:>>> nvcc -V
会得到相应的nvcc编译器相应的信息,那么CUDA配置成功了。记得重启系统
从官网下载需要注册账号申请,两三天批准。网盘搜索一般也能找到最新版。 Linux目前就是cudnn-8.0-win-x64-v5.1-prod.zip。 下载解压出来是名为cuda的文件夹,里面有bin、include、lib,将三个文件夹复制到安装CUDA的地方覆盖对应文件夹,在终端中输入:
>>> sudo cp include/cudnn.h /usr/local/cuda-8.0/include/>>> sudo cp lib64/* /usr/local/cuda-8.0/lib64/
在终端
中输入:
>>> sudo pip install -U --pre pip setuptools wheel>>> sudo pip install -U --pre numpy scipy matplotlib scikit-learn scikit-image>>> sudo pip install -U --pre theano>>> sudo pip install -U --pre keras
安装完毕后,输入python
,然后输入:
>>> import theano>>> import keras
如果没有任何提示,则表明安装已经成功
终端
中输入:>>> gedit ~/.keras/keras.json
终端
中输入:>>> gedit ~/.theanorc
并写入以下:
[global]openmp=False device = gpu floatX = float32 allow_input_downcast=True [lib]cnmem = 0.8 [blas]ldflags= -lopenblas[nvcc]fastmath = True
如果您的所安装的是CPU加速版本,那么.theanorc
文件配置如下:
[global]openmp=True device = cpu floatX = float32 allow_input_downcast=True [blas]ldflags= -lopenblas
之后可以验证keras是否安装成功,在命令行中输入Python命令进入Python变成命令行环境:
>>>import keras
没有报错,并且会打印出关于显卡信息以及cnmem
等信息(CPU版本没有)那么Keras就已经成功安装了。
新建一个文件test.py
,内容为:
from theano import function, config, shared, sandboximport theano.tensor as Timport numpyimport timevlen = 10 * 30 * 768 # 10 x #cores x # threads per core iters = 1000rng = numpy.random.RandomState(22)x = shared(numpy.asarray(rng.rand(vlen), config.floatX))f = function([], T.exp(x))print(f.maker.fgraph.toposort())t0 = time.time()for i in xrange(iters): r = f()t1 = time.time()print('Looping %d times took %f seconds' % (iters, t1 - t0))print('Result is %s' % (r,))if numpy.any([isinstance(x.op, T.Elemwise) for x in f.maker.fgraph.toposort()]): print('Used the cpu')else: print('Used the gpu')
在GTX 970显卡下,输出结果大概是0.21秒,在一百倍运算量下19秒,可以进行对比。理论上,相比较主频为3.3GHz的CPU,加速比应该是75倍,但不同的ssd和内存限制了IO接口传输速度。
下载Keras开发包
git clone https://github.com/fchollet/keras.gitcd keras/examples/python mnist_mlp.py
程序无错进行,至此,keras安装完成。
由于作者水平和研究方向所限,无法对所有模块都非常精通,因此文档中不可避免的会出现各种错误、疏漏和不足之处。如果您在使用过程中有任何意见、建议和疑问,欢迎发送邮件到scp173.cool@gmail.com与作者取得联系.
本教程不得用于任何形式的商业用途,如果需要转载请与作者或中文文档作者联系,如果发现未经允许复制转载,将保留追求其法律责任的权利。
作者:SCP-173E-mail :scp173.cool@gmail.com如果您需要及时得到指导帮助,可以加微信:SCP173-cool,酌情打赏即可
联系客服