标准的深度学习三件套包括pytorch, cuda, cudnn。根据经验,一般安装顺序如下:
conda install cudatoolkit==11.7
,使用清华源(到官网确认安装了符合pytorch要求的cuda版本)到官网下载cuda安装包 https://blog.csdn.net/h3c4lenovo/article/details/119003405
安装方式有deb、在线deb和runfile可选,本人用在线deb安装。它会为你同时安装driver和toolkit。
安装后,运行nvidia-smi
和ls/usr/local
查看nvdiia cuda版本。
如果报错"you are running x server",说明有程序在使用显卡,要关闭lghtdm。
https://blog.csdn.net/lien0906/article/details/54312166
英文版。高赞回答
https://unix.stackexchange.com/questions/25668/how-to-close-x-server-to-avoid-errors-while-updating-nvidia-driver
sudo service lightdm stop
驱动和library的版本不一致,需要检查版本,并卸载重装驱动!
如何查看驱动版本
https://xujinzh.github.io/2022/05/25/nvidia-driver-library-version-mismatch/
…系统运行中的 NVIDIA 驱动版本(查看方法:cat /proc/driver/nvidia/version)与安装的驱动版本(查看方法:sudo dpkg -l | grep nvidia)不一致
如何卸载驱动
https://itslinuxfoss.com/fix-failed-initialize-nvml-driver-library-version-mismatch-error/
sudo apt purge nvidia*
用conda安装即可:conda install cudatoolkit==11.7
,conda可以使用国内清华源。
参考博客 https://blog.csdn.net/qq_51206550/article/details/127835129
下载pytorch gpu版本太慢,到官方镜像 https://download.pytorch.org/whl/torch/,下载需要的GPU版本,比如torch-1.13.1+cu117-cp39-cp39-win_amd64.whl
,其中cu117代表cuda版本为11.7,cp37代表python版本为3.7。
https://blog.csdn.net/qq_41710226/article/details/125548986
在windows安装cudnn详见"2. Installing cuDNN on Windows"一章,简单讲就是下载cudnn的压缩包,放到某个路径,再将bin目录添加到path。
联系客服