深度学习大型模型训练和部署,需要使用GPU,使用Pytorch、Tensorflow等深度学习框架之前需要安装驱动环境,本文系统环境:ubuntu22.04系统,四张3090显卡
安装显卡驱动
下载:
选择显卡类型,下载驱动
驱动下载路径:官方驱动 | NVIDIA
验证:
安装成功后,输入nvidia-smi显示显卡基本信息
安装cuda
下载:
cuda最好下载安装,不直接使用apt-get命令安装,会出现一些问题
https://developer.nvidia.cn/cuda-toolkit-archive
cuda版本需要满足条件: dirver cuda版本 >= cuda版本
下载run版本
安装:
执行.run文件
配置环境变量:
vim ~/.bashrc
最末尾添加两行:
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
验证:
安装成功 输入 nvcc -V 显示cuda版本
3.安装cudnn
下载:
下载压缩版的cudnn,需要注册账号并登录
安装过程参考官方文档:
https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#installlinux-tar
解压:
$ tar -xvf cudnn-linux-x86_64-8.x.x.x_cudaX.Y-archive.tar.xz
安装:
$ sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
$ sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
验证:
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2