环境要求
- 内核版本 > 3.10 的 GNU/Linux x86_64
- Docker >=19.03(支持最低的版本为1.12)
- 架构 >= Kepler(或计算能力 3.0)的 NVIDIA GPU
- NVIDIA Linux 驱动程序>= 418.81.07(不支持较旧的驱动程序版本或分支)
-
GPU驱动安装
- 下载对应型号GPU驱动安装 例如A10
-
# 查看显卡是否正常识别 lspci | grep NVIDIA # 禁用nouveau并重启 cat > /etc/modprobe.d/blacklist-nouveau.conf << EOF blacklist nouveau options nouveau modeset=0 EOF #centos sudo dracut --force reboot #ubuntu sudo update-initramfs -u sudo reboot # 若没有输出,则表示禁用成功 lsmod |grep nouveau # centos安装基础依赖环境 yum -y install gcc kernel-devel kernel-headers # ubuntu安装gcc和make apt-get -y install gcc make # 安装GPU驱动 cd /opt #若没有驱动包先下载 https://www.nvidia.cn/geforce/drivers/ https://www.nvidia.com/Download/driverResults.aspx/224350/en-us/ chmod +x NVIDIA-Linux-x86_64-515.105.01.run sh NVIDIA-Linux-x86_64-515.105.01.run -no-x-check -no-nouveau-check -no-opengl-files #验证 nvidia-smi 正常显示驱动版本及设备信息则安装成功
- 安装过程
-
1.Would you like to register the kernel module sources with DKMS? 选择NO 2.Install 32-bit compatibility libraries? 选择N 3.Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择NO 其他选择默认
- 报错解决
-
报错:Unable to load the kernel module 'nvidia.ko' # 根据实际环境指定内核源文件路径 yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r) sudo ./NVIDIA-Linux-x86_64-515.105.01.run --no-opengl-files --kernel-source-path=/usr/src/kernels/3.10.0-1127.13.1.el7.x86_64/ (根据实际内核版本执行) # 若kernel initramfs不存在,需重新生成 mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak dracut /boot/initramfs