文章目录
- 设置存储库和 GPG 密钥
- 更新包列表后安装 nvidia-container-toolkit 包(和依赖项)
- 配置 Docker 守护进程以识别 NVIDIA 容器运行时
- 设置默认运行时后,重新启动 Docker 守护进程以完成安装
- 测试
参考官方文档,在
CentOS 7
上安装:
https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html#id1
设置存储库和 GPG 密钥
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
更新包列表后安装 nvidia-container-toolkit 包(和依赖项)
sudo yum clean expire-cache
sudo yum install -y nvidia-container-toolkit
配置 Docker 守护进程以识别 NVIDIA 容器运行时
sudo nvidia-ctk runtime configure --runtime=docker
设置默认运行时后,重新启动 Docker 守护进程以完成安装
sudo systemctl restart docker
测试
此时,可以通过运行基本 CUDA 容器来测试工作设置:
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi
也可以加入 -L 参数,只显示显卡:
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi -L