CUDA Toolkit多版本安装目的是为了将CUDA Toolkit支持多个版本,并将当前版本更新到后续支持常见pytorch的版本(即cuda11.6),目前该系统默认安装的是cuda10.2,cuda11.0和cuda11.2。CUDA一般有两种API,一个是驱动API(Driver Version),依赖NVIDIA驱动,由nvidia-smi查看; 另一个是运行API(Runtime Version)是软件运行所需要的,比如python环境需要的cuda api版本等。一般驱动API版本>=运行API版本即可。
0.cuda版本查询命令
运行API(runtime api):nvcc -V
驱动API(driver api):nvidia-smi,循环监控:watch -n 1 -d nvidia-smi
运行环境:"Red Hat Enterprise Linux Server7.5,python3.10,cuda11,torch1.13.1
1.下载:https://developer.nvidia.com/ 选择对应的版本进行下载
2.安装:sudo sh cuda_11.6.2_510.47.03_linux.run
选择accept,只选择CUDA Toolkit 11.6,其他都去掉,选择Install,详见下图
3.建立cuda的软链接,一般默认安装完成后会自动创建,后续可根据需要进行软连接的调整,比如改为cuda-11.2等等
进入/usr/local/目录
sudo rm -rf cuda # 删除之前创建的软链接
sudo ln -s /usr/local/cuda-11.6/ /usr/local/cuda # 建立新的软链接(制定链接版本为11.6)
4.配置PATH,打开.bashrc文件添加如下两行
export PATH="/usr/local/cuda/bin:/root/anaconda3/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/extras/CUPTI/lib64:/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
5.配置文件生效:source .bashrc