今天在安装环境时遇到报错:
The detected CUDA version (10.1) mismatches the version that was used to compile
PyTorch (11.8). Please make sure to use the same CUDA versions.
报错原因:安装的cuda版本不对应,我需要安装cuda的版本为11.8
下面开始cuda的安装:
1.打开网址CUDA Toolkit Archive | NVIDIA Developerhttps://developer.nvidia.com/cuda-toolkit-archive
2.下载11.8版本就点击CUDA Toolkit 11.8,如下图:
按照指令依次执行即可
在安装环境期间,遇到如下报错:
error: [Errno 2] No such file or directory: '/usr/local/cuda/bin/nvcc'
如果 /usr/local/cuda
是指向当前活跃 CUDA 版本的符号链接,确保它链接到了正确的版本:
如果链接不正确,你可以通过以下命令更新它:
sudo ln -sfn /usr/local/cuda-11.8 /usr/local/cuda
还遇到了:
error: command '/usr/bin/gcc' failed with exit code 1
原因是conda环境中的python版本过高,降低python版本为3.9即可
在环境安装时发现numpy的版本也过高了,正确的版本如下:
pip install numpy==1.23.0
后来又遇到了报错:
ImportError: libcudart.so.12: cannot open shared object file: No such file or directory
应该时cuda11.8的版本问题,我后面又换成了cuda12.1版本,对应的pytorch版本也需要进行适配
注意torch的版本要降低为2.1.0:
[linux] undefined symbol: _ZN2at4_ops5zeros4callEN3c108ArrayRefINS2_6SymIntEEENS2_8optionalINS2_10Sc-CSDN博客
补充:解压2.8.3版本包里Packages文件下的sdk-develop-python包的指令
sudo apt install libspdlog-dev
python setup.py install