室友新购入一个笔记本,笔记本的显卡是GeForce RTX 3060 Ti,记录一下使用GeForce RTX 3060 Ti+cuda 11.6+Anaconda3搭建Pytorch深度学习环境。
安装很简单,当你有了Python环境时记住一个核心命令即可,显卡驱动因该在之前已经安装过了,只需要注意他的版本即可,如果觉着使用显卡训练模型依旧很慢的话可以先装一个cuda tooklit,然后安装一下cudnn加速驱动(具体自己网上百度,这里就不展开说了,据说安装之后可以提速50%)。
核心命令:
pip install torch==1.12.0+cu116 torchvision==0.13.0+cu116 torchaudio==0.12.0 -f https://download.pytorch.org/whl/torch_stable.html
安装的时候一定要注意torch有GPU版本与CPU版本两种,如果安装错误很可能无法使用GPU,大家根据自己的Cuda版本修改掉命令中的+cuxxx,比如我是Cuda11.6,我就改成+cu116。然后去后面网址找一找有没有自己想要的torch版本,在安装的时候需要注意torch、torchvision、torchaudio
三者的对应关系,以免后面会出现错误。
可以通过下面命令查看自己的驱动版本号。
nvidia-smi
期间碰到了许多坑,废了许多事。跑起来的那一刻感觉还是蛮快的,本文主要记录一下配置环境中可能遇到的一些问题。
不得不说,性能嘎嘎好。
预测嘎嘎快,嘎嘎爽。
文章目录
- 一、指定GPU版本却重复安装CPU版本
- 二、InvalidArchiveError问题
- 三、torch.cuda.is_available()返回False
一、指定GPU版本却重复安装CPU版本
Anaconda3环境究竟是省事还是费事?
Anaconda是一个非常优秀的工具,使用conda自带众多科学计算与数据分析库,安装Python库的时候会自动解析依赖的所有库,这里有一点不足就是对新手太过友好,当conda找不到你想要的库时们就会找到一个相似的库给你安装上,当我重复卸载安装5-6遍torch环境时发现了这个问题。这里还要注意镜像源的问题,推荐使用官方源。
原命令:
conda install pytorch torchvision torchaudio pytorch-cuda=11.6 -c pytorch -c nvidia
使用原命令安装之后torch版本一直是cpu版本。命令本身是没有问题的,问题出在了conda处理依赖关系那一步,后来换成使用pip命令下载。先去https://download.pytorch.org/whl/torch_stable.html找一找有没有自己想要的torch版本,然后在网上找一下torch、torchvision、torchaudio版本对应关系,替换命令中的版本号。
pip install torch==1.12.0+cu116 torchvision==0.13.0+cu116 torchaudio==0.12.0 -f https://download.pytorch.org/whl/torch_stable.html
期间可能会使用到的命令如下:
①清除缓存(不清除的话conda可能会偷偷省事):
conda clean -p # 删除未使用的包
conda clean -t # 删除缓存的tarballs包
conda clean -a # 删除所有缓存的数据(包括索引缓存等 )
②显示、添加、删除镜像源
conda config --show channels #显示目前的源
conda config --remove channels #删除源
#添加清华源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
二、InvalidArchiveError问题
这是anaconda3文件夹权限问题,可能安装在默认C盘路径就不会出现问题。我们需要给用户赋予控制文件夹的权限。操作如下:
如果还是不行的话,使用超级权限打开conda终端,这里自己可以多测试一下。
三、torch.cuda.is_available()返回False
这种问题比较复杂,但归根结底是版本问题。
- 问题1:版本不匹配
电脑实际安装的CUDA版本 大于 已安装的pytorch所对应的CUDA的版本
注意:小于等于是可以的,但是不能大于 - 问题2:错下成了cpu版本的(正是这种问题困扰了我好久)
可能使用了清华源镜像,但是清华源镜像中所对应的pytorch没有cuda版本的,但conda不给我们提示,总是吧cpu版本默默装上,这就造成了GPU版本命令下载成了cpu版本的失误。
针对于问题一,降低pytorch的版本 ,一般不建议去修改CUDA的版本,因为CUDA的版本会极有可能影响其他部分的使用。
针对于问题二,卸载重装,如果是conda安装的pytorch,就是用下面命令,用pip安装的就用pip替换conda。
conda uninstall pytorch
即使命令是从下面网站复制的标准命令,也会出现上述的问题二,这里要特别注意。
重复卸载依旧False,可以使用conda list查看一下包是否卸载干净,在配置过程中我就因为下面一个包而重复False。
使用下面命令可以卸载掉。
conda uninstall pytorch-mutex