目录
1. 具体的配置过程:
2. 在指定位置(路径)创建虚拟环境:
3. conda常用命令:
4: 在跑模型时候遇到的一些问题:
4.1: conda添加python解释器找不到对应的python.exe文件
4.2: 报错“OSError: [WinError 1455] 页面文件太小,无法完成操作。”
4.3: 报错“CUDA out of memory. Tried to allocate 14.00 MiB
5: CUDA11.1版本出现NAN的问题原因及解决措施:
6: 虚拟环境中的cuda和系统中cuda的区别:
1. 具体的配置过程:
手把手教你Anaconda安装虚拟环境配置yolov5
2. 在指定位置(路径)创建虚拟环境:
1:使用命令查看当前拥有的虚拟环境
conda info --envs
2:在指定目录下创建新的虚拟环境,输入命令:
conda create --prefix=C:/ProgramData/Anaconda3/envs/pytorch python=3.8
其中C:/ProgramData/Anaconda3/envs 是创建的目录所在位置;/pytorch是所创建的环境的名称 python=3.8是创建的python的版本。
可以看到,验证确实创建在我们想要的位置
OK啦,创建成功:
3. conda常用命令:
常用命令大全
- 删除虚拟环境的代码如下(yolo5表示env名字)
conda env remove -n yolo5
- 激活虚拟环境
conda activate F:\Anaconda\envs\yolo5
4: 在跑模型时候遇到的一些问题:
4.1: conda添加python解释器找不到对应的python.exe文件
网上有很多解决方法,我参考了这个:
- 直接在Virtualenv Enviroment中找conda的虚拟环境里的python.exe就可以
- 直接在System Environment中找conda的虚拟环境就可以
但是后来发现右下角就有conda虚拟环境中的python.exe,所以我就直接选择了
4.2: 报错“OSError: [WinError 1455] 页面文件太小,无法完成操作。”
这个好像和给cuda虚拟环境所在盘分配的虚拟内存有关:
具体可以参考下边这个博客:
页面文件太小,无法完成操作。
4.3: 报错“CUDA out of memory. Tried to allocate 14.00 MiB
这个应该是训练的模型所设置的batch-size太大了,GPU的显存满足不了
把batch-size调小一些,如设置常用的256 128 64 32 16等,我是把yolov5中的16改为了8,然后问题就迎刃而解了。
最后附上使用GPU训练yolov5模型成功的截图:
(之前用CPU跑同样规模的数据集跑了2个小时,用了GPU只需要16分钟,不得不说真香)
显卡配置:(有钱一定换块好的)
5: CUDA11.1版本出现NAN的问题原因及解决措施:
我在完成上述步骤后,出现了一些错误,具体表现为如下形式:
该问题出现的原因在于CUDA版本较高(11.1),最好采用10.2的CUDA版本 ,只需要在虚拟环境中安装10.2的cuda即可,不需要在系统中重新安装。
解决方法可以参考下述博客:
YOLOv5s GTX 1660 Ti训练时出现,box,obj,cla全是nan的问题P、R、mAP都是0,Pytorch和cuda、cudnn版本不对
GTX 16XX系显卡 yolov5训练结果出现NAN的问题
yolov5 训练自己的数据集后,检测不到目标的解决办法
此外,也可能是如下问题导致的:
服务器上训练好的yolov5数据集在自己电脑上什么都检测不出来(已解决)
6: 虚拟环境中的cuda和系统中cuda的区别:
https://blog.csdn.net/qq_42744739/article/details/118640226