附录2-pytorch yolov5目标检测

附录2-pytorch yolov5目标检测

news2025/4/18 20:37:27

项目地址 https://github.com/ultralytics/yolov5

参考 https://zhuanlan.zhihu.com/p/711356735

目录

1 数据集准备

1.1 images

1.2 labels

1.3 yaml文件

2 环境配置

3 python环境配置

3.1 安装torch

3.2 安装opencv

3.3 安装 ultralytics

4 预训练模型准备

5 训练

6 预测

6.1 看大概的预测结果

6.2 预测命令

6.3 获取标签

1 数据集准备

我数据集单独放了一个文件夹，放在yolov5-master路径下

dataset中有两个文件夹 images 与 labels

1.1 images

images中有训练图像(train)与测试图像(val)，val与train的数量比2:8

我们打开train看一下

打开test看一下

1.2 labels

labels中有训练标注数据(train)与测试标注数据(val)，标注数据与图像数据一一对应（包括文件名）

我们打开train看一下

打开val看一下

标注文件txt是标准的yolo格式，我们随便打开一个txt看一下

1.3 yaml文件

在 yolov5-master/data 文件夹中创建custom.yaml文件，新建一个文本文档然后改尾缀就行了

内容如下

path是dataset的绝对路径
train是训练图片路径
val是测试图片路径
test可以不写
nc是种类数，是几分类就写几
names是标签，顺序最好与标注时一直（不一致也没事儿，后面可以再改，实际上训练出来的模型也不知道是哪个标签，它只认txt文件中的0、1、2这种序号）

2 环境配置

用的是亚马逊的EC2，型号是ml.t3.medium

一个小时需要0.2684元

这个型号是目前（2024.10.8）基本上可以说是性能最差的型号，应该是2核CPU的意思

如果要加速训练的话还是建议用这个

这个是将近34块钱一小时

虽然我的型号不支持GPU，但是执行nvcc -V还是能出东西

但是nvidia-smi出不了

查显卡的版本也查不了

3 python环境配置

我用的机器配置好了CUDA，所以我就直接配置python环境了，如果没配置好CUDA也可以尝试用CPU训练

我当前的python环境是3.10.8

3.1 安装torch

我安装pytorch的时候不知道我当前的云计算平台上用不了gpu，所以就按照CUDA装的，如果硬件没问题的话，安装方式是没问题的

可以在官网查看安装的命令 PyTorch

现在安装pytorch看起来简单的很，CUDA的版本它自己就给你搞定了

速度太慢了，否掉后用的清华源

清华源到后面一样会帮你解决cuda问题

最后安装成功是这样的

由于硬件问题，我这里如果使用 torch.cuda.is_available() 显示的是 false

会导致训练特别慢，大概要16个小时才能训练好一个模型

3.2 安装opencv

pip3 install opencv-python -i Simple Index

3.3 安装 ultralytics

pip3 install ultralytics -i Simple Index

4 预训练模型准备

预训练模型地址 Releases · ultralytics/yolov5 · GitHub

搜索pretrained，然后一直下一个到第五个（随着不断的更新可能就不是第5个了，不过我觉得使用别的应该也差不多，只要名字一样就行了）。点表格里的YOLOv5s是没用的

要到该条下面的Assets中找

下载之后的名称叫yolov5s.pt ，我把它的名字改成了pretrained_yolov5s.pt

5 训练

python train.py --weights pretrained_yolov5s.pt --data data/custom.yaml --workers 1 --batch-size 4

如果batch-size调整为8，我当前的机器会崩溃
pretrained_yolov5s.pt本身也是一个模型，如果你把你训练好的pt文件放到这里就相当于是中继训练了

可能会出现少一个字体文件

在本地下载完 https://github.com/ultralytics/assets/releases/download/v0.0.0/Arial.ttf 然后上传上去，之后复制到 /home/ec2-user/.config/Ultralytics/Arial.ttf 就行了

之后再次执行 python train.py --weights pretrained_yolov5s.pt --data data/custom.yaml --workers 1 --batch-size 4

训练时会自动给你调整epoch，终端上显示的进度条走到100%的时候是一个epoch。进度条后面的时间比如 00：04<13:40 的意思是，该epoch已经训练了4秒，完成该epoch预计需要13分钟40秒

训练了19个epoch后我就否掉了，因为实在太慢了，否掉也是有模型出现的，在yolov5-master/runs中会出现文件夹train

打开train后会根据训练的次数出现exp，我训练了三次，所以出现了三个exp，最后一次训练是exp3

模型在 exp3 的 weights 中

其中best.pt是最好的，last.pt是最后的

6 预测

6.1 看大概的预测结果

我们可以通过 train_batch 的这三张图像大概看一下预测结果

我们发现在有些图像上还是可以的

6.2 预测命令

执行 python detect.py --weights ./runs/train/exp3/weights/best.pt --source ./dataset/images/val/road0.jpg 可以进行预测

执行后在 yolov5-master/runs 会出现 detect

里面有exp

预测几个就有几个exp

再里面有预测好的图像

打开看效果还行

6.3 获取标签

如果想获取标签的名称可以在detect中做一些修改，想这种写的比较好的项目，变量的命名都比较标准，在detect.py中搜索label

在这里给他打印出来

我估计下面的confience应该就是置信度

运行后发现可以在终端打印

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2245121.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

$CDM(码分复用)发送和接受原理$

CDM(码分复用)发送和接受原理

现在假设主机A、B、C。其对应的码片序列为a、b、c。现在有： 现在假设A发送比特1，对应发送的是。B不发送。C发送比特0，对应发送。信号叠加的结果为。基站X将结果与每一个主机的码片序列做内积。与A： ,因此A发送了1。与B…

阅读更多...

菜鸟驿站二维码/一维码取件识别功能

菜鸟驿站二维码/一维码取件识别功能

特别注意需要引入库文 ZXing 可跳转： 记录【WinForm】C#学习使用ZXing.Net生成条码过程_c# zxing-CSDN博客 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using static System.Net.…

阅读更多...

华为云鸿蒙应用入门级开发者认证考试题库(理论题和实验题）

华为云鸿蒙应用入门级开发者认证考试题库(理论题和实验题）

注意：考试链接地址：华为云鸿蒙应用入门级学习认证_华为云鸿蒙应用入门级开发者认证_华为云开发者学堂-华为云当前认证打折之后是1元，之后原价700元，大家尽快考试！考试题库里面答案不一定全对，但是可以保证…

阅读更多...

Spring Boot与MyBatis-Plus的高效集成

Spring Boot与MyBatis-Plus的高效集成

Spring Boot与MyBatis-Plus的高效集成引言在现代 Java 开发中，MyBatis-Plus 作为 MyBatis 的增强工具，以其简化 CRUD 操作和无需编写 XML 映射文件的特点，受到了开发者的青睐。本篇文章将带你一步步整合 Spring Boot 与 MyBatis-Plus&…

阅读更多...

Elasticsearch：如何部署文本嵌入模型并将其用于语义搜索

Elasticsearch：如何部署文本嵌入模型并将其用于语义搜索

你可以按照这些说明在 Elasticsearch 中部署文本嵌入模型，测试模型并将其添加到推理提取管道。它使你能够生成文本的向量表示并对生成的向量执行向量相似性搜索。示例中使用的模型在 HuggingFace上公开可用。该示例使用来自 MS MARCO Passage Ranking Task 的公共…

阅读更多...

uniapp 购物弹窗组件（微信小程序)

uniapp 购物弹窗组件（微信小程序)

效果图，暂时只适应单规格，居中弹出和下方弹出，如需求不满足，请自行修改代码 （更新于24/11/15) 居中显示效果下方弹出效果 html <template><view class"" v-if"show":class"mod…

阅读更多...

(Linux)搭建静态网站——基于http/https协议的静态网站

(Linux)搭建静态网站——基于http/https协议的静态网站

简单了解nginx配置文件 1.下载并开启nginx服务下载 [rootlocalhost ~]# dnf install nginx -y开启 [rootlocalhost ~]# systemctl restart nginx 1.(1)搭建静态网站——基于http协议的静态网站实验1：搭建一个web服务器，访问该服务器时显示“hello w…

阅读更多...

爬取网易云音乐热歌榜：从入门到实战

爬取网易云音乐热歌榜：从入门到实战

爬取网易云音乐热歌榜：从入门到实战前提声明爬虫应遵守目标网站的robots.txt协议，尊重版权和用户隐私。本代码仅供学习和研究使用，不得用于商业用途。请确保在合法合规的前提下使用本代码。本代码所爬音乐为公开可选择的音乐目录引言…

阅读更多...

Quality minus junk论文阅读

Quality minus junk论文阅读

Quality minus junk论文阅读文章目录 Quality minus junk论文阅读 AbstractTheoretical FrameworkEmpirical AnalysisDataQuality scorePortfoliosEx ante quality forecasts fundamentals Results and DiscussionThe price of qualityUnderstanding the price of quality: th…

阅读更多...

利用RAGflow和LM Studio建立食品法规问答系统

利用RAGflow和LM Studio建立食品法规问答系统

前言食品企业在管理标准、法规，特别是食品原料、特殊食品法规时，难以通过速查法规得到准确的结果。随着AI技术的发展，互联网上出现很多AI知识库的解决方案。经过一轮测试，找到问题抓手、打通业务底层逻辑、对齐行业颗粒度、沉…

阅读更多...

类和对象——拷贝构造函数，赋值运算符重载（C++）

类和对象——拷贝构造函数，赋值运算符重载（C++）

1.拷⻉构造函数如果⼀个构造函数的第⼀个参数是自身类类型的引用，且任何额外的参数都有默认值，则此构造函数也叫做拷贝构造函数，也就是说拷贝构造是⼀个特殊的构造函数。 // 拷贝构造函数//d2(d1) Date(const Date& d) {_year d._yea…

阅读更多...

浅谈软件开发中的yield关键字：从餐厅服务理解异步编程之美

浅谈软件开发中的yield关键字：从餐厅服务理解异步编程之美

在现代软件开发中，处理大量数据流时经常会遇到性能和内存消耗的问题。传统的编程方式往往是一次性获取所有数据，这就像餐厅厨师要把所有菜品做完才上菜一样，既不高效也不够灵活。而yield关键字的出现，为我们提供了一种优雅的解决方…

阅读更多...

散户持股增厚工具：智能T0算法交易

散户持股增厚工具：智能T0算法交易

最近市场很多都说牛市，但是大多数朋友怎么来的又怎么吐出去了。这会儿我们用T0的智能算法交易又可以增厚我们的持仓收益。简单来说，就是基于用户原有的股票持仓，针对同一标的，配合智能T0算法，每天全自动操作&#xff0…

阅读更多...

[ 网络安全介绍 1 ] 什么是网络安全？

[ 网络安全介绍 1 ] 什么是网络安全？

🍬 博主介绍 👨‍🎓 博主介绍：大家好，我是 _PowerShell ，很高兴认识大家~ ✨主攻领域：【渗透领域】【数据通信】【通讯安全】【web安全】【面试分析】 🎉点赞➕评论➕收藏养成习…

阅读更多...

R语言4.3.0安装教程【附安装包】

R语言4.3.0安装教程【附安装包】

R for Windows是一个免费的用于统计计算和统计制图的优秀工具，是R语言开发工具。它拥有数据存储和处理系统、数组运算工具（其向量、矩阵运算方面功能尤其强大）、完整连贯的统计分析工具、优秀的统计制图等功能。提供的图形界面，可…

阅读更多...

【网络】Socket编程TCP/UDP序列化和反序列化理解应用层（C++实现）Json::Value

【网络】Socket编程TCP/UDP序列化和反序列化理解应用层（C++实现）Json::Value

主页：醋溜马桶圈-CSDN博客专栏：计算机网络原理_醋溜马桶圈的博客-CSDN博客 gitee：mnxcc (mnxcc) - Gitee.com 目录 1.基于Socket的UDP和TCP编程介绍 1.1 基本TCP客户—服务器程序设计基本框架编辑1.2 基本UDP客户—服务器程序设计基本框…

阅读更多...

小熊派Nano接入华为云

小熊派Nano接入华为云

一、华为云IoTDA创建产品创建如下服务，并添加对应的属性和命令。二、小熊派接入根据小熊派官方示例代码D6完成了小熊派接入华为云并实现属性上传命令下发。源码：小熊派开源社区/BearPi-HM_Nano 1. MQTT连接代码分析这部分代码在oc_mqtt.c和oc_mq…

阅读更多...

如何在 Ubuntu 上安装 Jellyfin 媒体服务器

如何在 Ubuntu 上安装 Jellyfin 媒体服务器

Jellyfin 是一个开源的媒体服务器软件，让你可以整理、管理和流式传输你的个人媒体收藏，比如电影、音乐、电视节目和照片，而且完全免费，没有订阅费用或数据收集的担忧。简介媒体管理：Jellyfin 整理媒体库&#xff0…

阅读更多...

Android集成FCM（Firebace Cloud Messaging ）

Android集成FCM（Firebace Cloud Messaging ）

集成FCM官方文档 Firebace主页面将 Firebase 添加到您的 Android 应用 1、进入Firebace页面，创建自己的项目 2、点击自己创建好的项目，在右侧选择Cloud Messaging 3、点击Android去创建 google-services.json 4、将下载的 google-services.json 文件…

阅读更多...

实时直播平台如何实现美颜功能？第三方美颜API与美颜SDK的技术

实时直播平台如何实现美颜功能？第三方美颜API与美颜SDK的技术

通过实时美颜技术，主播可以轻松实现肤色优化、五官调整以及滤镜效果，极大提升观众的观看体验。本篇文章，小编将深入讲解实时直播平台如何通过第三方美颜API与美颜SDK实现美颜功能，以及其中的技术实现与关键要点。一、实时美颜的…

阅读更多...

推荐文章

最新文章