[YOLOv8] 用YOLOv8实现指针式圆形仪表智能读数(二)

news2024/10/5 16:28:59

        最近研究了一个项目,利用python代码实现指针式圆形仪表的自动读数,并将读数结果进行输出,若需要完整数据集和源代码可以私信。

目录

🍓🍓1.yolov8实现圆盘形仪表智能读数 

🙋🙋2.表盘指针语义分割

🍋2.1数据准备

🍋2.2 模型选择

🍋2.3 加载分割预训练模型

🍋2.4数据组织 

🍉🍉3.目标检测训练代码

传送门

整理不易,欢迎一键三连!!!

送你们一条美丽的--分割线--


 

🍓🍓1.yolov8实现圆盘形仪表智能读数 

        实现的效果如下:

        对整个项目来说,可分为三个大步骤:

  1. 仪表目标检测
  2. 仪表表盘指针分割
  3. 计算读数

        此篇主要讲解仪表表盘指针语义分割,将表盘中的刻度位置和指针位置识别出来。

🙋🙋2.表盘指针语义分割

        同样采用YOLOv8n模型进行分割任务,将表盘中的刻度位置和指针位置识别任务看做是实例分割任务,用YOLOv8可以简单快速的识别出像素级刻度和指针。

🍋2.1数据准备

        首先还是准备数据,我的数据集展示如下:

        image:

        label可视化显示如下:

         其中要将label转成yolo-seg格式的txt文件,才能进行训练,具体格式如下:

        txt文件的第一列仍然为类别信息,后面的数字为归一化后的每个实例要素的边界位置点,红色框里代表一个实例,类别信息可以从第一列进行区分,与目标检测的格式一致。具体可以参考官网给出的数据格式说明。

        转换之后的label为:

🍋2.2 模型选择

         以YOLOv8n为例,模型选择代码如下:



# Load a model
model = YOLO('yolov8n-seg.yaml')  # build a new model from YAML
model = YOLO('yolov8n-seg.pt')  # load a pretrained model (recommended for training)
model = YOLO('yolov8n-seg.yaml').load('yolov8n.pt')  # build from YAML and transfer weights

        其中yolov8n.yaml为./ultralytics/cfg/models/v8/yolov8n-seg.yaml,可根据自己的数据进行模型调整,打开yolov8n-seg.yaml显示内容如下:

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv8-seg instance segmentation model. For Usage examples see https://docs.ultralytics.com/tasks/segment

# Parameters
nc: 2 # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n-seg.yaml' will call yolov8-seg.yaml with scale 'n'
  # [depth, width, max_channels]
  n: [0.33, 0.25, 1024]
  s: [0.33, 0.50, 1024]
  m: [0.67, 0.75, 768]
  l: [1.00, 1.00, 512]
  x: [1.00, 1.25, 512]

# YOLOv8.0n backbone
backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2
  - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4
  - [-1, 3, C2f, [128, True]]
  - [-1, 1, Conv, [256, 3, 2]] # 3-P3/8
  - [-1, 6, C2f, [256, True]]
  - [-1, 1, Conv, [512, 3, 2]] # 5-P4/16
  - [-1, 6, C2f, [512, True]]
  - [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32
  - [-1, 3, C2f, [1024, True]]
  - [-1, 1, SPPF, [1024, 5]] # 9

# YOLOv8.0n head
head:
  - [-1, 1, nn.Upsample, [None, 2, "nearest"]]
  - [[-1, 6], 1, Concat, [1]] # cat backbone P4
  - [-1, 3, C2f, [512]] # 12

  - [-1, 1, nn.Upsample, [None, 2, "nearest"]]
  - [[-1, 4], 1, Concat, [1]] # cat backbone P3
  - [-1, 3, C2f, [256]] # 15 (P3/8-small)

  - [-1, 1, Conv, [256, 3, 2]]
  - [[-1, 12], 1, Concat, [1]] # cat head P4
  - [-1, 3, C2f, [512]] # 18 (P4/16-medium)

  - [-1, 1, Conv, [512, 3, 2]]
  - [[-1, 9], 1, Concat, [1]] # cat head P5
  - [-1, 3, C2f, [1024]] # 21 (P5/32-large)

  - [[15, 18, 21], 1, Segment, [nc, 32, 256]] # Segment(P3, P4, P5)

        主要需要修改的地方为nc,也就是num_class,此处如果是自己的数据,那就要换成自己数据的类别数,因为这里数据集只有2类,所以nc=2。

        如果其他的模型参数不变的话,就默认保持原版yolov8,需要改造模型结构的大佬请绕行。

🍋2.3 加载分割预训练模型

        加载实例分割预训练模型yolov8n-seg.pt,可以在第一次运行时自动下载,如果受到下载速度限制,也可以自行下载好(下载链接),放在对应目录下即可。

 

🍋2.4数据组织 

        yolov8还是以yolo格式的数据为例,./ultralytics/cfg/datasets/data-seg.yaml的内容示例如下,仍然是coco格式:

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8  # dataset root dir
train: images/train  # train images (relative to 'path') 4 images
val: images/val  # val images (relative to 'path') 4 images
test:  # test images (optional)
 
# Classes (80 COCO classes)
names:
  0: person
  1: bicycle
  2: car
  # ...
  77: teddy bear
  78: hair drier
  79: toothbrush

        要注意此处的names是从0开始的,如果是0-79,那上面模型选择的nc=80。这里要特别小心。

        训练时的数据加载方式为:

# Train the model
results = model.train(data='data-seg.yaml', epochs=20, imgsz=640)

 

🍉🍉3.目标检测训练代码

        准备好数据和模型之后,就可以开始训练实例分割模型了,train-seg.py的内容显示为:

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-seg.yaml')  # build a new model from YAML
model = YOLO('yolov8n-seg.pt')  # load a pretrained model (recommended for training)
model = YOLO('yolov8n-seg.yaml').load('yolov8n.pt')  # build from YAML and transfer weights

# Train the model
results = model.train(data='data-seg.yaml', epochs=20, imgsz=640)

训练完成后的结果如下:

        其中weights文件夹内hi包含2个模型,一个best.pth,一个last.pth。

在此处贴上我的训练结果:

         预测效果如下:

        显示的太乱,可以屏蔽掉一些输出,比如文字和框等信息,可以参考我的另一篇文章【【YOLOv8】隐藏预测实例分割的目标类别和置信度信息】

        至此,表盘实例分割任务就完成了,接下来就可以根据我们的识别结果进行读数计算了,详细信息我们在下一篇进行讲解。

传送门

上一篇:[YOLOv8] 用YOLOv8实现指针式圆形仪表智能读数(一)

下一篇:圆形表盘智能读数

整理不易,欢迎一键三连!!!

送你们一条美丽的--分割线--

🌷🌷🍀🍀🌾🌾🍓🍓🍂🍂🙋🙋🐸🐸🙋🙋💖💖🍌🍌🔔🔔🍉🍉🍭🍭🍋🍋🍇🍇🏆🏆📸📸⛵⛵⭐⭐🍎🍎👍👍🌷🌷

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1653121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据分析面试】38.更新图书馆数据(Python)

题目 作为一名精通Python的图书管理员,你正在搭建一个更高效地更新图书数据的系统。 编写一个名为 update_availability 的函数,用于更新数据表中特定 book_id 的 availability 值,并返回更新后的数据表。 注意: 如果找不到 book_id&#…

【触想智能】工业级平板电脑五大特征与应用领域分析

工业级平板电脑是专供工业环境使用的工业控制计算机,也被称为工控一体机。工业级平板电脑基本性能及兼容性与商用平板电脑几乎相同,但是工业级平板电脑更注重在不同环境下的稳定性能,因此,工业级平板电脑与普通的商用平板电脑存在…

使用arthas 定位三方源码中报错行数

程序编译之后和你源java文件会有差异,导致报错行数不是你真实的java文件的行数 代码一共三百多行idea优化过后的 class代码,但是报错在六百多行不想下周源码 这时候使用 jad org.mindrot.jbcrypt.BCrypt 反编译执行的源代码信息确定行数

华火电焰灶,科技打造“新”厨房

家里最大的空气污染源其实来自厨房里的燃气灶!——斯坦福大学发表的《科学进展》期刊 厨房在家庭中占有举足轻重的地位,它不仅是一个烹饪美食的场所,更是家人情感交流的重要空间。厨房大致经历了两次变革,分别是以柴火灶为主体的厨…

Android广播机制简介

文章目录 Android广播机制简介广播的基本概念广播的类型广播的使用场景Android广播的优缺点优点缺点 使用Android广播的一些最佳实践: Android广播机制简介 Android广播是一种轻量级的消息传递机制,用于应用程序之间或系统与应用程序之间进行通信。它类似于订阅-发…

Blender修改器

修改器 Modifier,对模型进行修改,相当于一个函数。 修改器图标是界面右下角的扳手样式 每个修改器的顶部都有如下样式,从左到右分别为:展开/折叠,修改器类型,修改器名称,编辑模式按钮&#xff…

基于高德 API 的自动获取气候数据的 Python 脚本

文章目录 高德申请 Key脚本介绍运行结果示例 源代码: https://github.com/ma0513207162/PyPrecip。pyprecip\reading\read_api.py 路径下。 项目介绍:PyPrecip 是一个专注于气候数据处理的 Python 库,旨在为用户提供方便、高效的气候数据处理…

鸿蒙DevEco Studio 4.1 Release-模拟器启动方式错误

软件版本:DevEco Studio 4.1 Release 报错提示: 没有权限查看处理指导 Size on Disk 显示1.0MB 尝试方案(统统无效): 1、“windows虚拟机监控程序平台”、"虚拟机平台"已开启 启用CPU虚拟化 2、C…

康谋分享 | aiSim5仿真场景重建感知置信度评估(三)

aiSim5重建高精度的真实交通场景,用于测试和训练ADAS/AD系统。内置场景包括赛道、车库、高速公路和城市环境。通过全局行动日志,aiSim能将驾驶数据转化为场景重建。车道线检测算法在仿真与现实世界的相关性测试中误差相近,召回率均接近98.5%。…

Camtasia Studio 的功能介绍及常规操作教程

随着数字媒体时代的快速发展,视频已经成为人们获取信息、娱乐和沟通的主要方式之一。在这样的背景下,一款强大且易于使用的视频编辑和制作工具显得尤为重要。Camtasia Studio就是这样一款能够满足各种视频制作需求的优秀软件。 一、Camtasia Studio的特…

Python生成文学编程风格文档库之pycco使用详解

概要 Pycco是一个Python库,用于生成文学编程风格的文档。它受到了Docco(一个快速生成源代码文档的工具)的启发,并通过解析源代码旁边的注释来创建一个美观的文档页面,使代码的解释与代码本身并排显示。 安装 安装Pycco非常简单,可以通过Python的包管理器pip进行安装: …

论文阅读_RAG融合现有知识树_T-RAG

英文名称: T-RAG: LESSONS FROM THE LLM TRENCHES 中文名称: T-RAG:来自LLM战壕的经验教训 链接: https://arxiv.org/abs/2402.07483 作者: Masoomali Fatehkia, Ji Kim Lucas, Sanjay Chawla 机构: 卡塔尔计算研究所, 哈马德本哈利法大学 日期: 2024-02-12 引用次数…

《米小圈上学记》|快乐读书,从身边的人身边的事开始!

时间,抓住了就是黄金,虚度了就是流水;书,看了就是学问,没看就是废纸:抱负,努力了才叫幻想,放弃了那只是妄想。读书,不一定能转变命运,但肯定能让我们安静,安静本身就是一…

企业计算机服务器中了faust勒索病毒如何处理,faust勒索病毒解密恢复

随着网络技术的不断发展与应用,越来越多的企业利用网络走向了数字化办公模式,网络也极大地方便了企业生产运营,大大提高了企业生产效率,但对于众多企业来说,企业的数据安全一直是大家关心的主要话题,保护好…

LLM Agent 全网最全简介

什么是LLM Agent 导语 GPT(尤其是GPT-4)等大语言模型(LLM)的推出,让人类认识到了大语言模型强大的文本生成能力。 只是用来做文本生成工具的话,LLM的能力就被严重低估了。Agents的想法的出现,…

粘土制作的梵高世界;实时自由地转换您的声音Supertone;几秒钟内设计出令人惊叹的LOGO

✨ 1: 梵高的世界 你探索 runwayml #Gen2 过 的风格功能吗?看看这个用粘土制作的梵高作品的视频——就像走进了梵高的双手雕刻的世界。 🎨 🖌️ 关注更多将经典艺术与现代技术融合的创新方式! ✨ 2: Supertone Shift 实时自由…

数字工厂管理系统如何实现生产过程透明化

随着科技的飞速发展,数字化转型已成为制造业不可逆转的趋势。数字工厂管理系统作为实现生产自动化、智能化的重要工具,其在提升生产效率、降低运营成本、优化资源配置等方面的作用日益凸显。其中,实现生产过程的透明化是数字工厂管理系统的重…

Vinted店铺总被封号?如何有效养号?

Vinted是一家欧洲知名的二手时尚交易平台,致力于连接买家和卖家,让他们能够在平台上买卖二手时尚商品。用户可以在Vinted上销售和购买服装、鞋子、配饰等各种时尚物品,无论是品牌商品还是非品牌商品,都可以在平台上找到。Vinted的…

什么是驱动数字签名?如何获取驱动数字签名?

Windows 驱动程序承载着计算机实现的各种内核和用户模式功能。如果驱动程序被黑客攻击,可能会产生很多问题。Windows通过数字签名来验证驱动程序包的完整性及发布者的身份。2020年10月的安全更新中,微软加强了对驱动软件的验证,如果Windows无…

OFDM802.11a的FPGA实现(十)导频插入(含verilog和matlab代码)

原文链接(相关文章合集):OFDM 802.11a的xilinx FPGA实现 目录 1.前言2.插入导频原理3.硬件实现4.Matlab仿真5.ModelSim仿真6.结果对比验证7.verilog代码 1.前言 前面一篇文章完成了星座图的映射,今天继续设计后面的模块。在接收机…