紧接上文,基于轻量级yolov5s模型开发构建手写甲骨文检测识别系统

news2025/1/12 13:21:08

在我之前的文章中,关于手写文字、手写数字、手写字母的检测识别相关的项目都有了不少的实践了,这里就不在赘述了,感兴趣的话可以自行移步阅读即可。

《基于轻量级目标检测模型实现手写汉字检测识别计数》

《python开发构建基于机器学习模型的手写数字识别系统》

《Yolov3目标检测实战【实现图像中随机出现手写数字的检测】》

《Python 手写数字识别实战分享》

《超轻量级目标检测模型Yolo-FastestV2基于自建数据集【手写汉字检测】构建模型训练、推理完整流程超详细教程》

《python开发构建轻量级卷积神经网络模型实现手写甲骨文识别系统》

《python基于yolov7开发构建手写甲骨文检测识别系统》

本文是手写甲骨文检测识别三部曲的终章,也是建立在前面两篇文章的数据基础上开发构建的基于轻量级的yolov5s系列的模型,首先看下效果图:

 数据集与前文yolov7模型所用的数据集是完全一致的,这里就不再赘述了。

模型所用配置文件如下:

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license

# Parameters
nc: 40  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

训练数据配置如下:

# Dataset
path: ./dataset
train:
  - images/train
val:
  - images/test
test:
  - images/test

# Classes
names:
  0: 0102
  1: 0103
  2: 0104
  3: 0105
  4: 0106
  5: 0107
  6: 0108
  7: 0109
  8: 0110
  9: 0111
  10: 0112
  11: 0113
  12: 0114
  13: 0115
  14: 0116
  15: 0117
  16: 0118
  17: 0119
  18: 0120
  19: 0121
  20: 0122
  21: 0123
  22: 0124
  23: 0125
  24: 0126
  25: 0127
  26: 0128
  27: 0129
  28: 0130
  29: 0131
  30: 0132
  31: 0133
  32: 0134
  33: 0135
  34: 0136
  35: 0137
  36: 0138
  37: 0139
  38: 0140
  39: 0141

共包含40种不同的甲骨文字,使用到的仿真数据集为4w。

默认执行100次epoch的迭代计算,结果评估详情如下所示:

【混淆矩阵】

 【F1值曲线和PR曲线】

 【精确率和召回率曲线】

【训练可视化】

【 batch计算实例】:

 从评估结果上来看:模型的检测和和识别效果已经是非常出色了已经。不过这个毕竟是实验环境下仿真数据集,真实环境下肯定是更加复杂多变的,而且真实场景下的数据成本也是很高的,这里只是学习实践。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/615880.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ICEM CFD】导入模型后,即使勾选point和curve也看不到几何模型上的点和线

一、问题背景 导入模型后,即使勾选point和curve也看不到几何模型上的点和线。 二、解决办法 原来导入模型后,往往第一步最需要操作的是!!! 构建拓扑!!! Build Diagnostic Topolo…

完美解决safari、微信浏览器下拉回弹效果、包含微信小程序 webview 套H5页面下拉效果。

如题,解决微信小程序、公众号 下拉回弹橡皮筋效果, 屏蔽掉 “此网页由XXXXX提供”; // 禁止页面上下整体滑动 document.body.style.overflow "hidden"

基于Jmeter+ant+Jenkins+钉钉机器人群通知的接口自动化测试

前言 搭建jmeterantjenkins环境有些前提条件,那就是要先配置好java环境,本地java环境至少是JDK8及以上版本,最好是JAVA11或者JAVA17等较高的java环境,像jenkins这种持续构建工具基本都在向上兼容JAVA的环境,以前的JAV…

为什么网络安全人口很稀缺,招聘人数却很少?

2020年我国网络空间安全人才数量缺口超过了140万,就业人数却只有10多万,缺口高达了93%。这里就有人会问了: 1、网络安全行业为什么这么缺人? 2、明明人才那么稀缺,为什么招聘时招安全的人员却没有那么多呢&#xff1…

常见数据库(MSSQL,Mysql,PostgreSQL,Oracle)安装注意事项

常见数据库安装注意事项 (原标题: DataWindowHTTP数据库安装) 转载请保留版权消息勿删除:(谢绝转载到任何文档网站!) blog.csdn.net/chengg0769 http://www.powerbuilder.ltd http://www.haojiaocheng.…

设计模式(行为型模式)之:Observer(观察者模式)

文章目录 动机使用场景代码实现类图结构模式分析: 动机 在软件构建过程中,我们需要为某些对象建立一种“通知依赖关系” - 一个对象(目标对象)的状态改变,所有的依赖对象(观察者对象)都将得到通…

绝不能错过!8款AI文案神器,让你轻松写出优质文案

无论你是否准备好,它们都已经来了。如果你知道如何使用它们,AI文案工具可以成为你的新朋友。 现在AI文案工具无处不在,眼花缭乱,从内容生成器到电子商务聊天机器人。原因很简单:AI可以节省大量时间和金钱。这是我们都喜…

markdown 编辑器使用

在博客开头加上 [TOC](这是你的目录标题)就可以根据博客内容自动生成如下所示的目录: 这是你的目录标题 Markdown 编辑器功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表无序…

智慧城市的建设需要数字孪生技术吗?

智慧城市建设需要依靠多种技术来实现数字化、智能化和可持续发展的目标。其中,数字孪生技术在智慧城市建设中起着重要的作用。 首先,数字孪生技术可以提供高度精确的城市建筑和基础设施的数字模型。通过对城市的建筑、道路、水系等要素进行数字化建模&a…

vue.set this.$set的作用

Vue.set 的作用就是在构造器外部操作构造器内部的数据、属性或者方法 当一个对象在vue中是响应式的,如果仅仅使用普通的方式向这个对象添加或修改这个属性的值,是不会触发视图更新的 但是使用 vue.set 或者 this.$set 的方式可以使得新添加的属性也是响…

【ARM AMBA AXI 入门 2 - AXI协议中的BURST】

文章目录 1.1 突发传输简介1.1.1 AXI4 突发传输控制信号1.1.1.1 AxLEN 突发传输长度1.1.1.2 AxSIZE 突发传输宽度1.1.1.3 AxBURST 突发传输类型 1.1.2 AXI 传输实例 1.1 突发传输简介 在地址总线上进行一次地址传输后,进行多次数据传输( data transfer)…

GPT4 在医学任务表现-Capabilities of GPT-4 on Medical Challenge Problems

微软和openai在2023年4月的论文。 Capabilities of GPT-4 on Medical Challenge Problems 数据集介绍 USMLE Self Assessments:问题,有表格 USMLE Sample Exam:pdf,有图片 MedQA:多语种多选, PubMedQA…

基于Python的接口自动化-pymysql模块操作数据库

目录 引言 一、PyMySQL安装 二、Python操作数据库 写在最后 引言 在进行功能或者接口测试时常常需要通过连接数据库,操作和查看相关的数据表数据,用于构建测试数据、核对功能、验证数据一致性,接口的数据库操作是否正确等。 因此&#x…

MES系统选择指南:企业如何选择适合需求的MES管理系统?

MES(Manufacturing Execution System)管理系统是一种用于生产管理的软件系统,可以帮助企业提高生产效率、降低成本和提高质量。然而,不同类型的MES管理系统适用于不同类型的企业需求,因此选择适合自己企业需求的MES管理…

基于瑞芯微芯片RK3399学习

同是soc,参加新星计划学习下大佬的思路 sys系统 针对:(内核)1.1、通过sysfs清楚了解设备的系统状况的学习 通过了解sys目录和文件了解嵌入式设备的系统状况。 sysfs把连接在系统上的设备和总线组织成为一个分级的文件&#xff0c…

全国职业院校技能大赛信息安全管理与评估赛题一

全国职业院校技能大赛 高等职业教育组 信息安全管理与评估 赛题一 模块一 网络平台搭建与设备安全防护 赛项时间 共计180分钟。 赛项信息 竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 第一阶段 网络平台搭建与设备安全防护 任务1 网络平台搭建 XX:XX- XX:XX 50 任务…

第6章SpringMVC的RESTful

一、RESTful 1.RESTful简介 REST:Representational State Transfer,表现层资源状态转移 ①资源 将服务器看作是由很多离散的资源组成。每个资源是服务器上一个可命名的抽象概念 ②资源的表述 源的表述可以有多种格式,例如HTML/XML/JSON…

yolo v5

参考 睿智的目标检测56——Pytorch搭建YoloV5目标检测平台 原理 前处理 网络结构 整体思想 思想框架 特征提取-特征加强-预测先验框对应的物体情况。 改进部分 1、主干部分:使用了Focus网络结构,具体操作是在一张图片中每隔一个像素拿到一个值&…

118. 杨辉三角解题思路

文章目录 题目解题思路 题目 给定一个非负整数 numRows,生成「杨辉三角」的前 numRows 行。 在「杨辉三角」中,每个数是它左上方和右上方的数的和。 示例 1: 输入: numRows 5 输出: [[1],[1,1],[1,2,1],[1,3,3,1],[1,4,6,4,1]] 示例 2: 输入: num…

【Java基础】集合List/Set/Map

零、重点 初始大小加载因子扩容大小底层机制ArrayList101(存满)1.5倍动态数组,Arrays.copyof()HashMap160.752.0倍 jdk1.7及其之前:数组单向链表(有扩容死锁问题) jdk1.8及其之后:Node 数组 单向Node链表 红黑树 …