在之前的文章中我们已经做了很多基于yolov5完成实例分割的项目,感兴趣的话可以自行移步阅读:
《基于YOLOv5-v7.0的药片污染、缺损裂痕实例分割检测识别分析系统》
《基于yolov5-v7.0开发构建裸土实例分割检测识别模型》
《基于yolov5-v7.0开发实践实例分割模型超详细教程》
《基于yolov5-v7.0开发构建工业机械齿轮瑕疵实例分割检测识别分析系统》
《基于yolov5-v7.0开发构建汽车车损实例分割检测识别分析系统》
本文主要的目的就是基于官方的v7.0分支的模型来开发构建银行卡号分割检测识别系统。这里不仅精确分割得到了银行卡号的区域,而且进行了精确的面积计算。话不多说,首先来看效果图:
简单看下数据情况:
数据标注如下所示:
实例标注内容如下所示:
0 0.23255813953488372 0.5509761388286334 0.8588039867109635 0.5227765726681128 0.8621262458471761 0.6008676789587852 0.23421926910299004 0.6290672451193059
这里一共只有一个目标对象:
bankcardnum
在data目录下新建self.yaml文件,内容如下:
#Dataset
path: ./datasets/bankcardnum-seg
train: images/train
val: images/train
test: images/train
# Classes
names:
0: bankcardnum
模型yaml文件如下:
#Parameters
nc: 1 # number of classes
depth_multiple: 0.33 # model depth multiple
width_multiple: 0.50 # layer channel multiple
anchors:
- [10,13, 16,30, 33,23] # P3/8
- [30,61, 62,45, 59,119] # P4/16
- [116,90, 156,198, 373,326] # P5/32
#Backbone
backbone:
# [from, number, module, args]
[[-1, 1, Conv, [64, 6, 2, 2]], # 0-P1/2
[-1, 1, Conv, [128, 3, 2]], # 1-P2/4
[-1, 3, C3, [128]],
[-1, 1, Conv, [256, 3, 2]], # 3-P3/8
[-1, 6, C3, [256]],
[-1, 1, Conv, [512, 3, 2]], # 5-P4/16
[-1, 9, C3, [512]],
[-1, 1, Conv, [1024, 3, 2]], # 7-P5/32
[-1, 3, C3, [1024]],
[-1, 1, SPPF, [1024, 5]], # 9
]
#Head
head:
[[-1, 1, Conv, [512, 1, 1]],
[-1, 1, nn.Upsample, [None, 2, 'nearest']],
[[-1, 6], 1, Concat, [1]], # cat backbone P4
[-1, 3, C3, [512, False]], # 13
[-1, 1, Conv, [256, 1, 1]],
[-1, 1, nn.Upsample, [None, 2, 'nearest']],
[[-1, 4], 1, Concat, [1]], # cat backbone P3
[-1, 3, C3, [256, False]], # 17 (P3/8-small)
[-1, 1, Conv, [256, 3, 2]],
[[-1, 14], 1, Concat, [1]], # cat head P4
[-1, 3, C3, [512, False]], # 20 (P4/16-medium)
[-1, 1, Conv, [512, 3, 2]],
[[-1, 10], 1, Concat, [1]], # cat head P5
[-1, 3, C3, [1024, False]], # 23 (P5/32-large)
[[17, 20, 23], 1, Detect, [nc, anchors]], # Detect(P3, P4, P5)
]
这里是基于s系列模型开发构建自己的应用的,主要就是修改nc符合自己的数据集类别即可。
默认执行100次的迭代计算,日志输出如下所示:
可以看到最终的效果还是蛮不错的,因为本身这里没有准备很多的数据。接下来看下结果文件详情:
F1值曲线:
PR曲线:
混淆矩阵:
LABEL可视化:
batch检测实例:
可视化界面推理如下:
这里同时检测到了卡号目标对象,分割提取出来了对应的细粒度区域,之后计算出来了卡号细粒度区域的面积与占比情况一同展示在界面端了。