虽然说标注工作不是由算法工程师负责的,但是如何标注,标注要求却是由算法工程师指导标注人员去实施的,如果标注工作人员标注的数据有问题,就会出现模型训练不收敛的问题,导致很多问题的出现,所以标注要求很重要,在一开始的时候就要整理好标注要求,讲清楚标注要求,这样就能减少标注工作的反复无用功。
接下来就说一下具体的标注规范:
框的规范
同一行数据,最好标在一个框里。
根据目标的形态,灵活选取横向、竖向和倾斜的方式,将文本按照四点标注的画法框选
框要贴合文本,不要有过多的空余区域
斜文本也要尽力贴合。
像这种弯曲的文本,就不要自觉聪明的框成这样,完全就是错误的标注方式。
而是应该让框更加贴合文本去框。
标注顺序
1、有语意时:标注框的四点顺序要按照文本语意的顺序去标。
2、无语意时:按照阅读顺序横向文本-从左至右、竖向文本-从上至下、倾斜文本-从上至下的顺序标矩形的四个点。
模糊字和变形字
1、模糊不清的文本需要舍弃(模糊字体不要联想上下文去看)
2、只要字体轮廓整体清晰,部分笔画模糊转写了可以给到合格
3、模糊/变形字的空格代替使用规则
(1)正常文本中模糊字变形字3个(即≥3个),则整行舍弃
(2)正常文本中间出现的1个(连续2个或连续3个)模糊变形字体,均只用一个空格代替
(3)句首/尾模糊字/舍弃字,可以单独框选舍弃,可以用空格代替
(4)可当做模糊和变形字处理,用空格代替的其他情况:重叠导致无法识别的文字、不符合
转写规则的遮挡缺失文字等
遮挡字
1、未被遮挡字需要转写,遮挡处空格代替,不能整行舍弃
2、遮挡宽度及画框规则
(1)被遮挡处距离未达到3个(即<3)个字符时,未被遮挡的部分必须整行一起框选。如图2框
法错误
(2)被遮挡处距离达到3个(≥3)个字符时,未被遮挡的部分必须分框转写。
(3)纯英文文本中,被遮挡部分间隔以最宽的字母的为参照
(4)中英文混合文本,被遮挡部分间隔以最宽的汉字为参照
3、文字缺失
(1) ①~③三点规则,图片边缘,图片中间均适用
(2)①剩余部分≥1/2,且人为客观可识别的文字正常框选转写;
(3) 剩余部分≥1/2,但人为客观无法识别的文字或一些简单的文字,少了一横、一竖、一撇
or截断文字有歧义必须舍弃;
(4)②剩余部分<1/2,且文字很小,舍弃框难画时,可不处理(舍弃可过);剩余部分<1/2,
但)
(5)③剩余部分<1/5,的较大文字,可不处理
(6)④左右/上下结构的文字,存在遮盖情况转写规则:
存在遮盖,但不影响整字识别,必须整字转写;
存在遮盖,影响整字识别,未被遮盖的一半不能识别为一个字时,必须整字舍弃;
存在遮盖,影响整字识别,未被遮盖的一半能识别为一个字,但被遮盖的一半,剩余部分≥1/5
时,必须整字舍弃;
存在遮盖,影响整字识别,未被遮盖的一半能识别为一个字,且被遮盖的一半,剩余部分<1/5
时,必须转写该半文字,剩余部分可舍弃,可不处理