项目介绍:
本教程讲述如何解决依赖运动变化来区分目标的目标检测问题。以酒液杂质目标检测为例,讲述如何合理利用运动的酒液图像来设计算法进行杂质的检测。通过学习掌握依赖运动变化区分目标的检测任务的解决方法。首先我们对酒液杂质检验任务做了简要介绍。接下来再对数据进行预处理后使用mmdetection框架搭建了一个Faster R-CNN模型。接下来,为了提升检测的精度,我们对模型进行了一系列的优化,包括加入多尺度训练,TTA,预测时使用Soft NMS,使用数据增强等。然后我们测试了优化后的模型的检测能力,并将其可视化。最后对优化后的模型进行了简单的精简化处理。
1.任务描述
酒液中的杂质检验是酒水行业生产和质量管理的重要环节,由于酒水中杂质与气泡及其他微小的非杂质物体外观相似,所以很难通过在静止状态下直接观察的方式来判定是否含有杂质。传统的方式是通过快速摇动酒瓶来使酒液中的杂质产生运动,从而依据运动来人工判断酒中是否含有杂质,导致效率不高,效果也不佳。
一个序列5张图片的检测样例如下,其中红色框为运动着的杂质目标,而绿色为看起来像杂质但是并没有运动的目标,所以不是真正的杂质:
2.数据
2.1 数据初步分析
首先来查看本任务提供的图像数据, 可以看到均为jpg格式的图片,每个酒瓶拍摄了5张图片,分别在图片最后以0-4数字表示
!ls datasets/images/