最近看到了一篇有意思的论文,讲的是开发应用于医疗领域内的肿瘤检测的快速高精度的目标检测模型,论文地址在这里,如下所示:
凭借速度和准确性之间的良好平衡,尖端的YOLO框架已成为最有效的算法之一用于对象检测。然而,使用YOLO网络的性能很少在脑肿瘤检测中进行研究。我们提出基于信道的重参数卷积YOLO体系结构(RCS-YOLO)。我们提出了RCS和一次性聚合RCS(RCS-OSA),连接特征级联和计算效率以提取更丰富的信息并减少时间消耗。在脑肿瘤数据集Br35H上的实验结果表明:该型号在速度和精度上超过了YOLOv6、YOLOv7和YOLOv8。值得注意的是,与YOLOv7相比,RCS-YOLO的精度提高了2.6%,在检测到114.8张图像时,推理速度提高了60%每秒(FPS)。我们提出的RCS-YOLO达到了最先进的水平在脑肿瘤检测任务中的表现。
RCS-YOLO的体系结构主要包括RCS-OSA(蓝色)和RepVGG(橙色)模块。n表示数字堆叠RCS模块。ncls表示检测到的对象中的类的数量。
针对用于医学图像的更快且高精度的对象检测器,
我们通过利用RepVGG/RepConv。这项工作的贡献总结如下:
1) 我们首先通过将带有ShuffleNet的RepVGG/RepConv从重新参数化中受益,可以在训练阶段提供更多的特征信息,并减少推理时间。然后,我们构建了一个基于RCS的一次性聚合(RCOSA)模块,该模块不仅允许低成本的内存消耗,而且还允许语义信息提取。
2) 我们将开发的RCS-OSA和RepVGG/RepConv与路径聚合相结合,设计了YOLO架构的新骨干和瓶颈网络,以缩短特征预测层之间的信息路径。这导致准确的定位信息快速传播到特征主干网和颈部网络中的层次结构。
3)我们将所提出的RCS-YOLO模型应用于一项具有挑战性的大脑任务肿瘤检测。据我们所知,这是第一项利用基于YOLO的模型进行快速脑肿瘤检测的工作。公开评估可用的脑肿瘤检测注释数据集显示出卓越的检测能力与其他最先进的YOLO体系结构相比,具有更高的精度和速度。
感兴趣的话可以自行移步研读原论文即可。
在论文摘要部分作者同时扔出来了开源出来的项目地址,在这里,如下所示:
项目中自带有数据集,是可以直接使用的。
原始数据集地址在这里,如下所示:
脑瘤被认为是儿童和成人的侵袭性疾病之一。脑肿瘤占所有原发性中枢神经系统(CNS)肿瘤的85%至90%。每年约有11700人被诊断患有脑瘤。患有脑癌或中枢神经系统肿瘤的人的5年生存率男性约为34%,女性约为36%。脑肿瘤分为:良性肿瘤、恶性肿瘤、垂体瘤等。应实施适当的治疗、计划和准确的诊断,以提高患者的预期寿命。检测脑肿瘤的最佳技术是核磁共振成像(MRI)。通过扫描生成了大量的图像数据。这些图像由放射科医生检查。由于脑肿瘤及其性质的复杂性,手动检查可能容易出错。
使用机器学习(ML)和人工智能(AI)的自动分类技术的应用一直显示出比手动分类更高的准确性。因此,提出一种通过使用卷积神经网络(CNN)、人工神经网络(ANN)和迁移学习(TL)的深度学习算法来执行检测和分类的系统将对世界各地的医生有所帮助。
项目下载解压缩后如下所示:
dataset-Br35H是数据集目录,如下所示:
labels可视化如下所示:
训练集500张图像,测试集201张图像数据,基本上是5:2的比例设置。
训练使用方式的话很简单,直接终端执行train.py即可,如下所示:
训练日志输出如下所示:
0/149 10G 0.1057 0.1145 0 0.2202 19 640 0 0 0 0 0.07334 0.1166 0
1/149 10G 0.1016 0.1101 0 0.2117 8 640 0.1609 0.0199 0.009611 0.001152 0.08257 0.09451 0
2/149 10G 0.09592 0.1075 0 0.2035 7 640 0 0 0 0 0.1245 0.05381 0
3/149 10G 0.08582 0.1063 0 0.1922 9 640 0.05836 0.06468 0.004128 0.0006721 0.09741 0.06698 0
4/149 10G 0.08061 0.1112 0 0.1918 11 640 0.2067 0.1642 0.04183 0.008532 0.0668 0.09159 0
5/149 10G 0.08051 0.107 0 0.1876 9 640 0.52 0.1294 0.08336 0.03141 0.0874 0.07353 0
batch计算实例如下所示:
后面考虑基于实际业务场景的数据来应用开发本文中的模型看看实际效果如何!