YOLOv11改进介绍
YOLOv11 跟 YOLOv8 结构差不多相似,只是作者在 YOLOv8 基础上进行了改进,我感觉 YOLOv11 训练速度更快,map和精度应该比 YOLOv8 高一些,所以我会把 YOLOv11 改进也写在本专栏里面。YOLOv11 改进,可以看往期 YOLOv8 改进主干网络教程,原理都是一样的,这里就不多讲了,这里出一期教程方便理解,只需订阅 YOLOv8 改进专栏, 同样适用于 YOLOv11 改进,一个专栏轻轻松松拿捏 YOLOv8 改进和 YOLOv11 改进。
摘要
MobileNetV3通过结合硬件感知网络架构搜索(NAS)和NetAdapt算法,通过新颖的架构改进进一步提升了性能。本文开始探讨了自动化搜索算法与网络设计如何协同工作,以利用互补方法来提升整体技术水平。通过这一过程,创建了两个新的MobileNet模型:MobileNetV3-Large和MobileNetV3-Small,分别针对高资源和低资源使用场景。这些模型随后被适配并应用于目标检测和语义分割任务。对于语义分割(或任何密集像素预测)任务,提出了一种新的高效分割解码器——Lite Reduced Atrous Spatial Pyramid Pooling(LR-ASPP)。我们在移动端的分类、检测和分割任务中取得了新的最先进的成果。相比于MobileNetV2,MobileNetV3-Large在ImageNet分类上精度提高了3.2%,同时延迟减少了15%;MobileNetV3-Small的精度提高了4.6%,而延迟减少了5%。在COCO检测任务中,MobileNetV3-Large的检测速度比MobileNetV2快25%,而精度几乎相同。对于Cityscapes分割任务,MobileNetV3-Large LR-ASPP比MobileNetV2 R-ASPP快30%,且精度相近。本篇将改进主干网络为 MobileNetV3 和在 Head 部分添加 CA 注意机制,形成新的融合网络模型,助力涨点。接下来手把手教你如何添加 MobileNetV3 + CA 注意机制。
理论介绍
MobileNetV3,使用平台感知NAS来搜索全局网络结构,通过优化每个网络块来实现这一目标。然后,使用NetAdapt算法逐层搜索滤波器的数量。这些技术是互补的,可以结合起来有效地找到针对特定硬件平台优化的模型。通过架构搜索找到模型后,观察到一些最后几层以及一些早期层的计算成本较高。作者提出了一些架构修改,以减少这些慢层的延迟,同时保持准确性。这些修改超出了当前搜索空间的范围。第一个修改是重新设计网络的最后几层的交互方式,以更高效地产生最终特征。基于 MobileNetV2倒置瓶颈结构和变体的当前模型使用 1x1 卷积作为最终层,以扩展到更高维度的特征空间。这一层对于提供丰富的预测特征至关重要,但代价是增加了