目标检测-One Stage-SSD

news2024/11/28 0:44:22

文章目录

  • 前言
  • 一、SSD的网络结构和流程
  • 二、SSD的创新点
  • 总结


前言

根据前文目标检测-Two Stage-YOLOv1可以看出YOLOv1的主要缺点是:

  1. 每个格子针对目标框的回归是不加限制的,导致目标的定位并不是很精准
  2. 和Faster RCNN等先进Two Stage算法相比,没有应用多尺度特征图的思想
  3. 预训练时与实际训练时输入大小不一致,模型需要去适应这种分辨率的转换,会影响最终精度

SSD(Single Shot MultiBox Detector)针对上述缺点做了改进


提示:以下是本篇文章正文内容,下面内容可供参考

一、SSD的网络结构和流程

  1. 将影像输入VGG16,得到不同卷积层的多尺度特征图(38,19,10,5,3,1)
  2. 引入了anchor机制,不同尺度特征图每个像素预设置不同数量的先验框 [4, 6, 6, 6, 4, 4]

ps:产生共计 3 8 2 × 4 + 1 9 2 × 6 + 1 0 2 × 6 + 5 2 × 6 + 3 2 × 4 + 1 2 × 4 = 8732 38^2×4+19^2×6+10^2×6+5^2×6+3^2×4+1^2×4 = 8732 382×4+192×6+102×6+52×6+32×4+12×4=8732 个anchor
SSD中anchor的大小尺寸(scale)并不是按照特征图的大小统一缩放对应的,而是手动设置了一个线性插值变换,使浅层使用较小的scale,往深层逐渐增大scale。由于随着层次加深感受野逐渐增大,这意味着SSD使用感受野小的feature map检测小目标(较小的scale),使用感受野大的feature map检测更大目标(较大的scale)。

  1. 将不同尺度特征图的anchor输入不同的分类和边框回归器
  2. 使用非极大值抑制NMS去除冗余窗口
    在这里插入图片描述
    在这里插入图片描述

二、SSD的创新点

  1. 引入了多尺度特征图和anchor机制,改进了YOLOv1边框不加限制的缺点
  2. 为适应数据集的输入,采用了两种大小输入:300 × 300和512 × 512
  3. 使用了一些数据增强手段

总结

SSD结合了YOLO中的回归思想和Faster R-CNN中的anchor机制,使用全图各个位置的多尺度区域特征进行回归,既保持了YOLO速度快的特性,也保证了窗口预测的跟Faster R-CNN一样比较精准。SSD在VOC2007上mAP可以达到72.1%,速度在GPU上达到58帧每秒。

但是,和Faster RCNN使用SPP不限制输入大小相比,到目前为止,One Stage算法都是缩放到固定大小,可能会使图片变形失真。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1342266.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1.DQL查询数据(超重点)以及distinct(去重)

DQL(Data Query Language:数据查询语言) 1.所有查询操作都用 SELECT 2.无论是简单的查询还是复杂的查询它都能做 3.数据库中最核心的语言,最重要的语句 4.使用频率最高的语句 语法: SELECT 字段1,字段2,……FROM 表 有时候…

GitHub教程-自定义个人页制作

GitHub是全球最大的代码托管平台,除了存放代码,它还允许用户个性化定制自己的主页,展示个人特色、技能和项目。本教程旨在向GitHub用户展示如何制作个性化主页,同时,介绍了GitHub Actions的应用,可以自动化…

2023-12-29 工作心得补充 适时抽取方法,让代码变简洁

1 JSONObject 实际上是个map 2 数据库实际上也是map 只不过map 是竖着写,数据库横着写. 3 像 用户名 密码 这种后续可能随时会改的,不要写死在代码里,都写成nacos参数。 4 方法的抽取 让代码变得简洁 可读性很高。这是方法抽取的秘诀。写文…

力扣题目学习笔记(OC + Swift)25. K 个一组翻转链表

K 个一组翻转链表 给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。 k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后剩余的节点保持原有顺序。 你不能只是单纯的改…

2024年U.S.News全美最佳大学排名公布(附top100榜单)

9月18日,《美国新闻与世界报道》正式发布了最新的2024全美最佳综合大学排名。知识人网小编整理并附上top100的学校榜单,以供访问学者、博士后及联合培养博士们参考。 2024 US News 排名机制调整 U.S. News的排名综合考虑了包括录取率、师生比例、学生标…

大创项目推荐 深度学习中文汉字识别

文章目录 0 前言1 数据集合2 网络构建3 模型训练4 模型性能评估5 文字预测6 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 深度学习中文汉字识别 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐&#xf…

Qt Designer中各个模块的详细介绍,小白一看就会!!第一部分——layouts模块与Spacers模块

Qt Designer 第一部分:layouts介绍第二部分:Spacers介绍总结(非小白可忽略) 第一部分:layouts介绍 Qt Designer中的layouts模块提供了多种布局方式,包括垂直布局、水平布局、网格布局和表单布局。这些布局…

音画欣赏|《河水不犯井水的游戏》

《河水不犯井水的游戏》 尺寸:130x90cm 陈可之2007年绘 《警示贤文》之人和篇 天时不如地利,地利不如人和。 黄金未为贵,安乐值钱多。 钱财如粪土,仁义值千斤。 两人一般心,有钱堪买金。 一人一般心,无…

HTML+CSS+JS网页设计期末课程大作业 web课程设计 web前端开发 网页规划与设计

HTMLCSSJS网页设计期末课程大作业 web前端开发技术 web课程设计 网页规划与设计 💥 文章目录一、🚩 网站描述二、🎌 网站介绍三、🏴 网站类型A 个人博客主题B 人物明星主题C 旅游主题D 游戏主题E 动漫主题F 美食主题G 校园主题H 企…

记一次修复外网无法访问vmware里面的虚拟机的网络端口的问题

发现一个奇怪的网络问题,vmware里一个程序的端口通过vmnat穿透出来,然后这个端口就能够通过局域网被其他机器访问,但是另一个网段就没法访问这个端口。使用主机上的其他程序使用开启同样的端口,另一个网段的机器却可以访问。我想不…

探索 EndNote:卓越文献管理工具的功能与应用

引言 在当今科研与学术写作的领域,文献管理是每一位研究者都不可避免面对的挑战。为了有效地整理、引用和协作,研究者需要强大而灵活的文献管理工具。EndNote作为一款备受推崇的文献管理软件,在解决这一问题上发挥着关键作用。本文将深入探讨…

OpenCV-Python(21):轮廓层次结构

目标 学习轮廓的层次结构,了解轮廓之间的父子关系 原理 在前面的内容中我们使用函数cv2.findContours() 来查找轮廓的时候,我们会传入一个参数:轮廓提取模式(Contour_Retrieval_Mode)。我们总是把它􄕭置为cv2.RETR_…

css+js实现鼠标移动边框高亮效果

前言&#xff1a;效果是鼠标移入空白区域&#xff0c;边框高亮的效果。效果是在douyin的渡一教育袁老师的课程学习到的&#xff0c;观看以后是一个实用的小特效。想看的可以平台查询&#xff0c;自己也学到了知识。 <!DOCTYPE html> <html lang"en"> <…

Erlang、RabbitMQ下载与安装教程(windows超详细)

目录 安装Erlang 1.首先安装RabbitMQ需要安装Erlang环境 2.点击下载好的.exe文件进行傻瓜式安装,一直next即可 3.配置Erlang环境变量 安装RabbitMQ 1.给出RabbitMQ官网下载址&#xff1a;Installing on Windows — RabbitMQ&#xff0c;找到 2.配置RabbitMQ环境变量&#xff0…

3. Bean 的配置

配置信息的继承 查看下面两个 Employee 的配置&#xff0c;其中 dept 属性是重复的: <bean id"dept" class"com.parent.bean.Department"><property name"deptId" value"100"/><property name"deptName" v…

#define定义宏

#define的定义范围 #define不光可以定义变量&#xff0c;常量&#xff0c;还可以定义几乎所有的东西&#xff0c;因为#define可以定义一串代码&#xff08;即宏&#xff09;&#xff0c;所以包含在代码中的东西都能被定义。 #define定义宏 定义是宏名必须于它的参数括号紧挨&am…

秋招复习篇之代码规范

目录 前言 1、变量命名 2、代码空格 1&#xff09;操作符左右一定有空格&#xff0c; 2&#xff09;分隔符&#xff08;, 和;&#xff09;前一位没有空格&#xff0c;后一位保持空格&#xff0c;例如&#xff1a; 3&#xff09;大括号和函数保持同一行&#xff0c;并有一个空格…

2024年第三届服务机器人国际会议(ICoSR 2024) | Ei、Scopus双检索

会议简介 Brief Introduction 2024年第三届服务机器人国际会议(ICoSR 2024) 会议时间&#xff1a;2024年7月26日-28日 召开地点&#xff1a;中国杭州 大会官网&#xff1a;www.iwosr.org 进入新时代&#xff0c;科技更新迭代快速发展&#xff0c;机器人不仅变得更加节能&#x…

SpringBoot+AOP+Redis 防止重复请求提交

本文项目基于以下教程的代码版本&#xff1a; https://javaxbfs.blog.csdn.net/article/details/135224261 代码仓库: springboot一些案例的整合_1: springboot一些案例的整合 1、实现步骤 2.引入依赖 我们需要redis、aop的依赖。 <dependency><groupId>org.spr…

【滑动窗口】【二分查找】C++算法:和至少为 K 的最短子数组

作者推荐 动态规划 多源路径 字典树 LeetCode2977:转换字符串的最小成本 本题涉及知识点 滑动窗口 有序向量 二分查找 LeetCode862:和至少为 K 的最短子数组 给你一个整数数组 nums 和一个整数 k &#xff0c;找出 nums 中和至少为 k 的 最短非空子数组 &#xff0c;并返回…