目标检测-One Stage-SSD

目标检测-One Stage-SSD

news2026/2/15 14:42:14

文章目录

前言
一、SSD的网络结构和流程
二、SSD的创新点
总结

前言

根据前文目标检测-Two Stage-YOLOv1可以看出YOLOv1的主要缺点是：

每个格子针对目标框的回归是不加限制的，导致目标的定位并不是很精准
和Faster RCNN等先进Two Stage算法相比，没有应用多尺度特征图的思想
预训练时与实际训练时输入大小不一致，模型需要去适应这种分辨率的转换，会影响最终精度

SSD（Single Shot MultiBox Detector）针对上述缺点做了改进

提示：以下是本篇文章正文内容，下面内容可供参考

一、SSD的网络结构和流程

将影像输入VGG16，得到不同卷积层的多尺度特征图（38，19，10，5，3，1）
引入了anchor机制，不同尺度特征图每个像素预设置不同数量的先验框 [4, 6, 6, 6, 4, 4]

ps：产生共计 $38^2×4+19^2×6+10^2×6+5^2×6+3^2×4+1^2×4 = 8732$ 个anchor
SSD中anchor的大小尺寸（scale）并不是按照特征图的大小统一缩放对应的，而是手动设置了一个线性插值变换，使浅层使用较小的scale，往深层逐渐增大scale。由于随着层次加深感受野逐渐增大，这意味着SSD使用感受野小的feature map检测小目标（较小的scale），使用感受野大的feature map检测更大目标（较大的scale）。

将不同尺度特征图的anchor输入不同的分类和边框回归器
使用非极大值抑制NMS去除冗余窗口

二、SSD的创新点

引入了多尺度特征图和anchor机制，改进了YOLOv1边框不加限制的缺点
为适应数据集的输入，采用了两种大小输入：300 × 300和512 × 512
使用了一些数据增强手段

总结

SSD结合了YOLO中的回归思想和Faster R-CNN中的anchor机制，使用全图各个位置的多尺度区域特征进行回归，既保持了YOLO速度快的特性，也保证了窗口预测的跟Faster R-CNN一样比较精准。SSD在VOC2007上mAP可以达到72.1%，速度在GPU上达到58帧每秒。

但是，和Faster RCNN使用SPP不限制输入大小相比，到目前为止，One Stage算法都是缩放到固定大小，可能会使图片变形失真。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1342266.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

1.DQL查询数据（超重点）以及distinct（去重）

1.DQL查询数据（超重点）以及distinct（去重）

DQL(Data Query Language:数据查询语言) 1.所有查询操作都用 SELECT 2.无论是简单的查询还是复杂的查询它都能做 3.数据库中最核心的语言，最重要的语句 4.使用频率最高的语句语法： SELECT 字段1，字段2，……FROM 表有时候…

阅读更多...

GitHub教程-自定义个人页制作

GitHub教程-自定义个人页制作

GitHub是全球最大的代码托管平台，除了存放代码，它还允许用户个性化定制自己的主页，展示个人特色、技能和项目。本教程旨在向GitHub用户展示如何制作个性化主页，同时，介绍了GitHub Actions的应用，可以自动化…

阅读更多...

2023-12-29 工作心得补充适时抽取方法,让代码变简洁

2023-12-29 工作心得补充适时抽取方法,让代码变简洁

1 JSONObject 实际上是个map 2 数据库实际上也是map 只不过map 是竖着写，数据库横着写. 3 像用户名密码这种后续可能随时会改的，不要写死在代码里，都写成nacos参数。 4 方法的抽取让代码变得简洁可读性很高。这是方法抽取的秘诀。写文…

阅读更多...

力扣题目学习笔记(OC + Swift)25. K 个一组翻转链表

力扣题目学习笔记(OC + Swift)25. K 个一组翻转链表

K 个一组翻转链表给你链表的头节点 head ，每 k 个节点一组进行翻转，请你返回修改后的链表。 k 是一个正整数，它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍，那么请将最后剩余的节点保持原有顺序。你不能只是单纯的改…

阅读更多...

2024年U.S.News全美最佳大学排名公布（附top100榜单）

2024年U.S.News全美最佳大学排名公布（附top100榜单）

9月18日，《美国新闻与世界报道》正式发布了最新的2024全美最佳综合大学排名。知识人网小编整理并附上top100的学校榜单，以供访问学者、博士后及联合培养博士们参考。 2024 US News 排名机制调整 U.S. News的排名综合考虑了包括录取率、师生比例、学生标…

阅读更多...

大创项目推荐深度学习中文汉字识别

大创项目推荐深度学习中文汉字识别

文章目录 0 前言1 数据集合2 网络构建3 模型训练4 模型性能评估5 文字预测6 最后 0 前言 🔥 优质竞赛项目系列，今天要分享的是 🚩 深度学习中文汉字识别该项目较为新颖，适合作为竞赛课题方向，学长非常推荐&#xf…

阅读更多...

Qt Designer中各个模块的详细介绍，小白一看就会！！第一部分——layouts模块与Spacers模块

Qt Designer中各个模块的详细介绍，小白一看就会！！第一部分——layouts模块与Spacers模块

Qt Designer 第一部分：layouts介绍第二部分：Spacers介绍总结（非小白可忽略） 第一部分：layouts介绍 Qt Designer中的layouts模块提供了多种布局方式，包括垂直布局、水平布局、网格布局和表单布局。这些布局…

阅读更多...

音画欣赏|《河水不犯井水的游戏》

音画欣赏|《河水不犯井水的游戏》

《河水不犯井水的游戏》尺寸：130x90cm 陈可之2007年绘《警示贤文》之人和篇天时不如地利，地利不如人和。黄金未为贵，安乐值钱多。钱财如粪土，仁义值千斤。两人一般心，有钱堪买金。一人一般心，无…

阅读更多...

HTML+CSS+JS网页设计期末课程大作业 web课程设计 web前端开发网页规划与设计

HTML+CSS+JS网页设计期末课程大作业 web课程设计 web前端开发网页规划与设计

HTMLCSSJS网页设计期末课程大作业 web前端开发技术 web课程设计网页规划与设计 💥 文章目录一、🚩 网站描述二、🎌 网站介绍三、🏴 网站类型A 个人博客主题B 人物明星主题C 旅游主题D 游戏主题E 动漫主题F 美食主题G 校园主题H 企…

阅读更多...

记一次修复外网无法访问vmware里面的虚拟机的网络端口的问题

记一次修复外网无法访问vmware里面的虚拟机的网络端口的问题

发现一个奇怪的网络问题，vmware里一个程序的端口通过vmnat穿透出来，然后这个端口就能够通过局域网被其他机器访问，但是另一个网段就没法访问这个端口。使用主机上的其他程序使用开启同样的端口，另一个网段的机器却可以访问。我想不…

阅读更多...

探索 EndNote：卓越文献管理工具的功能与应用

探索 EndNote：卓越文献管理工具的功能与应用

引言在当今科研与学术写作的领域，文献管理是每一位研究者都不可避免面对的挑战。为了有效地整理、引用和协作，研究者需要强大而灵活的文献管理工具。EndNote作为一款备受推崇的文献管理软件，在解决这一问题上发挥着关键作用。本文将深入探讨…

阅读更多...

OpenCV-Python(21)：轮廓层次结构

OpenCV-Python(21)：轮廓层次结构

目标学习轮廓的层次结构，了解轮廓之间的父子关系原理在前面的内容中我们使用函数cv2.findContours() 来查找轮廓的时候，我们会传入一个参数:轮廓提取模式（Contour_Retrieval_Mode）。我们总是把它􄕭置为cv2.RETR_…

阅读更多...

css+js实现鼠标移动边框高亮效果

css+js实现鼠标移动边框高亮效果

前言：效果是鼠标移入空白区域，边框高亮的效果。效果是在douyin的渡一教育袁老师的课程学习到的，观看以后是一个实用的小特效。想看的可以平台查询，自己也学到了知识。 <!DOCTYPE html> <html lang"en"> <…

阅读更多...

Erlang、RabbitMQ下载与安装教程（windows超详细）

Erlang、RabbitMQ下载与安装教程（windows超详细）

目录安装Erlang 1.首先安装RabbitMQ需要安装Erlang环境 2.点击下载好的.exe文件进行傻瓜式安装,一直next即可 3.配置Erlang环境变量安装RabbitMQ 1.给出RabbitMQ官网下载址：Installing on Windows — RabbitMQ，找到 2.配置RabbitMQ环境变量&#xff0…

阅读更多...

3. Bean 的配置

3. Bean 的配置

配置信息的继承查看下面两个 Employee 的配置，其中 dept 属性是重复的: <bean id"dept" class"com.parent.bean.Department"><property name"deptId" value"100"/><property name"deptName" v…

阅读更多...

#define定义宏

#define定义宏

#define的定义范围 #define不光可以定义变量，常量，还可以定义几乎所有的东西，因为#define可以定义一串代码（即宏），所以包含在代码中的东西都能被定义。 #define定义宏定义是宏名必须于它的参数括号紧挨&am…

阅读更多...

秋招复习篇之代码规范

秋招复习篇之代码规范

目录前言 1、变量命名 2、代码空格 1）操作符左右一定有空格， 2）分隔符（, 和;）前一位没有空格，后一位保持空格，例如： 3）大括号和函数保持同一行，并有一个空格…

阅读更多...

2024年第三届服务机器人国际会议(ICoSR 2024) | Ei、Scopus双检索

2024年第三届服务机器人国际会议(ICoSR 2024) | Ei、Scopus双检索

会议简介 Brief Introduction 2024年第三届服务机器人国际会议(ICoSR 2024) 会议时间：2024年7月26日-28日召开地点：中国杭州大会官网：www.iwosr.org 进入新时代，科技更新迭代快速发展，机器人不仅变得更加节能&#x…

阅读更多...

SpringBoot+AOP+Redis 防止重复请求提交

SpringBoot+AOP+Redis 防止重复请求提交

本文项目基于以下教程的代码版本： https://javaxbfs.blog.csdn.net/article/details/135224261 代码仓库: springboot一些案例的整合_1: springboot一些案例的整合 1、实现步骤 2.引入依赖我们需要redis、aop的依赖。 <dependency><groupId>org.spr…

阅读更多...

【滑动窗口】【二分查找】C++算法：和至少为 K 的最短子数组

【滑动窗口】【二分查找】C++算法：和至少为 K 的最短子数组

作者推荐动态规划多源路径字典树 LeetCode2977:转换字符串的最小成本本题涉及知识点滑动窗口有序向量二分查找 LeetCode862:和至少为 K 的最短子数组给你一个整数数组 nums 和一个整数 k ，找出 nums 中和至少为 k 的最短非空子数组 ，并返回…

阅读更多...

推荐文章

最新文章