SSD目标检测

news2026/2/12 15:27:26

数据集以及锚框的处理

数据集：

图像：（batch_size , channel , height , width）

bounding box: （batch_size , m , 5）

m: 图像中可能出现的最多边界框的数目

5：第一个数据为边界框对应的种类，对于少于m个边界框的图像，为了保持数据的统一，需要填充非法边界框，此时将其标为-1，并在后面计算中舍弃。剩余四个数据为边界框的左上角和右下角坐标。

在训练数据中标注锚框：

在训练集中，我们将每个锚框视为一个训练样本。

首先，在图片中使用不同的方法生成大量锚框。接着使用数据集中的真实边界框与锚框的交并比来为每一个锚框标记类别和偏移量。

SSD模型

模型结构：

首先，使用基本网络块从图像中抽取特征，再逐步将其使用卷积和池化将特征图宽高减半，最终使用全局最大池将高度和宽度都降到1。

锚框构造：

我们对每一个特征图的每一个像素生成不同宽高比的锚框。当特征图尺寸越小，映射到原图的锚框越大，这样我们可以搜素不同大小的物体。
diyigetup

请添加图片描述

锚框的种类和偏移量预测：

对于种类和偏移量的预测使用不同通道来表示：

具体来说对于一个2x2的特征图假设每一个像素生成3个锚框，对于这个特征图一共有12个锚框。假设我们一共要预测3个种类，我们使用卷积生成 12x(3+1)（+1是指将锚框标注为背景）个通道的**（4，4）**结果。例如第一个通道的第一个像素表示为特征图第一个像素生成的第一个锚框预测为第一个种类的概率。

相同的我们对偏移量的预测一共生成12x4个通道来表示预测结果。

最终网络如下所示：

请添加图片描述

我们使用交叉熵损失函数来对每一个锚框的预测种类和真实值求loss，对于每一个锚框的偏移量使用L1范数损失来求其loss。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/463611.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

tongweb

tongweb

13051667606 东方通产品介绍产品兼容硬件要求安装安装目录结构启动tongweb 停止tongweb bin下常用命令企业版管理控制台文档：产品简介及安装指南绿色版直接解压安装 tar -zxvf …tar.gz Tongweb的配置文件在conf的tongweb.xml 修改端口等信息通过页面…

阅读更多...

第四章 Unity工程和相机介绍

第四章 Unity工程和相机介绍

在上面的章节中，我们创建了一个“New Unity Project”工程，并保存到了“E:\workspace”工作空间下。那么，我就先看看这个工程的文件结构（E:\workspace\ New Unity Project）。接下来，我们简单介绍一下这些目…

阅读更多...

【老王读SpringMVC-3】根据 url 是如何找到 controller method 的？

【老王读SpringMVC-3】根据 url 是如何找到 controller method 的？

前面分析了 request 与 handler method 映射关系的注册，现在再来分析一下 SpringMVC 是如何根据 request 来获取对应的 handler method 的? 可能有人会说，既然已经将 request 与 handler method 映射关系注册保存在了 AbstractHandlerMethodMapping.Ma…

阅读更多...

Python 二进制八进制十进制十六进制之间的转换

Python 二进制八进制十进制十六进制之间的转换

众所周知：计算机底层是以二进制数来进行存储计算，而计算机进制：数制是用一组固定的符号和统一的规则来表示数值的方法。开始下面讲述之前首先要声明： 二进制，八进制，十六进制都可以转换为十进制&#xf…

阅读更多...

【DRF配置管理】如何在视图类使用get_objects()

【DRF配置管理】如何在视图类使用get_objects()

原文作者：我辈李想版权声明：文章原创，转载时请务必加上原文超链接、作者信息和本声明。 DRF应用和管理【DRF配置管理】Django使用DRF框架【DRF配置管理】如何在视图类配置参数(一) 【DRF配置管理】如何在视图类配置参数(二) 【DRF配置管理…

阅读更多...

第二届广州·琶洲算法大赛启动，百度飞桨助力广州打造中国算法新高地

第二届广州·琶洲算法大赛启动，百度飞桨助力广州打造中国算法新高地

‍‍ 生成式人工智能热潮席卷全球，算法创新成为 AI 突破发展的关键，推动实体经济高质量增长。4月25日，第二届广州琶洲算法大赛正式启动，广州市政府主办、百度飞桨等联合承办，广召天下算法英雄，加快“琶洲算…

阅读更多...

＜网络编程＞网络套接字

＜网络编程＞网络套接字

目录理解源IP地址和目的IP地址认识端口号端口号和进程ID的关系理解源端口号和目的端口号初步认识TCP、UDP协议 TCP协议 UDP协议网络字节序列 socket网络接口 socket常见API sockaddr结构 UDPsocket 编码： 理解源IP地址和目的IP地址源IP&#xf…

阅读更多...

服装店铺装修有哪些窍门？做好这3点，顾客主动上门

服装店铺装修有哪些窍门？做好这3点，顾客主动上门

现在街边有各种各样的服装店，有的服装店客流不断，有的服装店却很冷清，导致这种现象的原因有很多，比较重要的一点就是你的服装店铺装修没做好。你的服装店铺装修足够吸引人吗？ 什么样的服装店铺装修才能吸引顾客&#…

阅读更多...

【技巧】如何修改PDF文件？

【技巧】如何修改PDF文件？

PDF文件格式安全、标准化，很多人在工作中几乎离不开。可有些小伙伴想要修改PDF文件内容时，发现无法修改，那是什么情况呢？如何才能修改PDF文件呢？下面小编就来分享一些小技巧。技巧一：使用PDF编辑器如果使…

阅读更多...

凌恩生物文献分享｜一株细菌完成图也能发一区10分+！

凌恩生物文献分享｜一株细菌完成图也能发一区10分+！

期刊：Science of the Total Environment 影响因子：10.753 发表时间：2022 样本类型：Bosea sp. Ads-6菌株客户单位：中国科学院微生物研究所一、研究背景环境中抗生素残留和耐药性的增加引发了许多…

阅读更多...

一文详解汽车操作系统现状

一文详解汽车操作系统现状

摘要： 智能座舱和自动驾驶的发展，特斯拉的突飞猛进，让各大主机厂越来越重视汽车操作系统。但车企现在所做的软件定义汽车，大都是通过软硬件解耦来降低造车成本、丰富新车功能，在操作系统层面大都还停留在市场调研和学…

阅读更多...

linux ubantu 16.04 安装fbprophet 和 pystan经验总结

linux ubantu 16.04 安装fbprophet 和 pystan经验总结

写在前面之前在window11上，安装了一下午，不是C版本不行，就是这个那个不通过，主要是Pystan运行不起来就很气，fbprophet本身就需要依赖这个包，然后MSVC不支持，裂开。尝试了很多次，碰…

阅读更多...

基于Java开发的分布式在线教育系统，支持考试、直播、问答

基于Java开发的分布式在线教育系统，支持考试、直播、问答

一、开源项目简介知道学习平台是一个基于 Java 开发的分布式在线教育系统项目采用前后端分离的企业级微服务架构引入组件化的思想实现高内聚低耦合，项目代码简洁注释丰富上手容易注重代码规范，严格控制包依赖可以帮助个人、企业或机构快速搭建一个在线…

阅读更多...

C# 利用TabControl控件制作多窗口切换

C# 利用TabControl控件制作多窗口切换

TabControl控件切换时触发的事件选项卡切换触发的是TabControl控件的SelectedIndexChanged事件。当TabControl控件的任何一个TabPage被点击或选择，即发生SelectedIndexChanged事件事件。代码如下： private void tabControl1_SelectedIndexChanged(o…

阅读更多...

设计模式 --- 结构型模式

设计模式 --- 结构型模式

一、概述结构型模式描述如何将类或对象按某种布局组成更大的结构。它分为类结构型模式和对象结构型模式，前者采用继承机制来组织接口和类，后者釆用组合或聚合来组合对象。由于组合关系或聚合关系比继承关系耦合度低，满足“合成复用原则”…

阅读更多...

L2TP Client-initated场景

L2TP Client-initated场景

L2TP Client-initated场景 1. 原理 ![原理](https://img-blog.csdnimg.cn/66ce3169502b4252bca5d9d7a6c0027c.png)1.1 阶段1：创建L2TP隧道 C与LNS通过交互三条消息协商隧道ID、UDP端口（1701）、主机名称、L2TP版本、隧道验证等参数。 1.2 …

阅读更多...

使用Spark实现词频统计

使用Spark实现词频统计

文章目录一，词频统计准备工作（一）版本选择问题（二）安装Scala2.12.15（三）启动集群的HDFS与Spark（四）在HDFS上准备单词文件二，本地模式运行Spark项目&#xf…

阅读更多...

Meta的分割一切模型SAM( Segment Anything )测试

Meta的分割一切模型SAM( Segment Anything )测试

Meta不久前开源发布了一款图像处理模型，即分割一切模型：Segment Anything Model，简称 SAM，号称要从任意一张图片中分割万物，源码地址为： https://github.com/facebookresearch/segment-anything打开后看到…

阅读更多...

ssm+java企业公司产品分销商管理系统

ssm+java企业公司产品分销商管理系统

一、二、经营管理： ①分销商每月提交自己进多少货物（从总部进购了多少“鹊巢”的商品给自己负责区的大型商超）——对应的种类一共进多少货物；该种类中具体的产品又进了多少货物具体到（参考三产品管理模块）…

阅读更多...

RelativeLayout相对布局

RelativeLayout相对布局

一、官方地址： https://developer.android.google.cn/reference/kotlin/android/widget/RelativeLayout?hlen 二、概述相对布局（RelativeLayout）是一种根据父容器和兄弟控件作为参照来确定控件位置的布局方式三、基本格式 <RelativeLay…

阅读更多...

推荐文章

最新文章