【目标检测经典算法】R-CNN、Fast R-CNN和Faster R-CNN详解系列三：Faster R-CNN图文详解

【目标检测经典算法】R-CNN、Fast R-CNN和Faster R-CNN详解系列三：Faster R-CNN图文详解

news2025/4/21 13:58:42

【目标检测经典算法】R-CNN、Fast R-CNN和Faster R-CNN详解系列二：Fast R-CNN图文详解

概念预设

感受野

感受野(Receptive Field) 是指特征图上的某个点能看到的输入图像的区域。

神经元感受野的值越大表示其能接触到的原始图像范围就越大，也意味着它可能蕴含更为全局，语义层次更高的特征；
值越小则表示其所包含的特征越趋向局部和细节。

在这里插入图片描述
在论文中，ZF网络特征图中 $3 * 3$ 的滑动窗口在原图中的感受野为 $171 * 171$

RPN

框架

Faster R-CNN不再需要SS算法进行候选框的生成，而是使用RPN进行锚框的生成和筛选，可以和分类回归任务放在一起进行实现，是一个一阶段任务。
在这里插入图片描述

anchor box

什么是anchors

在图像上预设好的不同大小，不同长宽比的参照框。 论文中设定每个区域可以生成k个anchor box。
在这里插入图片描述

anchors的大小和比例

由于每个目标的大小不同，所以会预设的anchors的大小和长宽比也不同。

在论文中预设了3种不同的面积和3种不同的比例大小的anchors：

$128 * 128, 256 * 256, 512 * 512$
$1 : 1, 1 : 2, 2 : 1$

因此一共会有9个anchors生成。
在这里插入图片描述

步骤

在这里插入图片描述

1. 滑动窗口

将图片输入网络得到相应的特征图后，将有一个3*3的滑动窗口在特征图上进行滑动，每滑动到一个新的位置，就生成一个一维向量（维度由所使用的backbone决定），在一维向量的基础上连接两个全连接层（cls layer和reg layer），获得2k个分类参数和4k个位置参数。

2k: 正样本概率和负样本概率
4k：4个需要回归的位置参数， $d_x d_y$ ：anchors的中心坐标的偏移量， $d_w d_h$ ：宽和高的调整参数

2. 生成anchor box

在这里插入图片描述

根据滑动窗口所在的特征图的中心点坐标以及特征图和原图的比例还原找到原图中所在位置的中心点坐标，然后根据原图所在位置的中心点坐标生成k个anchors（图中假设k=3）,这些anchors中可能包含着需要检测的目标。

3. scores详解

一维向量通过 $1 * 1$ 、个数为2k的卷积核可以生成2k个分类scores，通过 $1 * 1$ 、个数为4k的卷积核可以生成4k个分类scores。

生成的参数具体代表的含义如下图所示。

在这里插入图片描述

4. anchors的筛选

将大量生成的anchors进行筛选和删除，再通过NMS进行重叠的候选框，最后剩下大约2000个候选框（和SS算法生成的候选框数量差不多）
在这里插入图片描述

5. 正负样本的采样

在这里插入图片描述

正样本：

与标注框的iou值>0.7的anchors
与标注框的iou值最大的anchors

一般第一条就完全可以生成足够的标注框，但是为了防止所有的anchors与标注框的交并比都不大于0.7的特殊情况，则加上了第二个条件

负样本：与所有的标注框的iou值都<0.3的anchors

总结

可以看到
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1527865.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

工业AMR机器人如何实现规模化的柔性生产

工业AMR机器人如何实现规模化的柔性生产

在当下高度复杂的工业生产环境中，机器人如何实现规模化的柔性生产，已成为业界关注的焦点。特别是在追求高效率、高质量的生产过程中，团队协作的重要性愈发凸显。富唯智能一体化AMR控制系统，作为机器人的核心指挥部，犹如…

阅读更多...

VMware安装Centos 6.5系统

VMware安装Centos 6.5系统

文章目录镜像下载地址1.在vmware中新建虚拟机2.选择标准典型步骤进行安装3.选择以后再放入光盘4.选择准备安装的系统类型5.为虚拟机指定名称并指定位置6.磁盘空间20G默认下一步；7.将无用的硬件删除掉8.点击打开虚拟机；9.选择第一个回车进行全新安装&…

阅读更多...

蓝桥杯刷题（十一）

蓝桥杯刷题（十一）

1.卡片反向思考，看k种卡片可以分给几位同学代码 n int(input()) k 1 while k*(k1)<2*n:k1 print(k)2.美丽的2 代码 def f(x)->bool:while x:if x%102:return Truex//10return False cnt 0 for i in range(1,2021):if f(i):cnt1 print(cnt)3.单词分析 …

阅读更多...

Pytorch详细应用基础（全）

Pytorch详细应用基础（全）

🔥博客主页： A_SHOWY🎥系列专栏：力扣刷题总结录数据结构云计算数字图像处理力扣每日一题_ 1.安装pytorch以及anaconda配置尽量保持默认的通道，每次写指令把镜像地址写上就行。 defaults优先级是最低的&#…

阅读更多...

Matlab 双目相机标定（内置函数）

Matlab 双目相机标定（内置函数）

文章目录一、简介二、实现代码三、实现效果参考资料一、简介相机标定的目的就是要找到从世界坐标转换为图像坐标所用到的投影P矩阵各个系数（即相机的内参与外参）。具体过程如下所述： 1、首先我们需要获取一个已知图形的图像（这里我们使用MATLAB所提供的数据）。 2、找到同…

阅读更多...

Django templates 存放html目录

Django templates 存放html目录

模板一概述模板由两部分组成，一部分是HTML代码，一部分是逻辑控制代码（变量，标签，过滤器） 作用：可以通过一些逻辑控制代码减少一些重复的操作更快速的生成HTML代码，并且实现简单的…

阅读更多...

二叉树遍历（牛客网）

二叉树遍历（牛客网）

描述编一个程序，读入用户输入的一串先序遍历字符串，根据此字符串建立一个二叉树（以指针方式存储）。例如如下的先序遍历字符串： ABC##DE#G##F### 其中“#”表示的是空格，空格字符代表空树。建立起此二叉树…

阅读更多...

后端工程师快速使用vue和Element

后端工程师快速使用vue和Element

文章目录 Vue1 Vue概述2 快速入门3 Vue指令3.1 v-bind和v-model3.2 v-on3.3 v-if和v-show3.4 v-for3.5 案例 4 生命周期 Element快速使用1 Element介绍2 快速入门3 当前页面中嵌套另一个页面案例代码案例截图 Vue 1 Vue概述通过我们学习的htmlcssjs已经能够开发美观的页面了…

阅读更多...

Linux 文件系统：重定向、缓冲区

Linux 文件系统：重定向、缓冲区

目录一、重定向 1、输出重定向 2、输入重定向 3、追加重定向 4、dup2 系统调用二、理性理解Linux系统下“一切皆文件” 了解硬件接口三、缓冲区 1、为什么要有缓冲区? 2、刷新策略 3、缓冲模式改变导致发生写时拷贝未创建子进程时创建子进程时使用fflush…

阅读更多...

使用树莓派结合Python Adafruit驱动OLED屏幕显示实时视频

使用树莓派结合Python Adafruit驱动OLED屏幕显示实时视频

关于OLED屏幕的驱动，在之前我已经写过很多篇博文： IIC 协议和 OLED_oled iic-CSDN博客香橙派配合IIC驱动OLED & 使用SourceInsight解读源码_香橙派5 驱动屏幕-CSDN博客这两篇博文都是通过模拟或调用IIC协议来使用C语言驱动OLED屏幕，现…

阅读更多...

Sentinel加密锁的工作原理

Sentinel加密锁的工作原理

Sentinel加密锁是一种先进的安全机制，它旨在提供强大的数据加密和访问控制功能，确保数据在传输和存储过程中的机密性、完整性和可用性。下面将详细介绍Sentinel加密锁的工作原理、优势以及在现实中的应用。一、Sentinel加密锁的工作原理 Sentinel加密锁…

阅读更多...

2024年腾讯云GPU服务器价格表_1小时费用_一个月价格和一年优惠

2024年腾讯云GPU服务器价格表_1小时费用_一个月价格和一年优惠

腾讯云GPU服务器怎么收费？GPU服务器1小时多少钱？一个月收费价格表和一年费用标准，腾讯云百科txybk.com分享腾讯云GPU服务器GPU计算型GN10Xp、GPU服务器GN7、GPU渲染型 GN7vw等GPU实例费用价格，以及NVIDIA Tesla T4 GPU卡和V100详细…

阅读更多...

LiveGBS流媒体平台GB/T28181常见问题-如何订阅设备状态在线离线状态redis订阅设备或是通道状态subscribe device操作及示例

LiveGBS流媒体平台GB/T28181常见问题-如何订阅设备状态在线离线状态redis订阅设备或是通道状态subscribe device操作及示例

LiveGBS如何订阅设备状态在线离线状态redis订阅设备或是通道状态subscribe device操作及示例 1、如何监听设备状态2、device订阅2.1、设备上线消息2.2、设备离线消息2.2、通道上线消息2.2、通道离线消息 3、订阅示例3.1、连接REDIS3.2、订阅device示例3.3、设备上线示例3.3.1、…

阅读更多...

解决微信录像帧率不足30fps

解决微信录像帧率不足30fps

问题现象使用工具检测录像帧率不足30fps 问题分析 1，抓取微信录像systrace 很明显camera provider很多线程处于Runnable状态，获取不到cpu原因，有两种可能原因：一是cpu频率很低；二是存在高负载应用。先检查cpu频率…

阅读更多...

使用RabbitMQ，关键点总结

使用RabbitMQ，关键点总结

文章目录 1.MQ的基本概念2.常见的MQ产品3.MQ 的优势和劣势3.1 优势3.2 劣势 4.RabbitMQ简介4.1RabbitMQ 中的相关概念 1.MQ的基本概念 MQ全称 Message Queue（消息队列），是在消息的传输过程中保存消息的容器。多用于分布式系统之间进行通信。…

阅读更多...

【c++】内联-引用-重载

【c++】内联-引用-重载

主页：醋溜马桶圈-CSDN博客专栏：c_醋溜马桶圈的博客-CSDN博客 gitee：mnxcc (mnxcc) - Gitee.com 目录 1.【c】内联函数 1.1 背景 1.2 内联函数的概念 1.3 内联函数的特性 1.4 宏和内联的小知识宏的优缺点？ C有哪些技术替代…

阅读更多...

HTML静态网页成品作业(HTML+CSS)——宠物狗店网页(1个页面)

HTML静态网页成品作业(HTML+CSS)——宠物狗店网页(1个页面)

🎉不定期分享源码，关注不丢失哦文章目录一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码五、源码获取一、作品介绍 🏷️本套采用HTMLCSS，未使用Javacsript代码，共有1个页面。二、作品演示三、代…

阅读更多...

vue元素声明之后未使用的解决方法

vue元素声明之后未使用的解决方法

错误情况：类似的这种元素声明未使用的情况解决方法方法一将lintOnSave :false 改为lintOnSave:true 方法二在项目中找到package.json........① 使用快捷键Ctrl F 搜索eslintconfig........② 找到eslintconfig..........③ 找到rules .........④ 添…

阅读更多...

python农产品农药商城溯源系统vue+Django_flask

python农产品农药商城溯源系统vue+Django_flask

后端：python 前端：vue.jselementui 框架：django/flask Python版本：python3.7 数据库：mysql 数据库工具：Navicat 开发软件：PyCharm 使用Navicat或者其它工具，在mysql中创建对应名称…

阅读更多...

嵌入式学习第二十九天！（数据结构的概念、单向链表）

嵌入式学习第二十九天！（数据结构的概念、单向链表）

数据结构： 1. 定义： 一组用来保存一种或者多种特定关系的数据的集合（组织和存储数据） 1. 程序设计： 将现实中大量而复杂的问题以特定的数据类型和特定的数据结构存储在内存中，并在此基础上实现某个特定的功…

阅读更多...

推荐文章

最新文章