目标检测研究

news2025/1/17 21:33:17

传统的目标检测流水线 

1.候选区域生成
        通过滑动窗口选择感兴趣区域Rol;使用多尺寸的输入图像和多尺度的滑动窗口识别多尺度和不同比例的目标。
⒉特征向量抽取
        常用SIFT、 Harr、HOG、SURF。

3.区域分类
        常用支持向量机。
结合集成、串联学习、梯度提升的方法提高准确率。

卷积神经网络(CNN)应用于目标检测


1.两阶段方法Two-Stage Detectors
        先生成候选区域,再对区域做预测。精度高,速度慢。如:R-CNN、SPP-net、fast R-CNN、faster R-CNN、
        R-FCN、FPN、 Mask R-CNN
⒉.单阶段方法One-Stage Detectors
        把图像的每个区域看作候选区域。精度低,速度快。如: OverFeat、YOLO、SSD、RetinaNet、YOLOv2、
        YOLOv3、CornerNet、YOLOv4

R-CNN的主要结构


1.选择候选区域

2.缩放区域尺寸

3.训练CNN计算特征

4.训练SVM进行分类

5.边界框回归修正模型

SPPNet


 SPP层的实现
1.输入图像经过卷积层得到特征图像

2.对于特征图像按照预先给定的(s x s)划分成子区域,分通道进行最大池化;若s取1、2、4,共21个池化箱;
每个池化箱的维度为输出通道数。
3.若进行目标检测,上述操作对Rol映射区域进行。
4.得到固定长度的输出张量,输入FC层。

Fast R-CNN

Fast R-CNN的主要结构
1.选择候选区域
2.CNN特征映射
3.Rol池化
4.FC网络多任务评估

Faster R-CNN

 【【精读RCNN】03选择性搜索,selective search】 https://www.bilibili.com/video/BV1wN4y1w7zF/?share_source=copy_web&vd_source=9ee2521627a11b87c06e3907e194e1ab

 Anchor-Based方法
在卷积特征图像上,用NxN的滑动窗口处理,每次窗口滑动时为其中心像素设置k个anchor。
每个anchor包含两类参数:第一类用来区分其是目标还是背景,共产生2k个参数,用于分类;第二类用来对边界框进行预测,共产生4k个参数,用于回归。

Feature Pyramid Networks


FPN主要有三个部分:①自底向上的通路
实现前向传播,生成不同程度的分辨率和语义信息。
②自顶向下的通路
生成多尺度的特征映射。③平衡连接
连接卷积特征与构造特征。为特征映射增加图像信息。

 Cascade R-CNN

1.cascade不断改变了proposal的分布,并且通过调整阈值的方式重采样;

2.cascade在train和inference时都会使用,并没有偏差问题;
3.cascade重采样后的每个检测器,都对重采样后的样本是最优的,没有mismatch的问题

 YOLO

YOLO将目标图像划分成S×S个栅格,每个格子预测B个边界框和C个目标的置信度,每个边界框参数包含坐标的偏移、(相对于整体归—化的)高度和宽度以及边界框的置信度。最终形成S×Sx(B×5+C)维张量。

SSD

单阶段,作者提出了一种目标检测框架: SSD。这种方法选取多个卷积层的特征映射配置预设的anchor,综合获得检测结果,从而提高精度。

 目标检测的未来..

  • 基于anchor的方法引入了很强的先验知识;【人为引入一些目标边界框的先验尺寸,然后对目标的偏差进行修正】
  • anchor-free的方法需要找到有效的区域生成策略;
  • 如何使用更多的语境信息;
  • 寻找更大的benchmarks;
  • low-shot目标检测,即样本很少的情况下如何检测;
  • 基于AutoML的检测,找到低消耗的方法;
  • 设计检测的backbone网络
  • 如何增加检测训练时的batch size

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/197897.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3D俯视角色割草游戏模板+视频教程,免费发布 | 一周精品推荐

大家好,我是晓衡。新年开工第一周,我就被热心的开发者们感动得热泪盈眶!今天我冒死推荐几款 Creator 游戏开发资源,希望能对得起这些开发者们,同时也希望你能也有所收获。3D俯视角割草游戏视频源码B 站 UP 主『好巧啊c…

MyBatis 数据查询语句中有关于大于,小于的书写方法 及 查询时相关sql 关键字

前言 提示:这里记录的大概内容: MyBatis 数据查询语句中有关于大于,小于的书写方法 一、MyBatis MyBatis 本是 apache 的一个开源项目 iBatis, 2010 年这个项目由 apache software foundation 迁移到了 google code,并且改名为…

Python封装、继承和多态

Python 语言在设计之初,就定位为一门面向对象的编程语言,“Python 中一切皆对象”。同时,Python 也支持面向对象的三大特征:封装、继承和多态。 一、封装 封装(Encapsulation),即在设计类时&am…

讲师邀请 | 在 DevData Talks,开放务实地聊聊研发效能!

什么是 DevData Talks? DevData Talks 是专注于研发效能实践经验与方法论的系列分享活动。 2022 年,我们既看到外部环境变幻莫测,也看到研发效能领域沉下心来稳步发展,从宏大的概念和价值,转向具体的问题&#xff0c…

若依框架代码自动生成器研究-表查询篇

最近生产环境用了一个开源系统:若依,其中有一个版块很有意思,很能提高生产效率: “代码生成器”。 其功能所处模块菜单为:系统工具->代码生成。我们来研究一下他的代码生成逻辑。 工具使用方法 1、建表 使用代码生成&#…

Python列表中你所不知道的事

1. 引言 目前,Python是世界上使用最广泛、最受欢迎的编程语言之一。Python丰富的功能性使它非常流行,因为我们可以使用它创建任何内容。我将在本博客中与大家分享关于Python列表的几条有趣的花絮。 闲话少说,我们直接开始吧! 2.…

如何高薪入职心仪的公司

序 本文首发自:稀土掘金、思否 我们从几个问题开始入手,来看一下本博客是否适合你: 如果你想要换工作,但是:制作的简历平平无奇如果你想要换工作,但是:投放了的简历总是无法得到 [心仪公司] 的…

SpringBoot+Vue茶叶商城系统

简介:本项目采用了基本的SpringBootVue设计的茶叶商城系统。详情请看主要截图。经测试,本项目正常运行。本项目适用于Java毕业设计、课程设计学习参考等用途。 项目描述 项目名称SpringBootVue茶叶商城系统源码作者LHL项目类型Java EE项目 (…

C#windows彩票信息管理

摘要:近年来,中国彩票行业已经进入市场急速扩张和加速上升的阶段,即开票占整个彩票销量的比率也将急剧上扬。自助售彩终端,这一崭新的售彩模式已被中国彩民接受,爆发点很快来临。到2020年,我国多功能彩票自…

百趣代谢组学文献分享:OnPLS方法在哮喘领域应用研究

百趣代谢组学文献分享,本周分享的文献题目为OnPLS-Based Multi-Block Data Integration: A Multivariate Approach to Interrogating Biological Interactions in Asthma,是由日本前桥群马大学创新研究中心Craig E. Wheelock教授课题组在2018年发表于Ana…

商业智能 BI 人员的六个Level,你到了哪一层?

现在商业智能 BI 行业的从业人员越来越多,但很多人对于自己的职业规划可能并不是特别的清晰,不知道在这个细分领域到底有多大的成长空间,未来大概可以走到哪一个层次。 今天大概介绍下这六个层次,可以是大多数从事商业智能 BI 工…

【计算机程序设计思想与方法】1 什么是计算?

计算是利用计算机解决问题的过程,计算机科学是关于计算的学问。 计算机科学家在用 计算机解决问题时形成了特有的思维方式和解决方法,即计算思维。 1.1 什么是计算? 1.1.1 计算机与计算 计算机是当代最伟大的发明之一。 自从人类制造出第一台电子数字计算机,迄今已近 …

面试题-Java集合常见问题

1 常见集合集合相关类和接口都在java.util中,主要分为三中List(列表)、Map(映射)和Set(集合)其中Collection是集合List、Set的父接口,它主要有两个子接口:List:存储的元素有序,可重复。ArrayList基于数组实现LinkedLis…

STM32开发(二)CubeMX详解构建基本框架

文章目录STM32 CubeMX背景STM32 CubeMX基本配置选择芯片型号新建工程配置系统时钟、调试口、GPIO配置时钟配置配置GPIO (LED为例)GENERATE CODE 生成代码使用工具:CubeMX STM32 CubeMX背景 玩过STM32单片机的朋友都知道,以前的时…

网络协议栈简单设计(udp)

网络协议栈简单设计 操作系统内核中实现了网络协议栈,但今天利用netmap(也可利用dpdk)绕过内核协议栈进行网络数据的收发 netmap 内核协议栈加载数据: 数据从网卡到内核再到内存,需要经过两次拷贝 netmap映射数据&…

List底层源码剖析之List扩容机制

在list集合中有一个add方法: 在众多类中,最长使用的是ArrayList,其中有个方法是add方法 在add方法底层存在 private int size; ensureCapacityInternal(size 1) 其中的size1会对add()方法的调用次数进计数&#x…

Docker系列(常用命令) 02

Docker常用命令总结 docker官方命令文档 一、Docker环境信息命令 docker version # 查看docker版本信息 docker info # 查看docker详细信息二、系统日志信息常用命令 2.1 docker events 作用:从服务器获取实时事件,比如:启动、关闭和创…

九龙证券|美国散户疯狂抄底,嗅到了什么?华尔街最新警告

当地时间周五,美股三大指数低开后经历“过山车”行情,虽然盘中一度转涨,但午后再度回落。截至收盘,道指跌0.38%,报收33926.01点;纳指跌1.59%,收于12006.95点;标普500指数跌1.04%&…

九龙证券|全市场注册制下 多层次资本市场定位更清晰

全商场施行注册制的启动,让多层次本钱商场各个板块之间的定位愈加明晰。沪深交易所主板将杰出大盘蓝筹定位,各个板块互联互通也在逐渐加强。 分析人士认为,全面施行股票发行注册制是一场触动本钱商场全局的革新。注册制在全商场推广后&#x…

解读测试能力素质模型

软件测试的能力素质模型(Job Model),是对不同层级测试工程的能力要求进行明确的定义。目的是为了对每位工程师的能力进行科学的评估,然后分配合理的工作,也帮助大家明确职业规划的方向。 淘宝测试工程师的最常用的有4个,分别是&am…