试读:目标检测定义及技术详解

news2025/1/12 1:04:43

1.通用目标检测Generic Object Detection定义

目标检测旨在从图像、视频或者类似高维数据中定位大量预定义类别的物体实例,原始的图像、视频或类似数据经过数据预处理后,进入目标检测模型进行前向预测,最终得到数据中每个实例的位置以及该实例的对应类别。

2.目标检测实际效果案例

 

3.通用目标检测常用公开数据集

3.1 Pascal VOC

  • 20 classes
  • 11,530 images
  • 27,450 ROI annotated objects
  • 6,929 segmentations

3.2 MS-COCO

  • Object segmentation
  • Recognition in context
  • Superpixel stuff segmentation
  • 330K images (>200K labeled)
  • 1.5 million object instances
  • 80 object categories
  • 91 stuff categories
  • 5 captions per image
  • 250,000 people with keypoints

4.目标检测算法归纳

4.1 基于深度学习的目标检测算法总结(2014-2019部分)

  • 更多相关paper可以参考Object Detection in 20 Years: A Survey

4.2 目标检测算法的常用分类方式

4.2.1 基于anchor使用分类

  • anchor based
  • anchor free

4.2.2 基于bbox refine的次数分类

  • 单阶段 one stage
  • 两阶段 two stage
  • 多阶段 multi stage

4.3 目标检测算法的通用结构

  • backbone
    • ResNet
    • ResNext
    • SENet
    • HRNet
    • DCN
    • EfficientNet
    • ResNest
    • Res2Net
    • CBNET
    • Nolocal
    • $...$
  • neck
    • FPN
    • PANET
    • NAS-fpn
    • Bifpn
    • $...$
  • head
    • rcnn head
    • cascade head
    • double head
    • $...$
  • post-process
    • nms
    • soft-nms
    • $...$
  • loss
    • cls
      • cross entropy
    • regression
      • l1
      • iou
      • giou
      • diou
      • ciou
    • $...$

4.4 目标检测算法的常用评估指标 mean Average Precision(mAP)

  • mAP定义及相关概念:

    • mAP指的是各类别AP的平均值. AP指的是PR曲线下面积,下面会详细讲解

    • PR曲线Precision-Recall曲线

    • Precision: TP / (TP + FP)

    • Recall: TP / (TP + FN)

    • IoU (交并比 - Intersection Over Union (IOU)):

      交并比(IOU)是度量两个检测框(对于目标检测来说)的交叠程度,使用两个框相交的面积除上并集的面积公式如下:

      IoU=aera(Bp⋂Bgt)aera(Bp⋃Bgt)IoU=aera(Bp⋂Bgt)aera(Bp⋃Bgt)

    • TP: IoU>指定阈值的检测框数量(同一Ground Truth只计算一次)

    • FP: IoU<=指定阈值的检测框,或者是检测到同一个GT的多余检测框的数量

    • FN: 没有检测到的GT的数量

  • mAP的具体计算 计算mAP必须先绘出各个类别的PR曲线,计算出AP。一般有两种方式来采样PR曲线:(i)在VOC2010以前,只需要选取当Recall >= 0, 0.1, 0.2, ..., 1共11个点时的Precision最大值,然后AP就是这11个Precision的平均值;(ii)在VOC2010及以后,需要针对每一个不同的Recall值(包括0和1),选取其大于等于这些Recall值时的Precision最大值,然后计算PR曲线下面积作为AP值. 来看一个简单的例子:

    假设我们有 7 张图片(Images1-Image7),这些图片有 15 个目标(绿色的框,GT 的数量)以及 24 个预测边框(红色的框,A-Y 编号表示,并且有一个置信度值)

根据上图以及说明,我们可以列出以下表格,其中 Images 代表图片的编号,Detections 代表预测边框的编号,Confidences 代表预测边框的置信度,TP or FP 代表预测的边框是标记为 TP 还是 FP(认为预测边框与 GT 的 IOU 值大于等于 0.3 就标记为 TP;若一个 GT 有多个预测边框,则认为 IOU 最大且大于等于 0.3 的预测框标记为 TP,其他的标记为 FP,即一个 GT 只能有一个预测框标记为 TP),这里的 0.3 是按照实际评估需求取的阈值,实际应用中要结合业务需求来合理设置。

通过上表,我们可以绘制出 P-R 曲线(因为 AP 就是 P-R 曲线下面的面积。我们需要根据置信度从大到小排序所有的预测框计算出 P-R 曲线上各个点的坐标,然后就可以计算 Precision 和 Recall,见下表:

上图的计算方式可以这么理解:

  • 标号为 1 的 Precision 和 Recall 的计算方式:

    Precision=TP/(TP+FP)=1/(1+0)=1

    Recall=TP/(TP+FN)=TP/(all ground truths)=1/15=0.0666

  • 标号 2:

    Precision=TP/(TP+FP)=1/(1+1)=0.5

    Recall=TP/(TP+FN)=TP/(all ground truths)=1/15=0.0666

  • 标号 3:

    Precision=TP/(TP+FP)=2/(2+1)=0.6666

    Recall=TP/(TP+FN)=TP/(all ground truths)=2/15=0.1333

其他的依此类推。有了上面所有的成对的Precision和Recall的值,就可以用这些P-R成对值来绘制PR曲线:

得到 PR 曲线就可以使用计算 AP(PR 曲线下的面积),这里介绍11点插值法:

  • 11点插值法:令recall的值分别为 [0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1] 的插值所得
    计算AP值如下:那么最终 mAP的计算就是把把所有类别的 AP 计算出来,然后求取平均即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/149583.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Compose 动画入门 (一) : animateXxxAsState 实现放大/缩小/渐变等效果

1. 前言 动画是Android Compose中很重要的一块内容。利用Compose可以简洁地定义动画&#xff0c;我们可以轻松快速地通过动画让应用变得生动有趣。 本文会介绍如何定义一个最简单的Compose动画&#xff0c;从而实现Compose动画。 1.1 定义一个Box 首先&#xff0c;我们先定义…

关于volatile解决内存可见性问题(保证线程安全)

Volatile是和内存可见性问题是密切相关的。先看下面一段代码&#xff0c;执行结果是什么&#xff1f; class MyCount{public int flag 0; } public class ThreadDemo15 {public static void main(String[] args) {MyCount myCount new MyCount();Thread t1 new Thread(()-&…

B站涨粉十万+!B站up主如何吸引高质量粉丝?

如何在b站快速增长粉丝&#xff0c;b站如何快速涨粉丝&#xff0c;这是所有Up主都关心的问题&#xff0c;对于初来乍到B站的up主来说&#xff0c;发布的作品内容是极为重要的&#xff0c;B站最初的粉丝积累往往都是靠这些在B站生产的视频。作品是否精彩&#xff0c;能否吸引粉丝…

AutoCAD打开文件提示“无法识别的版本,不能读取”

今天遇到一个很奇怪的问题&#xff0c;在CAD中执行自己创建的命令并关闭文档之后&#xff0c;重新打开CAD提示“无法识别的版本&#xff0c;不能读取”错误对话框。 后来查询资料&#xff0c;发现这是CAD的一个老bug了。原因是该dwg文档所在的目录下某个文件的文件名以“无”开…

MATLAB-常微分方程求解

MATLAB中可以用来求解常微分方程(组)的函数有ode23、 ode23s、 ode23t、 ode23tb 、ode45、ode15s和odel13等&#xff0c;见下表。它们的具体调用方法类似&#xff0c;为了方便后面的描述&#xff0c;在后面的介绍中将使用solver统一代替它们。函数的具体调用方法如下。[T,Y] s…

简述 synchronized 和 ReentrantLock 之间的区别?

相同点 synchronized 和 ReentrantLock 都是 Java 中提供的可重入锁。 可重入锁&#xff1a;什么是 “可重入”&#xff0c;可重入就是说某个线程已经获得某个锁&#xff0c;可以再次获取锁而不会出现死锁。 不同点 用法不同&#xff1a;synchronized 可以用来修饰普通方法、静…

红中私教:使用wamp64配置靶场

应朋友请求&#xff0c;出一篇配服务器的教程 首先安装软件 https://cowtransfer.com/s/9db1b9ad2c1d44 点击链接查看 [ wampserver3.3.0_x64.exe ] &#xff0c;或访问奶牛快传 cowtransfer.com 输入传输口令 pgs341 查看&#xff1b; 接下来&#xff0c;使用HbuilderX打开我…

基于Paddle实现实例分割

百度的Paddle这几年发展十分迅速&#xff0c;而且文档十分齐全&#xff0c;涉及到机器视觉的多个应用领域&#xff0c;感觉还是非常牛的&#xff0c;各种backbone&#xff0c;损失函数、数据增强手段以及NMS等&#xff0c;整体感觉复现的很全面&#xff0c;值得推荐学习。 本…

搭建Redisson流程以及解读MutilLock源码解决分布式锁的主从一致性问题

搭建Redisson流程以及解读MutilLock源码解决分布式锁的主从一致性问题1、搭建3台独立主节点的redis服务2、创建java redisson客户端3、获取分布式锁4、分析获取锁源码getMultiLocktryLock(long waitTime, long leaseTime, TimeUnit unit)5、总结1、搭建3台独立主节点的redis服务…

Apache Shiro教程(3)

shiro自定义realms及加密md5salt教程 1、添加pom 文件 <dependency><groupId>org.apache.shiro</groupId><artifactId>shiro-spring</artifactId><version>1.9.1</version> </dependency>2、创建realms自定义文件 import o…

【树莓派/入门】使用MAX30102测量血氧浓度

说在前面 树莓派版本&#xff1a;4b血氧模块&#xff1a;MAX30102树莓派系统&#xff1a;Linux raspberrypi 5.15.76-v8 #1597 SMP aarch64 GNU/Linuxpython版本&#xff1a;3.9.2 模块详情 某宝上买的MAX30102模块&#xff0c;包含杜邦线 准备工作 开启树莓派的GPIO&#x…

java 高级面试题整理

SpringMVC的控制器是单例的吗? 第一次&#xff1a;类是多例&#xff0c;一个普通属性和一个静态属性 总结 尽量不要在controller里面去定义属性&#xff0c;如果在特殊情况需要定义属性的时候&#xff0c;那么就在类上面加上注解Scope("prototype")改为多例的模式…

English Learning - L1-9 时态(中) 2023.1.3 周二

这里写目录标题8 时态8.1 一般时态&#xff08;三&#xff09;一般将来时核心思维&#xff1a;预测&#xff0c;计划&#xff0c;意愿will 和 be going to 的区别将来时的其它表示方式进行时表将来be about to (5 分钟之内)8.2 进行时态核心思维&#xff1a;持续有限的进行&…

黑苹果解决5500xt等navi14显卡引导二阶段黑屏几秒的问题

首先说结论&#xff1a;在注入缓冲帧FB Name的前提下&#xff0c;往显卡注入CFG_LINK_FIXED_MAP参数&#xff0c;类型为Number&#xff0c;值为1。注意一定要注入FB Name&#xff0c;注入FB Name&#xff0c;注入FB Name的前提下&#xff01;&#xff01;我试过不注入FB Name直…

【安全硬件】Chap.5 如何检测芯片中硬件木马?硬件木马的类型有哪些?检测硬件木马的技术

【安全硬件】Chap.5 如何检测芯片中硬件木马&#xff1f;硬件木马的类型有哪些&#xff1f;检测硬件木马的技术前言1. 硬件木马的种类1.1 硬件木马1.2 硬件木马的区分1.1 物理特性类别硬件木马——Physical hardware trojans1.2 激活特性类别硬件木马——Activation1.3 动作特性…

Kafka快速入门

文章目录安装部署集群规划集群部署kafka群起脚本Kafka命令行操作主题命令行操作生产者命令行操消费者命令行操作安装部署 集群规划 集群部署 官方下载地址&#xff1a;http://kafka.apache.org/downloads.html上传安装包到02的/opt/software目录下 [atguiguhadoop02 softwar…

5.hadoop系列之HDFS NN和2NN工作机制

1.第一阶段&#xff1a;NameNode启动 1.第一次启动NameNode格式化后&#xff0c;创建Fsimage和Edits文件&#xff0c;如果不是第一次启动&#xff0c;直接加载Fsimage和Edits到内存 2.客户端对元数据进行增删改请求 3.NameNode记录操作日志&#xff0c;更新滚动日志 4.NameNod…

elasticsearch-head使用问题汇总

1、elasticsearch-head数据预览、基本查询、复合查询模块无法查询es文档记录&#xff08;1&#xff09;解决办法复制vendor.jsdocker cp elasticsearch-head1:/usr/src/app/_site/vendor.js vendor.js修改vendor.js第6886行&#xff0c;将“contentType: "application/x-w…

高性能分布式缓存Redis-第三篇章

高性能分布式缓存Redis-第三篇章一、分布式锁1.1、高并发下单超卖问题1.2、何为分布式锁1.3、分布式锁特点1.4、基于Redis实现分布式锁1.4.1、实现思路&#xff1a;1.4.2、实现代码版本1.4.3、错误解锁问题解决1.4.4、锁续期/锁续命1.4.5、锁的可重入/阻塞锁&#xff08;rediss…

微服务 Spring Boot 整合 Redis BitMap 实现 签到与统计

文章目录⛄引言一、Redis BitMap 基本用法⛅BitMap 基本语法、指令⚡使用 BitMap 完成功能实现二、SpringBoot 整合 Redis 实现签到 功能☁️需求介绍⚡核心源码三、SpringBoot 整合Redis 实现 签到统计功能四、关于使用bitmap来解决缓存穿透的方案⛵小结⛄引言 本文参考黑马 …