目标检测评估指标

news2025/1/22 21:06:58

在这里插入图片描述

目录

  • 一、检测精度
    • 1、TP、FP、TN、FN概念
      • ==正样本和负样本==
      • ==TP(True Positive---正确的正向预测)==
      • ==FP(False Positive---错误的正向预测)==
      • ==FN(False Negative---错误的负向预测)==
      • ==TN(True Negative---正确的负向预测)==
    • 2、Precision(准确率)和Recall(召回率)
    • 3、P-R curve (Precison-Recall curve)
    • 4、F1 score指标
    • 5、IoU (Intersection over Union)
    • 6、AP (Average Precision)
    • 7、mAP (mean Average Precision)
    • 8、AP计算案例
    • 9、不同尺度下的AP值
  • 二、检测速度
    • 1、前传耗时
    • 2、FPS (Frames Per Second)
    • 3、浮点运算量(FLOPS)

一、检测精度

大家在看目标检测论文的时候,经常会遇到mAP@0.5或者mAP@[0.5:0.95]和精度等等评估指标,自己最开始在发论文的时候对这些品估指标也总是会产生惯性思维,导致很多概念会混淆,所以也是查阅很多文献和博客去理解,但是很多博主讲的其实也不够通俗,比较偏概念化,最后将自己的理解和查阅到的内容整理了一下并列举相关例子便于大家理解。

目标检测的评估指标主要分为两部分,一类是检测精度,一类是检测速度
在这里插入图片描述

1、TP、FP、TN、FN概念

正样本和负样本

要想理解上面4个概念,就需要先区分正样本和负样本,在目标检测中,正样本和负样本是指用于训练和评估模型的图像区域或图像片段。它们的概念与二分类问题中的正样本和负样本类似,但在目标检测中,正样本和负样本通常用于区分图像中是否存在目标物体。

  • 正样本:正样本是指包含要检测的目标物体的图像区域或图像片段。在目标检测任务中,正样本通常被标注为目标类别,并用于训练模型以识别和定位这些目标。例如,在车辆检测任务中,车辆图像的区域被标记为正样本。
  • 负样本:负样本是指不包含要检测的目标物体的图像区域或图像片段。这些图像区域通常被标注为背景或非目标类别,并用于模型训练中的负样本采样。负样本有助于模型学习如何区分目标物体和背景。例如,在车辆检测任务中,不包含车辆的图像区域被标记为负样本。

举例说明:
假设我们有一个目标检测任务,要求检测图像中的狗。在这种情况下,正样本将是图像中包含狗的区域,而负样本将是图像中不包含狗的区域。

  • 正样本示例:一张图像中有一只狗站在公园里。公园中的狗区域将被标记为正样本,因为它包含我们要检测的目标(狗)。
  • 负样本示例:另一张图像中是一幅风景画,没有狗。在这种情况下,整个图像或图像中不包含狗的区域都可以被标记为负样本。

通过使用正样本和负样本,模型可以学习从背景中准确地识别和定位目标物体,从而提高目标检测的性能。


在这里插入图片描述

TP(True Positive—正确的正向预测)

需要满足 3 个条件:

  1. 置信度(Confidence Score)大于阈值,实际上预测出的所有的框都要满足这个条件;
  2. 预测类型与标签类型匹配;
  3. 预测的 Bounding Box 与 Ground Truth 的交并比 (Intersection over Union,IoU,后续会详细介绍) 大于阈值 (e.g. 0.5) ,当有多个满足条件的预选框,则选择置信度最大的作为TP,其余的作为 FP。

总结:表示模型正确识别出的正样本数。即模型正确地将目标物体定位并识别出来的数量。

FP(False Positive—错误的正向预测)

负样本被检测为正样本的数量,也称误报,预测的 Bounding Box 与 Ground Truth 的 IoU 小于阈值的检测框(定位错误)或者预测的类型与标签类型不匹配(分类错误)。

总结:表示模型错误地将负样本错误识别为正样本的数量。即模型错误地将背景或非目标区域误认为是目标区域的数量。

FN(False Negative—错误的负向预测)

正样本没被检测为负样本的数量,也称漏报,指没有检测出的 Ground Truth 区域。

总结:表示模型错误地将正样本错误地识别为负样本的数量。即模型未能正确识别目标区域的数量。

TN(True Negative—正确的负向预测)

指的是被分配为负样本,而且分配对了的样本,代表的是被正确分类的负样本,在mAP评价指标中不会使用到。是负样本且被检测出的数量,无法计算,在目标检测中,通常也不关注 TN。

总结:表示模型正确识别出的负样本数。即模型正确地将背景或非目标区域排除在外的数量。

在这里插入图片描述


2、Precision(准确率)和Recall(召回率)

准确率(Precision):指模型正确识别出的正样本(TP)占所有模型预测为正样本的样本(TP + FP)的比例。它衡量了模型识别为正样本的样本中有多少是真正的正样本。
召回率(Recall):指模型正确识别出的正样本(TP)占所有真实正样本(TP + FN)的比例。它衡量了模型能够正确识别出多少正样本。

上面说了估计一大堆,可能还不明白,下面借用混淆矩阵来详细解释精度和召回率如何计算。

混淆矩阵(Confusion Matrix)常用来观察分类结果,其是一个N*N的方阵,N表示类别数。

混淆矩阵的行表示真实类别,列表示预测类别。例如,猫狗的二分类问题,有猫的图像10张,狗的图像30张,模型对这40张图片进行预测,得到的混淆矩阵为:

类别阿猫阿狗
阿猫73
阿狗1020

召回率计算:
从第一行中可知道,10张猫的图像中,7张预测为猫,3张预测为狗,猫的召回率(Recall)为7/10 = 70%,
从第二行中可知道,30张狗的图像中,10张预测为猫,20张预测为狗,狗的召回率为20/30 = 66.7%,

精确度计算:
从第一列中可知道,预测为猫的17张图像中,有7张是真正的猫,猫的精确度(Precision)为7 / 17 = 41.17%
从第二列中可知道,预测为狗的23张图像中,有20张是真正的狗,狗的精确度(Precision)为20 / 23 = 86.96%

模型的准确率(Accuracy)为:(猫预测正确样本数+狗预测正确样本数)/总样本数 ------> (7+20) / 40 = 67.5%

3、P-R curve (Precison-Recall curve)

在这里插入图片描述

它展示了在不同阈值下模型的准确率(Precision)和召回率(Recall)之间的权衡关系。

P-R 曲线的横轴是召回率(Recall),纵轴是准确率(Precision)。通过在不同的阈值下计算准确率和召回率,可以得到 P-R 曲线上的一系列点,这些点代表着不同的模型配置或不同的阈值选择。在理想情况下,我们希望模型的 P-R 曲线越靠近右上角,这意味着在较高的召回率下能够保持较高的准确率。

其实在实际训练过程,召回率和准确率是成反比的,召回率越高,检测出物体的框也就越多,那么识别错误的样本的概率也就越大,从而导致检测准确率的下降。

P-R 曲线的含义:

  • 最佳工作点(Best Operating Point):P-R 曲线上的每个点对应于模型在不同阈值下的性能。在某些应用中,可能需要根据具体需求选择最佳的工作点。通常情况下,可以通过牺牲一些准确率来获得更高的召回率,或者相反地通过增加阈值来提高准确率。

  • 评估模型性能:P-R 曲线提供了评估模型性能的一种方式,特别是在不平衡数据集中,其中正样本和负样本的数量差异较大。对于这种情况,准确率和召回率比仅仅使用准确率更具代表性。

  • 权衡准确率和召回率:P-R 曲线展示了准确率和召回率之间的权衡关系。例如,如果需要更高的召回率,则可以降低阈值以捕获更多的正样本,但这可能会导致准确率下降。相反,如果需要更高的准确率,则可以增加阈值以减少误报,但可能会牺牲一些召回率。

  • PR曲线有一个缺点就是会受到正负样本比例的影响。比如当负样本增加10倍后,在Racall不变的情况下,必然召回了更多的负样本,所以精度就会大幅下降,所以PR曲线对正负样本分布比较敏感。对于不同正负样本比例的测试集,PR曲线的变化就会非常大。

4、F1 score指标

在目标检测中,如果仅仅使用准确率和召回率作为评估指标,是不太严谨的,所以提出了F1score指标。
F1分数是一个结合了准确率(Precision)和召回率(Recall)的单一指标,旨在综合评估分类模型的性能。它被定义为准确率和召回率的调和平均数。F1分数的公式如下:
在这里插入图片描述

使用F1评估指标有以下优势:

  • 综合性能评估:F1分数综合考虑了准确率和召回率,因此它对模型在正负样本分类中的综合性能进行了评估。这是有益的,特别是在处理不平衡数据集(其中正负样本数量差异较大)时,因为在这种情况下,仅使用准确率可能会导致误导。

  • 权衡准确率和召回率:F1分数强调了准确率和召回率之间的平衡。在某些应用中,我们可能希望模型能够在保持较高准确率的同时,保持相对较高的召回率,或者相反。F1分数提供了一个单一的指标,可以帮助找到在这两者之间达到平衡的点。

  • 特别适用于不平衡数据:在不平衡数据集中,如果负样本远远多于正样本(或相反),那么一个简单的模型可以通过将所有样本都预测为多数类别来取得高准确率。但这并不是我们想要的,因为模型在正样本上的表现可能较差。F1分数有助于解决这个问题,因为它关注了分类器在两个类别上的整体性能。

  • 用于二分类问题:F1分数主要用于二分类问题,其中模型需要将样本分为正类和负类。对于多分类问题,可以考虑使用类别间的宏平均或微平均来扩展F1分数的概念。

5、IoU (Intersection over Union)

IoU的概念比较简单,就是预测框与真实框之间的"重叠率",当预测框和真实框无限接近的时候,此时预测的位置最理想,IOU约等于1.
在这里插入图片描述

在目标检测过程中可以设置不同的阈值,来提高对模型训练的要求,当IoU阈值设置的越大,此时要求预测框越接近真实框。下面是不同IOU阈值下P-R曲线的变化情况。
在这里插入图片描述

重点!!!

假设你将IoU设置为0.5:

  • 如果IoU≥为0.5,则将目标检测分类为True Positive(TP)
  • 如果IoU<为0.5,则为错误检测,并将其归类为 False Positive(FP)
  • 当图像中存在ground truth,且模型未能检测到该物体时,将其归类为False Negative(FN)
  • True Negative (TN):TN是图像中我们没有预测到一个物体的每个部分。这个度量值对对象检测无效,因此我们忽略了TN。

6、AP (Average Precision)

1、AP即Average Precision,称为平均准确率,是对不同召回率点上的准确率进行平均,在PR曲线图上表现为PR曲线下面的面积。AP的值越大,则说明模型的平均准确率越高。
2、AP(average precision 平均精度):虽然名为平均精度,但AP的计算方法并不是计算Precision的平均值,而是计算每个类别的PR曲线与坐标轴围成的面积,可以用积分的方法进行计算。如果一个模型的AP越大,也就是说PR曲线与坐标轴围成的面积越大,Precision与Recall在整体上也相对较高。
在这里插入图片描述

7、mAP (mean Average Precision)

1、mAP(mean of Average Precision) : 对所有类别的AP值求平均值。AP可以反映每个类别预测的准确率,mAP就是对所有类的AP求平均值,用于反映整个模型的准确率。

2、如果是多类别目标检测任务,就要使用mAP,mAP是多个类别AP的平均值。这个mean的意思是对每个类的AP再求平均,得到的就是mAP的值,mAP的大小一定在[0,1]区间,越大越好。该指标是目标检测算法中最重要的一个。

3、mAP@0.5
mAP@0.5,这种形式表示在IOU阈值为0.5的情况下,mAP的值为多少。当预测框与标注框的IOU大于0.5时,就认为这个对象预测正确,在这个前提下再去计算AP的均值mAP。

4、mAP@[0.5:0.95]
存在mAP@[0.5:0.95]这样一种表现形式,这形式是多个IOU阈值下的mAP,会在区间[0.5,0.95]内,以0.05为步长,取10个IOU阈值,分别计算这10个IOU阈值下的mAP,再取平均值。
在这里插入图片描述

对于发表论文图表的要求,可以看出,会计算出每个类别的AP以及所有类别AP的平均值,也就是mAP。
在这里插入图片描述

8、AP计算案例

用一个简单的例子来演示平均精度(AP)的计算。 假设数据集中总共有5个苹果。 我们收集模型为苹果作的所有预测,并根据预测的置信水平(从最高到最低)对其进行排名。 第二列表示预测是否正确。 如果它与ground truth匹配并且IoU≥0.5,则是正确的预测,否则是错误的预测。
在这里插入图片描述
第一行:预测为正样本,正样本苹果总数为5个,所以P=1/1=1,R=1/5=0.2;
第二行:预测为正样本,P=2/2=1,R=2/5=0.4;
第三行:预测为负样本,P=2/3=0.67,此时预测的正样本依旧为2个,所以R=2/5=0.4;
第四行:预测为负样本,P=2/4=0.5,此时预测的正样本依旧为2个,所以R=2/5=0.4;

Recall随着包含更多预测而增加,但Precision会上下波动。

求出每次的precision和recall就可以画出P-R曲线,并计算绘制出的曲线与PR轴所围成的面积,就可以得到该类别的AP值。
在这里插入图片描述

9、不同尺度下的AP值

在看在YOLO目标检测相关论文的时候,会经常见到APs、APm、APL等实验室数据,因为yolo会生成多尺度的特征图,用于检测小目标、中目标、大目标,所以一般都会加上不同尺度的检测AP,如下:AP50表示在阈值设置为0.5时的检测AP。
在这里插入图片描述
什么样的尺度为小目标和大目标,COCO AP给了一个定义如下:当物体的大小小于322 就是小物体,大于962 就是大物体。
在这里插入图片描述

二、检测速度

1、前传耗时

从输入一张图像到输出最终结果所消耗的时间,包括前处理耗时(如图像归一化)、网络前传耗时、后处理耗时(如非极大值抑制)

2、FPS (Frames Per Second)

FPS (Frames Per Second):每秒钟能处理的图像数量,FPS用来评估目标检测的速度,当然要对比FPS,你需要在同一硬件上进行。另外也可以使用处理一张图片所需时间来评估检测速度,时间越短,速度越快。

3、浮点运算量(FLOPS)

处理一张图像所需要的浮点运算数量, 跟具体软硬件没有关系,可以公平地比较不同算法之间的检测速度。越小越好

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1495577.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【开源】SpringBoot框架开发网上药店系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 药品类型模块2.3 药品档案模块2.4 药品订单模块2.5 药品收藏模块2.6 药品资讯模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 角色表3.2.2 药品表3.2.3 药品订单表3.2.4 药品收藏表3.2.5 药品留言表…

归并排序总结

1.归并排序 归并排序的步骤如下&#xff1a; ①枚举中点&#xff0c;将区间分为左右两段&#xff1b; ②对左右两段区间分别排序&#xff1b; 这个过程以递归的方式进行。 ③合并两段区间。 是一个模拟的过程。用两个指针分别指向左右区间&#xff0c;判断当前哪个数小&…

【Linux C | 网络编程】广播概念、UDP实现广播的C语言例子

&#x1f601;博客主页&#x1f601;&#xff1a;&#x1f680;https://blog.csdn.net/wkd_007&#x1f680; &#x1f911;博客内容&#x1f911;&#xff1a;&#x1f36d;嵌入式开发、Linux、C语言、C、数据结构、音视频&#x1f36d; &#x1f923;本文内容&#x1f923;&a…

酷开科技服务升级,酷开系统给消费者更好的使用体验!

看电视的时候你是不是也会有选择困难症&#xff1f;不知道要看哪个&#xff1f;不知道如何操作&#xff1f;体验不够顺畅&#xff1f;现在&#xff0c;有了酷开系统9.2&#xff0c;这些通通不再是问题&#xff01;酷开科技&#xff0c;一直致力于服务升级&#xff0c;给消费者更…

springBoot整合Redis(三、整合Spring Cache)

缓存的框架太多了&#xff0c;各有各的优势&#xff0c;比如Redis、Memcached、Guava、Caffeine等等。 如果我们的程序想要使用缓存&#xff0c;就要与这些框架耦合。聪明的架构师已经在利用接口来降低耦合了&#xff0c;利用面向对象的抽象和多态的特性&#xff0c;做到业务代…

uniapp+vue3+vites使用lime-echart问题记录

问题记录 1.vue3使用echarts,H5和微信小程序兼容问题 1.vue3使用echarts,H5和微信小程序兼容问题 问题描述&#xff0c;正常使用echarts&#xff0c;H5正常&#xff0c;小程序报错 报错信息如下 解决方案&#xff1a; 注意要点一&#xff1a;vue3需要使用esm文件 地址&#x…

Elasticsearch:从 ES|QL 到 Python 数据帧

在我之前的文章 “Elasticsearch&#xff1a;ES|QL 查询展示”&#xff0c;我展示了如何在 Kibana 中使用 ES|QL 对索引来进行查询及统计。在很多的情况下&#xff0c;我们需要在客户端中来对数据进行查询&#xff0c;那么我们该怎么办呢&#xff1f;我们需要使用到 Elasticsea…

怎么将电脑excel文档内的数据转换为图片形式

你平时在办公室会遇到格式转换的问题吗&#xff1f;比如PDF转Word&#xff0c;WPS转PDF&#xff0c;PDF转TXT&#xff0c;图片转PDF等。边肖最近在工作过程中遇到了类似的问题。为了更方便的查看表格&#xff0c;需要将Excel表格转换成图片格式。遇到这样的问题&#xff0c;很多…

CPP编程-CPP11中的内存管理策略模型与名称空间管理探幽(时隔一年,再谈C++抽象内存模型)

CPP编程-CPP11中的内存管理策略模型与名称空间管理探幽 CPP的四大内存分区模型 在 C 中&#xff0c;**内存分区是一种模型&#xff0c;用于描述程序运行时内存的逻辑组织方式&#xff0c;但在底层操作系统中&#xff0c;并不存在严格意义上的内存分区。**操作系统通常将内存分…

计算机大数据毕业设计-基于Flask的旅游推荐可视化系统的设计与实现

基于Flask的旅游推荐可视化系统的设计与实现 编程语言&#xff1a;Python3.10 涉及技术&#xff1a;FlaskMySQL8.0Echarts 开发工具&#xff1a;PyCharm 摘要&#xff1a;以Pycharm为旅游推荐系统开发工具&#xff0c;采用B/S结构&#xff0c;使用Python语言开发旅游景点推…

【python】成功解决ModuleNotFoundError: No module named ‘tensorboardX‘

【python】成功解决ModuleNotFoundError: No module named ‘tensorboardX’ &#x1f308; 个人主页&#xff1a;高斯小哥 &#x1f525; 高质量专栏&#xff1a;Matplotlib之旅&#xff1a;零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&#x1f…

二维码门楼牌管理系统应用场景:助力环保部门提升监管效率

文章目录 前言一、二维码门楼牌管理系统的环保应用场景二、二维码门楼牌管理系统如何助力环保监管三、二维码门楼牌管理系统与环保部门的联动效应 前言 随着城市化进程的加速&#xff0c;环保问题日益受到人们的关注。二维码门楼牌管理系统的出现&#xff0c;为环保部门提供了…

【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf

【论文阅读】DeepLab:语义图像分割与深度卷积网络&#xff0c;自然卷积&#xff0c;和完全连接的crf 文章目录 【论文阅读】DeepLab:语义图像分割与深度卷积网络&#xff0c;自然卷积&#xff0c;和完全连接的crf一、介绍二、联系工作三、方法3.1 整体结构3.2 使用空间金字塔池…

机器人期刊:Science Robotics and IEEE Transactions

文章目录 1. Science Robotics (出版商 AAAS)2. IEEE Transactions on RoboticsReference1. Science Robotics (出版商 AAAS) https://www.science.org/journal/scirobotics 2. IEEE Transactions on Robotics

动手学深度学习-现代循环神经网络(GRU、LSTM、编码器-解码器等)

现代循环神经网络 上一章节&#xff08;循环神经网络&#xff09;介绍了循环神经网络的基础知识&#xff0c;这种网络可以更好的处理序列数据。我们在文本数据上实现了基于循环神经网络的语言模型&#xff0c;但是对于当今各种各样的序列学习问题&#xff0c;这些技术可能不够…

SpringBoot集成JSP和war包部署到Tomcat

SpringBoot集成JSP 加依赖 <dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>org.springframework.boot…

Spring Security的API Key实现SpringBoot 接口安全

Spring Security的API Key实现SpringBoot 接口安全 Spring Security 提供了各种机制来保护我们的 REST API。其中之一是 API 密钥。API 密钥是客户端在调用 API 调用时提供的令牌。 在本教程中&#xff0c;我们将讨论如何在Spring Security中实现基于API密钥的身份验证。 API…

hyperf 二十五 数据迁移 一

教程&#xff1a;Hyperf 版本说明 一 生成迁移 php bin/hyperf.php gen:migration create_users_table 执行文件&#xff1a;Hyperf\Database\Commands\Migrations\GenMigrateCommand 功能&#xff1a;创建迁移文件 参数&#xff1a; name 文件名称 选项&#xff1a; c…

Docker连接Mysql

Docker连接mysql Docker通过云服务器&#xff0c;与本地连接 引言&#xff1a;这个东西我看狂神秒解决&#xff0c;我就试试了&#xff0c;结果G了&#xff0c;花了我两个小时&#xff0c; 希望内容能帮你解决问题 话不多说&#xff0c;直接上内容&#xff1a; navicat连接…

记一次 .NET某设备监控自动化系统 CPU爆高分析

一&#xff1a;背景 1. 讲故事 先说一下题外话&#xff0c;一个监控别人系统运行状态的程序&#xff0c;结果自己出问题了&#xff0c;有时候想一想还是挺讽刺的&#xff0c;哈哈&#xff0c;开个玩笑&#xff0c;我们回到正题&#xff0c;前些天有位朋友找到我&#xff0c;说…