yolo模型评估指标相关概念

news2025/2/27 16:18:17

        mAP(mean Average Precision 平均精度),是一个经常被用来衡量目标 检测模型是否具有较好性能的指标。

        计算mAP需要先计算每一类物体的AP,然后取平均值,所以下面介绍的 TP,FP,FN,TN都是针对某一类物体(目标)的检测结果来讲的。

        GT:Ground Truth,也就是标签,对应了真实框的大小位置以及分类。

        IoU:两个框的交并比。

        score或confidence:每个预测框的置信度,表示这个预测框包含某个目 标的可能性,score或者confidence越高,表示模型认为其包含某种目标的可能 性越大。

        IoU threshold:人工设定的IoU阈值。如果预测框与GT框的IoU大于此阈 值,则认为预测框与GT框非常相似,否则就认为预测框与GT差别很大。针对不 同数据集,这个取值会不一样,因为针对不同数据集有不同的评价标准,比如 说Pascal VOC数据集的设定是0.5,而COCO数据集设定了多个标准,从而会参 考在多个IoU threshold下的mAP来评判模型的好坏。

        score threshold:人工设定的score或confidence的阈值,对于某一类来 讲,预测框的分类置信度大于此阈值则认为这个框检测到了这类物体,保留预 测框,小于这个值则认为这个框中没有检测到这类物体,舍弃预测框。针对这 一步筛选出的预测框,通常会再进行一次NMS,消除冗余的框,然后将剩下的 边界框参与TP、FP、FN、TN的计算。

        TP: True Positive,一个正确的检测结果,被模型检测为正的正样本。我 们这步针对所有经过score threshold筛选出的预测框,针对一个预测框来讲, 如果边界框位置大小与某个GT非常相似(检测框与GT的IoU ≥ IoU threshold),那么我们就认为这个框就是一个正确的检测结果,并将其与该GT 配对,TP即为这类检测框的数量。注意,在实际预测中,经常出现多个预测框 和同一个GT的IoU都大于阈值,这时通常只将这些预测框中score最大的算作 TP,其它算作FP。

        FP: False Positive,一个错误的检测结果,被模型检测为正的负样本。即 边界框位置大小不达标(检测框与GT的IoU < IoU threshold)又或者这个预测 框是多余的预测框(即这个框对应的GT的已经存在一个TP与之对应)的数量。 在计算的时候,一般将检测出的所有边界框数量减去所有预测正确边界框的数 量,也就是所有经过score threshold筛选出的预测框除去TP,剩下的边界框的 数量就是FP。

        FN: False Negative,没有被检测到的GT的数量。即对于所有GT,除去所 有被预测正确的边界框(也就是TP)对应的GT,剩下的没有被检测到的GT的数 量。又称为被模型检测为负的正样本。

        TN: True Negative,被模型预测为负的负样本。但在目标检测mAP的计 算过程中没有用到这类,通常在分类任务中会用到。

         Precision(准确率): TP / (TP + FP),准确率是模型给出的所有预测结果 中,正确预测的结果所占的比例。其中TP+FP就是根据score threshold筛选出 来的候选框的数量。

        Recall(召回率): TP / (TP + FN),召回率是模型预测的正确结果最多能覆 盖多少GT。这也解释了为什么在计算TP时,同一个GT只对应一个正确的检测框 TP,如果允许一个GT对应多个正确的预测框,假如对于每个GT都存在大于一个 的正确预测框数,那么最终得到的召回率很明显会大于1,这是不符合常理的。 其中TP+FN就是GT的数量。

        对于多分类的目标检测任务来讲,会分别计算一张图片中每个类别的TP、 FP、FN的数量,进一步计算出每个类别的Precision和Recall。

        所以对于 precision和recall的含义,可以这样理解: preicision是在模型得 出的正样本中, 有多大比例真的是正样本, recall则是在真正的正样本中, 有 多少被你找到了。

        PR曲线: Precision-Recall曲线,将所有precision-recall点连成的曲线(一 般会为每个类别的预测框建立各自的PR曲线)。

        AP: Average Precision ,平均精度,根据PR曲线计算得出。 

        mAP: mean Average Precision, 各类别AP的平均值。

        首先来看,yolo算法是一个one-stage的算法,即一步直达,所以速度非常 快,适合做实时检测。缺点就是没有那么精确。

       有一个概念MAP:这个指标是为了去衡量综合的检测效果。

        这里牵扯到另一个概念就是召回率

关于预测结果我们可以分为四类:

        TP(真阳性) 预测为真的样本中确实为真的数量。

        FP(假阳性) 预测为真的样本中确实为假的数量。

        FN(假阴性) 预测为假的样本中确实为真的数量。

        TN(真阴性) 预测为假的样本中确实为假的数量。 

举个例子来说明:

        预测某些病人有没有得癌症。

        假设有100个样本,真实情况是有10个得癌症的,通过预测函数遇到到了有 12个得了癌症,其中有8个是真实得癌症的。

        这种情况下:

        TP=8

        FP=12-8=4

        FN=10-8=2

        TN=(100-12)-2=86

所以准确率:

        准确率 Accuracy

        正确预测为1,正确预测为0的样本比率,公式为:(TP+TN)/ALL

        上例中准确率为

        查准率 Precision

        查准率是指在所有预测为1的样本中预测正确的比率,公式为: TP/(TP+FP)

        上例中查准率为

        召回率 Recall

        召回率是指在所有真正为1的样本中预测正确的比率,公式为:TP/(TP+FN)

        上例中召回率为

        查准率和召回率的关系

    

        换句话说,召回率recall就是看每一个物体是不是都检测到了,查准率(也 就是精度)就是说对于每一个我们需要检测的东西,检测的好不好

        我们经常会看到一个叫做PR曲线图的概念

        其实pr图就是精度Precision和召回率Recall之间关系变化的图像 

        一般来说精度和召回率呈反相关关系。同时还会受置信度(阈值)的影 响。而MAP就是在所有阈值条件下的一个平均情况。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1823491.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CATIA软件 输入无参格式还原成为有参模型教程

上图为零件设计中特征辨识的命令栏&#xff0c;此次分享是对手动/自动特征辨识的命令应用&#xff0c;作个简单操作的分享了解。在CATIA软件中把输入的无参模型通过特征化后转化为有参模型的过程。其实CATIA软件早有这个功能提供给用户使用了&#xff0c;可能大家很少用。有了手…

数据通信与网络(二)

如何构建网络协议 这些协议采用分层的结构&#xff0c;每层协议实现特定功能&#xff0c;同时也需要依靠低层协议所提供的服务。 网络协议可以理解为三部分组成&#xff1a; 1、语法&#xff1a;通信时双方交换数据和控制信息的格式&#xff0c;是对通信时采用的数据结构形式…

【Numpy】numpy.r_用法

numpy.r_[字符串, 数组, 数组] numpy.r_的这三个整数默认值是0,1,-1 numpy.c_就是numpy.r_在三个整数是-1,2,0时的特例&#xff0c;因为常用&#xff0c;所以单独拎出来了。第一个参数-1指沿最后一个轴(维度)连接 有一个shape(2, 3, 4)的数组 np.random.randint(low0, high1…

Apache Tomcat介绍

目录 前言 一、Apache Tomcat的历史 二、核心特性与组件 三、Tomcat-基本使用 总结 前言 在Java Web开发领域&#xff0c;Apache Tomcat是一个不可或缺的核心组件。作为一个轻量级的开源Web应用服务器&#xff0c;Tomcat提供了一种简单而高效的方式来部署和管理Java Servle…

课外语文杂志课外语文杂志社课外语文编辑部2024年第4期目录

悦读时刻_我读经典 从忏悔到自救——鲁迅《风筝》的心灵叙事 杨丽; 5-7 读懂文字背后的深意——以《林黛玉进贾府》为例探索小说阅读之道 舒芳; 8-10 鲁迅笔下的真实与卑微——《故乡》中的人物形象 张淑堂; 11-13《课外语文》投稿&#xff1a;cn7kantougao163.com…

LLM基础知识

LLM背景知识介绍 1 大语言模型 (LLM) 背景 大语言模型 (英文&#xff1a;Large Language Model&#xff0c;缩写LLM) 是一种人工智能模型, 旨在理解和生成人类语言. 大语言模型可以处理多种自然语言任务&#xff0c;如文本分类、问答、翻译、对话等等。 &#x1f4a5;通常&…

vivado HW_TARGET

HW_目标 描述 硬件目标hw_target是包含一个或多个JTAG链的系统板 Xilinx FPGA设备&#xff0c;您可以使用比特流文件进行编程&#xff0c;或用于调试您的设计。 系统板上的硬件目标与Vivado Design Suite之间的连接 由硬件服务器对象hw_server管理。 使用open_hw_target命令打开…

三款有3D效果的js图表库

1、G2简洁的渐进式可视化语法。https://g2.antv.antgroup.com/manual/extra-topics/3d-charts 2、 https://www.highcharts.com/https://www.highcharts.com/ 3、https://www.fusioncharts.com/charts/pie-doughnut-charts/donut-chart-in-3d?frameworkjavascripthttps://www…

聚鼎科技:现在的装饰画做起来难吗

在当代&#xff0c;装饰画作为一种体现个人品味和审美情趣的方式&#xff0c;已经广泛应用于各种室内空间。不少人会产生这样的疑问&#xff1a;在现代化技术和材料的支持下&#xff0c;制作一幅装饰画是变得容易了&#xff0c;还是依旧充满挑战? 现代科技的确为装饰画的制作带…

STM32项目分享:OV7670将图片上传电脑

目录 一、前言 二、项目简介 1.功能详解 2.主要器件 三、原理图设计 四、PCB硬件设计 1.PCB图 2.PCB板及元器件图 五、程序设计 六、实验效果 七、资料内容 项目分享 一、前言 项目成品图片&#xff1a; 哔哩哔哩视频链接&#xff1a; https://www.bilibili.c…

tailwindcss的@apply使用

tailwindcss的apply是把在html写的tailwindcss可以挪到style里面 简化页面的可读性 没写之前的 <section class"block-risk absolute flex flex-col items-center p-4 text-center left-0 text-white;" :style"{ top, left: 60px }"> </section…

【秋招突围】2024届秋招笔试-阿里系列笔试题-第二套-三语言题解(Java/Cpp/Python)

&#x1f36d; 大家好这里是清隆学长 &#xff0c;一枚热爱算法的程序员 ✨ 本系计划跟新各公司春秋招的笔试题 &#x1f4bb; ACM银牌&#x1f948;| 多次AK大厂笔试 &#xff5c; 编程一对一辅导 &#x1f44f; 感谢大家的订阅➕ 和 喜欢&#x1f497; &#x1f4e7; 清隆这边…

基于Ascend C的FlashAttention算子性能优化最佳实践

LLM的Attention部分处理给计算系统带来巨大的计算和访存压力。业界先后出现FlashAttention、FlashAttention2等算法&#xff0c;通过计算等价和切分有效降低HBM数据访问量。 昇腾异构计算架构CANN针对昇腾AI处理器的片上内存和缓存大小&#xff0c;以及数据搬运通路&#xff0…

ozon如何上架产品,ozon平台怎么上架产品

在电子商务领域&#xff0c;产品上架是商家成功运营的关键步骤之一。对于正在或计划进军俄罗斯市场的卖家来说&#xff0c;了解如何在Ozon平台高效上架产品至关重要。接下来讲解下ozon如何上架产品&#xff0c;ozon平台怎么上架产品&#xff01; 产品上架工具&#xff1a;D.DDq…

基础-02-数据通信基础

文章目录 1.信道特征1.1 数据通信概念1.2 信道特性-信道带宽W1.3 信道特性-码元和码元速率1.4 信道特性-奈奎斯特定理1.5 信道特性-香农定理1.6 带宽/码元速率/数据速率关系梳理1.7 练习题 2.信道延迟2.1 信道延迟概念2.2 信道延迟计算2.3 练习题 3. 传输介质3.1 传输介质概念3…

电脑屏幕监控软件有哪些?2025年监控软件排行榜

电脑屏幕监控软件有哪些&#xff1f;2025年监控软件排行榜 虽然现在还是2024年&#xff0c;但是有一些被广泛讨论和推荐的电脑屏幕监控软件&#xff0c;它们将在2025年异军突起&#xff0c;成为行业的引领者。 1.安企神软件&#xff1a; 功能全面的电脑屏幕监控软件&#xf…

短视频矩阵系统/源码搭建---拆解热门视频功能开发上线

短视频矩阵系统/源码搭建 一、短视频矩阵系统源码开发需要用到以下技术&#xff1a; 1.前端技术&#xff1a;HTML、CSS、JavaScript、Vue.js等前端框架。 2.后端技术&#xff1a;Java、Python、PHP等后端语言及相关框架&#xff0c;如Spring Boot、Django、Laravel等。 3.移…

火车头采集怎么使用GPT等AI原创文章

火车头采集官方并没有GPT、百度文心一言AI、阿里通义千问AI、Kimi大模型等AI功能&#xff0c;但支持接入插件&#xff0c;可以编写相应人工智能AI原创文章插件&#xff08;火车头采集支持PHP和c#这2种语言的插件编写&#xff09;&#xff0c;或者导入第三方封装好的GPT等AI原创…

文件操作学不懂,小代老师带你深入理解文件操作(下卷)

文件操作学不懂&#xff0c;小代老师带你深入理解文件操作下卷 6. ⽂件的随机读写6.1 fseek6.2 ftell6.3 rewind 7. ⽂件读取结束的判定7.1 被错误使⽤的 feof 8. ⽂件缓冲区 6. ⽂件的随机读写 6.1 fseek 根据⽂件指针的位置和偏移量来定位⽂件指针&#xff08;⽂件内容的光…

RV32F\RV32D指令集

RV32F\RV32D指令集 F扩展1、浮点控制状态寄存器2、指令类型F扩展 F扩展增加了32个浮点寄存器f0-f31,每个32位宽,以及一个浮点控制和状态寄存器fcsr,其中包含浮点单元的工作模式和异常状态。FLEN=32表示F单精度浮点扩展,大多数浮点指令对浮点寄存器中的值进行操作。浮点加载…