P(查准率) R(查全率) AP mAP最通俗准确的讲解

news2024/11/24 5:00:17

学习YOLO的过程中遇到了mAP指标,在网上看了很多关于mAP的讲解,不是很理解其计算过程,于是总结了各个帖子及自己的理解,给出mAP计算的规律,这样就能很好的记忆。

目录

一、P(精确率)、R(召回率)和F1 Score

二、PR曲线

三、AP和mAP

一、P(精确率)、R(召回率)和F1 Score

  • True Positive(TP): 预测了。预测为正,实际为正。

  • False Negative(FN):预测了。 预测为负,实际为正。

  • False Positive(FP): 预测了。预测为正,实际为负。

  • True Negative(TN): 预测了。预测为负,实际为负。(在目标检测问题中,由于模型通常不会明确标记非目标的所有背景区域,所以通常不会计算TN

有T就是对,有F就是错。

P: Precision,精确率,也叫查准率。预测为正类的样本中确实为正类的比例。

R:Recall,召回率,也叫查全率。所有实际正类中,有多少正类被预测出来。

F1 Score:是精确率和召回率的调和平均数,是一种兼顾精确率和召回率的综合指标。

举个例子:一张图片中总共有10只猫咪,模型显示检测到了5只猫咪,但是检测到的其中只有4个是猫咪,另外一只实际上是小狗。
此时TP=4(检测到的4只猫咪是真猫咪),FN=6(没能检测到剩下的真实的6只猫咪), FP=1(误将1只小狗检测成小猫)。

此时P = 4/5 = 0.8,R = 4/10 = 0.6,F1 Score = 2X(0.8X0.6)/(0.8+0.6) = 0.686。

一般来说,P 和 R 是相互制约的,一个越高另一个就越低。
因为查准率只关注预测出的正类中有多少是真的,而查全率关注实际上所有的正类中模型检测出来多少。如果我的模型只关注查全率不关注查准率,我将所有物体都识别为正类,那么确实所有小猫都检测到了,但是不准确。

二、PR曲线

当你训练好一个分类算法后,它会对每个输入样本给出一个置信度评分,这个评分表示该样本是正类的概率。例如,算法认为样本A有99%的可能性是正类,而样本B只有1%的可能性是正类。

我们设定一个阈值,比如50%,来决定哪个样本被划分为正类,哪个样本被划分为负类。如果一个样本的置信度评分超过50%,我们就把它看作是正类;如果低于50%,则视为负类。

然后,可以按照置信度评分对所有样本进行排序。从置信度最高的样本开始,每次选取一个样本作为新的阈值。例如,首先选择置信度最高的样本A作为阈值,那么所有比样本A置信度高的样本都被认为是正类,其他样本则是负类。接着,计算当前状态下模型的精确率和召回率。

接着,继续选择下一个置信度稍低的样本B作为阈值,再次计算精确率和召回率。重复这个过程,直到遍历完所有样本。这样,就得到了一系列的精确率和召回率值,每个值对应着一个不同的阈值。

最后,把这些精确率和召回率值连接起来,就形成了一个 PR 曲线。这条曲线显示了随着阈值的变化,模型的精确率和召回率是如何变化的。

随着阈值的下降,recall值是递增的(但并非严格递增),因为实际为正类的对象会越来越多的被检测为正类,不会减少。而精确率precision并非递减,而是有可能振荡的,虽然正例被判为正例的变多,但负例被判为正例的也变多了,因此precision会振荡,但整体趋势是下降。

三、AP和mAP

虽然 PR 曲线提供了关于模型性能的直观信息,但它并没有提供一个单一的数值来概括整个曲线的表现。

平均精度(Average Precision, AP)平均精度是一种统计量,AP 是 PR 曲线上各点的精确率的平均值,每个精确率值乘以其对应的召回率的增量。。

口语化解释就是:
通过选取每个recall及其对应的precision,绘制出PR曲线。然后,对于每个recall值,计算下一个recall与当前recall之间的差值,并乘以从当前recall到之后的所有recall对应的最大precision值。重复这一过程直到遍历所有recall值,将这些值相加就得到了某个类别的AP (Average Precision)。(recall相同的点去precision最高的点)

举个图中特殊的点(框起来那个),此时下一个recall为0.71,当前recall为0.57,从当前recall开始(包括当前recall)一直到最后的recall中对应的precision最高为0.71,所以为(0.71-0.57)*0.71。

mAP:得到了不同类别的AP,取这些AP的平均值就是mAP。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2064014.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

I2C通信协议(软件I2C和硬件I2C)

相比于之前学的异步全双工且需要两条通信线的串口通信,I2C则为同步半双工,仅需要一条通信线,全双工与半双工区别如下: 全双工(Full Duplex)半双工(Half Duplex)数据传输方式同时双向…

linux 磁盘满了,程序运行失败,如何处理?df -h

场景:紧急呼救,上传图片失败了。我一脸懵,服务器这是又咋地了,别邪乎姐姐,姐姐胆子小啊。 一、寻找问题原因 1、OSS出问题了? 然后我尝试了 IOS 的APP是没问题的,Android提示上传失败&#xf…

Excel技巧(一)

快捷键技巧 原文链接 选取某一行的数据直到最后一行:【CTRL SHIFT ↓ 】或者选取一行后按住SHIFT键,双击下边线就可以快速选取区域。 如果表格中有多行空行,可以先按CTRL SHIFT END,再按CTRL SHIFT 上下键调整,…

CodeLLDB的快速安装

1、CodeLLDB很难安装 ‌‌CodeLLDB插件是一个基于‌LLDB的调试器插件,专为‌Visual Studio Code设计,旨在提供类似于传统集成开发环境(IDE)的调试体验。‌ 它支持‌C、‌C和‌Objective-C程序的调试,包括设置断点、查…

这4款工具可以教会你如何用AI写ppt.

随着AI工具的盛行,AI办公工具也组建越来越多,我们可以用AI帮助生成各种文档,包括PPT。今天我就帮大家总结一波专业又好用的ai生成PPT的工具,一共有4款。 1、笔灵ppt 直通车:https://ibiling.cn/ppt-zone 首先要说的这…

颠茄和草本曼陀罗参考基因组(茄科)

茄科的代表性物种之二:颠茄和草本曼陀罗 来源文献 Revealing evolution of tropane alkaloid biosynthesis by analyzing two genomes in the Solanaceae family 推荐 惕佫酰假托品合酶的发现-文献精读28 参考链接 https://ngdc.cncb.ac.cn/gwh/Assembly/29467/s…

【Python零基础】Python中的函数

文章目录 前言一、函数定义二、传递实参三、返回值四、传递列表五、传递任意数量实参六、把函数存储在模块中七、函数定义指南总结 前言 在Python中,函数是一段可重用的代码块,用于执行特定任务。函数可以通过定义关键字 def 来创建,并且通常…

网络安全-防火墙安全策略初认识

文章目录 前言理论介绍1. 安全策略1.1 定义:1.2 关键术语: 2. 防火墙状态监测 实战步骤1:实验环境搭建步骤2:配置实现 总结1. 默认安全策略2. 自定义安全策略3. 防火墙状态会话表 前言 who:本文主要写给入门防火墙的技…

容器篇(Java - 集合)

目录 有意者可加 一、集合 1. 出现的背景 2. 带大家具体了解下集合 3. 集合带来了哪些好处 4. 集合的特点 5. 集合和数组对比 6. 数组和集合应用场景(对比) 6.1 数组的应用场景 1. 存储一组数据 2. 图像处理 3. 矩阵运算 4. 缓存 6.2 集合…

基于Python的mediapipe和opencv的人体骨骼、人体姿态关键点的实时跟踪项目

随着计算机视觉技术的发展,人体姿态估计在虚拟现实、运动分析、人机交互等领域得到了广泛应用。传统的姿态估计方法通常依赖于深度学习模型,需要大量的计算资源。而 Google 开发的 MediaPipe 框架则提供了高效且易于使用的解决方案,它可以在各…

78、 ansible----playbook

一、ansible模块 11、防火墙和网络模块: [roottest1 ~]# ansible 192.168.168.23 -m iptables -a chainINPUT protocolICMP source192.168.168.22 jumpREJECT -b ##-b后台,拒绝[roottest3 ~]# yum -y install nginx[roottest3 ~]# systemctl restart …

论文合集下载丨第十九届全国人机语音通讯学术会议

2024年8月15日至18日,第十九届全国人机语音通讯学术会议(NCMMSC)暨CCF语音对话与听觉专委会2024年学术年会在新疆乌鲁木齐成功召开。 会议论文集下载方式在文末 👇 全国人机语音通讯学术会议作为语音技术领域内的专家、学者及科研…

为什么需要文献综述模板和创建文献综述技巧

为什么需要文献综述模板? 文献综述模板可以作为特定主题的指南。如果您的时间有限,无法进行更多研究,文献综述大纲示例可以为您提供帮助,因为它可以为您提供您打算研究的内容的概述。 甚至各个领域的专业人士也依赖文学评论来了解…

易灵思FPGA-Trion的MIPI设置使用

一、MIPI简介? 不需要各种资料上一大堆对物理层MIPI传输协议的讲解,实话说,我也不是特别能吃透其中的时序,所以不多研究;所有的FGPA如果带MIPI ,那就只研究控制器就行了 ,没必要舍近求远 二、硬…

NVM安装管理node.js版本(简单易懂)

一、前言 1.1 简介 NVM(Node Version Manager)是 node.js 的版本管理器,用 shell 脚本切换机器中不同版本的 nodejs。 Nodejs为什么需要多个版本? 有经验的开发者可能遇到过,某个依赖包明确nodejs是某个版本&#…

深度学习--RNN以及RNN的延伸

循环神经网络(Recurrent Neural Network, RNN)是一类能够处理序列数据的神经网络,在自然语言处理、时间序列分析等任务中得到了广泛应用。RNN能够通过其内部的循环结构,捕捉到序列中前后项之间的关系。下面我将从原理、作用、应用…

【AI绘画】Midjourney提示词详解:精细化技巧与高效实践指南

文章目录 💯Midjourney提示词基础结构1 图片链接1.1 上传流程 2 文字描述3 后置参数 💯Midjourney提示词的文字描述结构全面剖析1 主体主体细节描述2 环境背景2.1 环境2.2 光线2.3 色彩2.4 氛围 3 视角4 景别构图5 艺术风格6 图片制作方法7 作品质量万能…

振动分析-20-振动三要素的理解及决定设备分析水平的因素

1 对频谱分析的定位 一般咨询一个振动问题,很多人往往是要求把各种频谱贴上来看看,却很少有人问,振动过程、检修经历、设备结构、振动位置、振动方向、负荷关系、油温变化、转速影响等等。 刚刚接触振动检测时,对有关频谱分析方面资料如饥似渴,对于早期从事振动诊断的朋…

CentOS 7使用RPM安装MySQL

MySQL是一个开源的关系型数据库管理系统(RDBMS),允许用户高效地存储、管理和检索数据。它被广泛用于各种应用,从小型的web应用到大型企业解决方案。 MySQL提供了丰富的功能,包括支持多个存储引擎、事务能力、数据完整性…

Google Earth Engine(GEE)——计算非监督分类的中的面积和占比

函数: aggregate_sum(property) Aggregates over a given property of the objects in a collection, calculating the sum of the values of the selected property. 对一个集合中的对象的特定属性进行聚合,计算所选属性值的总和。 Arguments: this:collection (Featur…