3D目标检测实战 | 图解KITTI数据集评价指标AP R40(附Python实现)

news2024/11/26 7:53:10

目录

  • 1 准确率和召回率
  • 2 P-R曲线的绘制
  • 3 AP R11与AP R40标准
  • 4 实际案例

1 准确率和召回率

首先给出 T P TP TP F P FP FP F N FN FN T N TN TN的概念

  • 真阳性 True Positive T P TP TP
    预测为正(某类)且真值也为正(某类)的样本数,可视为 I o U > I o U t h r e s h o l d \mathrm{IoU>IoU_{threshold}} IoU>IoUthreshold的检测框数量
  • 假阳性 False Positive F P FP FP
    预测为正(某类)但真值为负(另一类)的样本数,可视为 I o U ≤ I o U t h r e s h o l d \mathrm{IoU\le IoU_{threshold}} IoUIoUthreshold的检测框数量
  • 真阴性 True Negative T N TN TN
    预测为负(不是某类)且真值也为负(不是某类)的样本数
  • 假阴性 False Negative F N FN FN
    预测为负(不是某类)但真值为正(某类)的样本数,即在真值区域没有给出检测框

基于上述概念给出准确率和召回率的计算方法

  • 准确率 Precision

P = T P T P + F P P=\frac{TP}{TP+FP} P=TP+FPTP

  • 召回率 Recall

R = T P T P + F N R=\frac{TP}{TP+FN} R=TP+FNTP

准确率 P P P又称为查准率,反映了目标检测的正确性;召回率 R R R又称为查全率,反映了目标检测的泛化性。

在这里插入图片描述

查准率高且查全率高

在这里插入图片描述

查准率高但查全率低

在这里插入图片描述

查准率低但查全率高

2 P-R曲线的绘制

P-R性能也称为准确率-召回率性能,或称查准率-查全率性能,常用于信息检索、Web推荐引擎等应用中。体现P-R性能的主要是P-R曲线,P-R曲线是用于评估二分类模型性能的重要工具,它展示了在不同阈值下模型的准确率和召回率之间的变化关系

P-R曲线的绘制过程是:将预测置信度从高到低排序,依次选择置信度为预测阈值(即大于该阈值的判定为正样本,否则为负样本),计算该阈值下的TP、FN、FP,从而得到准确率和召回率,从高到低移动阈值形成P-R曲线

以一个实例说明绘制过程

假设有10个样本,其中正负样本各5个,按照预测置信度从高到低排序,依次计算准确率和召回率

在这里插入图片描述

将形成的(Precision, Recall)坐标对画到坐标系上可得

在这里插入图片描述
随着样本增加,折现会趋于曲线

3 AP R11与AP R40标准

P-R曲线围成的面积称为平均准确率(Average Precision, AP),用于衡量模型的综合性能

在这里插入图片描述
对于面积的计算,一种方法是积分,但由于曲线形态各异,积分比较耗费计算资源;另一种方法是离散化求和,即用若干个矩形面积来近似曲线下面积

在这里插入图片描述

具体的公式为

A P ∣ R = 1 ∣ R ∣ ∑ r ∈ R ρ i n t e r ( r ) AP\mid_{R}^{}=\frac{1}{\left| R \right|}\sum_{r\in R}{\rho _{\mathrm{inter}}\left( r \right)} APR=R1rRρinter(r)

其中 R = { r 1 , r 2 , ⋯   , r n } R=\left\{ r_1,r_2,\cdots ,r_n \right\} R={r1,r2,,rn}是等间隔的召回率点, R 11 R_{11} R11 R 40 R_{40} R40分别指

R 11 = { 0 , 1 10 , 2 10 , ⋯   , 1 } R 40 = { 1 40 , 2 40 , 3 40 , ⋯   , 1 } R_{11}=\left\{ 0,\frac{1}{10},\frac{2}{10},\cdots ,1 \right\} \\ R_{40}=\left\{ \frac{1}{40},\frac{2}{40},\frac{3}{40},\cdots ,1 \right\} R11={0,101,102,,1}R40={401,402,403,,1}

相当于把召回率等分为 ∣ R ∣ \left| R \right| R个矩形,高度为P-R曲线在该召回率点的准确度。但问题是可能原曲线在该点没有计算准确度指(因为本质上还是离散曲线),因此就引入准确度插值函数

ρ i n t e r ( r ) = max ⁡ r ′ : r ′ > r ρ ( r ′ ) \rho _{\mathrm{inter}}\left( r \right) =\max _{r':r'>r}\rho \left( r' \right) ρinter(r)=r:r>rmaxρ(r)

就是取召回率为 r ′ r' r的位置之后所有准确率的最大值,作为该点的插值准确率,相当于把P-R曲线化成阶梯矩形,如下图蓝色曲线所示,接着按公式计算即可

在这里插入图片描述

R 40 R_{40} R40一定程度上削弱了 R 11 R_{11} R11在准确率很低时,AP结果仍然很高的情况,举例而言

假设一个场景中有20个Ground Truth,但是算法只给出了一个检测结果,且检测的IoU大于阈值,即这是一个TP样本。该置信度下, P r e c i s i o n = 1.0 Precision=1.0 Precision=1.0 R e c a l l = 1 20 = 0.05 Recall=\frac{1}{20}=0.05 Recall=201=0.05

  • 计算 A P ∣ R 11 = 1 11 = 0.0909 AP\mid_{R_{11}}^{}=\frac{1}{11}=0.0909 APR11=111=0.0909,这里的1对应 R 11 R_{11} R11中召回点0,而这个准确率已经超过了很多单目3D检测算法的准确率,显然不合理

在这里插入图片描述

  • 计算 A P ∣ R 40 = 1 + 1 40 = 0.05 AP\mid_{R_{40}}^{}=\frac{1+1}{40}=0.05 APR40=401+1=0.05,这里的1对应 R 40 R_{40} R40中召回点 1 40 \frac{1}{40} 401 2 40 \frac{2}{40} 402

目前KITTI官方也认可了 A P ∣ R 40 AP\mid_{R_{40}}^{} APR40指标,后续基本也采用 A P ∣ R 40 AP\mid_{R_{40}}^{} APR40进行实验评估

以下是KITTI数据集AP检测的实例

Car AP@0.70, 0.70, 0.70:
bbox AP:90.7769, 89.7942, 88.8813
bev  AP:90.0097, 87.9282, 86.4528
3d   AP:88.6137, 78.6245, 77.2243
aos  AP:90.75, 89.66, 88.66
Car AP_R40@0.70, 0.70, 0.70:
bbox AP:95.5825, 94.0067, 91.5784
bev  AP:92.4184, 88.5586, 87.6479
3d   AP:90.5534, 81.6116, 78.6108
aos  AP:95.55, 93.85, 91.33

解释如下:

  • 第一行 Car AP@0.70, 0.70, 0.70

    Car表示类别,AP表示基于AP R11的平均准确率,后面三个0.70分别指代2D检测框、BEV检测框和3D检测框的IoU阈值,即大于这个阈值才认为是正样本

  • 第二、三、四行
    每一行指代一种检测模式,即2D检测框、BEV检测框和3D检测框,每一行的三个数值分别对应EasyModerateHard三种检测难度的的结果,难度越大(例如遮挡严重),检测准确度越小

  • 第五行
    aos表示平均朝向相似度(average orientation similarity),用于评价预测输出的朝向与真实框朝向的相似程度

4 实际案例

在KITTI数据集中,按以下步骤计算AP数值

  1. 计算IoU,这部分原理参考3D目标检测实战 | 详解2D/3D检测框交并比IoU计算(附Python实现)

    frame_overlaps, parted_overlaps, gt_num, dt_num = iou(gt_annos, dt_annos, method, num_parts)
    
  2. 以0置信度阈值计算置信度列表,即只要IoU符合条件的都视为TP样本,提取其置信度评分

    rets = compute(frame_overlaps[i], gt_data_list[i], dt_data_list[i],
                        ignored_gts[i], ignored_dts[i], min_overlap=min_overlap, thresh=0.0)
    _, _, _, _, scores_i = rets
    
  3. 对置信度列表均匀采样41个点,得到40个召回点对应的置信度阈值

    thresholds = getThresholds(np.array(scores), valid_gt_num)
    
    def getThresholds(scores: np.ndarray, num_gt, num_sample_pts=41):
        scores.sort()
        scores = scores[::-1]
        current_recall = 0
        thresholds = []
        for i, score in enumerate(scores):
            l_recall = (i + 1) / num_gt
            if i < (len(scores) - 1):
                r_recall = (i + 2) / num_gt
            else:
                r_recall = l_recall
            if (((r_recall - current_recall) < (current_recall - l_recall))
                    and (i < (len(scores) - 1))):
                continue
            thresholds.append(score)
            current_recall += 1 / (num_sample_pts - 1.0)
        return thresholds
    
  4. 遍历每个阈值,计算该阈值下的TP、FP和FN,从而计算准确率和召回率

    for i in range(len(thresholds)):
        recall[m, l, k, i] = pr[i, 0] / (pr[i, 0] + pr[i, 2])
        precision[m, l, k, i] = pr[i, 0] / (pr[i, 0] + pr[i, 1])
        if compute_aos:
            aos[m, l, k, i] = pr[i, 3] / (pr[i, 0] + pr[i, 1])
    
  5. 取PR曲线外接矩形

    for i in range(len(thresholds)):
        precision[m, l, k, i] = np.max(precision[m, l, k, i:], axis=-1)
        recall[m, l, k, i] = np.max(recall[m, l, k, i:], axis=-1)
        if compute_aos:
            aos[m, l, k, i] = np.max(aos[m, l, k, i:], axis=-1)
    
  6. 计算AP

    def mAP(prec):
        sums = 0
        for i in range(0, prec.shape[-1], 4):
            sums = sums + prec[..., i]
        return sums / 11 * 100
    
    def mAPR40(prec):
        sums = 0
        for i in range(1, prec.shape[-1]):
            sums = sums + prec[..., i]
        return sums / 40 * 100
    

在这里插入图片描述

本文完整工程代码请通过下方名片联系博主获取


🔥 更多精彩专栏

  • 《ROS从入门到精通》
  • 《Pytorch深度学习实战》
  • 《机器学习强基计划》
  • 《运动规划实战精讲》

👇源码获取 · 技术交流 · 抱团学习 · 咨询分享 请联系👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1175903.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3Dmax Vary 渲染 玻璃 水 啤酒 的参数尝试

折射率&#xff1a; 空气折射率为1.0 水折射率一般 1.3 -1.4 &#xff0c;啤酒折射率一般 1.4-1.55 玻璃折射率 一般 1.5-1.7 金刚石钻石 2.0 透明物体 密度越大 折射率越高。折射&#xff1a;同一束光在不同密度介质传播时发生的 光路弯折。如果密度不断发生变化&#…

C++常用格式化输出

在C语言中可以用printf以一定的格式打印字符&#xff0c;C当然也可以。 输入输出及命名空间还不太了解的小伙伴可以看一看C入门讲解第一篇。  在C中&#xff0c;可以用流操作符&#xff08;stream manipulators&#xff09;控制数据的输出格式&#xff0c;这些流操作符定义在2…

UE5——源码阅读——4——引擎预初始化

预初始化的开始处理和结束处理 将GEnginePreInitPreStartupScreenEndTime设置为平台的时间 ON_SCOPE_EXIT 这个就是在程序结束后执行一个Lambda&#xff0c;这个弘的目的是简化代码确保正确的时机正确的执行清理操作&#xff0c;降低因资源泄露而导致BUG的概率 处理延迟注册…

【GEE】基于GEE-Landsat8数据集地表温度反演(LST热度计算)

老样子&#xff0c;最近在做生态方面的项目&#xff0c;然后需要分析城市的热岛效应&#xff0c;想了想还是用GEE计算比较简单&#xff0c;直接下载影像太麻烦了。所以在网上看看了资料&#xff0c;踩了踩坑终于是将代码写出来了。秉承着取之于民、用之于民的想法&#xff0c;今…

如何解决msvcp140.dll文件丢失问题,msvcp140.dll丢失的解决方法

在使用电脑时&#xff0c;有时我们可能会遇到一些错误提示&#xff0c;比如“找不到msvcp140.dll文件”。这是因为某些程序需要依赖于msvcp140.dll文件才能正常运行。这个问题是可以解决的,大家不需要担心&#xff0c;而且其解决的方法是有很多种的&#xff0c;今天我们就来给大…

VS编译器中创建新源文件,自动添加----#define _CRT_SECURE_NO_WARNINGS 1

每次创建新的源文件时都需要添加比较麻烦&#xff0c;我们让每次创建时自动添加&#xff0c;步骤如下&#xff1a; 1、右键编译器--->属性--->目标&#xff08;存放的是编译器的文件位置我们找到文件的位置&#xff09; 2、如下步骤找到“newc file.cpp”文件&#xff0…

MySQL基础之约束、多表查询、事务【基础完结】

1 SQL约束 SQL约束是用于规定表中的数据规则&#xff0c;如果存在违反约束的数据行为&#xff0c;行为会被终止。 1.1 如何创建约束 • 在创建表的时候进行规定&#xff08;create table&#xff09;• 修改表的时候进行规定&#xff08;alter table&#xff09; 1.2 约束的…

设计师的宝库:5个供应免费素材的设计网站

今天给大家推荐五个设计素材网站&#xff0c;设计师看到就要码住&#xff0c;码住就是灵感。 即时设计 即时设计是一个可在线使用的设计资源网站&#xff0c;在网页中打开「即时设计」的官网&#xff0c;登录账号后即可使用即时设计提供的设计资源。 即时设计 - 可实时协作的…

史上最全Windows安全工具汇总

史上最全Windows安全工具锦集来源于网络整理&#xff0c;安全性自测。 下载方式&#xff1a;史上最全Windows安全工具汇总

为了理直气壮怼回去,写了一个日志切面输出接口出入参数

1.背景 我们在日常排查问题过程中知道&#xff0c;入参传错是导致接口调用失败的常见原因之一。特别是提供给第三方调用的回调接口和openAPI接口&#xff0c;由于无法保证第三方开发人员的水平&#xff0c;经常问题不断&#xff0c;反反复复找你问为啥掉不通&#xff0c;甚至吐…

多人游戏小程序源码系统 带完整的搭建教程

现如今&#xff0c;人们对于娱乐和社交的需求也在不断提高。多人游戏作为一种能够满足人们社交需求的游戏类型&#xff0c;越来越受到用户的欢迎。同时&#xff0c;小程序作为一种轻量级的应用程序&#xff0c;在微信等平台上得到了广泛的应用和推广。因此&#xff0c;开发多人…

【LeetCode力扣】287.寻找重复数(中等)

1、题目介绍 原题链接&#xff1a;287. 寻找重复数 - 力扣&#xff08;LeetCode&#xff09; 示例 1&#xff1a; 输入&#xff1a;nums [1,3,4,2,2] 输出&#xff1a;2示例 2&#xff1a; 输入&#xff1a;nums [3,1,3,4,2] 输出&#xff1a;3提示&#xff1a; 1 < n &l…

hbase代码报错(以及解决方法)

》》》直接上代码 package HBase_Apiimport org.apache.hadoop.conf.Configuration import org.apache.hadoop.hbase.{HBaseConfiguration, TableName} import org.apache.hadoop.hbase.client.{Connection, ConnectionFactory, Get, Put} import org.apache.hadoop.hbase.ut…

烟台海森大数据——数据驱动材料研发,本土化为安全护航

随着大数据时代的来临&#xff0c;人们的生产和生活&#xff0c;各方面都在发生着深刻的变化。作为与国计民生息息相关的材料行业&#xff0c;也在数据时代迎来了新的机遇与挑战。 新材料是我国重点推进的战略性新兴产业之一&#xff0c;对于支撑整个战略性新兴产业发展&#…

海康Visionmaster-全局脚本:通过全局脚本加载本地图像的方法

通过 VM 的全局脚本加载本地图像的步骤如下所示&#xff1a; 1、打开全局脚本&#xff0c;选择需要的示例 2、在运行函数中插入如下代码 1. public int Process() 2. { 3. //m_operateHandle 二次开发 SDK 操作句柄 4. if (m_operateHandle IntPtr.Zero) 5. { return ImvsSd…

Solidity在函数里面返回中文报错原因

错误 from solidity: ParserError: Invalid character in string. If you are trying to use Unicode characters, use a unicode"…" string literal. –> contracts/text.sol:90:24: | 90 | return (1,true,“你好”); 原因与解决方法 在Solidity中&#xff0c;…

unittest 统计测试执行case总数,成功数量,失败数量,输出至文件,生成一个简易的html报告带饼图

这是一个Python的单元测试框架的示例代码&#xff0c;主要用于执行测试用例并生成测试报告。其中&#xff0c;通过unittest模块创建主测试类MainTestCase&#xff0c;并加载其他文件中的测试用例&#xff0c;统计用例的执行结果并将结果写入文件&#xff0c;最后生成一个简单的…

应用开发平台集成表单设计器系列之1——技术预研与技术选型

背景 表单的可视化配置&#xff0c;是低代码开发平台的重要组成部分。平台已实现的低代码配置部分&#xff0c;可以配置生成前端vue页面&#xff0c;对于属性较少的实体&#xff0c;如系统基础数据的管理、配置数据的维护&#xff0c;采用标准化的模板模式来生成&#xff0c;配…

腾讯云24元香港服务器有用过的吗?性能如何?

香港云服务器可以选择腾讯云香港地域的轻量应用服务器&#xff0c;轻量2核2G配置、20M峰值带宽、40G SSD系统盘&#xff0c;优惠价格24元一个月&#xff0c;Linux系统是288元一年&#xff0c;Windows系统是360元一年&#xff0c;腾讯云百科txybk.com分享腾讯云香港轻量应用服务…

墨者学院 Ruby On Rails漏洞复现第一题(CVE-2018-3760)

打开 web 页面&#xff1a; 发现是Ruby&#xff0c;在Ruby 3.7.1和更低版本中&#xff0c;存在由辅助解码引起的路径遍历漏洞。攻击者可以使用%252e%252e/访问根目录并读取或执行目标服务器上的任何文件。可以先检测一下是否有此漏洞&#xff1a; /assets/file:%2f%2f/etc/pas…