读论文——day61 目标检测模型的决策依据与可信度分析

news2025/1/17 17:59:29

目标检测模型的决策依据与可信度分析

  • 本文贡献及原文
  • 1 相关工作(略看)
    • 1.3 目标检测模型
  • 2 背景知识(LIME)
    • 2.2 LIME
  • 3 目标检测决策依据及可信度分析
    • 3.1 决策依据
    • 3.2 对目标检测模型的预测进行可信度评价
  • 4 基于 LIME 的目标检测模型解释
    • 4.1 传统 LIME 在目标检测模型上应用的局限性
    • 4.2 改进 LIME
      • 4.2.1 问题分析
      • 4.2.2 新的图像分割方法
      • 4.2.3 替换原始 LIME 的图像分割方法
  • 5 实验设置
  • 6 实验结果
  • 7 结论与展望

本文贡献及原文

本文主要贡献包括以下几点.
(1) 提出利用语义分割模型 DeepLab 代替 LIME 所使用的图像分割方法, 从而使 LIME 适用于目标检测模型.
(2) 分析并揭示 LIME 解释目标检测模型时的问题: 局部线性回归模型的忠诚度太低、权重太小. 详见第 4 节.
(3) 在解释目标检测模型时, 将其输出改造为关注每一类物体存在性概率的具体回归问题. 详见第 3.1 节.
(4) 提出使用 IoU, 在得到决策依据后, 可以在有标签数据集中对模型每一次预测的可信度进行定量计算.

  • 有需要的小伙伴直接私信我就可以拿原文,或者等我会在后面看到一定数量的时候集中上传。

1 相关工作(略看)

1.3 目标检测模型

近年来, 学界对目标检测问题的研究越发深入, 提出了大量基于深度学习的目标检测模型, 并在各类数据集中
表现出较好的性能. 一些基于传统 CNN 的目标检测模型, 如 Faster R-CNN[11]、YOLOv1[12]、YOLOv2[13]、YOLOv3[14]、YOLOv4[15]、YOLOX[16]等, 能在 PSACALVOC、COCO等数据集中达到相当高的准确率. 除了基于CNN 的模型, 随着自注意力机制[17]的广泛运用, 有大量基于 Transformer 的目标检测模型被提出, 如 DETR[18]、TPH-YOLOv5[19]、ViT-FRCNN[20]、Deformable DETR[21]等, 同样有不俗的性能. 此外, 也有许多基于某些特殊网络架构的模型, 比如基于脉冲神经网络的 Spiking-YOLO[22]
和基于 Matrix Nets 的模型[23], 这些模型在某些特定领域(比如小目标检测) 中有相当惊艳的表现.

2 背景知识(LIME)

因为目标检测的基础知识已经很熟悉了,就不过多介绍,具体内容可以看看之前得论文笔记,这篇论文所用的LIME倒是第一次看到,所以把它的介绍放上来给大家看看,

2.2 LIME

LIME (局部可解释的模型无关解释)是一种将回归问题模型 (Regressor) 看作黑箱的局部解释方法. 该方法针对模型的每一次预测 (Instance) 进行解释, 通过在局部使用线性回归模型对回归器的行为进行拟合, 给出每一个输入变量 (Feature) 对模型输出结果的影响. 理论上, LIME 的原理适用于所有回归器, 因此我们从 LIME 出发,对目标检测模型进行解释.

3 目标检测决策依据及可信度分析

本文核心内容是对目标检测模型进行决策依据和可信度分析, 因此也属于对深度学习模型的可解释性研究.

3.1 决策依据

对决策依据的分析理应从以上两方面出发.

  1. 物体存在性预测:
    举例说明, 若模型预测图片中存在两个不同位置与置信度的“dog”类物体, 我们不具体分析每个“dog”被预测的原因, 仅分析其认为图片中存在“dog”类的原因.
  2. 边界框定位:
    对边界框定位作决策依据分析, 就是分析图像块会如何影响边界框的坐标值.

3.2 对目标检测模型的预测进行可信度评价

  • 探究模型可靠性时, 我们不仅要知道“模型依据哪些图像块进行决策”, 还要知道“模型应该根据哪些图像块进行决策”.
  • 在 CV 领域中, 交并比 (IoU) 常被用于计算图片中的区域重合度, 且是计算目标检测模型性能的重要指标之一. 因此, 我们在计算模型可信度时直接套用这一方法.本文认为若 IoU 达到 0.5 以上, 则可说明模型的该次预测较为可信.

4 基于 LIME 的目标检测模型解释

4.1 传统 LIME 在目标检测模型上应用的局限性

在这里插入图片描述

  1. 增加 QuickShift分割算法的核值, 使其对图像块边界更不敏感, 即在分割后, 得到的每个图像块面积更大, 图像块总数更少, 更改核值前后的分割结果对比如图 5 所示.
  • 初步可以证明小块的图像分割算法不适用于解释目标检测模型.
  1. 使用原始 LIME 方法对目标检测模型进行解释时的另一个问题是: 局部线性回归模型的权重值非常小, 基本处于 10^−2级别, 偶尔有值会大于 0.1. 此问题说明原始 LIME 方法无法从输入图像中找出对目标检测模型决策影响力较大的图像块, 即无法找出有效决策依据.

上述问题可总结为 3 点.
(1) 特征图像块权重整体偏小.
(2) 有效特征数量低.
(3) 原始分割方法泛用性差

4.2 改进 LIME

本节使用 DeepLab 代替原本的图像分割方法, 得到了可用于解释目标检测模型的解释器 (LIME+DeepLab).

4.2.1 问题分析

通过对第 4.1 节中两个问题的研究发现, 图像块的分割大小与 R2权重值变化率之间可能存在某种正相关的联系, 可能与目标检测模型在局部行为的线性程度有关. 因此, 使用原分割算法, 并增大其核值可能是一种方法.

但增大核值本质是使分割算法对分割块的边界更加不敏感, 会导致部分背景与物体无法区分, 从而无法解释目标检测模型的决策依据是物体还是背景.

4.2.2 新的图像分割方法

(1) 能够区分物体与背景;
(2) 能够区分不同的物体;
(3) 尽可能保留每个物体的完整性.
使用语义分割 (semantic segmentation) 模型: DeepLab, 可以满足以上条件. DeepLab 是一种基于深度学习的语义分割模型, 其图像分割结果如图 7 所示.
在这里插入图片描述

4.2.3 替换原始 LIME 的图像分割方法

LIME 解释模型预测的过程如下.
(1) 对输入进行分割;
(2) 对输入进行扰动, 得到数据集;
(3) 训练局部线性回归模型, 得到解释.

  • 本文对原始分割算法的替换非常直接:在第 (1) 步中, 舍弃原有的分割方法,使用 DeepLab V3 模型对输入图片进行分割

5 实验设置

并没有太多细节的介绍,在这也不写太多混淆思路了。
在这里插入图片描述

6 实验结果

在这里插入图片描述
将图片扰动算法改变为 DeepLab 后, 在大物体数据集中进行实验, 得到的局部线性回归模型的 R2 对比结果如表 6 所示. 从表中数据可以发现, 更换分割算法为 DeepLab 后, R2 的平均值达到 0.95, 说明几乎在每一次解释中,产生的线性回归模型都能在局部非常忠实地拟合目标检测模型的行为.
在这里插入图片描述

7 结论与展望

  • 在用 LIME 直接对目标检测模型进行解释时, 发现局部线性回归模型的忠诚度与权重值过小这两个问题. 我们通过实验分析, 揭示了目标检测模型在预测时关注物体整体这一性质, 并将问题的原因定位在图像分割方法不合理. 本文通过将图像分割方法替换为语义分割模型 DeepLab, 并对解释内容作出定义, 成功解决 LIME 存在的问题, 并将其应用于解释目标检测模型. 通过实验证明, 采用 DeepLab+LIME, 可以得到可信度较高且直观的决策依据分析结果.
  • 另一方面, 基于 IoU、模型解释结果、基准决策依据, 本文提出了一种在有标签数据集中评价目标检测模型可信度的方法, 一定程度上填补了目标检测领域模型中, 对模型可信度评价的空白.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/155711.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

(第四章)OpenGL超级宝典学习:必要的数学知识

必要的数学知识 前言 在本章当中,作者着重介绍了几个和3D图形学重要的数学知识,线性代数基础好的同学可以直接绕过本章,说实话这篇博客写到这里,我是非常犹豫的,本章节的内容可以说是很基础,但是相当…

SSM框架01_Spring

有一个效应叫知识诅咒:自己一旦知道了某事,就无法想象这件事在未知者眼中的样子。00-Spring课程介绍01-初识Spring今天所学的Spring其实是Spring家族中的Spring Framework;Spring Fra是Spring家族中其他框架的底层基础,学好Spring可以为其他S…

Morse1题解

原理摩尔斯电码和电报简单说一下电报和摩尔斯电码的原理最简单的电报模型就是一个电源,一个开关和一个电磁铁当需要长距离使用时候,需要用到继电器按下开关,电磁铁会吸引磁铁长按开关,电磁铁就会闭合一段时间,留下一划…

Jenkins集成GitLab Webhooks自动化构建

JenkinsGitLab Webhooks自动构建项目1 构建步骤1.1 Jenkins中设置构建触发器1.2 Build Authorization Token Root插件安装1.3 GitLab配置Webhooks2 测试webhooks2.1 测试推送事件2.2 测试合并请求事件2.3 代码修改提交测试1 构建步骤 1.1 Jenkins中设置构建触发器 这里先随便写…

Markdown与DITA比较

Markdown是一种轻量级标记语言,创始人为John Gruber。它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的HTML文档。这种语言吸收了很多在电子邮件中已有的纯文本标记的特性。由于Markdown的轻量化、易读易写特性,并且对于图片&am…

第一章Mybatis基础操作学习

文章目录MyBatis简介MyBatis历史MyBatis特性和其它持久化层技术对比搭建MyBatis开发环境创建maven工程创建MyBatis的核心配置文件创建mapper接口创建MyBatis的映射文件通过junit测试功能加入log4j日志功能不带参数的增删改查Mapper接口的编写对应Mapper接口的xml文件编写核心配…

【Python基础】如何使用pycharm

1、设置Python 解释器 在任何项目,第一步就是设置Python 解释器,就是那个Python.exe 在File->Setting->Projec: xxx 下找到 Project Interpreter。然后修改为你需要的 Python 解释器。注意这个地方一定要注意的是:在选择 Python 解释…

Dubbo 学习笔记

Dubbo 学习笔记 1.基础知识 1.1 分布式基础理论 1.1.1 什么是分布式系统? 《分布式系统原理与范型》定义: 分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统分布式系统(distributed system&#xf…

java基于ssm蛋糕店蛋糕商城蛋糕系统网站源码

简介 java使用ssm开发的蛋糕商城系统,用户可以注册浏览商品,加入购物车或者直接下单购买,在个人中心管理收货地址和订单,管理员也就是商家登录后台可以发布商品,上下架商品,处理待发货订单等。 演示视频 …

HTML贪吃蛇游戏源码(穿墙)

演示 完整HTML <!DOCTYPE html> <html> <head><meta charset"utf-8"><title><・)))><<</title><link rel"shortcut icon" href"${ctx}/image/snake_eating.png"><meta name"ref…

中科大2006年复试机试题

中科大2006年复试机试题 文章目录中科大2006年复试机试题第一题问题描述解题思路及代码第二题问题描述解题思路及代码第三题问题描述解题思路及代码第四题问题描述解题思路及代码第五题问题描述解题思路及代码第六题问题描述解题思路及代码第一题 问题描述 求矩阵的转置。 给…

three.js入门篇6之 环境贴图、经纬线映射贴图与高动态范围成像HDR

目录013-1 环境贴图013-2 经纬度映射贴图与HDR013-1 环境贴图 就是把周边的环境&#xff0c;贴在物体的表面之上 注意&#xff1a;px&#xff1a;x轴正向&#xff0c;nx&#xff1a;x轴负向 import * as THREE from "three" // console.log(main.js,THREE);// 导入…

06什么是Fabless?什么是IDM?

Fabless是SIC&#xff08;半导体集成电路&#xff09;行业中无生产线设计公司的简称&#xff0c;只搞设计的无晶圆厂半导体公司&#xff0c;生产交给像台积电这样的代工厂去做。 IDM是整合元件制造商&#xff0c;像英特尔这样既设计又制造的就叫IDM&#xff0c;因为规模大&…

对于字节,16进制,2进制, 0xFF,位移的一些杂记

1.普通字符串95 对应的16进制的展示&#xff0c;使用工具查看如下图 下图为普通字符串 下图为95对应的16进制 95对应的16进制字符串为39 35》39代表一个字节 35代表另一个字节 &#xff08;一个字节是由两位16进制字符串组成&#xff0c;比如39或35&#xff09; 1个字节对应…

select for update加了行锁还是表锁?

最近在开发需求的时候&#xff0c;用到了select......for update。在代码评审的时候&#xff0c;一位同事说 &#xff0c;唯一索引一个非索引字段&#xff0c;是否可能会锁全表呢&#xff1f;本文将通过9个实验操作的例子&#xff0c;给大家验证select......for update到底加了…

迁移环境时,忘记私钥证书密码怎么办?

知行之桥的版本在进行不断更新&#xff0c;相较之前的版本而言&#xff0c;知行之桥每一次更新的版本&#xff0c;无论在操作还是功能亦或是便利性上都有更好的优势&#xff0c;因此不少企业会在新版本更新之后果断选择新的版本&#xff0c;企业选择版本更新之后&#xff0c;需…

He3 新版上新

系统功能更新 支持拖动工具&#xff0c;调整位置 支持置顶 支持自定义分类 新增工具 Paseto 生成器 2. 文本分析 JSON 转 PHP&#xff0c;YAML 转 PHP UTF7 编码、UTF7 解码 6. UTM 生成器 CSS 边框圆角生成器 CSV 类转换工具&#xff0c;目前支持 CSV 与 Markdown、HTML、JS…

什么是无代码ITSM工具

拥有强大 ITSM 团队的企业已经能够生存下来&#xff0c;并且在某些情况下在整个大流行期间表现出色。成功的 IT 团队以其在日常运营中断时快速恢复的能力而闻名。 当您需要重新组织服务交付流程时&#xff0c;ITSM 平台可以减少工程工作量&#xff0c;这对于制定弹性 ITSM 战略…

Python学习笔记——元组

Python将不能修改的值称为不可变的&#xff0c;而不可变的列表被称为元组。定义元组元组创建只需要在括号中添加元素&#xff0c;并使用逗号隔开即可。元组使用小括号 ( )&#xff0c;列表使用方括号 [ ]。定义元组后&#xff0c;就可以使用索引来访问其元素&#xff0c;就像访…

ansible作业二

ansible匹配自定义路径清单文件 查看当前匹配的清单文件路径 [rootserver ~]# ansible --version ansible [core 2.13.5]config file /etc/ansible/ansible.cfg --- 默认配置文件configured module search path [/root/.ansible/plugins/modules, /usr/share/ansible/plugin…