CV——day74 读论文:关注前景的anchor-free交通场景探测器

news2025/1/11 7:53:05

FII-CenterNet:关注前景的anchor-free交通场景探测器

  • FII-CenterNet
  • I. INTRODUCTION
  • II. RELATED WORK
    • C. Detectors Exploiting Segmentation Information
  • III. FII-CENTERNET APPROACH
    • A. 前景区域建议网络(Foreground Region Proposal Network)
      • 1) 上分支提出前景区域
      • 2) 自分支提出前景区域
    • B. 损失函数(Loss Function)
    • C. 前景分割标签生成(Foreground Segmentation Label Generation)
    • D. 中景(Midground)
    • E. 前景尺度信息介绍(Introduction of Foreground Scale Information)
  • V. CONCLUSION

FII-CenterNet

An Anchor-Free Detector With Foreground Attention for Traffic Object Detection

FII-CenterNet:关注前景的anchor-free交通场景探测器

I. INTRODUCTION

anchor-based模型:它们的检测性能很大程度上依赖于锚点的超参数,如锚点的大小、长宽比和数量。由于仍然没有有效的方法来自主地调整这些超参数,所以它们必须逐个地被手动校准。针对这一问题,人们提出了无锚方法来提高探测器的灵活性,并得到了广泛的关注。

因此我们提出了一种新的无锚方法,通过引入前景信息到中心网络,叫做Foreground Information Introduction CenterNet (FII-CenterNet)

方法如图1所示:该方法提出了基于语义分割的交通场景前景区域,并将前景信息引入到交通目标检测中

image-20230210154125519

综上所述,本文的主要贡献如下:

  • 针对无锚点检测器,提出了一种基于语义分割的前景区域建议方法。

  • 引入中景作为前景与背景的过渡区域,提供了丰富的目标边缘信息。

  • 在回归过程中引入前景尺度信息,可以提高交通对象的尺度预测性能。

  • 我们的方法在两个公共数据集KITTI和PASCAL VOC上进行了评估。大量的实验结果表明,FII-CenterNet有效地提高了交通目标检测的性能,在准确率和效率上都达到了最佳水平。

II. RELATED WORK

这一节还是挑没见过的看,A,B是关于Anchor-Based和Anchor-Free探测器的介绍,自行了解。

C. Detectors Exploiting Segmentation Information

语义分割是另一个重要的计算机视觉任务,广泛应用于ITS(智慧交通系统)中,如道路检测。我们的前景区域建议方法基于此。

我们使用语义分割特征来获得前景区域信息。位置信息用于生成前景区域特征图,尺度信息用于回归任务。

III. FII-CENTERNET APPROACH

特征提取:FII-CenterNet使用CenterNet中修改的DLA-34提取特征,在DLA上的具体修改:在每个上采样层用3 × 3可变形卷积替换原始卷积。

**网络模型:图2 FII-CenterNet,**如下所示:

**FII-CenterNet:**前景信息引入CenterNet进行交通目标检测。方框中的数字表示到图像的步幅。在CenterNet中使用改进的DLA-34进行特征提取。它使用可变形卷积来改变通道,并使用转置卷积来对特征图进行上采样。

我们用蓝色虚线箭头表示可变形卷积,用橙子虚线箭头表示这两个步骤。黑色虚线箭头表示没有向后传播的传播。

**前景区域建议网络:**旨在估计前景区域。由DLA-34提取的特征图生成前景特征图。在数学上,设FM为特征图,FFM为前景特征图。
F F M = F M ⊙ F FFM=FM⊙F FFM=FMF
其中,F是前景区域建议结果,并且⊙是逐元素乘法。

在推理时,热图(heatmap)中值不小于其8连通邻居的前100个峰值被保持为中心点预测。

在回归过程中产生一个尺度预测图 S 和局部偏移量 O
尺度预测图 S : S ∈ R ( W / R ) × ( H / R ) × 2 , 中心点为 p k , S k = ( w k , h k ) 是中心点 p k 物体的宽高 尺度预测图S:S ∈ R^{(W/R) × (H/R) ×2},中心点为p_k,Sk =(wk,hk)是中心点p_k物体的宽高 尺度预测图S:SR(W/R)×(H/R)×2,中心点为pk,Sk=(wk,hk)是中心点pk物体的宽高

局部偏移 O ∈ R ( W / R ) × ( H / R ) × 2 , 中心点为 p k , O k = ( δ k x , δ k y ) 局部偏移O∈ R^{(W/R) × (H/R) ×2},中心点为p_k,O_k =(δ_{kx},δ_{ky} ) 局部偏移OR(W/R)×(H/R)×2,中心点为pk,Ok=(δkx,δky)

最终的检测结果被描述为边界框:
对于中心点 p k ,对应的边界框是( x k 1 , y k 1 , x k 2 , y k 2 ),其利用 p k 和 S k 来解码 对于中心点p_k,对应的边界框是(x_{k1},y_{k1},x_{k2},y_{k2}),其利用p_k和S_k来解码 对于中心点pk,对应的边界框是(xk1yk1xk2yk2),其利用pkSk来解码
image-20230210161341175

以下各小节的组织方式如下。

  • 首先,我们在A节中提出前景区域建议网路。
  • 其次,描述了网络的训练方法。损失函数和前景分割标签生成方法分别在B和C节中描述。框诱导标记会丢失物体的一些边缘信息。
  • 因此,我们在D节中提出了中景的概念。
  • 在E节中,我们将尺度信息引入到回归网络中,以充分利用前景信息。训练图见图3:

image-20230210155023199

FII-CenterNet训练图。损失函数可以分为四个部分。Lf是前景区域建议网络的损失;Lp为中心点预测网络的损失;Ls为规模预测网络的损失;Lo是偏移预测网络的损耗。

A. 前景区域建议网络(Foreground Region Proposal Network)

为了实现基于语义分割的前景区域建议,有两种可行的实现方法:

  1. 上分支提出前景区域(Foreground Region Proposal by up Branch)

  2. 自分支提出前景区域(Foreground Region Proposal by self Branch)

1) 上分支提出前景区域

在该方法中,前景区域建议是基于编码器的结果,如分支在图2所示。它通过一个附加分支执行上采样操作,并使用多次连续卷积获得的结果提出前景区域。在上分支中,使用可变形卷积来改变通道,并且使用转置卷积来对特征图进行上采样。编码器-解码器结构是语义分割网络中常用的结构。

2) 自分支提出前景区域

该方法基于特征图直接执行进一步的卷积运算,如自我分支在图2所示。它直接利用提取的特征图谱,并进一步分析和处理。前景区域建议是通过多个连续旋转获得。

B. 损失函数(Loss Function)

损失函数可分为四部分:

(a)Lf是前景区域建议网络的损失;

image-20230210162612914

(B)Lp是中心点预测网络的损失;

image-20230210162633772

(c)Ls为规模预测网络的损失;

image-20230210162642630

(d)Lo是偏移预测网络的损失。

image-20230210162652304

对于Lf和Lp,使用修改的焦点损失

总损失函数为:
L = λ f L f + λ p L p + λ s L s + λ o L o L = λ_fL_f + λ_pL_p + λ_sL_s + λ_oL_o L=λfLf+λpLp+λsLs+λoLo
其中λf、λp、λs和λo是四个部分对应的损失权重。

C. 前景分割标签生成(Foreground Segmentation Label Generation)

生成前景分割标签来训练前景区域建议网络,这是一种框诱导的分割标注。

**分割标签生成示意图:**分割标签从边界框标签生成。右上角是前景标签的生成。标签中引入了中景,如右下角所示。

image-20230210164130853

D. 中景(Midground)

值得注意的是,两阶段检测器的RPN中的一些区域既不被分类为前景也不被分类为背景。Faster R-CNN 中的锚根据与任何地面实况对象的重叠进行标记。

image-20230210164025964

中景区域定义为前景区域外的环形区域,如图5所示。在生成分割标签时,中景区域的像素被设置为0.5。

image-20230210164108343

E. 前景尺度信息介绍(Introduction of Foreground Scale Information)

位置信息只是前景信息的一部分。值得注意的是,由于前景区域建议网络是基于类别的,因此每个类别的建议实际上包含了对象的尺度信息。在回归过程中引入前景尺度信息可以辅助尺度预测。因此,不同类别下的前景区域建议与FII-CenterNet中的前景特征图连接作为回归的输入。

V. CONCLUSION

综上所述,为了提高无锚点检测器在交通目标检测中的性能,提出了FII-CenterNet算法,该算法引入前景信息以消除交通场景中复杂背景信息的干扰。前景区域建议网络基于语义分割,其由从边界框标签生成的分割标签监督。引入中景作为前景与背景的过渡,可以提供丰富的目标边缘信息。由于引入了前景位置和尺度信息,有效地提高了检测精度,在KITTI验证集上的实验结果验证了这一点。KITTI基准测试和PASCAL VOC 2007测试结果表明,FII-CenterNet在准确性和效率方面都达到了最先进的水平。

为了以后的研究,可以在网络中加入分割分支来处理交通对象的分割任务,这可以简单地在前景区域的基础上提出。此外,检测结果可以进一步用于其他ITS应用,例如交通拥堵检测

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/336416.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux称手的终端管理器Zsh(Z shell)-图文安装超详细

linux默认的shell太low了,iTerm2在macOS系统简直堪称终端管理神器,有一款可以平替iTem2的linux开源软件 Zsh(Z shell) ,Zsh 是一个为交互使用而设计的 shell 一:安装Zsh 1.yum安装zsh yum install zsh安装…

频谱分析仪测量噪声系数方法介绍

用频谱仪测量噪声系数:测量框图为:基于噪声系数的定义得到的一个测量公式为:NFPNOUT-(-174dBm/Hz20lg(BW)Gain)(1)公式中,PNOUT是已测的总共输出噪声功率,-174dBm/Hz是290oK(室温)时环境噪声的功…

视频号小店新订单如何实时同步企业微信

随着直播带货的火热,视频号小店也为商家提供商品信息服务、商品交易,支持商家在视频号运营电商,许多企业也将产品的零售路径渗透至视频号小店中了。如果我们希望在视频号小店接收到订单后,能尽快及时发货,给用户较好的…

filter属性详解

filter属性详解 filter 属性定义了元素(通常是<img>)的可视效果(例如&#xff1a;模糊与饱和度)。 filter: none | blur() | brightness() | contrast() | drop-shadow() | grayscale() | hue-rotate() | invert() | opacity() | saturate() | sepia() | url();下面运用…

【金三银四系列】Spring面试题-上(2023版)

Spring面试专题 1.Spring应该很熟悉吧&#xff1f;来介绍下你的Spring的理解 有些同学可能会抢答&#xff0c;不熟悉!!! 好了&#xff0c;不开玩笑&#xff0c;面对这个问题我们应该怎么来回答呢&#xff1f;我们给大家梳理这个几个维度来回答 1.1 Spring的发展历程 先介绍…

由 GPT 驱动的沙盒,尽情发挥想象力! #NovelAI

一个由 GPT 驱动的沙盒&#xff0c;供用户尽情发挥想象力的空间&#xff0c;会获得怎样的体验&#xff1f;NovelAI NovelAI 是一项用于 AI 辅助创作、讲故事、虚拟陪伴的工具。NovelAI 的人工智能算法会根据用户的方式创建类似人类的写作&#xff0c;使任何人&#xff0c;无论能…

《爆肝整理》保姆级系列教程python接口自动化(十一)--发送post【data】(详解

简介  前面登录的是传 json 参数&#xff0c;由于其登录机制的改变没办法演示&#xff0c;然而在工作中有些登录不是传 json 的&#xff0c;如 jenkins 的登录&#xff0c;这里小编就以jenkins 登录为案例&#xff0c;传 data 参数&#xff0c;给各位童鞋详细演练一下。 一、…

【操作系统】操作系统IO和虚拟文件系统VFS

1.什么是操作系统的IO 输入&#xff08;input&#xff09;和输出&#xff08;output&#xff09;&#xff0c;就是对磁盘的读&#xff08;read&#xff09;和写&#xff08;write&#xff09;。 I/O模式可以划分为本地IO模型&#xff08;内存、磁盘&#xff09;和网络IO模型。…

测试的阶段性小小总结

转眼入职2年之余&#xff0c;毕业后就投入测试行业。在日常的工作中也有自己的一些思考和总结。2021到2023是多变的两年&#xff0c;加入教培行业&#xff0c;受双减政策影响&#xff0c;注定艰难。参与了各种类型的测试项目&#xff0c;不断在探索和前行&#xff0c;万变不离其…

C++ —— 多态

目录 1.多态的概念 2.多态的定义及实现 2.1构成多态的两个硬性条件 2.2虚函数的重写 2.3override和final 3.抽象类 3.1接口继承和实现继承 4.多态原理 4.1虚函数表 4.2原理 4.3静态绑定和动态绑定 5.单继承和多继承体系的虚函数表 5.1单继承体系的虚函数表 5.2多继…

【MyBatis】第七篇:动态sql

mybatis中的动态sql&#xff0c;其实就是在mybatis中映射配置文件中通过if等判断语句写sql。现在聊一下&#xff0c;常用的的判断语句。 前面准备&#xff1a; CREATE TABLE student (sid int DEFAULT NULL,sname varchar(10) CHARACTER SET utf8mb3 COLLATE utf8mb3_general…

2023年深圳/东莞/惠州CPDA数据分析师认证报名入口

CPDA数据分析师认证是中国大数据领域有一定权威度的中高端人才认证&#xff0c;它不仅是中国较早大数据专业技术人才认证、更是中国大数据时代先行者&#xff0c;具有广泛的社会认知度和权威性。 无论是地方政府引进人才、公务员报考、各大企业选聘人才&#xff0c;还是招投标加…

计算机网络-传输层

文章目录前言概述用户数据报协议 UDP(User Datagram Protocol)传输控制协议 TCP(Transmission Control Protocol)TCP 的流量控制拥塞控制方法TCP 的运输连接管理TCP 的有限状态机总结前言 本博客仅做学习笔记&#xff0c;如有侵权&#xff0c;联系后即刻更改 科普&#xff1a…

LeetCode经典问题总结笔记—一文搞懂滑动窗口和哈希表结合使用之3. 无重复字符的最长子串问题(第一篇)

今日主要总结一下可以使用滑动窗口和哈希表结合使用解决的一道题目&#xff0c;3. 无重复字符的最长子串 题目&#xff1a;3. 无重复字符的最长子串 Leetcode题目地址 题目描述&#xff1a; 给定一个字符串 s &#xff0c;请你找出其中不含有重复字符的 最长子串 的长度。 示…

华尔街分析师:斗鱼2023财年前景暗淡,但盈利能力有望提升

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 华尔街预计斗鱼2023财年收入前景悲观 根据S&P Capital IQ的一致性数据&#xff0c;华尔街卖方分析师预计&#xff0c;斗鱼&#xff08;DOYU&#xff09;的收入将从2022财年的71.93亿元下降到2023财年的67.53亿元&#x…

react -- Context

使用Context简单传参例子 解决父子组件多层嵌套传参&#xff0c;中间不用通过props传值 import React, { useContext } from "react"; // 参数对象 const param { title: "星期四" }; // 创建一个 Context 对象 // const MyContext React.createContex…

基于matlab使用机器学习和深度学习进行雷达目标分类

一、前言此示例展示了如何使用机器学习和深度学习方法对雷达回波进行分类。机器学习方法使用小波散射特征提取与支持向量机相结合。此外&#xff0c;还说明了两种深度学习方法&#xff1a;使用SqueezeNet的迁移学习和长短期记忆&#xff08;LSTM&#xff09;递归神经网络。请注…

【快排与归并排序算法】

作者&#xff1a;指针不指南吗 专栏&#xff1a;算法篇 &#x1f43e;或许会很慢&#xff0c;但是不可以停下&#x1f43e; 文章目录一、快速排序 ( Quick Sort )二、归并排序 ( Merge Sort )总结一、快速排序 ( Quick Sort ) 1.思路 找出一个分界点&#xff0c;随机的调整区间…

openmmlab 语义分割算法基础

本文是openmmlab AI实战营的第六次课程的笔记&#xff0c;以下是我比较关注的部分。简要介绍语义分割&#xff1a;如下图&#xff0c;左边原图&#xff0c;右边语义分割图&#xff0c;对每个像数进行分类应用语义分割在个各种场景下都非常重要&#xff0c;特别是在自动驾驶和医…

【docker知识】联合文件系统(unionFS)原理

一、说明 Docker CLI 操作起来比较简单——您只需掌握Create、Run、InspPull和Push容器和图像&#xff0c;但是谁想过Docker 背后的内部机制是如何工作的&#xff1f;在这个简单的表象背后隐藏着许多很酷的技术&#xff0c; UnionFS&#xff08;统一文件系统&#xff09;就是其…