低分辨率图像中目标检测(附论文下载)

news2024/11/16 18:00:59

关注并星标

从此不迷路

计算机视觉研究院

2244b9511876924fc8f78af51693e3b7.gif

e83af6793e903497eab04610edfe7962.gif

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

论文地址:https://arxiv.org/pdf/2201.02314.pdf

计算机视觉研究院专栏

作者:Edison_G

超分辨率(SR)等图像恢复算法是退化图像中目标检测不可或缺的预处理模块。然而,这些算法中的大多数假设退化是固定的并且是先验已知的。

一、前言

当真正的退化未知或与假设不同时,预处理模块和随后的高级任务(如目标检测)都会失败。在这里,研究者提出了一个新的框架,RestoreDet,来检测退化的低分辨率图像中的目标。RestoreDet利用下采样降级作为自监督信号的一种转换,以探索针对各种分辨率和其他降级条件的等变表示。

具体来说,通过编码和解码一对原始和随机退化图像的退化变换来学习这种内在的视觉结构。该框架可以进一步利用具有任意分辨率恢复解码器的高级SR架构来从退化的输入图像重建原始对应关系。表示学习和目标检测都以端到端的训练方式联合优化。RestoreDet是一个通用框架,可以在任何主流目标检测架构上实现。广泛的实验表明,基于CenterNet的框架在面对变质退化情况时与现有方法相比取得了卓越的性能。代码很快就会发布。

二、背景

由于大规模数据集,高级视觉任务(即图像分类、目标检测和语义分割)取得了巨大成功。这些数据集中的图像主要由具有更高分辨率和信噪比(SNR)的商用相机捕获。在这些高质量图像上进行训练和优化后,高级视觉在低分辨率或低质量图像上的性能会下降。为了提高视觉算法在退化的低分辨率图像上的性能,Dai等人[Is image super-resolution helpful for other vision tasks?]提出了第一个全面的研究,提倡使用超分辨率(SR)算法对图像进行预处理。其他高级任务,如人脸识别、人脸检测、图像分类和语义分割,也受益于恢复模块以提取更多区分特征。

三、新框架分析

e67f785cb84048e081d0dd5c080df850.png

研究者不是在严格假设下使用恢复模块显式增强输入图像,而是利用针对各种分辨率和退化状态的内在等变表示。基于上图所示的编码表示,研究者提出了 RestoreDet,这是一种用于在退化的LR图像中进行目标对象检测的端到端模型。为了捕捉视觉结构的复杂模式,利用下采样退化变换组作为自我监督信号。在训练过程中,通过随机退化变换t从原始HR图像x生成退化的LR图像t(x)。如上图所示,这对图像被送入编码器E以获取其潜在特征E(x)和E(t(x))。

为了训练编码器E学习退化等变表示,研究者首先引入一个变换解码器Dt来表示E(x)和E(t(x))解码应用的退化变换t。如果可以重建转换,则表示应尽可能捕捉它们在不同转换下如何变化的动态。

为了进一步利用快速增长的SR研究的优势,研究者引入了任意分辨率恢复解码器 (ARRD) Dr。ARRD从各种退化的LR图像t(x)的表示E(t(x))重建原始HR数据 x。ARRD Dr将监督编码器E对有助于后续任务的详细图像结构进行编码。基于编码表示E(t(x)),目标检测解码器Do然后执行检测以获取对象的位置和类别。在推理过程中,目标图像直接通过上图中的编码器E和目标检测解码器Do进行检测。与基于预处理模块的方法相比,研究者的推理pipeline计算效率更高。

为了覆盖实际场景中的各种退化,根据实际的下采样退化模型,通过随机抽样变换 t来生成退化的t(x)。如上图所示,变换t由下采样率s、退化核k和如下等式中的噪声水平n表征。

6229ff75fe2f7eeee0f075314eeffd0d.png

d85c2dc51c8bef86a8d99884eb7dc061.png

上图(a)是anchor free框架的CenterNet。图(b)说明了如何基于CenterNet实现的RestoreDet。详细的训练过程在Algo.1中给出。在训练RestoreDet时,原始HR图像x和变换后的退化LR图像t(x)被发送到编码器E以对退化等变表示进行编码。在这里,直接使用CenterNet的编码器E,但将其复制到共享权重Siamese结构中,分别接收HR和LR图像。

Algo.1

5e421283f13ce66100d282822364edae.png

四、实验及可视化

MS COCO 和KITTI数据集上性能比较

9679f0c931114df789ed996c99c2334b.png

57b0f1fdb291f333d81cbb9e667f3ce5.png

(a)/(b) is CenterNet trained on normal images and tested on normal/degraded down4 testset, (c)/(d)/(e) is CenterNet tested on the degraded image restored by individual SR algorithm RRDB/RealSR/BSRGan. (f) is the detection result of our RestoreDet and we use the output of ARRD Dr as background images.

© The Ending

转载请联系本公众号获得授权

6eddfb64319d6917227053f077824915.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

b461356fcfa6c28cb7c2d7209ed90f66.jpeg

扫码关注

计算机视觉研究院

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

 往期推荐 

🔗

  • Yolo-Z:改进的YOLOv5用于小目标检测(附原论文下载)

  • 零样本目标检测:鲁棒的区域特征合成器用于目标检测(附论文下载)

  • 目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)

  • 利用先进技术保家卫国:深度学习进行小目标检测(适合初学者入门)

  • 用于精确目标检测的多网格冗余边界框标注

  • 华为诺亚方舟实验室品:加法神经网络在目标检测中的实验研究

  • 多尺度特征融合:为检测学习更好的语义信息(附论文下载)

  • 利用TRansformer进行端到端的目标检测及跟踪(附源代码)

  • 目标检测:用图特征金字塔提升精度(附论文下载)

  • 人脸专集1 | 级联卷积神经网络用于人脸检测

  • 人脸专集知识巩固2 | 人脸关键点检测汇总(文末有相关文章链接)

  • 纯干货:Box Size置信度偏差会损害目标检测器(附源代码)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/711936.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Openvino03】深入了解OpenVINO™ 工具包与Jupyter Notebooks工程

接上一篇,本篇将以OpenVINO™ 工具包、Jupyter Notebook工具以及OpenVINO™ Notebooks工程为基础,依照构建环境、工具学习、案例学习、实战部署的顺序引导初学者完成从0到1学习人工智能的全过程,希望众多对人工智能感兴趣的开发者&#xff0c…

【多维BFS】ABC308 D

VP的时候居然花了半小时! 可恶! D - Snuke Maze (atcoder.jp) 题意: 思路: 首先,我们发现到达一个格子之后,下一个格子的字符是确定的 但是,下一个格子到底是哪个是不确定的 下一个格子不…

FreeRTOS源码解析——第一章 整体架构

FreeRTOS源码解析 第一章 FreeRTOS 整体架构 第二章 FreeRTOS 编程规范 第三章 FreeRTOS 内存管理 第四章 FreeRTOS 任务管理 第五章 FreeRTOS 消息队列 第六章 FreeRTOS 软件定时器 第七章 FreeRTOS 信号量 第八章 FreeRTOS 互斥量 第九章 FreeRTOS 任务通知 第十章 FreeRTOS…

算法习题之宏观分层问题

宏观分层 习题1 给定一个正方形矩阵matrix,原地调整成顺时针90度转动的样子习题2 给定一个长方形矩阵matrix,实现转圈打印习题3 给定一个正方形或者长方形矩阵matrix,实现zigzag打印习题4 输入N,在控制台上输出初始边长为N的图案 习题1 给定一…

U盘数据丢失是什么原因?轻松让U盘数据恢复的教程

在数字化时代,我们不可避免地使用各种便携式存储设备,如U盘,来传输和存储重要数据。然而,有时我们可能不小心删除了U盘中的文件,或者格式化了U盘等等而导致数据丢失。这种情况下,你可能会困惑地想知道&…

机器学习——基于Tensorflow和Keras实现卷积神经网络CNN——猫狗分类

文章目录 环境的配置神经网络CNN的介绍卷积前馈神经网络卷积神经网络应用邻域 数据集准备数据预处理构建基准模型 总结什么是过拟合(overfit)?什么是数据增强?单独制作数据增强,精确率提高了多少? 然后再添…

硬件大熊原创合集(2023/06更新)

06月份更新篇章: 一款射频芯片的layout设计指导案例-篇章1 一款射频芯片的layout设计指导案例-篇章2 警惕超声波工艺对晶振造成损伤 走嵌入式方向,一定要软硬件都懂吗? 6月份广州光亚展,和电子电力大咖文老师见了个面,…

2023车载摄像头9大热点趋势

摘要: 相较于消费类电子摄像头,车载摄像头的工作环境极度恶劣,比如说震动、高温、雨雾、低温、光线变化剧烈等。而车载摄像头以驾驶安全为目的,上述各个工作状态下,均需要能获取稳定、可靠、清晰的周边环境数据。 近年…

HOT36-二叉树的中序遍历

leetcode原题链接:二叉树的中序遍历 题目描述 给定一个二叉树的根节点 root ,返回 它的 中序 遍历 。 示例 1: 输入:root [1,null,2,3] 输出:[1,3,2]示例 2: 输入:root [] 输出&#xff1a…

BUUCTF藏藏藏

也是一个图片文件,和一个txt文件 txt文件中是一个提交flag格式,没啥用 拿去010打开后发现可能存在隐藏文件 这个格式说明还有解压文件吧,但是为啥分离不出来呢 刚好有另外一个分离文件的软件foremost 解压后打开在zip文件下有一个福利docx文件…

【零基础入门学习Python---Python网络编程保姆级教程】

🚀 Python 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

GDB寻找segmentation fault位置

一、在当前文件夹下生成指定二进制文件的core文件 查看允许core文件空间大小: ulimit -c修改core文件空间为无限大: ulimit -c unlimited让core文件生成在当前目录下: sudo bash -c echo core.%e.%p > /proc/sys/kernel/core_pattern再…

2023黑马头条.微服务项目.跟学笔记(二)

2023黑马头条.微服务项目.跟学笔记 二 app端文章查看,静态化freemarker,分布式文件系统minIO今日简介学习内容1.文章列表加载1.1 需求分析1.2 表结构分析思考:表的垂直拆分 1.3 导入文章数据库1.3.1 导入数据库1.3.2 导入对应的实体类总结 1.4 实现思路1.4.1 sql练习…

hippo - 提升我们团队工程效率的工具

1. 背景 我们 shopeepay 团队是一个比较大的前端团队(80成员),团队内部分布着 react native、javascript npm包、react component npm包、serverless、普通的react工程等多种类型的项目,每种项目类型中的每个项目都有它们自己的配…

Windows 使用Git使用Gitee仓库

1.本地创建文件夹。图中例子,我在桌面创建了文件夹。 2.打开 Git Bash Here. 3.Git Bash 的部分指令。 ls 查看当前文件夹 mkdir gittest01 创建文件夹 cd gittest01 进入文件夹 git init 创建本地仓库 git config --global user.name"chengqian" 创建者…

Redis主从复制模式的2

搭建完后可以去测试一下这几个问题: 1.主机中的数据会复制到从节点中 2.主机中新增的数据会同步到从节点中 3.redis集群后,从节点只能读(slave),主节点可以写(master) 4.主机重启后还是主节点 5.从机重启后也会变成主节点 血脉相传 一个主机master理论上可以有多个从机slave…

抖音短视频矩阵号系统开发者开源部署分享(一)

抖音是一款备受欢迎的短视频APP,拥有数亿的用户,其中包括了大量的粉丝。为了让更多的人能够发现和观看到你的视频,抖音SEO是必不可少的一环,特别是对于拥有企业或个人品牌的用户来说。在这个过程中,抖音SEO源码的开源部…

【前端工程化】比gzip压缩更优的br压缩

🐱 个人主页:不叫猫先生,公众号:前端舵手 🙋‍♂️ 作者简介:2022年度博客之星前端领域TOP 2,前端领域优质作者、阿里云专家博主,专注于前端各领域技术,共同学习共同进步…

2.4g无线芯片G350产品介绍

G350是一款2.4GHz的无线收发芯片,具有低成本和高集成度的特点。它集成了发射机、接收机、频率综合器和GFSK调制解调器,为无线通信系统提供了完整的解决方案。 该芯片采用了低功耗设计,在各个环节都降低功耗以提高电池使用寿命。即使在最低电流…

STM32 Proteus UCOSII系统简易时钟计时系统-0054

STM32 Proteus UCOSII系统简易时钟计时系统-0054 Proteus仿真小实验: STM32 Proteus UCOSII系统简易时钟计时系统-0054 功能: 硬件组成:STM32F103R6单片机 LCD1602显示器 1.单片机程序使用UCOSII操作系统,显示任务、时间计算任…