RestoreDet

news2024/9/22 15:29:54

来说说低分辨率图像中目标检测吧~~

超分辨率(SR)等图像恢复算法是退化图像中目标检测不可或缺的预处理模块。然而,这些算法中的大多数假设退化是固定的并且是先验已知的。

论文地址:https://arxiv.org/pdf/2201.02314.pdf

当真正的退化未知或与假设不同时,预处理模块和随后的高级任务(如目标检测)都会失败。在这里,研究者提出了一个新的框架,RestoreDet,来检测退化的低分辨率图像中的目标。RestoreDet利用下采样降级作为自监督信号的一种转换,以探索针对各种分辨率和其他降级条件的等变表示。

具体来说,通过编码和解码一对原始和随机退化图像的退化变换来学习这种内在的视觉结构。该框架可以进一步利用具有任意分辨率恢复解码器的高级SR架构来从退化的输入图像重建原始对应关系。表示学习和目标检测都以端到端的训练方式联合优化。RestoreDet是一个通用框架,可以在任何主流目标检测架构上实现。广泛的实验表明,基于CenterNet的框架在面对变质退化情况时与现有方法相比取得了卓越的性能。代码很快就会发布。

由于大规模数据集,高级视觉任务(即图像分类、目标检测和语义分割)取得了巨大成功。这些数据集中的图像主要由具有更高分辨率和信噪比(SNR)的商用相机捕获。在这些高质量图像上进行训练和优化后,高级视觉在低分辨率或低质量图像上的性能会下降。为了提高视觉算法在退化的低分辨率图像上的性能,Dai等人[Is image super-resolution helpful for other vision tasks?]提出了第一个全面的研究,提倡使用超分辨率(SR)算法对图像进行预处理。其他高级任务,如人脸识别、人脸检测、图像分类和语义分割,也受益于恢复模块以提取更多区分特征。

研究者不是在严格假设下使用恢复模块显式增强输入图像,而是利用针对各种分辨率和退化状态的内在等变表示。基于上图所示的编码表示,研究者提出了 RestoreDet,这是一种用于在退化的LR图像中进行目标对象检测的端到端模型。为了捕捉视觉结构的复杂模式,利用下采样退化变换组作为自我监督信号。在训练过程中,通过随机退化变换t从原始HR图像x生成退化的LR图像t(x)。如上图所示,这对图像被送入编码器E以获取其潜在特征E(x)和E(t(x))。

为了训练编码器E学习退化等变表示,研究者首先引入一个变换解码器Dt来表示E(x)和E(t(x))解码应用的退化变换t。如果可以重建转换,则表示应尽可能捕捉它们在不同转换下如何变化的动态。

为了进一步利用快速增长的SR研究的优势,研究者引入了任意分辨率恢复解码器 (ARRD) Dr。ARRD从各种退化的LR图像t(x)的表示E(t(x))重建原始HR数据 x。ARRD Dr将监督编码器E对有助于后续任务的详细图像结构进行编码。基于编码表示E(t(x)),目标检测解码器Do然后执行检测以获取对象的位置和类别。在推理过程中,目标图像直接通过上图中的编码器E和目标检测解码器Do进行检测。与基于预处理模块的方法相比,研究者的推理pipeline计算效率更高。

为了覆盖实际场景中的各种退化,根据实际的下采样退化模型,通过随机抽样变换 t来生成退化的t(x)。如上图所示,变换t由下采样率s、退化核k和如下等式中的噪声水平n表征。

上图(a)是anchor free框架的CenterNet。图(b)说明了如何基于CenterNet实现的RestoreDet。详细的训练过程在Algo.1中给出。在训练RestoreDet时,原始HR图像x和变换后的退化LR图像t(x)被发送到编码器E以对退化等变表示进行编码。在这里,直接使用CenterNet的编码器E,但将其复制到共享权重Siamese结构中,分别接收HR和LR图像。 

实验及可视化

 whaosoft aiot http://143ai.com  

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/67418.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

四、文件管理(三)文件系统

目录 3.1文件系统结构 3.2文件系统布局 3.2.1文件系统在外存中的结构 3.2.2文件系统在内存中的结构 3.3外存空闲空间管理 3.3.1空闲表法 3.3.2空闲链表法 3.3.3位示图法 3.3.4成组链接法 3.4虚拟文件系统 3.5文件系统挂载(mounting) 3.1文件系统结构 从不同的角度出…

柚子是肝病“催化剂”吗?医生:滋养肝细胞,5种水果或可常吃

人体就像是一台大型的机器,五脏六腑就像是机器里的重要组成部分,血管是为五脏六腑输送机油的管道,骨骼是机器的整体框架等,它们彼此之间互相配合,机器才能够正常运转。 如果其中一个构造受损了,那么会影响到…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java散酒营销系统w5at6

对于计算机专业的学生最头疼的就是临近毕业时的毕业设计,对于如何选题,技术选型等这些问题,难道了大部分人,确实,还没毕业的学生对于这些问题还比较陌生,只有学习的理论知识,没有实战经验怎么能独自完成毕业设计这一系列的流程,今天我们就聊聊如何快速应对这一难题. 比较容易的…

第二证券|元宇宙赛道西北首个“吃螃蟹者”入场

元世界展开势头一浪高过一浪之际,地处西北的咸阳高新区也下决心参加这场比赛。 近来,咸阳高新区管委会发布《咸阳高新区元世界工业先行区举动方案》,对行将打出的元世界“先手牌”从多个维度予以规划。 值得关注的是,外界印象中&…

iOS视频流采集概述(AVCaptureSession)

需求:需要采集到视频帧数据从而可以进行一系列处理(如: 裁剪,旋转,美颜,特效....). 所以,必须采集到视频帧数据. 阅读前提: 使用AVFoundation框架 采集音视频帧数据 Overview AVCaptureSession:使用相机或麦克风实时采集音视频…

Java编程实战12:解数独

目录解数独题目示例 1提示解答解题思路完整代码解数独 题目 编写一个程序,通过填充空格来解决数独问题。 数独的解法需 遵循如下规则: 数字 1-9 在每一行只能出现一次。数字 1-9 在每一列只能出现一次。数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能…

1553_AURIX_TC275_CCU寄存器以及模块的独立时钟生成

全部学习汇总: GreyZhang/g_TC275: happy hacking for TC275! (github.com) 这里的BBB时钟应该是前面看到的调试时钟,BBB比较醒目,不过暂且不知道这个缩写是什么词语的缩写。 这个寄存器是CPU0的时钟设置寄存器。我有点好奇,这个寄…

多线程并发、线程池、同步方法、同步代码块(锁)

多线程: 同时执行多个程序 多线程需要硬件支持(cpu) 并行:在同一时刻,有多个指令在多个cpu上同时执行 并发:在同一时刻,有多个指令在单个cpu上交替执行 进程:正在运行的软件 独立…

详解VQVAE:Neural Discrete Representation Learning

VQVAE:Neural Discrete Representation Learning 原文链接:https://arxiv.org/abs/1711.00937 要看细节,强推,直接不用看论文了:VQ-VAE的简明介绍:量子化自编码器 - 科学空间|Scientific Spaces 一、问…

车辆管理怎么做?这六个车辆管理系统能帮到你!

通过本篇文章,您将了解以下问题:1、6个车辆管理系统盘点 2、企业使用车辆管理系统的价值是什么? 车辆管理系统指集合处理用车、还车、维保,监测油耗、车辆状态等车辆管理相关工作为一体的系统。 随着车辆数据的不断增长,如何快速…

武汉大学数据科学导论 WHU-data-science-introduction-996station GitHub鉴赏官

推荐理由:武汉大学数据科学导论 数据科学导论 声明: 本仓库构建目的为提供一个开源的可浏览的代码仓库,用于完成本人作业 代码作业的目录如下,纸质作业也已上传,下载地址 采用MIT协议,以供学习交流 第一次作业 决策树 第二次作业 Apriori k-means naive-bayes 第三次…

毕业设计 基于stm32与openmv的目标跟踪系统

文章目录0 前言课题简介设计框架3 硬件设计4 软件设计对被测物体的识别判断被测物体所在区域5 最后0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年…

Linux 负载均衡介绍之LVS工作模式-NAT转发模式

Linux 负载均衡介绍之LVS工作模式-NAT转发模式 图示: 工作原理: ①.客户端将请求发往前端的负载均衡器,请求报文源地址是CIP(客户端IP),后面统称为CIP),目标地址为VIP(负载均衡器前端地址,后面统称为VIP)。 ②.负载…

RK3568平台开发系列讲解(视频篇)视频渲染OpenGL ES是什么

🚀返回专栏总目录 文章目录 一、什么是OpenGL ES二、上下文环境三、OpenGL(ES)的用途四、OpenGL 渲染管线五、创建显卡执行程序5.1、创建 Shader5.2、创建 Program沉淀、分享、成长,让自己和他人都能有所收获!😄 📢渲染并不单单是要把画面绘制到屏幕上,更多的是需要…

VirtualBox启动问题记录

很久之前安装过的虚拟机,虚拟机文件是安装在移动硬盘上的,最近在做redis集群试验的时候,打算重新使用一下这个虚拟机,在启动的时候出现了一些问题,特此记录一下,便于后面再出现此问题时不知所措。 实体机操…

ChatGPT 这玩意也太猛了!程序员朋友们,我在此严正呼吁大家:端好饭碗,谨防 AI!

大家周二好呀。 最近几天大火的 ChatGPT 你玩了吗? 如果你不知道它是个什么东西,那么我让它给你来个自我介绍: ​说白了,就是一个可以对话的人工智能。 我开始以为就是一个升级版的“小爱同学”,“小度小度”&#x…

第一个MyBatis程序

目录 一、新建项目 二、设置数据库和MyBatis的配置 🍑配置数据库的连接信息 🍑配置MyBatis XML存放位置和命名规则 三、MyBatis实现查询操作 🍎MyBatis的组成 🍎使用MyBatis实现查询功能 🍎SpringBoot单元测…

TF卡格式化了怎么办?tf卡数据恢复,看这3个方法

现在手机存储卡都很普及,TF卡是最常见的存储卡之一。但是你知道吗?TF卡也会有问题,比如出现误删数据,或者把数据格式化。因为手机内存有限,我们经常会把 TF卡设置为默认的最大空间,这样就可能会出现存储空间…

Java: 字符串indexOf() /substring()/replace() 的使用

需要做的: 获取如下图响应信息html页面中的 fec7f1e4-30e0-41d1-9417-bb4829be51dc 值 一.具体思路: (1)字符串查找 indexOf()其实就是在字符串中查找其子串第一次出现的位置,如果没有找到该子串,则返回-1 四种用…

三面“有赞”Java岗斩获offer:Spring+JVM+并发锁+分布式+算法

年末离职,年初为面试也筹备挺长一段时间,找了不少复习资料,刷了很多题在网上投了很多简历最终面试了有赞,还有幸拿到offer! 本人两年Java开发,本科毕业,计算机专业,勤学好问、积极上…