文献阅读 Meta-SR: A Magnification-Arbitrary Network for Super-Resolution

news2024/12/27 0:52:14

题目

Meta-SR: A Magnification-Arbitrary Network for Super-Resolution
Meta-SR: 用于超分辨率的任何放大网络

摘要

由于DCNN的发展,最近关于超分辨率的研究取得了巨大成功。然而,任意比例因子的超分辨率长期以来一直被忽视。以往的研究者大多将不同比例因子的超分辨率视为独立的任务。他们为计算效率低下的每个比例因子训练一个特定的模型,而之前的工作只考虑了几个整数比例因子的超分辨率。在这项工作中,我们提出了一种称为Meta-SR的新方法,首先用单个模型解决任意比例因子(包括非整数)的超分辨率问题。在我们的Meta-SR中,提出了Meta-Upscale Module 来取代传统的upscale模块。对于任意比例因子,Meta-Upscale Module 通过将比例因子作为输入动态预测放大过滤器的权重,并使用这些权重生成任意大小的HR图像。对于任何低分辨率图像,我们的Meta-SR可以仅使用单个模型以任意比例因子连续放大图像。
我们通过对广泛使用的单图像超分辨率基准数据集进行大量实验来评估所提出的方法。实验结果显示了我们的Meta-Upscale的优越性。

引言

能否使用单一模型解决任意比例因子的超分辨率是一个重要的问题。然而,现有的大多数超分辨率方法仅考虑某些特定整数比例因子( × 2 , × 3 , × 4 ) \times 2, \times 3, \times 4) ×2,×3,×4的超分辨率。这些方法将不同比例因子的超分辨率视为独立的任务。
例如,ESPCN、EDSR、RDN这些方法使用亚像素放大网络末端的特征图卷积。不幸的是,这些方法必须为每个比例因子设计一个特定的放大模块。每个放大模块只能以固定的整数比例因子,并且亚像素卷积仅适用于整数比例因子。这些缺点限制了超分辨率方法在真实场景中的使用。
受元学习的启发,我们提出了一个网络来动态预定义每个比例因子的过滤器权重。因此,我们不再需要为每个比例因子存储权重。与存储每个比例因子的权重相比,存储小权重网络预测网络更方便。

方法

在这里插入图片描述

Meta-Upscale 规范

I S R \mathbf{I}^{SR} ISR 为重建后的图像, F L R \mathbf{F}^{LR} FLR 表示特征学习模块提取到的特征,假设比例因子为 r r r。对于SR图像上的每个像素 ( i , j ) (i, j) (i,j),我们认为它是由LR图像上像素 ( i ′ , j ′ ) (i',j') (i,j) 的特征和相应滤波器的权重决定的。从这个角度看,放大模块可以看作是映射 I S R \mathbf{I}^{SR} ISR F L R \mathbf{F}^{LR} FLR。首先,放大模块应该将像素 ( i , j ) (i, j) (i,j) 映射到像素 ( i ′ , j ′ ) (i', j') (i,j)。然后,放大模板需要一个特定的滤波器来映射像素 ( i ′ , j ′ ) (i', j') (i,j) 的特征,从而生成这个像素 ( i , j ) (i, j) (i,j) 的值。数学描述为:
I S R = Φ ( F L R ( i ′ , j ′ ) , W ( i , j ) ) \mathbf{I}^{SR} = \Phi(\mathbf{F}^{LR}(i', j'), \mathbf{W}(i, j)) ISR=Φ(FLR(i,j),W(i,j))
由于SR图像上的每个像素对应一个滤波器。对于不同的比例因子,滤波器的数量和滤波器的权重都与另一个比例因子不同。为了解决单一模型对任意比例因子的超分辨率,我们提出了Meta-Upscale Module,根据比例因子和坐标信息动态预测权重 W ( i , j ) \mathbf{W}(i, j) W(i,j)
对于Meta-Upscale Module,有三个重要的功能。即Location Projection 位置投影、Weight prediction 权重预测和 Feature Mapping 特征映射。如图所示:在这里插入图片描述
Location Projection 将像素投影到LR图像上; Weight Prediction 为SR图像上的每个像素预测滤波器的权重;最后,Feature Mapping 函数将LR图像上特征与预测的权重映射回SR图像,计算像素值。

Location Projection:对于SR图像上的每个像素点 ( i , j ) (i, j) (i,j),位置投影就是找到LR图像上的 ( i ′ , j ′ ) (i', j') (i,j)。我们认为像素 ( i , j ) (i, j) (i,j)的值是由LR图像上的 ( i ′ , j ′ ) (i', j') (i,j)的特征决定的。我们使用以下投影算子来映射这两个像素:
( i ′ , j ′ ) = T ( i , j ) = ( ⌊ i r ⌋ , ⌊ j r ⌋ ) (i', j') = T(i, j) = (\lfloor \frac ir \rfloor, \lfloor \frac jr \rfloor) (i,j)=T(i,j)=(⌊ri,rj⌋)
位置投影可以看作是一种可变分数步长机制,他可以使用任意比例因子放大特征图。如上图所示,如果比例因子为 2 2 2,则每个像素点 ( i ′ , j ′ ) (i', j') (i,j) 确定两个点。但是如果比例因子是非整数,比如 r = 1.5 r=1.5 r=1.5,则有的像素决定2个像素,有的像素决定1个像素。对于SR图像上的每个像素 ( i , j ) (i, j) (i,j),我们可以在LR图像上找到一个唯一的像素 ( i ′ , j ′ ) (i', j') (i,j),我们认为这两个像素最相关。

Weight Prediction:对于典型的放大模块,它预先定义了每个比例因子的过滤器数量,并从训练集中学习 W \mathbf{W} W。不同的是,我们的Meta-Upscale Module 使用网络来预测过滤器的权重,公式化为:
W ( i , j ) = φ ( v i j ; θ ) \mathbf{W}(i, j) = \varphi(\mathbf{v}_{ij};\theta) W(i,j)=φ(vij;θ)
对于像素 ( i , j ) (i, j) (i,j) φ ( . ) \varphi(.) φ(.)输入,适当的选择是相当于 ( i ′ , j ′ ) (i',j') (i,j)的偏移量:
v i j = ( i r − ⌊ i r ⌋ , j r − ⌊ j r ⌋ ) \mathbf{v}_{ij}=(\frac ir -\lfloor \frac ir \rfloor, \frac jr - \lfloor \frac jr \rfloor) vij=(riri,rjrj⌋)
为了一起训练多个比例因子,最好将比例因子加到 v i j \mathbf{v}_{ij} vij中以区分不同比例因子的权重。例如,如果我们想用比例因子2和4对图像进行放大,我们将它们分别表示为 I 2 S R I_{2}^{SR} I2SR I 4 S R I_{4}^{SR} I4SR I 2 S R I_{2}^{SR} I2SR上的像素 ( i , j ) (i, j) (i,j) I 4 S R I_{4}^{SR} I4SR上的像素 ( 2 i , 2 j ) (2i, 2j) (2i,2j)具有相同的滤波器权重和相同的投影坐标。这意味着 I 2 S R I_{2}^{SR} I2SR I 4 S R I_{4}^{SR} I4SR的子图像。它会影响性能。因此我们将 v i j \mathbf{v}_{ij} vij重新定义为:
$$ v i j = ( i r − ⌊ i r ⌋ , j r − ⌊ j r ⌋ , 1 r ) \mathbf{v}_{ij}=(\frac ir -\lfloor \frac ir \rfloor, \frac jr - \lfloor \frac jr \rfloor, \frac 1r) vij=(riri,rjrj,r1)

Feature Mapping:我们从 F L R \mathbf{F}^{LR} FLR 中提取LR图像上的 ( i ′ , j ′ ) (i', j') (i,j)的特征。我们用权重预测网络预测过滤器权重。我们需要做的最后一件事是将特征映射到SR图像上的像素值。我们选择矩阵积作为特征映射函数,如下:
Φ ( F L R ( i ′ , j ′ ) , W ( i , j ) ) = F L R ( i ′ , j ′ ) W ( i , j ) \Phi(\mathbf{F}^{LR}(i', j'),\mathbf{W}(i,j)) = \mathbf{F}^{LR}(i', j')\mathbf{W}(i, j) Φ(FLR(i,j),W(i,j))=FLR(i,j)W(i,j)

在这里插入图片描述

实验效果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/493052.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Stable-Diffusion AI画画本地搭建详细步骤

ChatGPT出来后,第一次感觉到人工智能真的可能要来了,因此也顺便尝试了下开源AI画画的搭建。网络上写的教程总是不那么面面俱到,因此本文参考了3篇文章才成功把Stable-Diffusion 本地搭建搭建了起来。参考教程在文末。 本文是本地搭建AI画画&a…

C/C++内存泄露检查利器—valgrind

1、Valgrind概述 Valgrind是一套Linux下,开放源代码(GPL V2)的仿真调试工具的集合。 Valgrind由内核(core)以及基于内核的其他调试工具组成。内核类似于一个框架(framework),它模拟…

Android中的GPS开发

GPS简介 Gobal Positioning System,全球定位系统,是美国在20世纪70年代研制的一种以人造地球卫星为基础的高精度无线电导航的定位系统,它在全球任何地方以及近地空间都能够提供准确的地理位置、车行速度及精确的时间信息;它是具有…

2023年房地产抵押贷款研究报告

第一章 概述 房地产抵押贷款是一种以房地产为抵押品的贷款形式,包括个人和企业两种情况。个人房地产抵押贷款是指个人将名下房产作为抵押品向银行或其他金融机构申请贷款,而企业房地产抵押贷款则是指企业将自己名下的商业房产作为抵押品向金融机构申请贷…

202309读书笔记|《野性之美:非洲野生动物初窥》——走进自然界的野性之美

《野性之美: 非洲野生动物初窥》微读的一本书,图片居多,非常有视觉上的震撼。拍摄者也是我们孙姓的一员,孙长智。正如作者所说,与自然对话,你会感悟到生命之美、竞争之美、进化之美、和谐之美! 我喜欢自然…

SPSS如何绘制常用统计图之案例实训?

文章目录 0.引言1.绘制简单条形图2.绘制分类条形图3.绘制分段条形图4.绘制简单线图5.绘制多重线图6.绘制垂直线图7.绘制简单面积图8.绘制堆积面积图9.绘制饼图10.绘制直方图11.绘制简单散点图12.绘制重叠散点图13.绘制矩阵散点图14.绘制三维散点图15.绘制简单箱图16.绘制分类箱…

【markdown工具配合图床】PicGo图床配置教程,一秒读懂配置

前言 看到这篇文章的大佬,我默认大家都会配置git,已经配置好ssh公钥。 此时你看到的这篇文章就是基于markdown工具(VSCode,Typora)编写的。 PicGo作为图床转换工具,并配合gitee作为图片服务器&#xff0…

java元注解和自定义注解的区别

Java的元注解和自定义注解是两个不同的概念。 元注解是Java内置的一组用于修饰其他注解的注解,包括Retention、Target、Inherited和Documented。它们可以控制被修饰的注解的保留策略、目标范围、是否继承等属性,并且可以在编写自定义注解时使用。 Retent…

国考省考结构化面试:综合分析题,社会现象(积极消极政策)、名言哲理(警句观点启示)、漫画反驳题等

国考省考结构化面试:综合分析题,社会现象(积极消极政策)、名言哲理(警句观点启示)、漫画反驳题等 2022找工作是学历、能力和运气的超强结合体! 公务员特招重点就是专业技能,附带行测和申论&…

【Java数据结构】优先级队列(堆)

优先级队列(堆) 概念模拟实现堆的概念堆的存储方式堆的创建向下调整堆的创建建堆的时间复杂度 堆的插入和删除堆的插入堆的删除 用堆模拟实现优先级队列 常用接口PriorityQueue的特性PriorityQueue常用接口介绍构造方法插入/删除/获取优先级最高的元素 P…

孙溟㠭篆刻,红木上的‘’椎凿稚趣‘’

了解中国传统篆刻的人,一定知道篆刻作品中追求的“金石气”。作为拥有3700多年历史的中国传统艺术,篆刻艺术是将书法(主要是篆书)和镌刻(包括凿、铸)相结合,制作印章,亦是汉字独有的…

Vivado 仿真器中以批处理或脚本模式(Batch or Scripted Mode)进行仿真

以下说明来自ug900:在 Vivado 仿真器中以批处理或脚本模式进行仿真 具体可以内容可自行查找 其中代码运行截图为自己实践的实例 Note: xelab, xvlog and xvhdl are not Tcl commands. The xvlog, xvhdl, xelab are Vivado-independent compiler executables. Hence, there is…

20230505使用amazon来批量翻译SRT格式的日语字幕为简体中文

20230505使用amazon来批量翻译SRT格式的日语字幕为简体中文 2023/5/5 19:03 百度搜索:使用 amazon 批量翻译 请严重注意:可能会扣费的! https://aws.amazon.com/cn/blogs/china/translating-documents-with-amazon-translate-aws-lambda-and…

线性判别分析LDA计算例题详解

线性判别分析(Linear Discriminant Analysis, LDA)的核心思想是:将给定训练集投影到特征空间的一个超平面上,并设法使同类样本投影点尽可能接近,异类样本投影点尽可能远离 由于做题时针对的是解题过程,因此原理相关方面省略&#…

回文数:探索数字世界中的对称美学

本篇博客我会讲解力扣中的“9. 回文数”这道题,大家重点理解判断回文数的方法。 先来审题:这是题目链接。 来看几个输出示例: 还有一些条件: 第一反应是:为啥是个整数呢?万一是个字符串,那不…

windows下安装OpenCL

由于我的电脑是windows10,显卡是集显Intel UHD Graphics 630。 下载Intel的SDK for OpenCL,下载地址https://software.intel.com/en-us/opencl-sdk/choose-download,也可以在我的资源里面直接下载https://download.csdn.net/download/qq_363…

System verilog【2】字符串,函数,任务

前言 素手青颜光华发,半世尘缘半世沙。我唤青天睁开眼,风霜怎奈并蒂花 \;\\\;\\\; 目录 前言字符串packed组合型结构体组合型数组 过程块initial & always functiontask 字符串 module chertanis;initial beginstring s"hola,mundo!",s2…

Java 多线程知识

参考链接:https://www.cnblogs.com/kingsleylam/p/6014441.html https://blog.csdn.net/ly0724ok/article/details/117030234/ https://blog.csdn.net/jiayibingdong/article/details/124674922 导致Java线程安全问题最主要的原因: (1&#…

修改亮度、对比度、色调、饱和度,达到预期效果

用户态可以通过v4l2自带工具进行一些UVC相机参数的设定,包括采集卡驱动之类,也可以通过v4l2自带工具进行参数设定。 通过修改这些参数的值,可以弥补相机本身彩色部分自带不足。 总的来说就这么几种命令: 查看设备所有参数信息&a…

C++系列三:变量、常量

常量、变量 1. 变量1.1 定义变量1.2 初始化变量1.3 变量数据类型1.4 变量作用域 2. 常量2.1 定义常量2.2 常量类型2.3 常量作用域2.4 常量用法 3. 总结 1. 变量 变量是一个用于存储值的命名内存位置,可以存储多种不同类型的数据,例如整数、实数、字符或…