FSRCNN论文读后感

news2024/12/28 3:07:30

本文的主要目的是在尽可能保持恢复质量不变的情况下,提高模型的处理速度,以将其投入实际应用。(注意:本文只要是针对大尺寸图像,但实验结果证明,FRSNN模型对于小尺寸图像的处理速度也比SRCNN快,且性能与SRCNN相当)

文章的主要贡献

  1. 我们设计了一个紧凑的沙漏形CNN结构,以实现快速的图像超分辨率。在一组反卷积滤波器的协作下,网络可以学习原始LRHR图像之间的端到端映射,而无需预处理。
  2. 所提出的模型比SRCNN-Ex的速度提高至少40倍,同时仍保持其优异的性能。其中一个小尺寸版本可以在通用CPU上实时运行(>24fps),恢复质量比SRCNN更好。
  3. 我们转移所提出的网络的卷积层,以便实现不同的扩展因子的快速训练和测试而不会损失修复质量。

FSRCNN网络结构(一种紧凑的沙漏型CNN结构)

从三个方面重新设计了SRCNN结构

  1. 直接学习原始低分辨率图像(不需要插值)到高分辨率图像的映射
  2. 在映射之前加入一个收缩层(缩小输入特征的维数)和在映射之后加入一个扩展层
  3. 采用较小的滤波器尺寸和更多的映射层
  4. 在网络的末端加入一个反卷积层

FSRCNN网络结构的优越性

  1. 显著的速度提高
  2. 可以实现不同放大因子的快速训练和测试。在训练过程中,我们只需要对另一个放大因子的反卷积层进行微调,而几乎不会损失映射精度。在测试过程中,我们只需要进行一次卷积运算,然后使用相应的反卷积层对图像上采样到不同的尺度。

(注意:先前的方法必须针对特定的放大因子训练设计一个完全不同的网络,而FSRCNN仅需要不同的反卷积层。这也为我们提供了一种将图像放大到几种不同尺寸大小的更快方法。FSRCNN仍要对特定尺度因子训练一个网络,只是这个训练过程比之前的方法都要简单、快。)

SRCNN的局限性

  1. SRCNN对于大尺寸图像的处理速度并不令人满意,与实时速度相差甚远
  2. SRCNN在预处理步骤,使用双三次插值将原始LR图像上采样到期望大小以形成输入,这导致了计算成本过大。
  3. 非线性映射

2和3限制了模型的运行速度

解决方法:

对于2的解决方法:采用在网络末端加入一个反卷积层来代替双三次插值

对于3的解决方法:在映射之前加入一个收缩层(缩小输入特征的维数)和在映射之后加入一个扩展层。此外,我们将单个宽的映射层分解成多个具有大小为3×3的固定滤波器的映射层。

FSRCNN和SRCNN的区别:

  1. 将SRCNN-Ex的最后一个卷积层替换为反卷积层,然后将整个网络对原始LR图像进行处理。
  2. 用收缩层、4个映射层和扩张层的组合来代替单个映射层。
  3. 采用较小的滤波器尺寸和较少的滤波器

FSRCNN和SRCNN的网络架构对比如图所示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1984717.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙应用开发之GridRow和GridCol容器

在不同屏幕上布局是一个比较困难的问题,因为屏幕大小不一样,导致内容布局会比较混乱。所以提出一种网络的方式来布局,即使屏幕大小改变了,但是布局行列数不变,那么内容就不会混乱。使用组件GridRow来管理行,使用组件GridCol管理列。 先来看一下组件GridRow的定义: Grid…

VSCode在windows系统下使用conda虚拟环境配置

如何解决CondaError: Run ‘conda init‘ before ‘conda activate‘_condaerror: run conda init before conda activat-CSDN博客 首先检查自己的anaconda是否是添加到整个的环境变量里了 打开cmd如果conda和python都能够识别那么就是配置成功了 然后看插件是否安装&#xf…

在 cPanel 和 WHM 中配置域名重定向

在处理HTTP请求时,服务器会返回页面内容,这一过程依赖于域名和IP地址的正确配置。手动配置IP和域名非常复杂,但cPanel & WHM的网页界面让日常的网络服务器管理变得轻而易举。例如,Hostease提供的服务器解决方案,支…

3DCoat v2023 激活版下载与安装教程 (数字雕刻程序)

前言 3DCoat 是一款数字雕塑软件,由乌克兰开发。该软件专注于游戏模型的细节设计,集三维模型实时纹理绘制和细节雕刻功能为一身,可以加速细节设计流程,在更短的时间内创造出更多的内容。 一、下载地址 下载链接:分享…

想实现ubuntu搭建sqli-labs靶场

目录 首先前期的nginx和php部署完成​编辑​编辑 Xftp导入sqli-labs 遇到了的问题 它提示我们请检查db-creds.inc 去尝试解决这个问题 尝试修改MySQL root密码 修改db-creds.inc配置 再次尝试依旧失败 思考:会不会是MySQL版本过高的原因 重新下载MySQL5.7.…

优思学院|精益管理的指导思想给企业带来了什么启示?

很多企业和管理者以为,多即是好,尽量加快生产,提升库存,库存越多,安全性越高,尽量迫使员工多做工作,他们的工作越多,效率就越高,凡此种种都是在精益思想诞生前的人们对营…

B站宋红康JAVA基础视频教程个人笔记chapter04

文章目录 1.IDEA安装好后的一些设置和学习1.1关于IDEA内部jdk版本的设置1.2 一些样式以及快捷键的常用设置(强烈推荐) 2.工程与模块管理3.如何彻底的卸载IDEA 1.IDEA安装好后的一些设置和学习 1.1关于IDEA内部jdk版本的设置 1.File—>Project Struc…

Lumos学习王佩丰Excel第十讲:Sumif函数

一、Sumif函数语法 Sumif函数:用于对区域中符合指定的单个条件的值求和。 sumif(range,criteria,[sum_range]) sumif(条件区域,求和条件,求和区域) 二、Sumif函数计算数值区间 【注意】 1、当函数中两个区域相同时,可省略写后一个区域; …

Android开发 显示密码 输入时短暂显示字符

文章目录 Android开发 显示密码 输入时短暂显示字符1、设置和获取密码是否可见2、 设置系统权限3、实际修改的Settings的属性4、adb控制密码是否短暂可见 Android开发 显示密码 输入时短暂显示字符 Android UI 控件EditText为密码类型的字符串的控制显示。密码字符串默认可以短…

详解贪心算法

贪心算法(Greedy Algorithm) 概述: 贪心算法是一种在求解最优化问题时采取的一种常用算法策略。贪心算法的基本思想是,每次选择当前情况下的局部最优解,并相信这个局部最优解能够导致全局最优解。贪心算法通过迭代的方式一步步地…

Linux学习第57天:Linux PWM驱动实验

Linux版本号4.1.15 芯片I.MX6ULL 大叔学Linux 品人间百味 思文短情长 本章的思维导图如下: 一、PWM驱动简析 1、设备树下的PWM控制节点 8 路 PWM 都属于 I.MX6ULL 的 AIPS-1 域,分为了两部分, PWM1~P…

Spring Boot 中使用 JSON Schema 来校验复杂JSON数据

JSON是我们编写API时候用于数据传递的常用格式,那么你是否知道JSON Schema呢? 在数据交换领域,JSON Schema 以其强大的标准化能力,为定义和规范 JSON 数据的结构与规则提供了有力支持。通过一系列精心设计的关键字,JS…

MySQL的安装数据库的简单操作

💎所属专栏: MySQL 💎1. 数据库相关概念 数据库:存储数据的仓库,数据是有组织的进行存储 数据库管理系统:操纵和管理数据库的大型软件 SQL:操作关系型数据库的编程语言,定义了一套操作关系型…

基于Session和Cookie的模拟登录实战

准备工作 安装好 requests 库, 并掌握基本用法 安装 Selenium 库, 并掌握基本用法 案例介绍 用到的网站: https://login2.scrape.center/ 用户名和密码: admin 点击登录 这个网站是基于传统的 MVC 模式开发的,比较…

DM 数据迁移工具

1.1.概述 DM 数据迁移工具 DM DTS 提供了主流大型数据库迁移到 DM、DM 到 DM、文件迁移到 DM 以及 DM 迁移到文件等功能。 得益于 DM 数据库对目前主流大型关系型数据库系统有着业界领先的兼容性,在存储层面、语法层面、接口层面和它们保持高度兼容,借…

为什么企业需要进行能源体系认证?

通过能源体系认证,企业可以向公众和利益相关方展示其在节能减排方面的承诺和成就。这不仅提升了企业的社会责任形象,还增强了品牌的信誉度。在当今消费者更加关注环境问题的背景下,绿色企业形象有助于赢得市场和客户的认可与信任。 能源体系认…

江协科技51单片机学习- p33 PWM呼吸灯和直流驱动电机调速

🚀write in front🚀 🔎大家好,我是黄桃罐头,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流 🎁欢迎各位→点赞👍 收藏⭐️ 留言📝​…

《python语言程序设计》2018版第6章第34题正多边形的面积 重写3.5题返回正多边形的面积

def area(n, side):n eval(input("Enter the number of sides: ")) # 多边形的边数side eval(input("Enter the side: ")) # 多边形的长度area_num (n * pow(side, 2)) / (4 * math.tan(math.pi / n))print("The area of the pentagon is {:>…

t-分布随机邻域嵌入和多维尺度分析

t-分布随机邻域嵌入 (t-Distributed Stochastic Neighbor Embedding, t-SNE) t-SNE 是一种非线性降维方法,主要用于高维数据的可视化。它能够将高维数据映射到低维空间,同时保留数据的局部结构。 原理 t-SNE 通过将高维空间中的相似度分布与低维空间中…

KVM——安装桌面版本Rocky_linux9.4

安装桌面版本Rocky_linux9.4 一些配置见图