SwinIR速读

SwinIR速读

news2025/7/9 1:53:03

SwinIR发表在ICCV'21,它核心创新在于使用了SwinTransformer(同年ICCV best paper)进行图像修复，由ETH的CVL提出，大组还是抓前沿抓得好，不仅能想到，还能做出来性能，而且性能还是稳定的增益，通用性强。

目前，SwinIR的引用是2k+，是目前生成式复原模型，广泛使用的修复模型。

这体现出了arxiv的魅力。如果SwinTransformer不提前挂arxiv，也就没有SwinIR。

Q1：假设时间拨回到21年，如果想到swintransformer可以用来做图像修复，first-try是什么？

A1：swintransformer直接替换cnn。

Q2：那么这样做的问题是什么？

A2：首先是图像块的边界失真问题（boderline artifacts），其次边界处的像素由于丢失了相关其他信息而难以修复好。

Q3：不直接在图像上分块能不能避免这个问题？特征能否也考虑cnn的，至少最差也有cnn特征可以使用？

A3：在特征上进行分块，弱化这个问题。其次，使用cnn提取浅层特征，采用residual的结构，这样让swintransformer集中在高频信息学习上。

到此为止，网络结构呼之欲出。

优雅！有效~

由于这是architecture paper，实验中对于结构的ablation study放在了最前面。很喜欢这个探索。

接着是在各个应用上的探索，包括Image SR，JPEG Artifacts Reductuion，Image Denoising充分验证这个修复模型的通用性。

最后，也是我最喜欢的motivation部分。

cnn进行图像修复的问题有2个。动机1: 图像和卷积核的关联性是content-indepent。使用相同的卷积核去修复图像的不同区域也许不是个好选择；动机2: 局部处理的特性使得卷积对于long-range dependency modelling而言并不高效。

swintransformer完美将transformer和cnn优点相结合。首先，由于局部注意力机制，可以像cnn处理大尺寸图。其次，由于shifted window机制，可以很好地具备transformer的model long-range dependency能力。

最终，选择swintransformer是个必然。而且提出了一个实际可用，易于扩展的结构。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1997028.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

TCP Window Full TCP Zero Window

TCP Window Full TCP Zero Window

TCP window Full & TCP Zero Window 注： 192.168.60.67 是客户端IP10.250.251.223是服务端IP 当客户端向服务发送多个280大小应用层数据时，在No 45帧数据时发生TCP Window Full，应用发送280字节，实际发出去只有67个字节。28…

阅读更多...

机器学习——逻辑回归（学习笔记）

机器学习——逻辑回归（学习笔记）

目录一、认识逻辑回归二、二元逻辑回归（LogisticRegression） 1. 损失函数 2. 正则化 3. 梯度下降 4. 二元回归与多元回归三、sklearn中的逻辑回归（自查） 1. 分类 2. 参数列表 3. 属性列表 4. 接口列表四、逻辑回归…

阅读更多...

11.面试题——消息队列RabbitMQ

11.面试题——消息队列RabbitMQ

1.RabbitMQ是什么？特点是什么？ RabbitMQ是一种开源的消息队列中间件，用于在应用程序之间进行可靠的消息传递。它实现了AMQP（Advanced Message Queuing Protocol）协议，提供了强大的消息处理能力。RabbitMQ的…

阅读更多...

DVWA—SQL Injection

DVWA—SQL Injection

DVWA—SQL Injection实例 1. low等级进入界面后，可以看到它是一个ID的查找内容的输入框，我们输入数字1、2可以看到是从后端返回数据库相应的数据，但是我们作为SQL注入的最终目标是得到更多有关的信息，所以我们需要通过构造payl…

阅读更多...

【生成式人工智能-九-大型语言模型的幻觉、偏见等安全性问题】

【生成式人工智能-九-大型语言模型的幻觉、偏见等安全性问题】

大型语言模型的安全性幻觉对语言模型的输出做核查偏见消除偏见的方法鉴别是否是人工智能输出prompt hacking 语言模型被骗做事情jailbreakingjailbreaking的危害 prompt injection 今天还是先来谈一下有哪些安全性问题，以及简单介绍有那些应对方案。幻觉看过大…

阅读更多...

BugKu CTF Misc：

BugKu CTF Misc：

前言 BugKu是一个由乌云知识库（wooyun.org）推出的在线漏洞靶场。乌云知识库是一个致力于收集、整理和分享互联网安全漏洞信息的社区平台。 BugKu旨在提供一个实践和学习网络安全的平台，供安全爱好者和渗透测试人员进行挑战和练习。它包含了…

阅读更多...

写一个Vue2和vue3的自定义指令（以复制指定作为示例）

写一个Vue2和vue3的自定义指令（以复制指定作为示例）

文章目录一、自定义指令是什么？二、自定义指令有啥用？三、自定义指令怎么用？1.自定义指令的参数2.自定义指令的钩子函数（1）五个钩子函数的说明（2）钩子函数的参数(主要参数：el和valu…

阅读更多...

高效管理视频文件，2024年视频压缩软件精选集

高效管理视频文件，2024年视频压缩软件精选集

我的生活中处处都充满了数据的影子，不知道你是不是也这样。而且存储的数据可能由于某些失误会导致我们数据的丢失，幸运的是，现在我们掌握全免费的数据恢复工具的使用方式，就能尽可能地找回丢失的数据。 1.FOXIT数据恢复连接直达…

阅读更多...

解决客户访问超时1s问题

解决客户访问超时1s问题

访问公网地址返回状态码499-CSDN博客需求描述客户访问公司公网服务，期望在1s内完成。他们在客户端设置了超时1s的配置，如果超过1s公司服务就会报错499，这是正常的请求返回。分析问题目前这个服务通过公网的alb负载均衡到ecs&#xff0…

阅读更多...

Stable Diffusion绘画 | 提示词格式

Stable Diffusion绘画 | 提示词格式

推荐格式提升画质的提示词与画风的提示词，对整体画面影响较大，建议在首行填写画质词画风词画面主体描述环境、场景、灯光、构图Lora负面词画质词常规画质词： (masterpiece:1.2),best quality,highres,extremely detailed CG,perfect…

阅读更多...

集成新的 AI 服务时需要考虑的问题

集成新的 AI 服务时需要考虑的问题

让我们来谈论最近发生的几个恐怖故事。去年年底，一家雪佛兰经销商在其主页上部署了一个由大型语言模型 (LLM) 驱动的聊天机器人。该 LLM 经过雪佛兰汽车详细规格的训练，旨在仅回答有关雪佛兰汽车的问题。然而，用户很快就找到了绕过这些限…

阅读更多...

驰骋BPM RunSQL_Init接口SQL注入漏洞复现 [附POC]

驰骋BPM RunSQL_Init接口SQL注入漏洞复现 [附POC]

文章目录驰骋BPM RunSQL_Init接口SQL注入漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现驰骋BPM RunSQL_Init接口SQL注入漏洞复现 [附POC] 0x01 前言免责声明：请勿利用文章内的相关技术从事非法测试，由于…

阅读更多...

LeetCode 热题 HOT 100 （022/100）【宇宙最简单版】

LeetCode 热题 HOT 100 （022/100）【宇宙最简单版】

【技巧】No. 0647 回文子串【中等】👉力扣对应题目指路希望对你有帮助呀！！💜💜 如有更好理解的思路，欢迎大家留言补充 ~ 一起加油叭 💦 欢迎关注、订阅专栏【力扣详解】谢谢你的支持&#xff…

阅读更多...

step12:qml程序.exe生成指定图标

step12:qml程序.exe生成指定图标

文章目录 0.文章内容1.在qt中改变图标效果代码 2. 在生成的build应用程序中改变图标效果代码 3. 获取.ico格式图片的连接参考文档 0.文章内容 1.在qt中改变图标效果代码 2. 在生成的build应用程序中改变图标效果代码 RC_ICONS logo2.ico 3. 获取.ico格式图片的连接不…

阅读更多...

vue 日期控件 100天内的时间禁用不允许选择

vue 日期控件 100天内的时间禁用不允许选择

vue 日期控件 100天内的时间禁用不允许选择，可以从101天选起比如，2024年8月9号开始，100天内禁止选择，第101天之后的日期可以选，效果如图所示 // 日期控件代码加上 :picker-options"pickerOptions" <…

阅读更多...

使用 Vue3 生成二维码和条形码

使用 Vue3 生成二维码和条形码

目录前言一、前期准备 1.1. 使用Vite创建工程化项目 1.2 安装所需的依赖二、环境检查三、生成二维码 3.1 创建二维码组件 3.2 在App.vue中使用二维码组件四、生成条形码 4.1 创建条形码组件 4.2.在App.vue中使用条形码组件五、启动测试与效果演示 5.1 启动de…

阅读更多...

【前端可视化】大屏可视化项目三包含了横向柱形图、竖向柱形图、雷达图、环形图、关系图、数据云图、数据展示图和地图可视化等八个部分

【前端可视化】大屏可视化项目三包含了横向柱形图、竖向柱形图、雷达图、环形图、关系图、数据云图、数据展示图和地图可视化等八个部分

基于vite与tailwindcss创建大屏可视化项目准备传统的三列布局 <template><div class"w-full h-full"><div v-if"loading" class"bg-[url(assets/images/bg.png)] bg-cover bg-center loading-container h-screen w-full flex jus…

阅读更多...

Arthas简介及示例

Arthas简介及示例

一、什么是Arthas？ Arthas 是一款线上监控诊断产品，通过全局视角实时查看应用 load、内存、gc、线程的状态信息，并能在不修改应用代码的情况下，对业务问题进行诊断，包括查看方法调用的出入参、异常，监测方…

阅读更多...

记2024-08原生微信小程序开发

记2024-08原生微信小程序开发

继2024.08 最近需要开发一个微信小程序的一个功能模块，但是之前在学的时候都是好几年前的东东了，然后重新快速过了一遍b站大学的教程，这篇文章就是基于教程进行的一些总结，和自己开发过程当中使用到的一些点和一些技巧什么的吧。 …

阅读更多...

uniapp小程序出现【 wxss GetCompiledResult】报错

uniapp小程序出现【 wxss GetCompiledResult】报错

报错信息进入页面报错，导致页面无法显示原因查看小程序源代码发现 wxss 文件内有个不正常的字符就是这个 * 导致解析失败出现解析失败的原因 / 解决办法是因为这里使用了通配符注释掉就可以了

阅读更多...

推荐文章

最新文章