Image Super-Resolution with Text Prompt Diffusion

news2025/1/20 14:55:54

Image Super-Resolution with Text Prompt Diffusion (Paper reading)

Zheng Chen, Shanghai Jiao Tong University, arXiv23, Code, Paper

1. 前言

受多模态方法和文本提示图像处理进步的启发,我们将文本提示引入图像SR,以提供退化先验。具体来说,我们首先设计了一个文本图像生成管道,通过文本退化表示和退化模型将文本集成到SR数据集中。文本表示采用基于装箱方法的离散化方式来抽象描述退化。这种表示方法还可以保持语言的灵活性。同时,我们提出了PromptSR来实现文本提示SR。PromptSR采用了扩散模型和预先训练的语言模型(例如T5和CLIP)。我们在生成的文本图像数据集上训练模型。

2. 整体思想

在这里插入图片描述

快速一篇文章!没什么insight。如上图,这篇文章就是SR3+prompt或者说完全等于Stable Diffuison。数据集就是下面这么构建的:

在这里插入图片描述

好像没有别的要说的了。。。。不如看看这两篇文章1)AutoDIR: Automatic All-in-One Image Restoration with Latent Diffusion;2)CONTROLLING VISION-LANGUAGE MODELS FOR MULTI-TASK IMAGE RESTORATION

3. 实验

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


·消融实验,图4在给出[轻微噪声]这个prompt时,不能有效去除噪声,给出错误的[unchange]这个prompt时,会引入伪影。还做了不同文本编码器的影响,我觉得没必要吧。因为你这个text prompt换成1,2,3,4没准也work?

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1269064.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis 发布订阅机制深入探索

Redis 的发布订阅(pub/sub)机制是一种消息传递模式,允许消息的发送者(发布者)和消息的接收者(订阅者)通过一个中介层(频道)进行通信,而无需彼此直接交互。以下…

ARM麒麟V10 auditctl启动失败处理

问题: 业务服务器需要启用审计服务,但是启动审计服务失败,查看状态提示audit0。 修改配置文件/boot/efi/EFI/kylin/grub.cfg 删除audit0,或者设置audit1。 重启服务器后验证状态。 auditctl -D echo "-w /data -p rwxa"…

磁环电感参数计算

磁环电感参数计算 1.什么是电感磁饱和2.电感饱和的原因3.电感饱和带来的影响3.1 感应电动势变化3.2 电感值变化3.3 功率损耗增加3.4 系统稳定性受到影响4.饱和电流计算最近在做DC/DC电源,电感是用磁环绕制的,所以关注一下磁环绕制电感参数的计算,学习学习。 某款磁环参数。 …

【10】Python函数专题(上)

目录 1.什么是函数2.函数的参数2.1形参 和 实参2.2函数的传递方式2.3 不定长参数2.3.1 可变位置参数`*args`2.3.2可变关键字参数`**kwargs`2.3.3 小结2.4 参数的解包(也称拆包)1.什么是函数 在Python中,函数是一段可重复使用的代码块,用于执行特定任务。通过将代码封装在函…

C++设计模式——Bridge模式(下)

在上篇 《C设计模式——Bridge模式(上)》中我们对于桥接模式做了一些介绍。介于桥接模式在实际项目开发中使用广泛,而且也是面试中常问常新的话题。在本篇,我们专注bridge模式在具体的项目开发中的应用,举几个例子来说…

Linux系统安装-以文本模式安装rhel8

文本模式安装提供了用于安装 Red Hat Enterprise Linux 的交互式非图形界面。此安装方法对于没有图形功能的系统很有用。但是,在开始基于文本的安装之前,请务必考虑可用的替代方案。文本模式在安装过程中可以做出的选择数量有限。 目录 交互式文本模式安…

深入理解 Vue 中的指针操作(二)

文章目录 ☘️引言☘️基本用法🍂v-for指令🍂v-model指令🌱v-model适用表单控件 ☘️结论 ☘️引言 Vue.js 是一款非常流行且功能强大的前端框架,它以其响应式的数据绑定和组件化的开发方式赢得了众多开发者的喜爱。而在 Vue.js …

OKCC 客户中心

OKCC服务了这么多家客户中心,但很多小伙伴们其实并不是太了解客户中心的主要功能,那么我今天将从两类客户中心介绍下他们的主要功能。 一、 运营机构客户中心的功能 对于运营机构而言,客户中心的功能包括:能够帮助运营机构提升品牌形象&…

Chrome两个账号数据合并或者转移

文章目录 情况1情况2操作 情况1 「旧」账号:出于种种原因决定停用,但是账号里还有书签、历史记录、密码、设置等数据。 「新」账号:未来的主力账号。 需求是将「旧账号」的数据迁移到「新」账号之中。 情况描述:https://www.z…

openGauss学习笔记-134 openGauss 数据库运维-例行维护-检查操作系统参数

文章目录 openGauss学习笔记-134 openGauss 数据库运维-例行维护-检查操作系统参数134.1 检查办法134.2 异常处理 openGauss学习笔记-134 openGauss 数据库运维-例行维护-检查操作系统参数 134.1 检查办法 通过openGauss提供的gs_checkos工具可以完成操作系统状态检查。 前提…

Golang数据类型(字符串)

字符串重要概念 根据Go语言官方的定义: In Go, a string is in effect a read-only slice of bytes. 意思是Go中的字符串是一组只读的字节切片(slice of bytes),每个字符串都使用一个或多个字节表示(当字符为 ASCII 码…

医院室内导航解决方案:智慧医疗的重要组成部分

医院作为人们生活中不可或缺的一部分,面临着巨大的挑战。每天都有大量的患者前来就医,而医院内部的复杂结构和科室众多,常常让患者感到困惑和迷失。为了解决这个问题,医院室内导航解决方案应运而生,以其创新的技术和卓…

4G工业路由器智慧楼宇门禁无人值守、实时监控

门禁是我们日常生活中常见的基础设施,就像是现代社会智慧城市中的“门神”,在楼宇管理领域中普遍采用的安防卫士。4G工业路由器的物联网应用则为楼宇门禁管理带来了更加便捷和高效的解决方案。 在传统的楼宇门禁系统中,人员需要手动刷卡、输…

多个加速度计/麦克风连接指引

座舱内的振动投诉:如乘客/驾驶员在车厢内感受到传动轴、方向盘抖动剧烈 图1.三轴模式下的单个加速度计 图2.软件设置界面 如果您只有一个加速度计,可以在三轴模式下使用一个加速度计找出客户投诉车厢内振动最强烈的区域。例如将加速度计连接到驾驶员座椅…

PCIe学习必读——《PCI Express System Architecture》

PCI Express (peripheral component interconnect express) 简称 PCIe,是一种高速串行计算机扩展总线标准。是一种全双工总线,使用高速串行传送方式,能够支持更高的频率,连接的设备不再像 PCI 总线那样共享总线带宽。PCIe目前发布…

完美滤波器

完美滤波器 如下图所示,第 j j j级为输入图像,其中第 j − 1 j-1 j−1级为第 j j j级的尺寸减半的存在,直至为 1 1 1\times 1 11 的大小,这样的模式被称为图像金字塔 设原图像像素点个数为 N 2 N^2 N2,则图像金字塔的…

IP地址规划的基本方法与最佳实践

IP地址规划是建立网络基础设施的关键步骤之一,它涉及到为网络中的设备分配唯一的IP地址,确保网络的高效性和可管理性。本文将介绍IP地址规划的基本方法和最佳实践,以帮助网络管理员设计并维护高效的IP地址方案。 1. 了解网络拓扑结构&#x…

Java的字符流和字节流

Java的字节流:把数据从程序存储到文件,把数据从文件读取程序中 File:只操作文件和文件属性,createNewFile getPath--->项目目录 ,getAbsolutePath() getName()---->substring() list()-->列出当前目录的所有文件或文…

vue+less+style-resources-loader 配置全局颜色变量

全局统一样式后,可配置vue.config.js实现全局颜色变量,方便在编写时使用统一风格的色彩 一、新建global.less 二、下载安装style-resources-loader npm i style-resources-loader --save-dev三、在vue.config.js中进行配置 module.exports {pluginOpt…

架构图是什么,该怎么制作?

架构图是指可视化展示软件、系统、应用程序、网络等各种体系结构的一类图表或图形,它能够形象地展示体系结构中各个组成部分和它们之间的关系。 架构图的类型 架构图的种类比较多,逐一列举不太合适,这里只列举一些常见的架构图类型&#…