Differential Diffusion,赋予每个像素它应有的力量,以及在comfyui中的测试效果

news2024/12/26 7:55:49

🥽原论文要点

首先是原论文地址:https://differential-diffusion.github.io/paper.pdf

其次是git介绍地址:GitHub - exx8/differential-diffusion

感兴趣的朋友们可以自行阅读。

首先,论文开篇就给了一个例子:

我们的方法根据给定的图片和文本提示,以不同的程度改变图像的不同区域。这种可控性允许我们再现渐进的过程(例如,左下角的火),并且能够在不同编辑强度之间无缝融合。

引导用的提示词从左到右分别是:“海底的生命之树”,“云端之上的宫殿”,“3D深度外太空星云背景”,“火”,“彩虹的异想天开的插图”,“幻想艺术”。

从这个开篇例子就可以看出,这个算法可以实现图像重绘过程中,更好的调整重绘画面与原图的融合程度。

这种对变化量的精细控制开启了多种新的编辑能力,例如控制单个对象被修改的程度,或者引入逐渐的空间变化的能力。此外,这篇文章展示了框架在软修复方面的有效性——在确保无缝集成的同时微妙调整周围区域以完成图像的部分。

同时,这个框架仅在推理期间运行,不需要模型训练或微调。

原作者提出的一个重要洞察是,在扩散的推理过程中选择性地在不同的时间步骤修改各个区域,我们可以在空间基础上控制对原始图像的忠实度。

以在照片的树林区域引入野火为例。由于火是连续的现象,我们不希望进行突然和完全的转变,例如用烧焦的树桩替换所有树木。相反,我们希望以可控的方式在照片中的不同区域引入不同程度的火势(图1右下角)。 

论文中很重要的一个思路可以用这张图来概括:

随时间的分解。观察变化图如何决定推理过程——区域越暗,越早从残留中复制。或者换句话说,区域越暗,画面中添加的噪声越多,而画面越浅,推理的时候参与的时间越靠后,同时还会从原图中取得信息进行参与计算和推理。

 看一组图片:

嵌套掩码的消融研究。我们的结果显示了更复杂的内容,与场景融合得更好,且模糊度更低。注意过渡(第一行:墙上的锐利过渡)和位置(第二行:建筑物位于湖中)的差异。每一行的种子是固定的。提示词分别为:“一幅精美的艺术画作”,“一个城市天际线...”。

推理过程的示意图。

顶部:当前时间步骤的原始图像添加噪声。

底部:扩散模型去噪的中间图像。箭头附近的掩码表示从每张图片复制的区域。跟随箭头来识别原始来源对输出图像的影响,并观察其与分解掩码和变化图的相关性。提示是“哥特式绘画”。

 文中提到一种比较重要的技术是“软修复”

没有柔化的修复有时会因为与周围背景在风格和光照上的明显差异而显得不自然地叠加。"软修复"是在完成画面部分的同时轻轻修改周围区域以保证平滑融合的过程。我们扩展了我们的框架以支持软修复,允许用户输入一个二进制掩码和一个标量值来确定过渡的柔和度。我们根据柔和度参数对掩码进行高斯模糊,将其转换成变化图,然后由我们的标准框架处理。与以前的方法相比,我们的方法实现了更优秀的软修复编辑(如上图)。

文中提到第二个必要重要的技术是“强度扇” 

在使用扩散模型编辑图像时,找到保留某些元素和改变其他元素之间的完美平衡可能是一个挑战。通常,选择正确的编辑强度可能并不直观,尤其是因为最佳设置会因输入提示和图像的不同而变化。为了简化这个过程,我们提出了一个名为“强度扇”的新可视化工具。这个扇形是一个修改后的图像,通过将其划分为多个列来创建,每个列都以不同的强度级别进行编辑。这使用户能够同时观察多个强度设置,从而简化了比较和调整编辑强度的任务(见上图)。

论文中提到的,重点就是以上这些了。

那么实际测试效果会如何呢?

🥟实测效果

先搭建一组测试节点。

比较简单,相信学过基础课程的朋友都能自己手动搭出来。

(如果还没学过的可以看下文章最后的链接,感谢大家支持先~~~~~😄) 

提示:一朵玫瑰

提示:粉色的云彩; 

 粉色猫头的瓶盖

金色瓶盖

 在雨林中 (选择了背景)

总体来说,效果还可以,比默认的好,比上次推荐的brushnet,貌似没那么惊艳。

如果有局部重绘的场景,不妨试试看。

好了,记得点赞点关注哦,感谢大家的支持~~~~~ 

✨写在最后

如果对comfyui还不熟悉的话,最近面向ComfyUI的新手,写了一门系统性入门图文课程,现在已经更新完成了,内容主要包括如何下载软件、如何搭建自己的工作流、关键基础节点讲解、遇到报错怎么解决等等,如果大家在学习过程中遇到什么问题,也可以直接对应的文章下留言,会持续更新相关答疑内容哈。欢迎订阅哦~

https://blog.csdn.net/jumengxiaoketang/category_12683612.html

​​​

感谢大家的支持~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2114220.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot2:请求处理原理分析-RESTFUL风格接口

一、RESTFUL简介 Rest风格支持(使用HTTP请求方式,动词来表示对资源的操作) 以前:/getUser 获取用户 /deleteUser 删除用户 /editUser 修改用户 /saveUser 保存用户 现在: /user GET-获取用户 DELETE-删除用户 PUT-修改…

自定义TextView实现结尾加载动画

最近做项目,仿豆包和机器人对话的时候,机器人返回数据是流式返回的,需要在文本结尾添加加载动画,于是自己实现了自定义TextView控件。 源码如下: import android.content.Context import android.graphics.Canvas imp…

Java小程序案例:电子日历记事本

要点 菜单栏中提供编辑(剪切、复制、粘贴)、保存、打开等功能。使用类组件实现图形界面设计。基于图形界面的日历,用户可编辑或查看指定日期的日志内容。提供按钮实现月份的前后翻动。事件持久化到文件,可再次编辑保存 效果 程序…

【工具】使用 Jackson 实现优雅的 JSON 格式化输出

说明 在 Java 开发中,我们经常需要处理 JSON 数据。无论是从服务器端返回的数据,还是本地存储的数据,JSON 格式都因其轻量级和易于解析的特点而被广泛使用。当我们需要查看或调试 JSON 数据时,优雅、格式化的输出将大大提高我们的…

风控系统之指标回溯,历史数据重跑

个人博客:无奈何杨(wnhyang) 个人语雀:wnhyang 共享语雀:在线知识共享 Github:wnhyang - Overview 回顾 默认你已经看过之前那篇风控系统指标计算/特征提取分析与实现01,Redis、Zset、模版方…

C++万字解读类和对象(上)

1.类的定义 class为定义类的关键字,Stack为类的名字,{}中为类的主体,注意类定义结束时后面分号不能省略。类体中内容称为类的成员:类中的变量称为类的属性或成员变量; 类中的函数称为类的方法或者成员函数。 为了区分成员变量&…

SprinBoot+Vue应急信息管理系统的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质…

远心镜头选型公式

在当今的机器视觉领域,远心镜头凭借其独特的远心光路设计以及超低畸变、高远心度和高景深等特点,成为尺寸测量和视觉对位中的得力工具。然而,如何进行快速而准确的选型呢?答案就在于选型公式:倍率 焦距 N.A.Sensor 尺…

移动端视频编辑SDK解决方案,AI语音识别添加字幕

对于众多Vlog创作者而言,繁琐的字幕添加过程往往成为提升内容质量的绊脚石。为了彻底改变这一现状,美摄科技凭借其深厚的AI技术积累与创新的移动端视频编辑SDK解决方案,推出了革命性的AI语音识别添加字幕功能,让视频创作更加高效、…

再论大模型做内容消费

前言 今天咱们再体验几个有关大模型聚集内容创作的工作。 之前也专门介绍过一些大模型在该方面的工作,感兴趣的小伙伴可以穿梭:《提升大模型内容创作能力》:https://zhuanlan.zhihu.com/p/716240950 废话不多说,一起来看看吧&a…

【技术调研】三维(0)-webGL、三维基础知识、前置知识、数学知识以及简单示例

前言 ​ 因业务需要了解网页端三维相关技术,故对webGL相关技术学习并记录。旨在了解网页端三维的基本原理。 什么是webGL? ​ WebGL全称叫做Web Graphics Library,它是JavaScript API。用于在任何兼容的Web浏览器中渲染交互式的3D图形,并且无需使用插件。它基于 OpenGL …

参会邀请 | 第二届机器视觉、图像处理与影像技术国际会议(MVIPIT 2024)

第二届机器视觉、图像处理与影像技术国际会议(MVIPIT 2024)将于2024年9月13日-15日在中国张家口召开。 MVIPIT 2024聚焦机器视觉、图像处理与影像技术,旨在为专家、学者和研究人员提供一个国际平台,分享研究成果,讨论…

上海大学《2022年836+915自动控制原理真题及答案》 (完整版)

Part1:2022年上海大学真题题目 学硕836 专硕915 Part2:2022年上海大学真题答案 学硕836 专硕915

Linux学习之路 -- 线程概念

本文主要介绍线程的相关概念与基础控制 什么是线程&&线程的相关知识 按照书本上的定义,线程就是进程内部的一个执行分支,而线程是cpu调度的基本单位。 如果直接按照书本上的定义理解,线程这个概念是比较模糊的,而且我们…

013.Python爬虫系列_re正则解析

我 的 个 人 主 页:👉👉 失心疯的个人主页 👈👈 入 门 教 程 推 荐 :👉👉 Python零基础入门教程合集 👈👈 虚 拟 环 境 搭 建 :👉👉 Python项目虚拟环境(超详细讲解) 👈👈 PyQt5 系 列 教 程:👉👉 Python GUI(PyQt5)文章合集 👈👈 Oracle数…

SAP学习笔记 - 开发01 - BAPI是什么?通过界面和ABAP代码来调用BAPI

BAPI作为SAP中的重要概念,在SAP系统的开发中几乎是必须的。 本章来学习一下BAPI 的直观印象,以及在ABAP代码中的调用。 目录 1, BAPI概述 1,从画面角度来直观体验一下BAPI 1-1,MM:購買依頼変更BAPI - …

日志服务管理

系统日志管理 sysklogd 系统日志服务 在 CentOS5 以及之前的发行版中,其采用的 sysklogd 服务来记录和管理系统日志的。 sysklogd 服务有两个模块: klogd: 用于记录 linux kernel 相关的日志 syslogd:用于记录用户空间应用日志…

OCC开发_箱梁梁体建模

概述 OCC(全称OpenCascade)是一个近年来比较受欢迎的开源三维CAD建模平台,曲线、曲面、实体、渲染等方面功能强大,并且在机械、航空、船舶等许多领域应用广泛。基于OCC的强大功能考虑,本人尝试将其引入桥梁领域。桥梁设计中,比较常…

Nginx核心配置文件结构

一、简单介绍 源码安装的Nginx的核心配置文件默认是放在/usr/local/nginx/conf/nginx.conf yum安装的Nginx的核心配置文件默认是放在/etc/nginx/nginx.conf 使用命令:nginx -t,可以检查测试nginx的配置文件(nginx.conf)语法是否…

6.1排序——插入排序与希尔排序

本篇博客来梳理两种常见排序算法:插入排序与希尔排序 常见的排序算法如图 写排序算法的原则:先写单趟,再写整体 一、直接插入排序 1.算法思想 先假定第一个数据有序,把第二个数据插入;再假设前两个数据…