Stable diffusion WebUI img2img使用教学

news2024/11/26 18:26:38

图生图 (img2img) 相较于文生图 (txt2img),因存在参考图片的基础上创作,其可控性自然更强。下面从图生图的几个应用方向出发,详述其功能特性。

文章目录

  • 推提示词
  • img 重新绘制参考图
    • Resize mode 缩放模式
    • Denoising 重绘幅度
  • Sketch 绘图
  • Inpaint 局部绘制
  • Inpaint sketch 修补重绘
  • Inpaint upload
  • Batch

推提示词

顾名思义,就是通过图片反推关键词,不过作为附加功能首次使用时,需在线下载相应的模型包。有可能退出来的描述信息并不是非常准确

  • CLIP反推,这部分主要集中在图像的描述上,通过生成相应的语句。
  • DeepBooru反推,该部分主要针对图像内容的识别,生成对应的标签。

在这里插入图片描述
例如该图反推提示信息。
在这里插入图片描述

CLIP反推获得关键句:a beach with a sunset and some rocks and water with a wave coming in to shore and a sun setting

DeepBooru反推获得关键词:cloud, horizon, ocean, orange_sky, sky, sunset, beach, cloudy_sky, scenery, mountainous_horizon, twilight, gradient_sky, mountain, sun, evening, shore, water, sunrise, red_sky, river, no_humans, dusk, outdoors, waves, city, city_lights, lake, island, cityscape, planet, landscape, sunlight, purple_sky, house

然后把生成的关键词重新通过文生图反推绘图。顺序为CLIP反推、DeepBooru反推、原图。想要较好还原,建议选择DeepBooru反推修改使用。
请添加图片描述

img 重新绘制参考图

img2img应用领域广泛,包括但不限于大幅度改变图像内容、改变画风风格、线稿绘图等。其中基础的绘图参数和txt2img是一致的。
在这里插入图片描述
其中有一点不同的是其中多了Resize modeDenoising

Resize mode 缩放模式

当上传图片尺寸和要生成的图的尺寸不同时,需要选择调整大小方案。设想一种情况:参考图像是512768的竖图,比例大约为2.6:4;而待生成图像是512512的方形图像,比例为1:1。下图展示了几种不同的缩放模式效果。上1角图为原图,重绘参数为0。

原图。
在这里插入图片描述

拉伸模式:直接将短边拉长。调整图片为生图设置的宽高。若上传图片的宽高与生成设置的宽高不一致,则该图片会被压扁。
在这里插入图片描述

裁剪模式:剪去长边的上下部分。裁切图片以符合生图的宽高,我最推荐的方式。
在这里插入图片描述
填充模式:使用AI填充短边。裁切并调整图片宽高,若上传图片的宽高与生成设置的宽高不一致,则多出来的区域会自动填满。
在这里插入图片描述

Denoising 重绘幅度

用一个0到1之间的数值控制重绘的幅度。
在这里插入图片描述
数值越接近0基本不重绘,越接近于1重绘的画面越不一样。不同的 Denoising strength 效果的区别。

在这里插入图片描述
同时还可以重叠各种采样方法,下面是使用了不同采样方法后的效果。
在这里插入图片描述

Sketch 绘图

Sketch标签页的使用将得心应手。这个功能允许在已有的图像上进行添加和修改,或者根据个人想法和创意从零开始绘画。在完成绘制后,还可以通过输入提示词来完善作品。无需担心画画技巧的问题,因为这里并不要求必须是专业的绘画水平。

我们可以画若干个圆圈通过关键词让其画出苹果来。
在这里插入图片描述

Inpaint 局部绘制

对图像的特定部分进行重写。此功能允许在不改变整体图像的情况下,对某一特定区域进行修改。例如喜欢一张图像,但想改变其中某一部分的情况下,比如更改人物的面部表情,如将原本严肃的表情调整为微笑,或者改变图像中人物手中的物品,比如把手中的苹果变为草莓,这种特性就大显神威了。

指定这些变更的方法简单直接,只需设置好提示,然后编写出相应的代码,就能看到指定区域的图像得到了有效的重写。
在这里插入图片描述

Inpaint sketch 修补重绘

结合 Sketch 和 Inpaint 功能,可以同时重写指定范围,根据文字提示,绘制出与草图相匹配的图像。选择蒙版重绘模式,一般都选择重绘蒙版内容,也可以去对应反向的画面进行操作。
在这里插入图片描述
例如改变其中一个苹果为一把勺子。
在这里插入图片描述

Inpaint upload

除图像外,可利用遮罩数据来定义更精细的范围。基本来讲准备好一份黑白 png 数据,即可成为遮罩图像。同样也可以使用机器学习、深度学习的方法批量定义提取蒙版操作。

在这里插入图片描述
例如想给模特换衣服的话,就要提取对应的蒙版。进行重绘操作。不需要通过什么PS,通过算法直接提取服装的mask蒙版。
在这里插入图片描述
这个是通过机器自动批量提取的蒙版进行重绘操作。输入关键词blue dress就会得到下图的结果。
在这里插入图片描述

Batch

处理多张照片一次成为可能。在创建舞蹈视频的过程中,会对导出的序列化图像进行处理,这样可以使得视频中的每一帧都根据相同的提示和设置生成。
在这里插入图片描述

这里需要指明导入图片的文件路径和生成的图片路径。
在这里插入图片描述

然而为了维持生成图像的一致性,必须依赖于各种设定和扩展工具的帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/662566.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

集成光子芯片量子器件研究重要进展

前言: 中国科学技术大学郭光灿院士团队在集成光子芯片量子器件的研究中取得重要进展。该团队邹长铃、李明研究组提出人工合成光学非线性过程的通用方法,在集成芯片微腔中实验观测到高效率的合成高阶非线性过程,并展示了其在跨波段量子纠缠光源…

亚马逊云科技中国峰会“创业者之日”,赋能不同领域创业者前行

IDC预测,到2025年全球数据规模将达到175 ZB,这为人工智能模型训练提供了海量数据资源,全球AI产业迅速发展为创业者们带来了巨大的机遇,但也提出了全新的挑战。新的市场、高效的工具和智能的资源,开辟了创新的领域和商业…

23年互联网Java后端面试最全攻略,只花一周时间逼自己快速通关面试

大家从 Boss 直聘上或者其他招聘网站上都可以看到 Java 岗位众多,Java 岗位的招聘薪酬天差地别,人才要求也是五花八门。而很多 Java 工程师求职过程中,也是冷暖自知。很多时候技术有,但是面试的时候就是过不了! 为了帮…

JVM存储模型、值传递和引用传递

JVM存储模型、值传递和引用传递 一、首先根据下图理解一下JVM是什么? — Java程序和操作系统之间的桥梁 二、Java数据存储模型 因为栈区、本地方法栈、程序计数器是线程私有的,每一个线程在运行时会单独去创建这样一个内存,所以说有多少个线…

前端18K面试题总览,往这方面准备就对了

Vue面试题 生命周期函数面试题 1.什么是 vue 生命周期2.vue生命周期的作用是什么3.第一次页面加载会触发哪几个钩子4.简述每个周期具体适合哪些场景5.created和mounted的区别6.vue获取数据在哪个周期函数7.请详细说下你对vue生命周期的理解? vue路由面试题 1.mv…

Unity核心2——Sprite

顾名思义,Sprite Editor 就是精灵图片编辑器,它主要用于编辑 2D 游戏开发中使用的 Sprite 精灵图片 ​ 它可以用于编辑,图集中提取元素,设置精灵边框,设置九宫格,设置轴心(中心)点等…

以色列QM和荷兰QuantWare合作提供预集成控制系统和QPU解决方案

​ (图片来源:网络) 6月13日,以色列量子计算机操作系统初创公司Quantum Machines(QM)和荷兰超导量子处理器(QPU)的领先供应商QuantWare宣布合作,旨在大幅加速研究进展&a…

火爆全网,python自动化测试logging日志模块使用方法(详细)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 1、日志级别 imp…

3D WEB轻量化引擎工具HOOPS Communicator与Three.js和自主DIY的对比分析

​基于Web的2D和3D可视化已经变得越来越流行,而且市场根据这些变化,为其提供了更丰富的实用性。如果处理得好,开发人员可以使用户以简单、用户友好的方式与其他客户、开发人员或其他任何人共享来自市场的设计。 当开发人员考虑第三方提供这项…

保险业服务模式“智能化”升级

近年来,随着数字时代的多元化发展,人工智能技术凭借其高度便利性,已被广泛拓展应用到各行各业。在AI的加持下,保险行业的发展正处于从“数字化”阶段迈向“智能化”阶段的过渡时期,销售渠道多样、业务量激增以及客户对…

Django之路由层

一、路由的作用 路由即请求地址与视图函数的映射关系,如果把网站比喻为一本书,那路由就好比是这本书的目录,在Django中路由默认配置在urls.py中,如下图: 二、简单的路由配置 # urls.py from django.urls import re_…

java 献血管理系统Myeclipse开发mysql数据库web结构jsp编程计算机网页项目

一、源码特点 java 献血管理系统是一套完善的java web信息管理系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为 TOMCAT7.0,Myeclipse8.5开发,数据库为Mysql5.0&…

CSS查缺补漏之《如何优雅解决margin垂直方向塌陷与合并问题?》

一:父子元素之间margin垂直方向塌陷问题 在处理margin垂直方向问题时,经常会遇到在给子元素设置margin时,导致效果出现在了父元素上;如下代码所示: 代码原义是想实现三方面: ① 将box1的margin-top调为5…

Activity 的生命周期和启动方式

Activity 的生命周期 Activity A 启动B,生命周期: A: onPause - B: onCreate-onStart-onResume- A:onStop Activity B返回 A,生命周期: B:onPause - A:onRestart - onStart - onResume - A:onStop onPause onStop 区…

分布式数据保护策略——多副本和纠删码怎么选?

在之前的《一文读懂分布式存储》文章中,我们介绍了什么是分布式存储。 但谈到存储,安全就是一个绕不开的话题。 没有数据安全的存储毫无意义。 所以数据保护技术对于分布式存储来说非常重要。 ▉ 为什么需要数据保护? 数据显示&#xff0…

考研英语|2022年真题 正确率:16/20|14:00~15:30

22 错 25 错 34 错 40 错 Text 1 21 实词对应 preservemaintain 22 推理判断题 错因:仅仅定位在vulnerable 没有继续往后阅读 immune to decay 理解错误,真确释义为“不会腐烂”,错误理解为“容易腐烂坏掉” 文中定位:第…

618年中大促专属!不容错过的B2B电商机遇

即将又迎来一年一度的618年中大促,各大品牌商家是否都做好准备了呢? 对于这场购物狂欢的盛宴,很多人常常会把焦点放在面向消费者的B2C市场上,B2B市场则因线上化渗透率较低,显得相对冷清,不够引人关注。 事实…

全网最全,pytest自动化测试框架——数据驱动实战详解(超详细)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 第一种&#xff1…

Web前端开发技术储久良第三版课后选择答案(1-10章)

P16-第1章 练习与实验答案 练习1 1.选择题 【1】Html是一种()语言。 【A】编译型 【B】超文本标记 【C】高级程序设计 【D】面向对象编程【2】世界上第一个网页是()。 【A】http://www.w3c.org 【B】http:/info.cern.ch 【C】http://www.microsoft.com…

ffmpeg学习记录

1、对图片进行裁剪 ffmpeg -i input.jpg -vf cropiw/3:ih:20:0 caijian.jpg PS: crop100:100:12:34 相同效果: cropw100:h100:x12:y34 2、视频增加文字水印 使用drawtext滤镜进行增加水印 参数 类型 说明 text 字符串 文字 textfile 字符串 文字文件 …