【stable diffusion】保姆级入门课程02-Stable diffusion(SD)图生图-基础图生图用法

news2025/1/18 8:42:29

目录

学前视频

0.本章素材 

1.图生图是什么

2.图生图能做什么

3.如何使用图生图

4.功能区域

4.1.提示词区域

4.2.图片提示词反推区域

1.CLIP反推

2.DeepBooru 反推

4.3.图片上传区域

4.4.结果图区域

4.5.缩放模式 

4.6.重绘幅度

7.结语

8.课后训练  


学前视频

stable diffusion图生图教程

0.本章素材 

百度网盘夸克地址
anything模型(二次元模型)百度网盘 提取码:g5uk

夸克网盘

提取码:PWLu

chilloutmix模型(真人模型)百度网盘 提取码: qup0

夸克网盘

提取码:Ny9P

案例图夸克网盘
通用提示词夸克网盘

1.图生图是什么

简单来说:图生图就是依赖图片和提示词进行二次创作。

2.图生图能做什么

图生图的出现 是为了弥补文生图的不足,因为文生图有个无法避免的问题,就是随机性太大,当你抽卡 抽到一张你喜欢的图片,但是可能某些地方不满足需求,对于文生图而言,是很难进行修正以及修改的。

图片

虽然衣服是实现了白色衬衫,但是背景,人物,发型等都发生了变化,那如果 需求再加上在不改动原图的整体风格的情况下,变更衣服的样式,那么文生图就无法做到了。

而图生图则能实现这种效果,下面,我将图生图的功能实现做出详细讲解

图片

3.如何使用图生图

图生图并不是单纯的直接由图片生成图片,图片只是做主体作用,打个比喻,你要做一道麻辣鸡,鸡就是那个图片,但是 只有鸡是没有办法做成一道菜的,你还得加上各种调料,配菜,才能得到自己想要的料理。同理,图生图也是由文字与图片共同配合完成的,通过文字去控制原本的图片进行二次创作,从而减少图片生成的随机性,更好的满足我们的需求。

4.功能区域

图片

图生图大部分功能都与文生图的一致,需要讲解的点,都已经标出来,如果有哪块在本章未解答,可以去文生图这章翻阅。

4.1.提示词区域

这块区域的用法和文生图的用法是一样的,但是为什么我要特意拿出来讲解,因为 这块 和文生图的使用效果会有一点不一样,这块的提示词 会作用于结果图,而不是对于原图的描述,这里初学者 是很容易混淆的,大多数教程正向提示词都是和原图是有关系的,会让人误解为是对于原图的解释,图生图中无论是正向还是反向提示词 都是对于结果图的引导和规范,例如:

原图是女孩,提示词为1boy,则结果图 会往 男性引导

图片

 

4.2.图片提示词反推区域

当我们想利用原图进行操作,但是想保留某些特征,让原图和生成图保持相似度时,我们就需要进行提示词编写,此时反推区域就能帮助我们提取原图的特征提示词,例如:

图片

需要注意,反向提示词是不会生成的,还是需要自己进行填写,并且提示词的准确度也并不是百分百,准确度依靠图片中的特征是否足够明显,对于AI生成的图片,图片提示词反推也会更加准确。

1.CLIP反推

生成的提示词更像自然语言,一般是短语形式;

a young woman is posing for a picture in a t - shirt with a mountain scene on it and a quote on the front, Fan Qi, mountains, computer graphics, neo-romanticism

一位年轻女子正在摆姿势拍照,她穿着一件t恤,上面有山景,正面写着一句话:范琦,山,电脑图形,新浪漫主义

2.DeepBooru 反推

DeepBooru 反推注重对于图片进行标签化,生成的大多数是单词,对于二次元图片的反推尤其擅长

1girl, 3d, artist_name, asian, bangs, black_eyes, black_hair, brown_eyes, closed_mouth, indoors, lips, long_hair, looking_at_viewer, nose, photo_(medium), photo_inset, photorealistic, realistic, shirt, short_sleeves, solo, t-shirt, upper_body, white_shirt

女孩,3d,艺术家,亚洲人,刘海,黑眼睛,黑头发,棕色眼睛,闭着嘴,室内,嘴唇,长发,看着观众,鼻子,照片\(medium\),照片插页,逼真的,逼真的,衬衫,短袖,独奏,t恤,上身,白衬衫

两种反推并没有明显的优略之分,CLIP更加容易读懂,DeepBooru则更容易进行修改,但是我个人使用而言,我还是比较喜欢用DeepBooru,因为 多数情况下图片生成需要多次调试,标签化的提示词更容易进行替换和新增,也更好设置权重。

4.3.图片上传区域

可以选择点击上传 或者拖动到上传区域,但是 注意的是,图片名称不要携带中文字符或者空格之类的,当名称携带中文字符时,使用CLIP反推时会报:


TypeError: stat: path should be string, bytes, os.PathLike or integer, not NoneType

使用其他图生图功能时也有可能会出现类似问题,这里再次强调一下,文件和文件夹不要使用中文字符,甚至纯数字命名,最好是使用英文命名,以避免各种奇怪的问题

4.4.结果图区域

输出结果图的地方,也可以根据结果图 进行 再次修改 ,此时点击 结果图下方的图生图就可以了,这样原图就会变成结果图

图片

4.5.缩放模式 

缩放模式其实就是结果图的大小按照什么方式进行调整的,在拖动宽度或者高度时,会出现一个红色的框框,那就是结果图的大小,一般来说通过调整宽度和高度,默认使用拉伸就可以了

图片

图片

 

4.6.重绘幅度

这个与文生图高清修复的重绘幅度相似,用白话文来解释:就是结果图和原图有多少相似度,重绘幅度越高,结果图和原图越不像,重绘幅度越低,结果图和原图则越相似,当重绘幅度为0时,输出原图,重绘幅度为1时,原图和结果图没有任何关系。可以看出0.6之后结果集和原图的相似度就开始有较大的差距了,建议重绘幅度0.2到0.7即可。

正向提示词:masterpiece, best quality, 1gril,red hair

模型:anything

原图:案例图

图片

 

5.结语

图生图的第一小节 基础图生图就讲解到这里了,内容不算多,但是需要同学们自己进行实操一下,理解每个功能的作用,接下来,我会讲解图生图中绘图(涂鸦)功能

6.课后训练  

  1. 根据案例图,反推出相关的提示词

  2. 替换案例图人物的眼睛颜色,发色

  3. 保留人物特征,动作,以及背景,生成一张对应二次元图片(使用anythiny模型)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/779963.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Ranking】50 Matplotlib Visualizations, Python实现,源码可复现

详情请参考博客: Top 50 matplotlib Visualizations 因编译更新问题,本文将稍作更改,以便能够顺利运行。 1 Ordered Bar Chart 有序条形图有效地传达项目的排名顺序。但是,将图表上方的指标值相加,用户将从图表本身获得准确的信息…

制造业想要数字化转型应该从哪方面入手?

制造业可以通过关注以下几个关键领域来开启数字化转型之旅: 数据收集和分析:实施系统收集和分析来自各种来源(例如机器、传感器和生产过程)的数据至关重要。这些数据可以提供有关运营效率、质量控制和预测性维护的见解。 物联网&…

Flask Bootstrap 导航条

(43条消息) Flask 导航栏,模版渲染多页面_U盘失踪了的博客-CSDN博客 (43条消息) 学习记录:Bootstrap 导航条示例_bootstrap导航栏案例_U盘失踪了的博客-CSDN博客 1,引用Bootstrap css样式,导航栏页面跳转 2,页面两列…

【冒泡排序】模仿qsort的功能实现一个通用的冒泡排序

文章目录 前言曾经学的冒泡排序存在着一些局限性首先第一步:写一个main()函数,分装一个test1函数test1函数 用来描写类型的性状 在test1创建了bubble_int 函数,下一步就是实现它,分两步走步骤一:写函数参数步骤二&…

Matlab论文插图绘制模板第107期—标签散点图

在之前的文章中,分享了Matlab散点图绘制模板: 进一步,再来分享一种特殊的散点图:标签散点图。 先来看一下成品效果: 特别提示:本期内容『数据代码』已上传资源群中,加群的朋友请自行下载。有需…

内网穿透远程查看内网监控摄像头

内网穿透远程查看内网监控摄像头 在现代社会中,大家总是奔波于家和公司之间。大部分时间用于工作中,也就很难及时知晓家中的动态情况,对于家中有老人、小孩或宠物的(甚至对居住环境安全不放心的),这已然是…

ubuntu下tmux安装

目录 0. 前言1. Tmux介绍2. 安装3. 验证安装 0. 前言 本节安装tmux终端复用工具,在Ubuntu中运行一些服务或脚本的时候往往不能退出终端,需要一直挂着。在有图形界面的linux中你还可以新开一个终端去做别的事,但是在无界面linux中&#xff0c…

re学习(22)伪造CTF(谜之操作)

思维导图:找flag关键之处 1.字符串 (flag, sorry) 2.导入函数:(Import _scanf ) 其他函数(敏感函数) createfileA:将flag放在一个文件中 Createprocess&am…

基于HCL的​​​​​​​网络规划与部署综合实训报告

0、前言 本次实验是对之前有关网络规划与综合部署的综合实验,适合入门的同学们进行学习,该实验选择了使用华三模拟器进行,希望能够帮助大家了解相关的指令。 一、实训目的及意义 ① 掌握网络规划和设计的基本流程 从需求分析开始做起&#x…

4-2 3D images: Volumetric data Representing tabular data

本文所用到的资料下载地址 By stacking individual 2D slices into a 3D tensor, we can build volumetric data representing the 3D anatomy of a subject. We just have an extra dimension, depth, after the channel dimension, leading to a 5D tensor of shape N C D…

【MySQL进阶(三)】 InnoDB体系架构之内存池(buffer pool)

InnoDB体系架构之内存池 一、InnoDB 体系结构二、缓冲池 buffer pool内部结构free 链(管理空闲缓冲页)怎么知道数据页是否被缓存? flush 链表(管理脏页)1. 脏页2. 链表结构3. 刷盘时机 LRU 链表(控制数据热…

blender 纹理材质

添加材质纹理需要哪五个节点? 映射节点:调整纹理的位置、大小、缩放; 纹理坐标:怎么映射,以什么方式去映射这张图,换句话说就是如何将 2D 的图片映射到 3D 的图像上;纹理坐标就是以什么坐标方式…

【学会动态规划】下降路径最小和(8)

目录 动态规划怎么学? 1. 题目解析 2. 算法原理 1. 状态表示 2. 状态转移方程 3. 初始化 4. 填表顺序 5. 返回值 3. 代码编写 写在最后: 动态规划怎么学? 学习一个算法没有捷径,更何况是学习动态规划, 跟我…

Rust学习01:D-day

以前自学过Python,开发了一些小程序,用于工作中提升效率。 Python的确好学易用,但用来做一个真正意义上的产品,哪怕是比较简单的产品,差点意思,特别是在移动端开发领域。 Rust看了两本书,准备动…

剑指offer61.扑克牌中的顺子

我的想法非常简单,就是先给数组排序,然后统计里面有几个0,然后遍历数组,如果是0或者比后面一个数小1就直接进入下一次循环,如果比后面一个数小2,就用掉一个0,0的数量减1,如果比后面的…

leetcode面试题 判断字符是否唯一

⭐️ 题目描述 🌟 leetcode链接:判断字符是否唯一 思路: a - z 的 ASCII 区间在 [97 , 122] 当中的每个减去 97 或者 a 都会变成 0 - 25,所以只需要一个数组,用当前元素减去 97 97 97 的下标来记录当前字母出现的次数…

微软、OpenAI用上“数据永动机” 合成数据是晨曦还是暮光?

微软、OpenAI、Cohere等公司已经开始测试使用合成数据来训练AI模型。Cohere首席执行官Aiden Gomez表示,合成数据可以适用于很多训练场景,只是目前尚未全面推广。 已有的(通用)数据资源似乎接近效能极限,开发人员认为&a…

volatile轻量级锁

一、背景 我们在写项目的时候,有时会使用多线程。为了保证一部分线程之间的通信,所以需要线程中的一些变量具有可见性。 说到线程可见性,对于Java而言,有两种方法实现:volatile和synchronized。 需要注意的是&#…

Python中TensorFlow的长短期记忆神经网络(LSTM)、指数移动平均法预测股票市场和可视化...

原文链接:http://tecdat.cn/?p23689 本文探索Python中的长短期记忆(LSTM)网络,以及如何使用它们来进行股市预测(点击文末“阅读原文”获取完整代码数据)。 相关视频 在本文中,你将看到如何使用…

BART模型和 Electra模型对比

总结 Electra模型在使用较少的计算资源的情况下能够达到跟大语言模型相近的效果。但BART模型对于传统的BERT中加入了不同种制造noise的方式,是BERT和GPT的结合体。Electra模型主要是Generator模型和Discriminator模型的结合体。 未知参数设置,两个模型…