Stable Diffusion参数 - 步数、采样方法、提示词引导系数

news2024/9/17 7:48:09

1 迭代步数

一张图片的生成它需要多次迭代才能达到我们想要的一个效果。
理论上迭代步数越高,那生成的最终的这个图片的效果就越好,它质量更高。

实际在应用的时候迭代步数达到20以上,它的效果在提升的就不是十分明显了,而更多的迭代步数,就意味着更长的时间。

所以我们要综合考虑,图片能达到的效果,以及它的效率。
那么对于大多数模型来说呢,20-30步就已经足够用了。
那如果你想要求图片更加精细的话,你可以尝试30-40步。

去官网下载大模型,那你可以找到这个模型的作者的页面,一般作者会告知你,推荐什么样的参数来使用。比如:

像上面这个模型作者就推荐30,直接按照作者说明的来选择也是可以的,因为作者经过了大量的测试。

可以采用自己的实用设置来查看什么步数适合自己,在一个范围内选择几个数值来批量生成一下
对比一下效果,这样也可以找到,你认为比较合适的迭代步数

 

2 采样方法

Sampler(采样器/采样方法) 选择使用哪种采样器。

  • Euler a(Eular ancestral)可以以较少的步 数产生很大的多样性,不同的步数可能有不同的结果。而非 ancestral 采样器都会产生基本相同的 图像。
  • DPM 相关的采样器通常具有不错的效果,但耗时也会相应增加。
  • Euler 是最简单、最快的 Euler a 更多样,不同步数可以生产出不同的图片。但是太高步数 (>30) 效果不会更好。
  • DDIM 收敛快,但效率相对较低,因为需要很多 step 才能获得好的结果,适合在重绘时候使用。
  • LMS 是 Euler 的衍生,它们使用一种相关但稍有不同的方法(平均过去的几个步骤以提高准确 性)。大概 30 step 可以得到稳定结果
  • PLMS 是 Euler 的衍生,可以更好地处理神经网络结构中的奇异性。
  • DPM2 是一种神奇的方法,它旨在改进 DDIM,减少步骤以获得良好的结果。它需要每一步运行两 次去噪,它的速度大约是 DDIM 的两倍,生图效果也非常好。但是如果你在进行调试提示词的实 验,这个采样器可能会有点慢了。
  • UniPC 效果较好且速度非常快,对平面、卡通的表现较好,推荐使用。

不同采样步数与采样器之间的关系:

3 CFG Scale(提示词相关性)

图像与你的提示的匹配程度。增加这个值将导致图像更接近你的提 示,但它也在一定程度上降低了图像质量。 可以用更多的采样步骤来抵消。过高的 CFG Scale 体现 为粗犷的线条和过锐化的图像。一般开到 7~11。 CFG Scale 与采样器之间的关系 

  • 生成批次 每次生成图像的组数。一次运行生成图像的数量为“批次* 批次数量”。
  • 每批数量 同时生成多少个图像。增加这个值可以提高性能,但也需要更多的显存。大的 Batch Size 需要消耗巨量显存。若没有超过 12G 的显存,请保持为 1。
  • 尺寸 指定图像的长宽。出图尺寸太宽时,图中可能会出现多个主体。1024 之上的尺寸可能会出现 不理想的结果,推荐使用小尺寸分辨率+高清修复(Hires fix)。
  • 种子 种子决定模型在生成图片时涉及的所有随机性,它初始化了 Diffusion 算法起点的初始值。

理论上,在应用完全相同参数(如 Step、CFG、Seed、prompts)的情况下,生产的图片应当完全相同。

 

通过勾选 "Hires. fix " 来启用。 默认情况下,文生图在高分辨率下会生成非常混沌的图像。如果使用 高清修复,会型首先按照指定的尺寸生成一张图片,然后通过放大算法将图片分辨率扩大,以实现高清 大图效果。最终尺寸为(原分辨率*缩放系数 Upscale by)。

  • 放大算法中,Latent 在许多情况下效果不错,但重绘幅度小于 0.5 后就不甚理想。ESRGAN_4x、 SwinR 4x 对 0.5 以下的重绘幅度有较好支持。
  • Hires step 表示在进行这一步时计算的步数。
  • Denoising strength 字面翻译是降噪强度,表现为最后生成图片对原始输入图像内容的变化程度。 该值越高,放大后图像就比放大前图像差别越大。低 denoising 意味着修正原图,高 denoising 就 和原图就没有大的相关性了。一般来讲阈值是 0.7 左右,超过 0.7 和原图基本上无关,0.3 以下就 是稍微改一些。实际执行中,具体的执行步骤为 Denoising strength * Sampling Steps。
  • 面部修复 修复画面中人物的面部,但是非写实风格的人物开启面部修复可能导致面部崩坏。 

4 面部修复

如果生成真人的话,建议把面部修复打开,这样能让你的呃生成的图片,面部更加的理想,平铺图不用考虑高分辨率修复,这个是在我们后期放大图片的时候可以用的

5 宽和高

一般来说我们生成图片的时候选择,512x512比较安全,还有一个就是你可以参考作者的建议
一般作者他训练大模型的时候,他也会有一个倾向的图片的比例,所以根据作者的建议,你可以按照他提供的这个分辨率来生成你的图。

6 提示词引导系数

一般我们选择7是最多的,对于大多数模型来说,选择7它都是比较啊保险的一个选项。
一般来说不应该超过10以上,你可以尝试,超过10以上的话,其实他就不会说,忠实的按照你的提示词来生成了,可能会出现一些奇怪的物体。
那么如果太小的话呢?
可能画面跟你的提示词的相关性,又不够一般来说我们选择7比较保险,那么按照我当前的模型
根据作者的建议呢,他是建议5

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1959144.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于python的百度迁徙迁入、迁出数据分析(三)

百度迁徙定义 百度迁徙释义: 百度迁徙以用户常住地所在地市或停留超过一天的非常住地定义为出发城市,以用户离开出发城市,并在非出发城市停留超过4 h以上定义为到达城市。采用4h阈值,排除了城际出行中的途经地。 定义参考来源…

当年很流行,现在已经淘汰的Java技术,请不要学了!【建议收藏】

在Java技术的发展历程中,确实有一些曾经流行但现在已经被淘汰或不再推荐使用的技术。了解这些技术可以帮助你避免学习过时的知识,从而更高效地提升自己的技能。 以下是一些曾经流行但现在已经不太推荐学习的Java技术: 1. Servlet 2.x&#x…

日程管理多源归一,服务场景一键直达

时间对于每个人来说都是非常宝贵的,曾经我们使用台历、挂历来标记和查看重要日程,通过翻页来见证时光的流逝,随着信息化时代的不断发展,更加灵活简洁的电子日历成为主流,日历也从一个最简单的日期看板,慢慢…

RuntimeError: No CUDA GPUs are available

RuntimeError: No CUDA GPUs are available 目录 RuntimeError: No CUDA GPUs are available 【常见模块错误】 【解决方案】 解决步骤如下: 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页,我是博主英杰,211科…

如何利用代理ip探索外国新闻视角?

引言 在日常的网络使用中我们常常会遇到诸多难题,让我们无法获取到想要的信息或服务,若访问速度很慢还会影响好的在线工作和娱乐体验。其次,随着网络安全问题的频发,个人隐私泄露成为了一个不容忽视的问题。这些痛点,…

React Native新架构系列-新架构介绍

从今天起,会陆续更新React Native新架构相关的系列内容,本系列基于React Native 0.73.4版本,从一名Android开发者的视角进行介绍。本系列介绍的内容默认读者对React Native有一定的了解,对基础的开发内容不再赘述。 前言 首先介绍…

AI绘画3分钟解决英文恐惧症,comfyui汉化插件

前言 全面解析:Comfy UI汉化插件的安装与配置指南 本文涉及的工作流和插件,需要的朋友请扫描免费获取哦 引言 本文图片来源网络,侵权联删除。 在全球化的今天,软件界面的本地化是提升用户体验的重要一环。对于许多非英语母语的…

辅听耳机芯片型号介绍—云信通讯

辅听耳机系列芯片介绍: 杰理芯片型号: AC7003D / AC7006F 芯片特点: 1.内置啸叫抑制算法 2.内置辅听专用动态多段增益调节 3.内置人声增强和环境噪声压制算法 4.公版手机app开放定制服务,支持听力测试和个性化增益配置 5.支…

WAAP替代传统WAF已成趋势

数字化时代,Web应用和API已成为企业运营的核心。然而,随着网络攻击手段的不断进化,自动化攻击愈发频繁,传统的Web应用防火墙(WAF)已难以满足现代企业的安全需求。WAAP(Web Application and API …

Springboot手工艺品交易平台—计算机毕业设计源码11541

摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对手工艺品交易平台等问题,对手工…

办公人导航-一个资源丰富的网站

办公人导航是一个资源丰富的网站,旨在为办公人员提供各种优质资源和工具,以提高工作效率和生活质量。 ★★★★★办公人导航:https://www.bgrdh.com/ 这个网站涵盖了以下几个方面: 综合性的导航平台:办公人导航集成了…

机械学习—零基础学习日志(高数15——函数极限性质)

零基础为了学人工智能,真的开始复习高数 这里我们将会学习函数极限的性质。 唯一性 来一个练习题: 再来一个练习: 这里我问了一下ChatGPT,如果一个值两侧分别趋近于正无穷,以及负无穷。理论上这个极限值应该说是不存…

虹科技术前沿 | TSN网络中时间感知整形器的性能验证实测

来源:虹科技术前沿 | TSN网络中时间感知整形器的性能验证实测 原文链接:https://mp.weixin.qq.com/s/h3hTRAAEVN42DjDRifGxnA 欢迎关注虹科,为您提供最新资讯! #时间敏感网络 #TSN #时间感知整形器 导读 本文旨在验证时间敏感…

vscode搭建rust开发环境

由于rustrover不是免费的,此处教学搭建一套基于vscode的rust开发环境,可运行,可调式 1.下载vscode1.91.1 Download Visual Studio Code - Mac, Linux, Windows 2.下载插件 打开网站下载插件 rust-analyzer-0.4.2049、vscode-lldb-1.10.0、…

SQL数据库如何修改表中栏位的长度

1.问题 已经建立的表中MEMO 栏位原来长度是20,随着使用需要将MEMO长度调整为200; 即 MEMO VARCHAR(20) → MEMO VARCHAR(200) 2.修改办法 -- ALTER TABLE 表名 ALTER COLUMN 栏位名字 类型(长度);ALTER T…

java通过poi解析word入门

文章目录 介绍一、了解word docx文档的结构二、引入POI的依赖三、解析Word文档常用API加载Word文档获取文档整体结构获取文档中的段落获取文档中的表格获取文档中的脚注 四、解析Word中的段落示例五、读取Word文档并遍历图片六、解析Word中的图片示例 介绍 Apache POI 是一个处…

6. 运行时数据区-程序计数器和栈帧

运行时数据区分类 Java虚拟机在运行Java程序过程中管理的内存区域,称之为运行时数据区。运行时数据区分为两大类,线程共享和线程不共享,线程共享的有: 方法区堆 线程不共享的有: 程序计数器Java虚拟机栈本地方法栈…

收银系统源码-会员营销

系统概况 专门为零售行业的连锁店量身打造的收银系统,适用于常规超市、生鲜超市、水果店、便利店、零食专卖店、服装店、母婴用品、农贸市场等类型的门店使用。同时线上线下数据打通,线下收银的数据与小程序私域商城中的数据完全同步,如商品…

Luma AI发布文生视频大模型Dream Machine——可免费在线试玩

Sora模型的文生视频能力,想必一定惊艳过你。虽然Sora模型很惊艳,但是并没有开放给普通大众。Luma AI发布文生视频大模型Dream Machine模型,可以免费供大家使用,任何人只要到Luma AI的官方网站,就可体验Luma AI的文生视…

vue3前端开发-小兔鲜项目-sku的实现

vue3前端开发-小兔鲜项目-sku的实现!这是一个会计学的特殊专业名词,可以理解为产品的型号,规格的货品计量单位。 它是一组数据的混合体。比如:尺寸,材料,品质,等等。组合在一起形成的一个混合数…