AI绘画 Stable Diffusion图像的脸部细节控制——采样器全解析

news2024/11/18 16:42:45

大家好,我是画画的小强

我们在运用AI绘画 Stable Diffusion 这一功能强大的AI绘图工具时,我们往往会发现自己对提示词的使用还不够充分。在这种情形下,我们应当如何调整自己的策略,以便更加精确、全面地塑造出理想的人物形象呢?举例来说,假设我们输入的是:

a girl in dress walks down a country road,vision,front view,audience oriented,

在这里插入图片描述

图片效果总是不尽人意在这里插入图片描述

我们批量四个之后,除去背对的图片,我们可以看到其余三个的面部非常的奇怪

在这里插入图片描述

该如何快速处理呢?

原因分析

首先我们要了解脸部崩坏的原因

为什么在使用Stable Diffusion生成全身图像时,脸部细节往往不够精细?
  1. 问题一:图像分辨率和细节处理 在生成全身图像的过程中,模型会将计算资源集中于整个身体的描绘,包括服装、姿势和背景等要素。脸部通常仅占整个图像的一小部分,相对地,分配给脸部细节处理的资源就显得有限。这导致在最终生成的全身图像中,脸部的细节可能不如半身图像那样清晰。

  2. 问题二:训练数据的偏差效应 如果您的数据集中包含了大量高清的半身像而非全身像,Stable Diffusion模型可能会倾向于专注于处理这些半身像。由于全身像包含更多的图像元素和更高的维度,模型在绘制时需要投入更多的计算能力。因此,它在半身像的处理上可能会更有优势。

  3. 问题三:生成算法的局限性 当前的生成算法在处理尺寸不同的对象时,可能存在一些限制。例如,脸部区域是一个复杂且细节丰富的部分,而当算法处理全身图像时,可能难以保持对脸部细节质量的关注。

  4. 问题四:计算资源的限制 要生成一个特定尺寸的图像(如320x240像素),模型需要进行一系列运算,包括模板提取、特征表示、搜索和匹配等。这些都需要计算资源,并且在有限的资源下,对图像不同部分的优化可能会增加计算成本。因此,对于全身图像,可能对脸部细节质量有所优化,或者简化了处理流程。

解决策略

  1. 利用更高分辨率图像进行训练 通过使用更高分辨率的图像来进行训练,模型可以学习更多细节,这对提升生成照片中脸部的细节是有益的。但是更高的分辨率会导致人物拉长畸形,大大降低了质量

  2. 在生成全身图像时采用引导技术 在生成全身图像时,尝试应用引导技术(如注意力机制),这样可以让模型更加专注于脸部区域,从而提高对脸部细节的关注。

在这里插入图片描述

我们可以看到即使使用了prompt之后,Stable Diffusion似乎听不懂一样只是对面部加了一个渲染,但并没有达到预期的效果
在这里插入图片描述

局部重绘

在这里插入图片描述

我们可以直接点击这里到局部重绘,在选择重绘内容之后,如下:
在这里插入图片描述

提示词都不用变化,只需要把负面词加上即可

(worst quality, low quality:1.4),monochrome,zombie,bad_prompt_version2-neg,easynegative (1),(worst quality, low quality:1.4),(depth of field, blurry:1.2),(greyscale, monochrome:1.1),3D face,cropped,lowres,text,(nsfw:1.3),(worst quality:2),(low quality:2),(normal quality:2),normal quality,((grayscale)),skin spots,acnes,skin blemishes,age spot,(ugly:1.331),(duplicate:1.331),(morbid:1.21),(mutilated:1.21),(tranny:1.331),mutated hands,(poorly drawn hands:1.5),blurry,(bad anatomy:1.21),(bad proportions:1.331),extra limbs,(disfigured:1.331),(missing arms:1.331),(extra legs:1.331),(fused fingers:1.61051),(too many fingers:1.61051),(unclear eyes:1.331),lowers,bad hands,missing fingers,extra digit,bad hands,missing fingers,(((extra arms and legs))),

  1. 调整参数设置 通过增加迭代次数或采用不同的采样方法,可以提高生成图像的质量,其中包括脸部细节。

在这里插入图片描述

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

采样器

在探讨Stable Diffusion的核心技术中,采样器扮演着至关重要的角色。本文将深入分析几种主要的采样器,以及它们各自的特点和应用场景,为读者提供更全面的了解。首先,我们来看Euler采样器。这是一个基础而简洁的工具,它采用欧拉方法来进行迭代操作。欧拉方法本质上是一种高效的数值积分技术,专门用于求解非线性常微分方程。当应用于图像生成时,Euler采样器通过迭代去噪,可以有效地去除图像中的噪声。尽管速度快,Euler采样器也可能导致一些图像细节受损,因为过度的去噪可能会丢失一些微妙的边缘信息。

接下来是Euler a采样器,作为Euler的改进版,它增加了额外的参数用于控制去噪过程。这些参数的引入使得用户能够在去噪过程中拥有更多的自主权,从而有望获得更高的图像质量。这种改进带来了一系列潜在的优势:如更平滑的采样体验、更精细的噪声控制以及更优的整体图像效果。转向Heun采样器,它的设计理念源自Heun方法,这是一种结合了Euler和Midpoint方法的创新技术。Heun方法同样基于数值积分原理,专注于求解常微分方程,并在Stable Diffusion中用于迭代去噪过程。相较于Euler,Heun采样器展现出更加平滑细腻的采样过程,同时提供更为卓越的图像质量。

在这里插入图片描述

DPM2采样器则是一种基于物理模型的工具。它采用了“去噪扩散概率模型”(DPM)技术,这一模型能够在去噪过程中优化控制噪声水平,进而生成更高质量的图像。DPM2的强大之处在于它可以精确调整噪声水平,避免了传统去噪方法中常见的“过噪”问题。

DPM2 a是DPM2采样器的又一次重大升级,它继承了Euler a的特性,并引入了更多的参数来进一步控制去噪流程。这些新参数允许用户对去噪过程进行精细的控制,有助于提升最终图像的质量。

DPM fast是DPM系列的另一快速响应选项。它通过降低去噪迭代次数并简化过程的方式,牺牲了一定的图像质量以换取生成速度的提升。尽管如此,DPM fast仍然保留了许多吸引人的特点,包括快速的生成效率和更短的处理时间。

DPM adaptive是DPM2采样器的自适应变体。它具备动态调整采样策略的能力,能够根据图像的复杂度实时调整采样参数。这样做的目的是为了平衡高生成速度和高质量输出之间的关系,确保生成的图像既快又好。

Restart采样器是一种利用重启技术的新型采样器。当图像质量开始出现下降趋势时,Restart采样器会重新开始整个去噪过程,以恢复图像的原有质量,防止其进一步恶化。

在这里插入图片描述

DDIM采样器基于迭代去噪技术,使用“去噪扩散迭代模型”(DDIM)。这项技术能够生成非常高质量的图像,但由于它的迭代特性,生成速度相对较慢。

PLMS采样器是DDIM采样器的改良版,它采用了“预条件的Legendre多项式去噪”(PLMS)技术。这种方法不仅能提供更好的图像质量,还能在生成速度上略胜一筹,与DDIM形成鲜明对比。

UniPC采样器基于统一概率耦合,采用“统一概率耦合”技术实现高质量图像输出。UniPC虽然在图像质量方面表现出色,但其复杂性和迭代特性导致了较慢的生成速度。

LCM采样器则基于拉普拉斯耦合模型,运用“拉普拉斯耦合模型”技术。LCM同样能够产出非常高品质的图像,但由于其结构的复杂性及迭代特性,生成速度也相应受到影响。

DPM++ 2M采样器是DPM2的进一步改进版,它引入了许多额外的去噪步骤和参数,旨在提升图像质量。特别值得一提的是,DPM++ 2M在去噪概率模型方面做出了重要的更新。

DPM++ SDE采样器是DPM2的基于随机微分方程(SDE)的改进版本。SDE技术的引入为图像生成提供了更加稳定和高质的结果。

DPM++ 2M SDE采样器是DPM++ 2M与DPM++ SDE结合的产物。它融合了两种技术的优势,为用户带来了更佳的图像质量。

DPM++ 2M SDE Heun采样器是DPM++ 2M SDE的进一步升级,它使用Heun方法进行迭代,结合了去噪扩散概率模型和Heun方法的共同优点。

DPM++ 2S a采样器是DPM++ 2M的最新版本,它增加了额外参数来精细控制去噪过程。这些新增的控制参数允许用户在去噪过程中拥有更多选择,有望获得更加精细和高质量的图像。

最后,我们来看看DPM++ 3M SDE采样器。它是DPM++ 2M SDE采样器的第三代进化版,引入了更多的去噪步骤和参数以追求更高的图像质量。DPM++ 3M SDE的目标是在保持前两代产品优点的同时,进一步提升性能和图像质量,为用户提供更加流畅和精细的图像生成过程。

在这里插入图片描述

总结

在当今这个视觉至上的时代,无论是艺术创作、广告宣传还是社交媒体分享,高质量的图像都是吸引观众、传递信息的关键。通过上述介绍的解决策略和技术改进方法,我们不仅能够艺术地掌控人物形象,还能更好地运用Stable Diffusion采样器,这是图像生成领域的一大进步。艺术地掌控人物形象,不仅需要我们有独到的审美眼光,还需要我们掌握相关的技术手段。从化妆造型、服饰搭配到光影效果、后期处理,每一个环节都至关重要。通过上述介绍,我们了解到如何通过细节的调整,让人物形象更加立体、生动。

在这里插入图片描述

而Stable Diffusion采样器的运用,则是图像生成技术的又一次飞跃。它通过算法模拟出自然、逼真的图像效果,大大提高了图像生成的质量和效率。通过上述介绍,我们了解到如何通过调整参数、优化算法,让Stable Diffusion采样器更好地为我们服务。

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1896729.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据特征采样在 MySQL 同步一致性校验中的实践

作者:vivo 互联网存储研发团队 - Shang Yongxing 本文介绍了当前DTS应用中,MySQL数据同步使用到的数据一致性校验工具,并对它的实现思路进行分享。 一、背景 在 MySQL 的使用过程中,经常会因为如集群拆分、数据传输、数据聚合等…

24_嵌入式系统输入输出设备

目录 GPIO原理与结构 A/D接口基本原理 A/D接口原理 A/D转换的重要指标 D/A接口基本原理 D/A接口原理 DAC的分类 D/A转换器的主要指标 键盘接口基本原理 键盘接口原理 用I/O口实现键盘接口 显示接口基本原理 基本结构和特点 基本原理 LCD种类 市面上出售的LCD的类…

python怎么样将一段程序无效掉

1、python中可以用注释屏蔽一段语句,具体方法如下,首先打开一段python的示例程序: 2、然后单行注释的方法是在语句前面加上#,程序运行后添加注释的地方的语句会被自动跳过,这里可以看到将打印变量a的语句添加注释就没有…

STM32F1+HAL库+FreeTOTS学习5——内核中断管理及中断控制函数

STM32F1HAL库FreeTOTS学习5——中断管理和临界段代码保护 中断简介中断优先级寄存器拓展FreeRTOS中PendSV和Systick中断优先级配置三个中断屏蔽寄存器FreeRTOS中断管理函数代码验证 上一期我们学习了FreeRTOS中任务挂起与恢复,在中断服务程序中恢复任务过程中&#…

利用谷歌云serverless代码托管服务Cloud Functions构建Gemini Pro API

谷歌在2024年4月发布了全新一代的多模态模型Gemini 1.5 Pro,Gemini 1.5 Pro不仅能够生成创意文本和代码,还能理解、总结上传的图片、视频和音频内容,并且支持高达100万tokens的上下文。在多个基准测试中表现优异,性能超越了ChatGP…

竞赛选题 协同过滤电影推荐系统

文章目录 1 简介1 设计概要2 课题背景和目的3 协同过滤算法原理3.1 基于用户的协同过滤推荐算法实现原理3.1.1 步骤13.1.2 步骤23.1.3 步骤33.1.4 步骤4 4 系统实现4.1 开发环境4.2 系统功能描述4.3 系统数据流程4.3.1 用户端数据流程4.3.2 管理员端数据流程 4.4 系统功能设计 …

【Proteus】按键的实现『⒉种』

🚩 WRITE IN FRONT 🚩 🔎 介绍:"謓泽"正在路上朝着"攻城狮"方向"前进四" 🔎🏅 荣誉:2021|2022年度博客之星物联网与嵌入式开发TOP5|TOP4、2021|2222年获评…

13-错误-ERROR: duplicate key value violates unique constraint “ux_xxx“

13-错误-ERROR: duplicate key value violates unique constraint “ux_xxx” 更多内容欢迎关注我(持续更新中,欢迎Star✨) Github:CodeZeng1998/Java-Developer-Work-Note 技术公众号:CodeZeng1998(纯纯…

Vite: Bundler实现JavaScript的AST解析器—词法分析、语义分析

概述 基于前文,我们写了一个迷你版的 no-bundle 开发服务,也就是 Vite 开发阶段的 Dev Server,而在生产环境下面,处于页面性能的考虑,Vite 还是选择进行打包(bundle),并且在底层使用 Rollup 来完成打包的过…

liunx清理服务器内存和日志

1、查看服务器磁盘占用情况 # 查看磁盘占用大小 df -h 2、删除data文件夹下面的日志 3、查看每个服务下面的日志输出文件,过大就先停掉服务再删除out文件再重启服务 4、先进入想删除输入日志的服务文件夹下,查看服务进程,杀掉进程&#xff…

【算法】(C语言):二分查找

二分查找: 获取查找区域的中间位置。若中间位置的数据就是要找的值,则返回true。若要找的值 小于 中间位置的数据,则往左边查找。若要找的值 大于 中间位置的数据,则往右边查找。重复1和2,若没有要找的值,…

Mall,正在和年轻人重新对话

【潮汐商业评论/原创】 结束了一下午的苦闷培训,当Cindy赶到重庆十字大道时,才发现十字路口上的巨大“飞行棋”在前两天就已经撤展了。 “来了又错过,就会觉得遗憾,毕竟这样的路口不多,展陈又不可能会返场。” 飞行棋…

【机器学习】机器学习在AI Agent中的影响与作用

文章目录 🚀Al Agent是什么📕Al Agent的工作原理与技术💪Al Agent应用领域🚀智能家居应用🌈医疗健康领域⭐金融服务行业🌂交通运输管理🎬教育培训应用 🔒Al Agent优势与挑战✊Al Age…

苹果获得OpenAI董事会观察员职位、Runway最新估值40亿美元

ChatGPT狂飙160天,世界已经不是之前的样子。 更多资源欢迎关注 据知情人士透露,苹果应用商店(App Store)负责人、前营销主管Phil Schiller被选中担任这一职位。这位知情人士说,作为董事会观察员,他不会以正…

【综合能源】计及碳捕集电厂低碳特性及需求响应的综合能源系统多时间尺度调度模型

目录 1 主要内容 2 部分程序 3 实现效果 4 下载链接 1 主要内容 本程序是对《计及碳捕集电厂低碳特性的含风电电力系统源-荷多时间尺度调度方法》方法复现,非完全复现,只做了日前日内部分,并在上述基础上改进升级为电热综合电源微网系统&…

【uni-app】基础

一、官网 网址:https://zh.uniapp.dcloud.io/tutorial/其他辅助网页讲解:https://www.wenjiangs.com/doc/7y94pldun2插件下载free:https://ext.dcloud.net.cn/ 二、提示框 用uni.showToast提醒的次数超过7个字的时候就会导致文字显示不全&…

SSL证书遇到问题时的解决方案

当SSL证书遇到问题时,可能会影响到网站的安全性和用户体验,常见的问题包括证书过期、域名不匹配、证书链不完整、证书颁发机构不受信任、私钥丢失或损坏等。 一、证书过期 解决方法:更新或续订证书。这通常涉及联系你的SSL证书提供商&#…

ACL 2024 | CoCA:自注意力的缺陷与改进

近年来,在大语言模型(LLM)的反复刷屏过程中,作为其内核的 Transformer 始终是绝对的主角。然而,随着业务落地的诉求逐渐强烈,有些原本不被过多关注的特性,也开始成为焦点。例如:在 T…

Shopee Live的订单量在泰国猛增超40倍!然鹅,泰国站佣金费率上调,还有得做吗?

Shopee,作为东南亚地区电子商务领域的佼佼者,不仅在区域内树立了行业标杆,更在泰国这一充满活力的市场中占据了举足轻重的地位。其创新的商业模式与不断优化的服务体验,赢得了广大消费者的青睐与信赖。近日,Shopee官方…

合成孔径雷达原理与应用(四)

合成孔径雷达原理与应用(四) 2. 应用2.7. 沉降形变滑坡2.7.1. 地面沉降2.7.2. 铁路沉降2.7.3. 大坝形变2.7.4. 机场形变2.7.5. 桥梁形变2.7.6. 滑坡监测 2. 应用 2.7. 沉降形变滑坡 2.7.1. 地面沉降 由图2-17可知,从整体的区域分布上来看&a…