欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://spike.blog.csdn.net/article/details/131643131
LaMa: https://github.com/advimman/lama
- Paper: Resolution-robust Large Mask Inpainting with Fourier Convolutions
LaMa: Large Mask inpainting
尽管现代图像修复系统已经取得了显著的进步,但是在处理大面积缺失、复杂的几何结构和高分辨率图像方面,常常面临挑战。其中一个主要的原因是修复网络和损失函数中缺乏有效的接收视野。为了解决这个问题,提出了一种新的方法,称为 大面积 Mask 修复(LaMa),主要基于:
- 一种新的修复网络架构,使用快速傅里叶卷积(FFCs),具有全图像的接收视野;
- 高接收视野的感知损失;
- 大量训练 Mask,释放前两个部分的潜力。
LaMa 修复网络在一系列数据集上改进了最新的技术水平,并且在面临挑战的情况下,例如完成周期性结构,也取得了优秀的性能。LaMa 模型令人惊讶地能够很好地适应训练时未见过的更高分辨率,且在参数和时间成本上比竞争基线更低。
1. 基础图像
启动 SD 服务命令:
conda deactivate
source venv/bin/activate
# python launch.py --port 9301 --xformers
nohup python -u launch.py --port 9301 --xformers > nohup.sd.out &
ControlNet 版本:v1.1.231
,已升级至最新版本:
cd stable-diffusion-webui/extensions/sd-webui-controlnet
git pull
再重启服务。
模型是墨优人造人
,输入定制化的提示词
与配置
:
1girl,moyou,best quality,detailed,8k hdr,RAW,intricate details,chiaroscuro,drop shadow,
(cosmetics:1.1),(rim light:1.2),
solo,(face details:1.3),(light green hair:1.1),eyes,hair accessories,
standing on the ground,full body,fashionable clothing,school uniform,
huge chest,lacteal sulcus,sneakers,on the bustling streets,(pinkshoes:1.2),short skirt
Negative prompt: EasyNegative,(badhandv4:1.2)
Steps: 30, Sampler: DDIM, CFG scale: 7, Seed: 777766374, Face restoration: CodeFormer, Size: 512x768, Model hash: 6a226dd292, Model: 墨幽人造人_v1010_完整版, Denoising strength: 0.2, Hires upscale: 2, Hires upscaler: 8x_NMKD-Superscale_150000_G, Version: v1.4.0
默认 512x768 的输出图像:
2. 扩展图像
将图像存储之后,放入 ControlNet 插件,并且启用,配置如下:
- 选择:
完美像素模式
; - 控制类型,选择:
局部重绘(Inpaint)
- 预处理器,选择:
inpaint_only+lama
;模型,选择:control_v11p_sd15_inpaint
。 - 控制模型:
更偏向提示词
,可以生成更多细节。 - 缩放模式:
缩放后填充空白
。
即:
其他参数配置:
- 采样方法,选择:
DDIM
,即模型推荐方法。 - 迭代步数,选择:
30~50
- 宽度和高度:注意,如果要生成图像较宽,即 宽度:高度 > 2:1,建议拆分2次进行,以避免生成多个人像。即原图512x768 - 1024x768 - 1536x768,重复2次操作,即可。
即:
通过 2 次扩展,即512x768
- 1024x768
- 1536x768
,输出 1536x768
的图像:
3. 提升细节
使用 ControlNet 的 Tile 模式,可以有效去除边缘过渡。
将图像转换至 图生图
模式,配置参数:
提示词
保持不变。- 选择
面部修复
,因为重绘,就要选择面部修复
。 - 重绘尺寸倍数,选择:
2倍
,即从1536x768
-3072x1536
- 重绘幅度,选择:
0.6
- 其余默认或与模型相关。
即:
ControlNet 插件的 Tile
功能的配置:
- 启用:
完美像素模式
; - 控制类型,选择
Tile (分块)
; - 预处理器,选择:
tile_resample
;模型,选择control_v11f1e_sd15_tile
; - 其余保持默认。
即:
最终效果:
其中,绿色手提包的局部细节对比,如下:
其他
miaoshouai-assistant (喵手助理) 插件
添加 miaoshouai-assistant,安装链接,扩展
- 从网址安装
:
https://ghproxy.com/https://github.com/miaoshouai/miaoshouai-assistant.git
遇到 Bug,TypeError: 'type' object is not subscriptable
:
File "stable-diffusion-webui/extensions/miaoshouai-assistant/scripts/runtime/msai_prelude.py", line 116, in MiaoshouPrelude
def ENV_EXCLUSION(self) -> list[str]:
TypeError: 'type' object is not subscriptable
源码:miaoshouai-assistant/scripts/runtime/msai_prelude.py
,返回类型错误,修改即可:
# def ENV_EXCLUSION(self) -> list[str]:
def ENV_EXCLUSION(self) -> list:
暂时并未使用。