Stable Didffusion 学习笔记经验总结

news2026/3/28 14:45:18

值的概念

在Stable Diffusion中，有很多要设置的参数，这些参数起到的作用非常重要，直接决定了出图的各种样子和质量，经过实践，我大概搞明白他们遵循的规律，因为程序员是要与AI对话的，所以所谓的指标，应该就是让AI放开在机的意思，就如踩油门一样，所以，所有的数字越大，AI越放飞自己，越小，AI就越收敛。

文生图的意义

文生图的意义就是为了给图生图做准备的,所以一开始不能设置太大,只是为了看个样子,真正要挖细节时,再开始搞成图生图
lora 在文生图的意义在于,将大模型的人物或者服饰,先变成需要的样子,然后在图生图中微调,通过对lora和重绘的设置将样貌和服饰一点点向着自己需要的方向发展.

图生图

图生图的意义比文生图的意义要大的多,通过不断调整prompt和参数将一张图,向着自己要求的方向绘制,同时还可以借助姿势来帮助AI逐渐调整姿势,这个过程需要反复,通过调整重绘幅度提高AI的想象力,才能实现自己的目标
重绘值：例如换衣服或者增减衣服,如果选择重绘在0.7以下,AI基本不敢有大动作联想,而达到0.7时,即意味着告诉AI它可以重绘70%的部分,这样AI就可以绽放想象力,所以重绘的概念大家就会很容易理解了,重绘值越低，图片变化幅度越低，如果是0，则不会做任何改变；
对于衣服的处理，AI对黑色分辨率不高，即使让AI发挥想象力，AI对黑色仍然处理不太好，我想了个点子，就是将所有的服饰中的黑色全部搞成白色，这样AI就很容易识别出来。
另外就是透明的处理，对衣服，尤其是汉服的处理，可以让其透明，透明程度，可以让AI一点点处理，同时提高重绘程度，来达到透明质地的效果。
lora 在图片重绘时的作用要大些，尤其用lora做局部重绘，效果比较好，我本来想找一下脚的lora，结果训练的人很少，且角度也很少，所以，目前AI虽然能把手画好了，但是脚画起来真是让人痛苦不堪，希望未来有大佬补足这一块。
局部重绘，已经被融入PS了，也不知道PS怎么搞成图层的，不过这个创意很好，stable diffusion就是单张图片，之前我就在想，如果stable diffusion能做成图层，每渲染一层都进行模式叠加，那就强无敌了，也不知道底层AI是不是这样做的，但是专业的PS貌似已经解读出来了，我详细你不久的未来就会有大牛会搞出来图层的概念来
posex 无法画手，而且四肢的对应比较简单，不知道未来火柴人能不能做得更丰富些，openpose无法识别三维世界，虽然posex能输出三维立体的pose，但是AI不理解呀，它没有分层的概念后，还是靠抽象层去猜，一个抬起的手是在前还是在后，AI好像分不清，不知道我们的打开方式是不是不对，后期继续深入，看看别人怎么解决的
lora权重插件还没有研究，但是自己手写lora进行配置，的确多个lora可以组合效果，通过调节它们参数权重，可以将不同的lora风格加入到重绘当中，目前窍门还没有找到，只能下试，但目前来看，可以理解为层的概念，把最核心的大细节加大权重，小细节都比大lora小，就能实现主体风格不变，并且可以一直加细节
最终需要微调的图，一定要记得固定住seed，不然AI无法把控在原来的已经形成的模型上，继续追加细节
AI 能听懂你的修图要求，这个之前没提过修图要求，只是让AI设计图，从无到有，实际上也可以从有到无，只要你提的要求符合模型中的词汇即可，这个还是要对模型怎么训练的，LLM的词如何转化AI能识别的意思，尤其是LLM的词有哪些可用，要了解一下

局部重绘

我的想法得到证实，更具细节的lora，对局部优化有质的提升，AI可以通过对整体图片的识别，这是大模型起到的作用，然后分析你要重绘的局部，思考如何将周边的图像融合进来，以达到更好的无缝衔接效果，这个过程需要你对lora参数进行调整，以及给AI重绘的幅度，两者结合就能很好的让AI知道重绘的点在哪里，然后经过多次随机和prompt的组合调整，就能弄出来符合你预想的图像
于是商业价值就出来了，谁掌握了大量显卡，快速地给一堆人搞一堆lora，那么这个人以后就可以拿自己的lora搞事情了，甚至未来元宇宙，虚拟世界，都可以拿去用，这是服务于C端客户，同样B端客户的培训和指导，也是商机。

视频重绘

视频重绘的原理跟局部重绘的原理一致，差异点应该就像 After Effect 有图片批处理方式，例如局部重绘蒙版可以一次性追加到所有图片，如果人物动作幅度不大，AI 对蒙版区域的要求没那么严格，接下来的事情就是烧显卡，不过也比 3D 重新渲染速度要快？

stable diffusion 设计目的

有时候怎么盈利和赚钱，其实stable diffusion开源公司肯定想到了，所以玩到这里我也似乎有感觉了，文生图可以提高你的想象力，将想象力的成本降到最低，然后就是图生图，将产品经理的内心架构可以很快得到原公司设计体系和风格的延伸，很多大设计公司都是有自己的风格的，储备了大量的已有风格的产品，如果新进去的设计者要熟悉这种风格，并在这个基础上尽快进行新的迭代，而stable diffusion只要给每个设计公司训练一好基本模型之后，再让每个项目组训练好自己的lora，这样整个公司的风格就定下来了，新的设计者进去后，就可以快速知道风格，并且将自己设计理念用prompt的方式先给到大模型，进行文生图，这样只需要一天的时间，新人就能很好的适应这种风格，并创造出统一风格的设计，同时每个项目组都有大量的lora，融入项目租的速度也加快了，这就是价值的之所在。

（未完待续）