文章目录
- 🔥关于活动
- 📋前言
- 🎯什么是 Stable Diffusion
- 🧩Stable Diffusion 与其他 AI 艺术生成器有什么区别?
- 🎯开始体验 InsCode Stable Diffusion
- 🎯试用 SD 模型生成优质人物好图
- 🧩第一款(测试)
- 🧩第二款
- 🧩第三款
- 🧩第四款(优化第一款)
- 🎯Stable Diffusion常用提示词中英文对照表
- 📝最后
🔥关于活动
InsCode 是一个集成了在线 IDE 、在线 AI 编程、在线算力租赁、在线项目部署以及在线 SD (Stable Diffusion)模型使用的综合代码开发平台。不论你是初级软件工程师,还是 AI 大模型爱好者,InsCode 都能帮助你快速编写代码,运行项目。甚至在这里你还可以一键购买算力,训练大模型,开发自己的 AI 应用程序。
活动地址:https://activity.csdn.net/creatActivity?id=10496
📋前言
在体验和试用 InsCode Stable Diffusion 之前,我们首先先认识一下 Inscode 和 Stable Diffusion(下面简称 SD),上面活动简介也提及到了,InsCode 是一个集成了在线 IDE 、在线 AI 编程、在线算力租赁、在线项目部署以及在线 SD (Stable Diffusion)模型使用的综合代码开发平台。接下来跟随我的脚步,通过这篇文章带大家一起了解这款来自 CSDN 的 SD 模型。除此之外,还可以通过博主的这篇文章:InsCode AI 创作助手:源于 CSDN 的 AI 创作助手,不一样的创作体验 来体验 Inscode 创作助手。
🎯什么是 Stable Diffusion
Stable Diffusion 是一种基于机器学习的文本到图像模型,能够根据文本生成图形。为内容创作者和艺术家等提供更高水平的创造力和便利。 该技术通过使用“风格转换”来模仿其训练数据集中图像的风格,并根据文本输入生成相应的图像。
Stable Diffusion 算法上来自 CompVis 和 Runway 团队于 2021 年 12 月提出的 “潜在扩散模型”(LDM / Latent Diffusion Model),这个模型又是基于 2015 年提出的扩散模型(DM / Diffusion Model)。参考论文中介绍算法核心逻辑的插图,Stable Diffusion 的数据会在像素空间(Pixel Space)、潜在空间(Latent Space)、条件(Conditioning)三部分之间流转,其算法逻辑大概分这几步:
- 图像编码器将图像从像素空间(Pixel Space)压缩到更小维度的潜在空间(Latent Space),捕捉图像更本质的信息;
- 对潜在空间中的图片添加噪声,进行扩散过程(Diffusion Process);
- 通过 CLIP 文本编码器将输入的描述语转换为去噪过程的条件(Conditioning);
- 基于一些条件对图像进行去噪(Denoising)以获得生成图片的潜在表示,去噪步骤可以灵活地以文本、图像和其他形式为条件(以文本为条件即 text2img、以图像为条件即 img2img);
- 图像解码器通过将图像从潜在空间转换回像素空间来生成最终图像。
🧩Stable Diffusion 与其他 AI 艺术生成器有什么区别?
-
✅高质量结果
- Stable Diffusion 在大型图像和字幕数据集上进行训练,使其能够生成准确反映输入文本的高质量图像。 该模型能够模仿各种图像的风格,确保输出准确且具有视觉吸引力。
-
✅快速高效
- 使用 Stable Diffusion 生成图像只需几秒钟,使其成为内容创作者和艺术家在紧迫的期限内工作或需要在短时间内制作多件作品的理想解决方案。 通过 Stable Diffusion,您可以在不牺牲质量的情况下创作出令人惊叹的艺术作品。
-
✅高性价比
- 通过以手动创建图像所需时间的一小部分生成图像,从长远来看,Stable Diffusion 的传播可以节省您的时间和金钱。 无论您是个人内容创作者还是初创公司,Stable Diffusion 所带来的成本节约都可以帮助您更有效地分配资源并更高效地进行创意工作。
-
✅可定制的风格
- 凭借模仿各种图像风格的能力,Stable Diffusion 提供了极大的多功能性和灵活性,让您可以选择最适合您需要的风格。 无论您是想创作逼真的肖像、抽象艺术作品,还是介于两者之间的任何东西,Stable Diffusion 都能满足您的需求。
图片内容简单翻译为:
自2021年启动AI计划以来,我们已经汇集了超过20万名创作者、开发人员和研究人员,并建立了几个遍布全球的研究中心。
我们坚信我们的开源理念为创造和获取尖端研究提供了明确的路径。Stability AI支持的研究社区目前正在开发应用于图像、语言、代码、音频、视频、3D内容、设计、生物技术和其他科学研究领域的突破性AI模型。
我们与Amazon Web Services的合作为我们提供了全球第五大超级计算机——Ezra-1 UltraCluster,为生成这些进展提供了必要的计算能力。
🎯开始体验 InsCode Stable Diffusion
Stable Diffusion 模型在线使用地址:Stable Diffusion - InsCode
通过上面的内容介绍,我们大概了解了 Stable Diffusion ,接下来通过图片和文字描述,来一起体验 InsCode Stable Diffusion 吧。
点击上方的在线使用地址,然后点击运行及使用按钮,创建一个 Stable Diffusion。
输入标题内容,然后购买 GPU 并创建项目,简单购买一个小时来体验一下先,余额有钱的直接支付,如果没有的话可以扫码支付。
付款成功后返回主页,找到 Stable Diffusion WebUI ,点击图标启动即可,启动时需要等待一段时间。
启动成功后,界面如下。
在这个界面,我们可以设置模型版本及相关配置,同时还可以设置图片提示词与反向提示词等等。
然后我们简单体验一下效果,输入最基本的几个提示词,看看生成的内容质量如何。
提示词: best quality, ultra-detailed, masterpiece, finely detail, highres, 8k wallpaper
反向词: 无
其他模型版本及相关配置如下:
Steps: 11, Sampler: Euler a, CFG scale: 7, Seed: 312280338, Size: 512x512, Model hash: 74c61c3a52, Model: GuoFeng3, Version: v1.2.0
(这些内容分别是采样迭代数、采样方法、提示词相关性、种子、图片大小、模型哈希值、模型、版本)下面就不再赘述了。
大图如下,Seed 为 312280338。
效果质量还是不错的,回到主题,这期的美图活动的主题是试用 SD 模型生成优质人物好图,所以接下来我们针对性的输入对应的提示词、反向词以及模型版本及相关配置来生成人物好图。
🎯试用 SD 模型生成优质人物好图
通过上面内容的步骤,我们已经快速上手这个 SD 模型了,大致了解了所需配置的地方,我们接下来发挥自己的创造性和想象力,用这款 SD 模型生成一些优质的人物好图。
🧩第一款(测试)
第一款,小试牛刀,用一下网络上找的 Prompt 来测试一下,总体效果还行吧,但是 Stable Diffusion 模型不同,所以生成的内容效果有点差别,在部分小细节上差点意思(比如说五官、特别是眼睛方面),接下来继续优化 Prompt 。
提示词: 1girl, sailor dress, beautiful detailed eyes, highly detailed skin, extremely delicate and beautiful
反向词:mutated hands and fingers,deformed,poorly drawn hands
其他模型版本及相关配置如下:
Steps: 20,
Sampler: Euler a,
CFG scale: 7,
Seed: 2802259150,
Size: 512x512,
Model hash: 5be5011567,
Model: control_v2p_sd15_mediapipe_face,
Version: v1.2.0
🧩第二款
第二款,换一种 SD 模型,继续用网络上找的 Prompt 来生成,看到生成图越看越眼熟,然后发现提示词中的使用了 Lora,原来是周姐啊。其中最关键的还是是反向词的内容,这款图片的质量还是可以的,五官很精致,同时使用了 Lora 。
❗补充(Lora 和 VAE):
Lora 模型全称是:Low-Rank Adaptation of Large Language Models ,可以理解为 Stable Diffusion 中的一个插件,仅需要少量的数据就可以进行训练的一种模型。在生成图片时,Lora 模型会与大模型结合使用,从而实现对输出图片结果的调整。
VAE 是 Variational Autoencoder 的缩写,中文名变分自编码器,是一种基于深度学习的生成模型。VAE 的基本思想是将输入数据编码为潜在空间中的概率分布,并通过解码器将潜在空间中的随机向量映射回原始数据空间中。
提示词: best quality, ultra high res, (photorealistic:1.4), oversized jacket, white shirt,
<lora:ZhouShuyi:0.8>
反向词:paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans, lowres,bad anatomy,bad hands, text, error, missing fingers,extra digit, fewer digits, cropped, worstquality, low quality, normal quality,jpegartifacts,signature, watermark, username, blurry, bad feet,cropped,poorly drawn hands, poorly drawn face, mutation,deformed,worst quality,low quality normal quality,jpeg artifacts, signature, watermark, extra fingers, fewer digits,extra limbs,extra arms,extra legs,malformed limbs, fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions, gross proportions,text,error,missing fingers, missing arms, missing legs,extra digit,
其他模型版本及相关配置如下:
Steps: 20,
Sampler: DPM++ SDE Karras,
CFG scale: 7,
Seed: 1267322829,
Size: 512x512,
Model hash: 7234b76e42,
Model: chilloutmix-Ni,
Version: v1.2.0
🧩第三款
第三款,我们继续换一款风格的 SD 模型,生成一款二次元风格的人物,用最简单的提示词来生成这个人物。
提示词: a girl
反向词:mutated hands and fingers,extra limb,deformed,malformed hands
其他模型版本及相关配置如下:
Steps: 20,
Sampler: DPM++ 2M Karras,
CFG scale: 7, Seed: 3879995273,
Size: 512x512,
Model hash: b79a4f7283,
Model: primemix_v21,
Version: v1.2.0
🧩第四款(优化第一款)
第四款,我们继续使用第三款的 SD 模型,来优化第一款来生成二次元风格的人物,继续沿用第一款的提示词、反向词等等配置。总的来说,质的飞跃,看来第一款的 SD 模型没选对啊。
提示词: 1girl, sailor dress, beautiful detailed eyes, highly detailed skin, extremely delicate and beautiful girls
反向词:mutated hands and fingers,extra limb,deformed,malformed hands
其他模型版本及相关配置如下:
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 2704110108, Size: 512x512, Model hash: b79a4f7283, Model: primemix_v21, Version: v1.2.0
接下来沿用这套模板(不修改参数),继续生成几张看看效果。
Seed: 1377237799
Seed: 1483369475
Seed: 3479193900
🎯Stable Diffusion常用提示词中英文对照表
1、提高质量的正向提示词
HDR,UHD,8K(HDR、UHD、4K、8K和64K)——这样的质量词可以带来巨大的差异提升照片的质量
best quality——最佳质量
masterpiece——杰作
Highly detailed——画出更多详细的细节
Studio lighting——添加演播室的灯光,可以为图像添加一些漂亮的纹理
ultra-fine painting——超精细绘画
sharp focus——聚焦清晰
physically-based rendering——基于物理渲染
extreme detail description——极其详细的刻画
Professional——加入该词可以大大改善图像的色彩对比和细节
Vivid Colors——给图片添加鲜艳的色彩,可以为你的图像增添活力
Bokeh——虚化模糊了背景,突出了主体,像iPhone的人像模式
(EOS R8,50mm,F1.2,8K,RAW photo:1.2)——摄影币对相机设置的描述
High resolution scan——让你的照片具有老照片的样子赋予年代感
Sketch——素描
Painting——绘画
2、艺术风格代表的提示词
肖像画(Portraits)——Derek Gores,Miles Aldridge, Jean Baptiste-Carpeaux,Anne-Louis Girodet
风景画(Landscape)——Alejandro Bursido, Jacques-Laurent Agasse, Andreas Achenbach, Cuno Amiet
恐怖画(Horror)——H.R.Giger,Tim Burton, Andy Fairhurst,Zdzislaw Beksinski
动漫画(Anime)——Makoto Shinkai,Katsuhiro Otomo, Masashi Kishimoto, Kentaro Miura
科幻画(Sci-fi)——Chesley Bonestell, Karel Thole, Jim Burns, Enki Bilal
摄影(Photography)——Ansel Adams, Ray Earnes, Peter Kemp,Ruth Bernhard
概念艺术家(视频游戏)(Concept artists (video game))——Emerson Tung, Shaddy Safadi, Kentaro Miura
3、常用的反向提示词
mutated hands and fingers——变异的手和手指
deformed——畸形的
bad anatomy——解剖不良
disfigured——毁容
poorly drawn face——脸部画得不好
mutated——变异的
extra limb——多余的肢体
ugly——丑陋
poorly drawn hands——手部画得很差
missing limb——缺少的肢体
floating limbs——漂浮的四肢
disconnected limbs——肢体不连贯
malformed hands——畸形的手
out of focus——脱离焦点
long neck——长颈
long body——身体长
4、镜头视角
dynamic angle——动态角度
from above——从上方
from below——从下面
wide shot——广角宽景
Aerial View——空中俯瞰视图
5、主体远近
full body shot——全身
cowboy shot——半身
close-up shot——接近
6、光线
cinematic lighting——电影光
dynamic lighting——动感光
7、主体视线
looking at viewer——画面中的物体或人物在直接面对画面或观众
looking at another——两个角色正在相互交流或对视
looking away——看着别的方向,不直视对方
looking back——回头看
looking up——摄像机或观察者的视角调整为向上看
8、画风
sketch, one-hour drawing challenge——草图、速写、手绘风
photograph, photorealistic——照片
9、表情
blush——脸红
wet sweat——大汗
flying sweatdrops——飞汗
10、服装
china dress——旗袍
sailor dress——水手服
school uniform——校服
sailor senshi uniform——水手服
11、风景指定
underwater——水下
shinto shrine——神社
12、姿势指定
hands on——hands on own face, hands on feet, hands on breast
kneeling——跪下
hand between legs——腿夹手
hair flip——将头发向后或向一侧甩动的动作
skirt flip——裙子甩起来
📝最后
到此就是文章的全部内容了,通过这篇我们简单了解和学习 Stable Diffusion 的相关知识,以及快速体验 InsCode Stable Diffusion 。在边写文章边体验 InsCode Stable Diffusion 过程中,乐此不疲,只不过时间有限,还有很多想法没有实现出来,关于提示词、反向词、模型等等配置还要花时间去熟悉和学习。
阿里云文章地址:https://developer.aliyun.com/article/1275452
华为云文章地址:https://bbs.huaweicloud.com/blogs/405719
稀土掘金文章地址:https://juejin.cn/post/7255936307099762749