InsCode Stable Diffusion 美图活动一期——即刻体验!来自 CSDN 的 SD 模型

news2024/11/15 12:17:23

文章目录

  • 🔥关于活动
  • 📋前言
  • 🎯什么是 Stable Diffusion
    • 🧩Stable Diffusion 与其他 AI 艺术生成器有什么区别?
  • 🎯开始体验 InsCode Stable Diffusion
  • 🎯试用 SD 模型生成优质人物好图
    • 🧩第一款(测试)
    • 🧩第二款
    • 🧩第三款
    • 🧩第四款(优化第一款)
  • 🎯Stable Diffusion常用提示词中英文对照表
  • 📝最后


在这里插入图片描述

🔥关于活动

在这里插入图片描述
InsCode 是一个集成了在线 IDE 、在线 AI 编程、在线算力租赁、在线项目部署以及在线 SD (Stable Diffusion)模型使用的综合代码开发平台。不论你是初级软件工程师,还是 AI 大模型爱好者,InsCode 都能帮助你快速编写代码,运行项目。甚至在这里你还可以一键购买算力,训练大模型,开发自己的 AI 应用程序。

活动地址:https://activity.csdn.net/creatActivity?id=10496


在这里插入图片描述

📋前言

在体验和试用 InsCode Stable Diffusion 之前,我们首先先认识一下 InscodeStable Diffusion(下面简称 SD),上面活动简介也提及到了,InsCode 是一个集成了在线 IDE 、在线 AI 编程、在线算力租赁、在线项目部署以及在线 SD (Stable Diffusion)模型使用的综合代码开发平台。接下来跟随我的脚步,通过这篇文章带大家一起了解这款来自 CSDN 的 SD 模型。除此之外,还可以通过博主的这篇文章:InsCode AI 创作助手:源于 CSDN 的 AI 创作助手,不一样的创作体验 来体验 Inscode 创作助手。


🎯什么是 Stable Diffusion

Stable Diffusion 是一种基于机器学习的文本到图像模型,能够根据文本生成图形。为内容创作者和艺术家等提供更高水平的创造力和便利。 该技术通过使用“风格转换”来模仿其训练数据集中图像的风格,并根据文本输入生成相应的图像。
在这里插入图片描述
Stable Diffusion 算法上来自 CompVis 和 Runway 团队于 2021 年 12 月提出的 “潜在扩散模型”(LDM / Latent Diffusion Model),这个模型又是基于 2015 年提出的扩散模型(DM / Diffusion Model)。参考论文中介绍算法核心逻辑的插图,Stable Diffusion 的数据会在像素空间(Pixel Space)、潜在空间(Latent Space)、条件(Conditioning)三部分之间流转,其算法逻辑大概分这几步:

  • 图像编码器将图像从像素空间(Pixel Space)压缩到更小维度的潜在空间(Latent Space),捕捉图像更本质的信息;
  • 对潜在空间中的图片添加噪声,进行扩散过程(Diffusion Process);
  • 通过 CLIP 文本编码器将输入的描述语转换为去噪过程的条件(Conditioning);
  • 基于一些条件对图像进行去噪(Denoising)以获得生成图片的潜在表示,去噪步骤可以灵活地以文本、图像和其他形式为条件(以文本为条件即 text2img、以图像为条件即 img2img);
  • 图像解码器通过将图像从潜在空间转换回像素空间来生成最终图像。
    在这里插入图片描述

🧩Stable Diffusion 与其他 AI 艺术生成器有什么区别?

  • ✅高质量结果

    • Stable Diffusion 在大型图像和字幕数据集上进行训练,使其能够生成准确反映输入文本的高质量图像。 该模型能够模仿各种图像的风格,确保输出准确且具有视觉吸引力。
  • ✅快速高效

    • 使用 Stable Diffusion 生成图像只需几秒钟,使其成为内容创作者和艺术家在紧迫的期限内工作或需要在短时间内制作多件作品的理想解决方案。 通过 Stable Diffusion,您可以在不牺牲质量的情况下创作出令人惊叹的艺术作品。
  • ✅高性价比

    • 通过以手动创建图像所需时间的一小部分生成图像,从长远来看,Stable Diffusion 的传播可以节省您的时间和金钱。 无论您是个人内容创作者还是初创公司,Stable Diffusion 所带来的成本节约都可以帮助您更有效地分配资源并更高效地进行创意工作。
  • ✅可定制的风格

    • 凭借模仿各种图像风格的能力,Stable Diffusion 提供了极大的多功能性和灵活性,让您可以选择最适合您需要的风格。 无论您是想创作逼真的肖像、抽象艺术作品,还是介于两者之间的任何东西,Stable Diffusion 都能满足您的需求。

在这里插入图片描述
图片内容简单翻译为:

自2021年启动AI计划以来,我们已经汇集了超过20万名创作者、开发人员和研究人员,并建立了几个遍布全球的研究中心。

我们坚信我们的开源理念为创造和获取尖端研究提供了明确的路径。Stability AI支持的研究社区目前正在开发应用于图像、语言、代码、音频、视频、3D内容、设计、生物技术和其他科学研究领域的突破性AI模型。

我们与Amazon Web Services的合作为我们提供了全球第五大超级计算机——Ezra-1 UltraCluster,为生成这些进展提供了必要的计算能力。


🎯开始体验 InsCode Stable Diffusion

Stable Diffusion 模型在线使用地址:Stable Diffusion - InsCode
在这里插入图片描述
通过上面的内容介绍,我们大概了解了 Stable Diffusion ,接下来通过图片和文字描述,来一起体验 InsCode Stable Diffusion 吧。

点击上方的在线使用地址,然后点击运行及使用按钮,创建一个 Stable Diffusion。
在这里插入图片描述
输入标题内容,然后购买 GPU 并创建项目,简单购买一个小时来体验一下先,余额有钱的直接支付,如果没有的话可以扫码支付。
在这里插入图片描述
在这里插入图片描述
付款成功后返回主页,找到 Stable Diffusion WebUI ,点击图标启动即可,启动时需要等待一段时间。
在这里插入图片描述
启动成功后,界面如下。
在这里插入图片描述
在这个界面,我们可以设置模型版本及相关配置,同时还可以设置图片提示词与反向提示词等等。
在这里插入图片描述
然后我们简单体验一下效果,输入最基本的几个提示词,看看生成的内容质量如何。

提示词: best quality, ultra-detailed, masterpiece, finely detail, highres, 8k wallpaper

反向词:

其他模型版本及相关配置如下:
Steps: 11, Sampler: Euler a, CFG scale: 7, Seed: 312280338, Size: 512x512, Model hash: 74c61c3a52, Model: GuoFeng3, Version: v1.2.0

(这些内容分别是采样迭代数、采样方法、提示词相关性、种子、图片大小、模型哈希值、模型、版本)下面就不再赘述了。
在这里插入图片描述
大图如下,Seed 为 312280338。
在这里插入图片描述
效果质量还是不错的,回到主题,这期的美图活动的主题是试用 SD 模型生成优质人物好图,所以接下来我们针对性的输入对应的提示词、反向词以及模型版本及相关配置来生成人物好图。


🎯试用 SD 模型生成优质人物好图

通过上面内容的步骤,我们已经快速上手这个 SD 模型了,大致了解了所需配置的地方,我们接下来发挥自己的创造性和想象力,用这款 SD 模型生成一些优质的人物好图。

🧩第一款(测试)

第一款,小试牛刀,用一下网络上找的 Prompt 来测试一下,总体效果还行吧,但是 Stable Diffusion 模型不同,所以生成的内容效果有点差别,在部分小细节上差点意思(比如说五官、特别是眼睛方面),接下来继续优化 Prompt

提示词: 1girl, sailor dress, beautiful detailed eyes, highly detailed skin, extremely delicate and beautiful

反向词:mutated hands and fingers,deformed,poorly drawn hands

其他模型版本及相关配置如下:
Steps: 20,
Sampler: Euler a,
CFG scale: 7,
Seed: 2802259150,
Size: 512x512,
Model hash: 5be5011567,
Model: control_v2p_sd15_mediapipe_face,
Version: v1.2.0
在这里插入图片描述

在这里插入图片描述

🧩第二款

第二款,换一种 SD 模型,继续用网络上找的 Prompt 来生成,看到生成图越看越眼熟,然后发现提示词中的使用了 Lora,原来是周姐啊。其中最关键的还是是反向词的内容,这款图片的质量还是可以的,五官很精致,同时使用了 Lora

❗补充(Lora 和 VAE):
Lora 模型全称是:Low-Rank Adaptation of Large Language Models ,可以理解为 Stable Diffusion 中的一个插件,仅需要少量的数据就可以进行训练的一种模型。在生成图片时,Lora 模型会与大模型结合使用,从而实现对输出图片结果的调整。

VAEVariational Autoencoder 的缩写,中文名变分自编码器,是一种基于深度学习的生成模型。VAE 的基本思想是将输入数据编码为潜在空间中的概率分布,并通过解码器将潜在空间中的随机向量映射回原始数据空间中。

提示词: best quality, ultra high res, (photorealistic:1.4), oversized jacket, white shirt, <lora:ZhouShuyi:0.8>

反向词:paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans, lowres,bad anatomy,bad hands, text, error, missing fingers,extra digit, fewer digits, cropped, worstquality, low quality, normal quality,jpegartifacts,signature, watermark, username, blurry, bad feet,cropped,poorly drawn hands, poorly drawn face, mutation,deformed,worst quality,low quality normal quality,jpeg artifacts, signature, watermark, extra fingers, fewer digits,extra limbs,extra arms,extra legs,malformed limbs, fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions, gross proportions,text,error,missing fingers, missing arms, missing legs,extra digit,

其他模型版本及相关配置如下:
Steps: 20,
Sampler: DPM++ SDE Karras,
CFG scale: 7,
Seed: 1267322829,
Size: 512x512,
Model hash: 7234b76e42,
Model: chilloutmix-Ni,
Version: v1.2.0
在这里插入图片描述

在这里插入图片描述

🧩第三款

第三款,我们继续换一款风格的 SD 模型,生成一款二次元风格的人物,用最简单的提示词来生成这个人物。

提示词: a girl

反向词:mutated hands and fingers,extra limb,deformed,malformed hands

其他模型版本及相关配置如下:
Steps: 20,
Sampler: DPM++ 2M Karras,
CFG scale: 7, Seed: 3879995273,
Size: 512x512,
Model hash: b79a4f7283,
Model: primemix_v21,
Version: v1.2.0
在这里插入图片描述

在这里插入图片描述

🧩第四款(优化第一款)

第四款,我们继续使用第三款的 SD 模型,来优化第一款来生成二次元风格的人物,继续沿用第一款的提示词、反向词等等配置。总的来说,质的飞跃,看来第一款的 SD 模型没选对啊。

提示词: 1girl, sailor dress, beautiful detailed eyes, highly detailed skin, extremely delicate and beautiful girls

反向词:mutated hands and fingers,extra limb,deformed,malformed hands

其他模型版本及相关配置如下:
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 2704110108, Size: 512x512, Model hash: b79a4f7283, Model: primemix_v21, Version: v1.2.0
在这里插入图片描述
接下来沿用这套模板(不修改参数),继续生成几张看看效果。

Seed: 1377237799
在这里插入图片描述
Seed: 1483369475
在这里插入图片描述
Seed: 3479193900
在这里插入图片描述

在这里插入图片描述


🎯Stable Diffusion常用提示词中英文对照表

1、提高质量的正向提示词
HDR,UHD,8K(HDR、UHD、4K、8K和64K)——这样的质量词可以带来巨大的差异提升照片的质量
best quality——最佳质量
masterpiece——杰作
Highly detailed——画出更多详细的细节
Studio lighting——添加演播室的灯光,可以为图像添加一些漂亮的纹理
ultra-fine painting——超精细绘画
sharp focus——聚焦清晰
physically-based rendering——基于物理渲染
extreme detail description——极其详细的刻画
Professional——加入该词可以大大改善图像的色彩对比和细节
Vivid Colors——给图片添加鲜艳的色彩,可以为你的图像增添活力
Bokeh——虚化模糊了背景,突出了主体,像iPhone的人像模式
(EOS R8,50mm,F1.2,8K,RAW photo:1.2)——摄影币对相机设置的描述
High resolution scan——让你的照片具有老照片的样子赋予年代感
Sketch——素描
Painting——绘画

2、艺术风格代表的提示词
肖像画(Portraits)——Derek Gores,Miles Aldridge, Jean Baptiste-Carpeaux,Anne-Louis Girodet
风景画(Landscape)——Alejandro Bursido, Jacques-Laurent Agasse, Andreas Achenbach, Cuno Amiet
恐怖画(Horror)——H.R.Giger,Tim Burton, Andy Fairhurst,Zdzislaw Beksinski
动漫画(Anime)——Makoto Shinkai,Katsuhiro Otomo, Masashi Kishimoto, Kentaro Miura
科幻画(Sci-fi)——Chesley Bonestell, Karel Thole, Jim Burns, Enki Bilal
摄影(Photography)——Ansel Adams, Ray Earnes, Peter Kemp,Ruth Bernhard
概念艺术家(视频游戏)(Concept artists (video game))——Emerson Tung, Shaddy Safadi, Kentaro Miura

3、常用的反向提示词
mutated hands and fingers——变异的手和手指
deformed——畸形的
bad anatomy——解剖不良
disfigured——毁容
poorly drawn face——脸部画得不好
mutated——变异的
extra limb——多余的肢体
ugly——丑陋
poorly drawn hands——手部画得很差
missing limb——缺少的肢体
floating limbs——漂浮的四肢
disconnected limbs——肢体不连贯
malformed hands——畸形的手
out of focus——脱离焦点
long neck——长颈
long body——身体长

4、镜头视角
dynamic angle——动态角度
from above——从上方
from below——从下面
wide shot——广角宽景
Aerial View——空中俯瞰视图

5、主体远近
full body shot——全身
cowboy shot——半身
close-up shot——接近

6、光线
cinematic lighting——电影光
dynamic lighting——动感光

7、主体视线
looking at viewer——画面中的物体或人物在直接面对画面或观众
looking at another——两个角色正在相互交流或对视
looking away——看着别的方向,不直视对方
looking back——回头看
looking up——摄像机或观察者的视角调整为向上看

8、画风
sketch, one-hour drawing challenge——草图、速写、手绘风
photograph, photorealistic——照片

9、表情
blush——脸红
wet sweat——大汗
flying sweatdrops——飞汗

10、服装
china dress——旗袍
sailor dress——水手服
school uniform——校服
sailor senshi uniform——水手服

11、风景指定
underwater——水下
shinto shrine——神社

12、姿势指定
hands on——hands on own face, hands on feet, hands on breast
kneeling——跪下
hand between legs——腿夹手
hair flip——将头发向后或向一侧甩动的动作
skirt flip——裙子甩起来


📝最后

到此就是文章的全部内容了,通过这篇我们简单了解和学习 Stable Diffusion 的相关知识,以及快速体验 InsCode Stable Diffusion 。在边写文章边体验 InsCode Stable Diffusion 过程中,乐此不疲,只不过时间有限,还有很多想法没有实现出来,关于提示词、反向词、模型等等配置还要花时间去熟悉和学习。

阿里云文章地址:https://developer.aliyun.com/article/1275452
华为云文章地址:https://bbs.huaweicloud.com/blogs/405719
稀土掘金文章地址:https://juejin.cn/post/7255936307099762749
在这里插入图片描述

🎯点赞收藏,防止迷路🔥
✅感谢观看,下期再会📝
@CSDN | 黛琳ghz

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/759130.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

内存池是什么原理?|内存池简易模拟实现|为学习高并发内存池tcmalloc做准备

前言 那么这里博主先安利一些干货满满的专栏了&#xff01; 这两个都是博主在学习Linux操作系统过程中的记录&#xff0c;希望对大家的学习有帮助&#xff01; 操作系统Operating Syshttps://blog.csdn.net/yu_cblog/category_12165502.html?spm1001.2014.3001.5482Linux S…

在Linux系统中如何搭建Apache服务

在Linux系统中如何搭建Apache服务 Apache服务是一种开源的、跨平台的Web服务器软件&#xff0c;它的作用是提供网页内容给用户的Web浏览器。具体来说&#xff0c;Apache服务有以下几个主要的作用&#xff1a; 1.Web服务器&#xff1a;Apache是一款功能强大且广泛使用的Web服务…

54、Mysql索引的数据结构,各自优劣

Mysql索引的数据结构&#xff0c;各自优劣 索引的数据结构和具体存储引擎的实现有关在MySQL中使用较多的索引有Hash索引&#xff0c;B树索引等InnoDB存储引擎的默认索引实现为: B树索引。对于哈希索引来说&#xff0c;底层的数据结构就是哈希表&#xff0c;因此在绝大多数需求…

C++编程(三)—— C++11

文章目录 绑定器和函数对象函数对象绑定器lambda表达式 关键词与语法autonullptr右值引用 智能指针容器set和mapunordered_set和unordered_map数组链表 语言级别支持的多线程编程thread子线程如何结束主线程如何处理子线程线程间的互斥线程的同步通信机制&#xff08;条件变量&…

Windows Cluster 分布式算法

在分布式系统中&#xff0c;都需要解决分布式一致性问题。那么&#xff0c;在Windows 集群中&#xff0c;使用了什么算法来保证集群的一致性呢——Paxos。Windows Server 故障转移集群 (WSFC) 使用 Paxos 算法在整个系统中同步更改。通过记录 Paxos Tag 值并保留历史记录&#…

连锁门店如何搭建B2B2C多用户商城系统?

现在很多的线下店铺都开始慢慢的转型线上了&#xff0c;想线上线下相结合&#xff0c;但是最近很多的商家都在问什么样的B2B2C商城系统开发适合线下店铺呢?这个问题今天加速度jsudo小编给大家一起整理如下&#xff0c;相信商家看完后就知道如何选择一款合适的商城系统了。 一、…

【C语言】求序列前N项和

问题描述 输入一个正整数n&#xff0c;输出2/13/25/38/5…的前n项之和&#xff08;该序列从第2项起&#xff0c;每一项的分子是前一项分子与分母的和&#xff0c;分母是前一项的分子&#xff09;&#xff0c;保留2位小数。试编写相应程序。 代码实现 #include<stdio.h>…

spring-14优化性能

原始Junit测试Spring的问题 这里的&#xff1a;第一行代码获得应用上下文对象&#xff0c;第二行代码获得你那个对象 2、原先测试找junit&#xff0c;现在测试找spring&#xff0c;然后再找&#xff0c;junit&#xff0c;告诉我配置文件是什么&#xff0c;然后注入测试对象&am…

LeetCode 172.阶乘后的零

基础方法就是暴力解&#xff0c;其次是数学归纳。 具体思路如下&#xff1a;&#xff08;copy大佬的&#xff09; 耐心看完&#xff01; 代码如下&#xff1a; #include <iostream> #include <vector> #include <cmath> #include <algorithm> #incl…

Android GridPager实战,从RecyclerView to ViewPager

这个简单的的案例展示了如何从RecyclerView to ViewPager&#xff0c;以网上的公开图片为样例。 安卓开发中从RecyclerView 到 ViewPager demo运行结果demo项目工程目录结构关键代码 MainActivity关键代码GridFragment关键代码ImageFragment关键代码ImagePagerFragment关键布局…

关于示波器引入50HZ工频干扰的解释

前几天&#xff0c;小白在实验室工作时&#xff0c;听到同事抱怨示波器有问题。上前查看&#xff0c;才知道&#xff0c;小白的那位同事在测量信号波形时&#xff0c;实际与理想相差甚远。于是乎&#xff0c;在探头什么也不接的情况下&#xff0c;发现示波器本身也存在波形信号…

2022Robocom国赛-u2 女王的大敕令

副本是游戏里的一个特色玩法&#xff0c;主要为玩家带来装备、道具、游戏资源的产出&#xff0c;满足玩家的游戏进程。 在 MMORPG《最终幻想14》里&#xff0c;有一个攻略人数最大达到 48 人的副本“零式贡希尔德神庙”&#xff0c;其中守关 BOSS “天佑女王”有一个很有趣的技…

图形编辑器开发:一些会用到的简单几何算法

大家好&#xff0c;我是前端西瓜哥。 开发图形编辑器&#xff0c;你会经常要解决一些算法问题。本文盘点一些我开发图形编辑器时遇到的简单几何算法问题。 矩形碰撞检测 判断两个矩形是否发生碰撞&#xff08;或者说相交&#xff09;&#xff0c;即两个矩形有重合的区域。 …

C生万物 | 程序员必备实用调试技巧分享

一起来学习调试~ 一、前言二、什么是Bug&#xff1f;三、调试是什么&#xff1f;有多重要&#xff1f;1、导学引入2、调试的基本步骤3、Debug和Release的介绍 四、Windows环境下VS调试介绍1、调试环境的准备2、学会快捷键3、调试的时候查看程序当前信息3.1 查看临时变量的值3.2…

基于SSM的购物商城系统的设计与实现

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

SpringBoot中通过自定义Jackson注解实现接口返回数据脱敏

场景 SpringBoot中整合Sharding Sphere实现数据加解密/数据脱敏/数据库密文&#xff0c;查询明文&#xff1a; SpringBoot中整合Sharding Sphere实现数据加解密/数据脱敏/数据库密文&#xff0c;查询明文_霸道流氓气质的博客-CSDN博客 上面讲的是数据库中存储密文&#xff0…

音乐格式转换mp3软件有哪些?分享三个方法给大家!

要将音乐文件转换为MP3格式的情况&#xff0c;以便在各种设备上播放。为了帮助大家完成这个任务&#xff0c;下面将分享三种实用的方法和工具&#xff0c;其中方法一是使用记灵在线工具进行音乐格式转换。无论您是音乐爱好者还是需要将音频文件转换为MP3格式的专业人士&#xf…

障碍物距离显示需求功能定义

1. 需求 来源 整车功能定义清单中SAF-10 -06 条需求 。泊车视觉辅助 &#xff0c;360全景 -距离树数值显示时&#xff0c;显示车辆与障碍物的距离数字 。 2. 开发 范围 项目带全景功能的配置&#xff0c;见最新配置表&#xff1a; 3. 功能 定义 在雷达报警激活状态下&#xff0…

SSM入门—Spring框架-IOC简单案例

目录 控制反转&#xff1a;创建对象 基于XML实现 基于注解实现 依赖注入&#xff1a;对象赋值 通过xml注入 控制反转&#xff1a;创建对象 把对象的创建权交给了Spring容器 基于XML实现 1、maven 导入依赖 <!--Maven会自动添加当前jar依赖的其他jar--> <depen…

第一章 数据库的操作

第一章 数据库的操作 一、库的操作1、创建数据库&#xff08;1&#xff09;语法&#xff08;2&#xff09;字符集与校验规则a.定义 &#xff08;3&#xff09;创建不同字符集与校验规则的数据库 2、查看数据库&#xff08;1&#xff09;语法&#xff08;2&#xff09;示例 3、显…