【AI绘画--七夕篇】:七夕特别教程,使用SDXL绘制你的心上人(Stable Diffusion)(封神榜—妲己)

news2024/11/15 4:18:59

目录

  • 前言
  • 0、介绍
    • 0-0、结果展示
    • 0-1、Stable Diffusion
    • 0-2、sdxl介绍
  • 一、云端部署Stable Diffusion
    • 1-1、云端平台的优势
  • 二、平台介绍
  • 三、注册账号并且开始炼制
    • 3-1、购买算力并创建工作空间
    • 3-2、启动工作空间
    • 3-3、应用市场一键安装
    • 3-4、使用Stable-Diffusion作图
  • 四、有女朋友的——使用sdxl来进行图生图教程(以封神榜妲己为例)
    • 4-1、操作流程
    • 4-2、以封神榜妲己为例
  • 五、没有女朋友的——使用sdxl来生成一个女朋友
  • 五、结尾彩蛋


前言

七夕特别教程,快来使用SDXL画出一个女朋友吧!

0、介绍

0-0、结果展示

请添加图片描述
请添加图片描述

请添加图片描述

0-1、Stable Diffusion

Stable Diffusion是一种基于潜在扩散模型(Latent Diffusion Models,简称LDM)的模型,它最近在各个平台上都引起了广泛的关注,因为其在文本到图像(text2img)或图像到图像(img2img)的应用中都展示出了非常惊艳的效果。

  • Stable Diffusion的整体框架包含训练和采样两个阶段。在训练阶段,使用AutoEncoderKL自编码器将图像从像素空间映射到潜在空间,学习图像的隐式表达。
  • Stable Diffusion的重要组成模块包括DDPM、DDIM、PLMS算法等。这些算法都是用于模型的训练和生成过程。
  • Stable Diffusion的另一个重要组成部分是变分自动编码器(Variational Autoencoder,简称VAE)。VAE是一种用于学习输入数据的低维隐式表达的神经网络,它可以用于生成新的数据样本,如图像或文本。

总的来说,Stable Diffusion是一种强大的模型,它可以生成高质量的图像,对于不同的任务有很好的适应性。例如,它可以用于将文本描述转化为对应的图像,也可以用于图像的风格转换等任务

以下为官网截图
在这里插入图片描述

0-2、sdxl介绍

官方界面如下所示
在这里插入图片描述

SDXL和之前的版本一样也是基于latent diffusion架构,对于latent diffusion,首先会采用一个autoencoder模型来图像压缩为latent,然后扩散模型用来生成latent,生成的latent可以通过autoencoder的decoder来重建出图像。SDXL整体模型结构如下图所示:

在这里插入图片描述

相比之前SD版本,Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refiner模型,对Base模型生成的图像Latent特征进行精细化,其本质上是在做图生图的工作。
相比SD1.x和SD2.x,SDXL使用了更大的backbone,下图展示了三者结构和参数量上的对比,SDXL的参数量大约为之前版本的SD的3倍

总之一句话: 相比于之前发布的各种版本的Stable Diffusion,sdxl更大、更强!

一、云端部署Stable Diffusion

1-1、云端平台的优势

云端部署Stable Diffusion炼图成为解决方案。相较于本地炼模型,云端部署Stable Diffusion炼图有诸多优势

  • 国内访问无障碍
    云端平台可以提供国内访问无障碍的环境,让你无需担心访问限制的问题。

  • 不需要自己买显卡
    可使用云端的3090、A100显卡,云端平台提供多种显卡供你选择,包括强大的3090和A100显卡,让你不再为显卡的配置而烦恼。

  • Stable Diffusion一键部署
    云服务中自带部分底模/LoRA,云端平台已经为你准备好了Stable Diffusion一键部署的环境,你可以直接使用,而且平台中自带一些底模和LoRA,省去了自己上传的麻烦。

  • 价格低廉,支持多人使用
    云端部署Stable Diffusion的价格相对较低,而且服务开启后,可以在任意电脑远程操作画图,支持多人使用。

在使用云端平台训练绘画模型之前,用户需要根据自己的需求选择合适的平台。我们需要考虑计算资源、支持的框架、费用与预算等等因素,今天带大家使用最低的成本体验一下云端炼图,以在揽睿星舟-GPU算力平台为例。

二、平台介绍

基于隐私安全计算的揽睿星舟AI服务平台旨在提供人工智能发展中的数据全价值周期中的AI生态系统,为AI中小企业发展提供了降本增效的新解法。平台整合多方资源,撮合和对接各类AI供需,赋能长尾AI应用场景。实现包括市场需求、场景对接、技术协作、数据共享等方面真正意义上的人工智能开放生态。除此之外,揽睿星舟引入众多第三方合作伙伴提供各类AI工具,将需求、供应、数据、算力等资源汇聚在一起,实现自助式AI供需对接,促成AI提供方和AI需求方互补合作,形成双赢局面。而对于开发者而言,揽睿星舟则具备提供丰富的GPU卡、开箱即用的开发环境、大容量、高可用的分布式文件系统、开放的镜像生态等平台优势,极大提高开发迭代速度并降低了运维成本。

此前,揽睿星舟平台上已有多家AIGC企业入驻,并通过平台能力实现了快速开发与变现

  • 性能提升——为企业提供百卡级别RDMA训练,百卡级别3090推理,揽睿星舟团队帮助进行算子优化

  • 成本降低——将已经训练好的模型,通过平台高效的弹性推理服务进行变现并控制成本

  • 技术创新——结合开源的Stable Diffusion进行二次创作

三、注册账号并且开始炼制

3-1、购买算力并创建工作空间

新用户在这个GPU算力平台上将获得两个小时的免费使用时间,可以选择强大的3090型号的显卡进行训练。这款显卡性能卓越,能够极大地加速模型的训练过程,让你在有限时间内获得更好的结果。

在开始训练前

  • 你可以从平台提供的丰富镜像库中选择公有镜像-others-sd-trainer-1.1.0
  • 此外,除了显卡的选择和镜像的设定,其他设置都是默认的,这样你就不需要过多担心配置的问题,可以专注于模型的训练和优化。

在这里插入图片描述
在这里插入图片描述

3-2、启动工作空间

点击启动你的训练任务,稍等几分钟,你就能轻松地进入训练环境。这个过程非常简单,只需要几个简单的步骤,你就可以开始你的AI之旅:

  • 如果在启动过程中遇到网络问题,不要着急,你可以先尝试调试网络连接,然后选择重新启动。不用担心,这个过程不会对你的费用造成任何损失。平台会为你提供免费的重新启动机会,确保你能够顺利开始你的训练任务。
  • 在进入训练环境后,你可以根据个人习惯和喜好选择适合自己的集成开发环境(IDE)。在这里,我选择使用VS Code,因为它是一款强大而灵活的IDE,拥有丰富的插件和扩展功能,可以满足各种编程需求。
    在这里插入图片描述
    在这里插入图片描述

3-3、应用市场一键安装

除了上述方法,也可以选择在应用市场一键安装,这样大大省去了自行搭建的步骤

  • 在我的应用里点击Stable-Diffusion
  • 选择新建实例
  • 选择web3.0,这里默认使用3090,为1.9/h,点击创建实例。(当前有活动,1.46/h,这还不冲?
  • 点击地址,即可进行体验。
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3-4、使用Stable-Diffusion作图

打开网址后的界面如下:我们可以看到左上角有许多可供选择的模型
在这里插入图片描述

在这里插入图片描述

四、有女朋友的——使用sdxl来进行图生图教程(以封神榜妲己为例)

4-1、操作流程

步骤1:依据上边步骤3-1购买完算力之后,选择配置页面参数配置。根据下图完成配置之后选择创建实例(七夕算力特价!)
参数

运行环境镜像: 公有镜像-others-sd-webui-3.0-V2
数据集: sd-base
预训练模型: sdxl-models

在这里插入图片描述
在这里插入图片描述
步骤二: 创建完成后等待几分钟让云端系统启动,选择VS Code启动
在这里插入图片描述
在这里插入图片描述
步骤三:选择Terminal——New Terminal,之后下方出现命令栏,命令窗口输入命令

bash /app/start.sh --skip-prepare-environment

在这里插入图片描述
在这里插入图片描述
步骤四:等待加载完毕后,我们到工作空间,选择“更多—复制调试地址”,在浏览器粘贴地址,进入到sd的主界面
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4-2、以封神榜妲己为例

原图如下图所示

在这里插入图片描述

步骤一:左上角模型选择sdxl_base,选择图生图模式,上传原图。

在这里插入图片描述

步骤二:设置参数

模型选择:sdxl_base
步数:20(看个人的机器配置,配置好的情况下可以加大采样步数)
宽度&高度: 10241024 (sdxl的训练数据为这个尺寸,最好选择10241024)
采样器:Euler 2 (采样器可以多多去尝试)
CFG:7

在这里插入图片描述
步骤三:有关于重绘强度,下图是重绘强度从0.1到0.6分别的图片展示。由图可知,重绘比例较小时,只有脸部发生细微变化,姿势基本维持原状,但是随着重绘强度的增大。脸部、衣服会慢慢发生变化,当重绘强度达到0.6时,姿势已经开始发生变化。 可以去试着调大一下重绘强度来生成完全不一样的妲己噢!

在这里插入图片描述

五、没有女朋友的——使用sdxl来生成一个女朋友

正向Prompt:图片的描述内容

realistic, photorealistic, masterpiece, best quality, dark shot, (photo of portrait:1.2), cowbody shot,1girl, solo, smile, looking at viewer, long black hair, ([:see-through:4]:1.2) (colorful:1.2) cns_dress, (floral print:1.2), standing by a river, dynamic pose, (shanghai:1.2), water, colorful cloud, incredible beautiful sky, netural lighting, dynamic Angle, neon, bokeh, Chiaroscuro,

反向Prompt:不希望图片中出现的内容

(deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), text, cropped, out of frame, (worst quality, low quality:2), jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck,
(tree,wood:1.2), (stone:1.2), (green,black,white:1.4), (sandals:1.4),

参数

模型选择:选择sd_xl_base
步数:28, 数值越大质量越好,但是同样的时间也越长。
宽度&高度: 1024*1024
采样器:DPM2,推荐选择 Euler a 或 DPM++ 系列,采样速度快,效果不一定好噢,要多次进行尝试。
CFG:7, 提示词的相关性,数值越大越相关,一般设置7—10之间。
在这里插入图片描述
其他参数

面部修复:脸部、手部最容易发生一些鬼畜,点击面部修复可以帮助修复脸部
高清修复:高清修复,增大图片像素。
生成批次: 图片生成的数量(这个值注意不要设置太大噢,容易崩掉卡住,设置为10-30之间,看个人机器配置)

五、结尾彩蛋

总结:折腾的时间比我想象的长,但比起自己部署整个环境,云端训练的优势还是显而易见的。如果你想练练手,不妨可以试试先薅个2小时羊毛注册链接,最近七夕还有优惠活动,大家快去试试吧!

                       		💋【“爱”在七夕,全场77折】💋
						👉🏻活动日期:2023/8/17-2023/8/22
				👉🏻活动详情:指定区 全场3090 24G资源【7.7折】优惠!!
								 相当于只要1.46/时

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/908355.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

cuda gdb调试

如果cudaDeviceEnablePeerAccess函数不支持或不起作用,您仍然可以尝试其他方法来实现GPU之间的数据交换和通信。以下是一些替代方法: 通过主机内存进行数据传输: 如果GPU之间的数据交换不是非常频繁,您可以将数据从一个GPU复制到…

【c语言】五子棋(EasyX图形库+背景音乐)

大家好,有没有觉得写了好多c语言代码,面对的都是黑框框控制台,当我们学习了基础的c语言知识,和EasyX图形库后,终于可以和黑框框saygoodbye,今天要分享给大家的是小游戏五子棋,跟着小张一起学习吧 EasyX图形…

(四)Doceke安装MySQL镜像+Docker启动MySQL容器

Doceke安装MySQL镜像/Docker启动MySQL容器 一、doceke安装MySQL镜像 切换到root用户,su root 。 1、启动Docker 启动:sudo systemctl start docker 停止:systemctl stop docker 重启:systemctl restart docker 查看docker运行…

视频汇聚平台EasyCVR安防视频监控在地下停车场中的具体应用方案

一、背景 随着我国城市化进程的加快,汽车已成为人们生活中不可缺少的交通工具,但在许多城市中,买车容易,停车难的问题愈发突出。特别是在人群密集的商场、写字楼和地下停车场,车流量大、车况复杂。传统的人工判断方式耗…

go、java、.net、C#、nodejs、vue、react、python程序问题进群咨询

1、面试辅导 2、程序辅导 3、一对一腾讯会议辅导 3、业务逻辑辅导 4、各种bug帮你解决。 5、培训小白 6、顺利拿到offer

【网络基础实战之路】基于三层架构实现一个企业内网搭建的实战详解

系列文章传送门: 【网络基础实战之路】设计网络划分的实战详解 【网络基础实战之路】一文弄懂TCP的三次握手与四次断开 【网络基础实战之路】基于MGRE多点协议的实战详解 【网络基础实战之路】基于OSPF协议建立两个MGRE网络的实验详解 【网络基础实战之路】基于…

Lombok生成的Getter和Setter的名称对于“eMail”或“xAxis”等属性存在大小写转换异常

问题 最新开发中,遇到一个字段映射问题。我们先看问题案例: 明明代码中第二个字母是大写,结果测试接口时发现变成了小写字母。 分析 通过网上查询发现,这属于Lombok的bug。而且早在2015年就有人在GitHub上提出了issues。 Names o…

基于SpringBoot房产销售系统【附ppt|开题|万字文档(LW)和搭建文档】

主要功能 前台界面: ①首页、房源信息推荐、房源信息展示、查看更多等 ②房源信息、房源名称、房源户型、销售姓名等 ③购房、预约、点我收藏、评论等 ④个人中心、我的收藏、支付等 后台登录: ①首页、个人中心:修改密码、用户信息管理等 ②…

三角函数与圆,角度和弧度 (草稿,建设中)

目录 1 三角函数与圆,角度和弧度 1.1 三角形 1.2 圆形 2 角度 3 弧度 rad 4 角度,弧度的换算 2 三角函数 1 三角函数与圆,角度和弧度 1.1 三角形 角度弧长sin()cos()tan() 1.2 圆形 半径,周长,弧长半径面积 …

Linux面试笔试题(2)

27、按下( A ) 键能终止当前运行的命令 A. Ctrl-C B. Ctrl-F C. Ctrl-B D. Ctrl-D 28、下面哪个命令用来启动X Window ( C ) A. runx B. Startx C. startX D. xwin 29、用 “rm -i”,系统会提示什么来让你确认( B ) A.命令行的每个选项 B.是否真的删除 C.是否有写的权限 D…

计算机网络第2章(物理层)

计算机网络第2章(物理层) 2.1 物理层的基本概念2.2 物理层下面的传输媒体2.2.1 导引型传输媒体2.2.2 非导引型传输媒体 2.3 传输方式2.3.1 串行传输和并行传输2.3.2 同步传输和异步传输2.3.3 单向通信(单工)、双向交替通信&#x…

【Leetcode】105.从前序与中序遍历序列构造二叉树

一、题目 1、题目描述 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵树的中序遍历,请构造二叉树并返回其根节点。 示例1: 输入: preorder = [3,9,20,15,7], inorder = [9,3,15,20,7] 输出: [3,9,20,null,null,15,7]示例…

口腔牙科门诊挂号系统 微信小程序的设计与实现_1171u-

随着信息时代的来临,过去的“口腔助手”管理方式缺点逐渐暴露,现在对过去的“口腔助手”管理方式的缺点进行分析,采取计算机方式构建“口腔助手”小程序。本文通过阅读相关文献,研究国内外相关技术,提出了一种预约信息…

睿趣科技:抖音小店新人最适合卖什么产品

随着移动互联网的不断发展,短视频平台如今已经成为了人们日常生活中不可或缺的一部分。其中,抖音作为国内短视频平台的代表,不仅让用户可以欣赏到各种有趣、创意的短视频内容,同时也为创业者提供了一个广阔的创业机会——抖音小店…

【数据结构入门指南】二叉树顺序结构: 堆及实现(全程配图,非常经典)

【数据结构入门指南】二叉树顺序结构: 堆及实现(全程配图,非常经典) 一、前言:二叉树的顺序结构二、堆的概念及结构三、堆的实现(本篇博客以实现小堆为例)3.1 准备工作3.2 初始化3.3 堆的插入3.3.1 向上调…

【五子棋】

五子棋 文章目录 五子棋前言一、登录功能二.哈希表管理用户的会话和房间三.基于Websocket连接开发的功能1.匹配功能2.游戏房间3.挑战功能4.人机对战5.聊天功能 前言 这篇博客主要详细介绍我的五子棋项目的核心功能的实现细节,也就是详细介绍五子棋各个功能是如何实…

Java IO流(三)线程模型

传统阻塞I/O模式 其中黄色框表示对象,蓝色框表示线程,白色框表示API方法 特点 采用阻塞IO模式获取输入数据每个连接都需要独立的线程完成数据的输入,业务处理和处理结果数据返回 潜在问题 并发数很大时,需要对应每个连接请求创建一个线程,所以占用资源很大连接创建后,若当前…

CentOS系统环境搭建(十七)——elasticsearch设置密码

centos系统环境搭建专栏🔗点击跳转 elasticsearch设置密码 没有密码是很不安全的一件事😭 文章目录 elasticsearch设置密码1.设置密码2.登录elasticsearch3.登录kibana4.登录elasticsearch-head 1.设置密码 关于Elasticsearch的安装请看CentOS系统环境搭…

每天一道leetcode:1306. 跳跃游戏 III(图论中等广度优先遍历)

今日份题目: 这里有一个非负整数数组 arr,你最开始位于该数组的起始下标 start 处。当你位于下标 i 处时,你可以跳到 i arr[i] 或者 i - arr[i]。 请你判断自己是否能够跳到对应元素值为 0 的 **任一** 下标处。 注意,不管是什…

【C++从0到王者】第二十二站:一文讲透多继承与菱形继承

文章目录 前言一、多继承二、菱形继承三、菱形虚拟继承四、菱形虚拟继承的底层原理五、菱形虚拟继承对于空间的优化六、多继承和菱形继承中的一些细节七、菱形继承在库里面的应用八、继承和组合九、继承总结 前言 在我们前面所说的继承其实在C中也叫做单继承 即一个子类只有一…