AnimateDiffusion文字生成图片--入门

news2025/1/9 6:08:49

AnimateDiffusion文字生成图片--入门

  • 1. 安装
  • 2. 插件
    • 2.1 汉化插件
    • 2.2 中文提示词插件
    • 2.3 模型下载插件
    • 2.4 模型下载
    • 2.5 c站helper插件
    • 2.6 c站秘钥
  • 3. 模型
  • 4. 总结

gitio: https://a18792721831.github.io/

下面基本上所有的操作都需要访问外网,请自行解决外网。

1. 安装

首先使用git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 下载代码。
在这里插入图片描述

然后使用conda create -n aidraw python=3.10 创建一个python环境,如果没有conda,那么可以使用如下命令安装conda:

mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3
rm -rf ~/miniconda3/miniconda.sh

安装完成后使用conda init bash初始化conda,然后就可以使用conda了。

这里有个需要注意的点,仓库里面说是python的版本是3.10.6,这里有点问题,因为目前python中3.10大版本中最新的已经是3.10.13了,如果你还是用3.10.6,那么安装的依赖会让你升级python才能用的问题。所以我们只需要指定大版本为3.10就行了,第三位的小版本直接使用最新的就行。

在这里插入图片描述

然后就可以使用提示的命令激活和退出环境了:
在这里插入图片描述

在这里插入图片描述

然后使用如下命令启动:

python3 launch.py --autolaunch --listen --xformers --force-enable-xformers --precision full --no-half --enable-insecure-extension-access

其中的选项,autolaunch表示自动安装依赖,listen表示监听的地址为0.0.0.0否则会监听127.0.0.1只能本机访问,如果你是在远程linux上运行,那么这个最好设置下。
xformers表示使用xformers加速推理,force-enable-xformers表示强制开启,enable-insecure-extension-access表示允许插件。

更多信息参考: https://github.com/sudoskys/StableDiffusionBook/blob/main/docs/install/WebUi/launch.md

运行之后就会开始下载依赖等等:
在这里插入图片描述

当运行成功后,就可以将上面命令中的launch.py换成webui.py,因为命令比较长,可以使用echo 'alias aiweb_start="python3 webui.py --autolaunch --listen --xformers --force-enable-xformers --precision full --no-half --enable-insecure-extension-access"' >> ~/.bash_profile
将这个巨长的启动命令设置为别名,设置后使用source ~/.bash_profile生效。
然后就会出现这个错误:
在这里插入图片描述

这表示缺少一个依赖,使用pip install opencv-python-headless下载缺少的依赖:
在这里插入图片描述

下载成功后重新启动(可以使用launch.py,也可以使用webui.py启动)就会下载一个基础的模型:
在这里插入图片描述

耐心等待下载完成就行
在这里插入图片描述

根据日志查看就会发现已经成功启动了,监听的端口是7860,然后就可以访问了:
在这里插入图片描述

访问:
在这里插入图片描述

然后我们小小的试一把:
在这里插入图片描述

然后点击enerate生成:
在这里插入图片描述

如果你的环境没有GPU,可以去掉启动命令中的--xformers --force-enable-xformers,然后启动,表示使用CPU进行计算。我自己的环境,使用CPU生成相同的提示词的图片,需要大概80~120秒,使用GPU大概15秒左右,差距还是挺大的。
在这里插入图片描述

可以使用batch count一次生成多张图片,下面的batch size表示执行几次,两者相乘,就是最终生成的图片数量,需要注意,生成的图片越多,那么耗费的时间越长。
在这里插入图片描述

当然你也可以使用中文的提示词。
比如加个性感,然后生成:
在这里插入图片描述

如果出现内存,或者显卡的显存不足,尝试使用--medvram或者--lowvram提示使用低内存,但是可能需要的时间会更长。
如果对于大图,觉得细节比较粗糙,可以开启精细化:
在这里插入图片描述

而且可以限定生成的人物数量,以及开启随机种子:
在这里插入图片描述

一般在开启精细化处理的时候,会出现内存不足等问题。精细化相当于在整体图片不变的基础上,将图片分割为一个个小块,然后针对小块重新用大图的方式绘制,绘制完成后再合并。
在这里插入图片描述

所以可以看到比之前需要计算的迭代次数也增加了,而且数据量也大了。
在这里插入图片描述

结果确实高清了不少

在这里插入图片描述

2. 插件

2.1 汉化插件

英文的界面,没有中文,全靠猜。
在启动的时候加了允许插件的参数,所以可以安装插件:
在这里插入图片描述

这里表示从https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui-extensions/master/index.json 加载插件列表。
在这里插入图片描述

不过这里面没有汉化包,所以使用指定url下载插件https://github.com/VinsonLaro/stable-diffusion-webui-chinese:
在这里插入图片描述

在这里插入图片描述

下载完成后需要重启生效:
在这里插入图片描述

然后就会重启:
在这里插入图片描述

重启后只是加载了插件,还没有使用呢:

在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

然后就汉化了:
在这里插入图片描述

2.2 中文提示词插件

在插件列表中这个插件可以安装下,毕竟中文提示词的效果其实比较差,所以有了中文提示词转为英文提示词的插件:
在这里插入图片描述

点击安装就行了,需要注意的是,每次安装了插件,都需要重启哦。
在这里插入图片描述

这就是刚安装的插件,试试:
在这里插入图片描述

效果真不错,你就不用自己写了,点点点,你心中的她就出来了[偷笑]
还可以选择负面词,需要注意的是,右键是加入到负面提示词里面的哦,这个牢记:
在这里插入图片描述

最后看看效果:
在这里插入图片描述

2.3 模型下载插件

增加一个插件https://github.com/tzwm/sd-webui-model-downloader-cn 可以在webui中下载模型,而不需要手动下载。
在这里插入图片描述

出现更新失败,可能是因为我们没有配置Civitai的秘钥,不管它,先下载一个试试:
https://civitai.com/models/228525/ultra 为例:
将上面的地址输入到插件中,需要去掉最后一层哈,然后点击预览
在这里插入图片描述

然后点击下载就行了,因为模型毕竟在国外,所以预览可能失败,多点击几次。
在这里插入图片描述

等待下载成功就行了。
在这里插入图片描述

下载成功就可以刷新并选择新的模型了,试试:
下载必须有秘钥,否则会失败。。
在这里插入图片描述

2.4 模型下载

另一种方式是使用命令行手动下载,这样可以不需要秘钥:
首先在~/.bash_profile中加入如下内容:

function download_model {   
        wget "https://g.blfrp.cn/civitai.com/api/download/models/$1" --content-disposition
}

然后source ~/.bash_profile生效
然后切换到stable-diffusion-webui/models/Stable-diffusion目录,使用download_model 228525下载:
这种方式下载存在一定的滞后性,可能模型还没同步到加速站,出现404问题。
我下载使用的方式:
在这里插入图片描述

这里的id值是从c站拿到的:
在这里插入图片描述

先选择版本,然后使用版本号就可以下载了。
这种方式相对成功率高一点。

2.5 c站helper插件

如果上面两种方式都不好使,还有一个插件:https://github.com/butaixianran/Stable-Diffusion-Webui-Civitai-Helper
这个插件也是下载模型的,具体哪个能用,哪个好使,需要自己选择。(我用的是这个)
安装插件都是一样的。
在这里插入图片描述

安装好后,将模型地址填入,获取模型信息,这里也多试几次,网络问题:
在这里插入图片描述

记得选择路径和版本:
在这里插入图片描述

然后点击下载就行了.
下载模型如果没有秘钥,是一个麻烦的事情。
我下载使用的方式:
在这里插入图片描述

这里的id值是从c站拿到的:
在这里插入图片描述

先选择版本,然后使用版本号就可以下载了。

2.6 c站秘钥

在这里插入图片描述

3. 模型

上面我们玩的只是其中的一个模型,实际上训练的数据不同,生成的效果也不同。
可以到https://civitai.com/ 查看更多的模型,以及效果比较好的case.
比如: https://civitai.com/models/18523/magmix 或者 https://civitai.com/models/228525/ultra
在这里插入图片描述

模型下载后就可以选择使用了:
在这里插入图片描述

使用提示词,生成
在这里插入图片描述

提示词:

正向:
front view,full_body,best quality,Highly detailed,realistic,full body,1girl,solo,female,young,big breasts,unbuttoned clothes,gym leader,oval face,Cupid mouth,slender,glamor,shiny skin,bare_legs,swimsuit,long hair,ponytail,bangs,hair behind ear,High leg lift,Hands on waist,v,high kick,wide eyed,bright pupils,Slightly open mouth,seductive smile,bikini,necklace,earrings,bracelet,summer,grasslands,
反向:
multiple breasts, (mutated hands and fingers:1.5 ), (long body :1.3), (mutation, poorly drawn :1.2) , black-white, bad anatomy, liquid body, liquid tongue, disfigured, malformed, mutated, anatomical nonsense, text font ui, error, malformed hands, long neck, blurred, lowers, lowres, bad anatomy, bad proportions, bad shadow, uncoordinated body, unnatural body, fused breasts, bad breasts, huge breasts, poorly drawn breasts, extra breasts, liquid breasts, heavy breasts, missing breasts, huge haunch, huge thighs, huge calf, bad hands, fused hand, missing hand, disappearing arms, disappearing thigh, disappearing calf, disappearing legs, fused ears, bad ears, poorly drawn ears, extra ears, liquid ears, heavy ears, missing ears, fused animal ears, bad animal ears, poorly drawn animal ears, extra animal ears, liquid animal ears, heavy animal ears, missing animal ears, text, ui, error, missing fingers, missing limb, fused fingers, one hand with more than 5 fingers, one hand with less than 5 fingers, one hand with more than 5 digit, one hand with less than 5 digit, extra digit, fewer digits, fused digit, missing digit, bad digit, liquid digit, colorful tongue, black tongue, cropped, watermark, username, blurry, JPEG artifacts, signature, 3D, 3D game, 3D game scene, 3D character, malformed feet, extra feet, bad feet, poorly drawn feet, fused feet, missing feet, extra shoes, bad shoes, fused shoes, more than two shoes, poorly drawn shoes, bad gloves, poorly drawn gloves, fused gloves, bad cum, poorly drawn cum, fused cum, bad hairs, poorly drawn hairs, fused hairs, big muscles, ugly, bad face, fused face, poorly drawn face, cloned face, big face, long face, bad eyes, fused eyes poorly drawn eyes, extra eyes, malformed limbs, more than 2 nipples, missing nipples, different nipples, fused nipples, bad nipples, poorly drawn nipples, black nipples, colorful nipples, gross proportions. short arm, (((missing arms))), missing thighs, missing calf, missing legs, mutation, duplicate, morbid, mutilated, poorly drawn hands, more than 1 left hand, more than 1 right hand, deformed, (blurry), disfigured, missing legs, extra arms, extra thighs, more than 2 thighs, extra calf, fused calf, extra legs, bad knee, extra knee, more than 2 legs, bad tails, bad mouth, fused mouth, poorly drawn mouth, bad tongue, tongue within mouth, too long tongue, black tongue, big mouth, cracked mouth, bad mouth, dirty face, dirty teeth, dirty pantie, fused pantie, poorly drawn pantie, fused cloth, poorly drawn cloth, bad pantie, yellow teeth, thick lips, bad cameltoe, colorful cameltoe, bad asshole, poorly drawn asshole, fused asshole, missing asshole, bad anus, bad pussy, bad crotch, bad crotch seam, fused anus, fused pussy, fused anus, fused crotch, poorly drawn crotch, fused seam, poorly drawn anus, poorly drawn pussy, poorly drawn crotch, poorly drawn crotch seam, bad thigh gap, missing thigh gap, fused thigh gap, liquid thigh gap, poorly drawn thigh gap, poorly drawn anus, bad collarbone, fused collarbone, missing collarbone, liquid collarbone, strong girl, obesity, worst quality, low quality, normal quality, liquid tentacles, bad tentacles, poorly drawn tentacles, split tentacles, fused tentacles, missing clit, bad clit, fused clit, colorful clit, black clit, liquid clit, QR code, bar code, censored, safety panties, safety knickers, beard, furry ,pony, pubic hair, mosaic, excrement, faeces, shit, futa, testis,scowl,disdain,

调整下高清,给与更多的引导:
在这里插入图片描述

在这里插入图片描述

使用了细化器,导致风格变了,还是关闭细化器吧
在这里插入图片描述

看看另一个模型:

在这里插入图片描述
这个还不错在这里插入图片描述

4. 总结

这次只是使用了一个文本到图片的功能,实际上AnimateDiffusion还是非常强大的,继续探索。

最后祝愿各位玩的开心!~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1436289.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设备预测性维护、预防性维护、反应性维护的区别与联系

三者象一个三层金字塔: 预测性维护 预防性维护 反应性维护 底部是反应性维护,其操作理念是“等到它坏了,然后修复它”。 中间是预防性维护,即按预定的时间间隔进行维修或改造。预防性维护的目标是延长机器及其零件的使用寿命…

跟着pink老师前端入门教程-day20

二、移动WEB开发之flex布局 1、flex 布局体验 1.1 传统布局与flex布局 传统布局:兼容性好、布局繁琐、局限性、不能再移动端很好的布局 flex弹性布局:操作方便,布局极为简单,移动端应用很广泛;PC 端浏览器支持情况…

OJ_W的密码

题干 c实现 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<map> #include<string> #include<vector> using namespace std;void Partition(string &str,vector<int> &vec1, vector<int>& vec2, vector<int…

如何在Linux部署Yearning并结合cpolar实现公网访问内网管理界面

文章目录 前言1. Linux 部署Yearning2. 本地访问Yearning3. Linux 安装cpolar4. 配置Yearning公网访问地址5. 公网远程访问Yearning管理界面6. 固定Yearning公网地址 前言 Yearning 简单, 高效的MYSQL 审计平台 一款MYSQL SQL语句/查询审计工具&#xff0c;为DBA与开发人员使用…

基于Vue的移动端UI框架整理

一、Vant 官方地址&#xff1a;https://youzan.github.io/vant/#/zh-CN/ 简介&#xff1a;有赞公司开发。 特性&#xff1a;60 高质量组件、90% 单元测试覆盖率、完善的中英文文档和示例、支持按需引入、支持主题定制、支持国际化、支持 TS、支持 SSR。 特别说明&#xff1…

【大模型上下文长度扩展】FlashAttention-2:比1代加速1.29倍、GPU利用率从55%上升到72%

FlashAttention-2 提出背景FlashAttention-2 改进 前向传播和反向传播对比FlashAttention前向传播FlashAttention反向传播FlashAttention-2前向传播FlashAttention-2反向传播FlashAttention-2并行性线程束之间的工作分区 总结FlashAttentionFlashAttention-2 论文&#xff1a;h…

YUM | 起源 | 发展 | 运行逻辑

介绍 YUM&#xff08;Yellowdog Updater, Modified&#xff09;起源于 Red Hat Linux 发行版 up2date 工具。 最初&#xff0c;up2date 是由 Red Hat 公司提供的用于管理系统更新的工具。然而&#xff0c;社区逐渐对 up2date 出现一些不满&#xff0c;主要是由于其使用体验和…

跟着cherno手搓游戏引擎【21】shaderLibrary(shader管理类)

前置&#xff1a; ytpch.h&#xff1a; #pragma once #include<iostream> #include<memory> #include<utility> #include<algorithm> #include<functional> #include<string> #include<vector> #include<unordered_map> #in…

SpringBoot 过滤器Filter的过滤链 多个过滤器优先级

SpringBoot 过滤器Filter 拦截请求 生命周期 什么是过滤链&#xff1f; 指的是有多个过滤器形成的过滤链&#xff0c;一个项目中可以存在多个过滤器。 优先级 根据字母排序&#xff0c;如XFilter和AFilter&#xff0c;那么按照顺序应该先到AFilter过滤器当中

2024/02/06

画出TCP三次握手和四次挥手的示意图 三次握手 四次挥手 并且总结TCP和UDP的区别 TCP: TCP提供面向连接的&#xff0c;可靠的数据传输服务传输过程中&#xff0c;数据无误、数据无丢失、数据无失序、数据无重复 TCP会给每个数据包编上编号&#xff0c;该编号称之为序列号每个序…

2、6作业

TCP和UDP的区别 TCP和UDP都是通信协议 TCP提供有连接的&#xff0c;稳定的&#xff0c;无误码无失真无乱序无丢失的通信 UDP提供无连接的&#xff0c;尽力的&#xff0c;可能误码可能乱序&#xff0c;可能丢失的通信 TCP每发一个数据包就需要对方回应一个应答包&#xff0c…

Linux进程信号处理:深入理解与应用(3)

&#x1f3ac;慕斯主页&#xff1a;修仙—别有洞天 ♈️今日夜电波&#xff1a;its 6pm but I miss u already.—bbbluelee 0:01━━━━━━️&#x1f49f;──────── 3:18 &#x1f504; ◀️…

编译原理与技术(三)——语法分析(二)自顶向下-递归下降

一、语法分析的两种方法 自顶向下&#xff08;Top-down&#xff09;&#xff1a; 针对输入串&#xff0c;从文法的开始符号出发&#xff0c;尝试根据产生式规则推导&#xff08;derive&#xff09;出该输入串。 从根部开始构造语法树。 自底向上&#xff08;Bottom-up&#…

双非本科准备秋招(18.1)—— 力扣二叉树

1、404. 左叶子之和 方法一&#xff1a; 可以在父节点判断一下&#xff0c;如果左子树不为null&#xff0c;并且左子树没有左右子树&#xff0c;说明这是个左叶子节点。 class Solution {public int sumOfLeftLeaves(TreeNode root) {if(root null) return 0;int LV sumOfL…

怎么把两段视频合成一个画面?教你4个合成方法

怎么把两段视频合成一个画面&#xff1f;在数字媒体时代&#xff0c;视频编辑已经成为一项必备技能。有时候&#xff0c;我们需要将两段或多段视频合并成一个画面&#xff0c;这在电影制作、自媒体内容创作、家庭相册制作等领域都有广泛应用。本文将为你介绍四种简单易行的方法…

挑战杯 python+opencv+机器学习车牌识别

0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; 基于机器学习的车牌识别系统 &#x1f947;学长这里给一个题目综合评分(每项满分5分) 难度系数&#xff1a;4分工作量&#xff1a;4分创新点&#xff1a;3分 该项目较为新颖&#xff0c;适…

PyTorch的10个基本张量操作

PyTorch是一个基于python的科学计算包。它的灵活性允许轻松集成新的数据类型和算法&#xff0c;并且框架也是高效和可扩展的&#xff0c;下面我们将介绍一些Pytorch的基本张量操作。 Tensors 张量Tensors是一个向量&#xff0c;矩阵或任何n维数组。这是深度学习的基本数据结构…

企业计算机服务器中了halo勒索病毒如何解密,halo勒索病毒数据恢复

对于众多的企业来说&#xff0c;数据是一个企业的发展的根基&#xff0c;通过数据可以更好地规划调整企业的发展方向&#xff0c;提高企业生产效率。但网络是一把双刃剑&#xff0c;网络技术的发展不仅会为企业带来极大便利&#xff0c;但也为企业数据安全带来严重威胁。近期&a…

谈谈BlueFS

目录 前言数据结构标识一个文件文件系统的全局记录事务记录超级块 启动流程磁盘管理读写流程创建文件流程为文件写数据把数据下刷到磁盘读流程 参考资料 前言 BlueFS具体是个什么东西呢&#xff1f; 如上图&#xff0c;在Ceph里&#xff0c;使用BlueStore作为默认的存储引擎。…

LLM(大语言模型)——大模型简介

目录 概述 发展历程 大语言模型的概念 LLM的应用和影响 大模型的能力、特点 大模型的能力 涌现能力&#xff08;energent abilities&#xff09; 作为基座模型支持多元应用的能力 支持对话作为统一入口的能力 大模型的特点 常见大模型 闭源LLM&#xff08;未公开源…