Stable Diffusion的发布是AI图像生成发展过程中的一个里程碑,相当于给大众提供了一个可用的高性能模型,让「AI 文本图片生成」变成普通人也能玩转的技术。最近一些网友将网上的真人图片不断喂给模型,让其自主学习,训练出来的效果已经可以做到以假乱真——你甚至不知道哪些图片是 AI 生成的还是真人拍出来的。你感兴趣吗?今天这篇文章从零开始,手把手教你如何搭建自己的真人 AI 网站。强烈建议收藏(不管是否吃灰)。
👉看目录,点收藏
1. 搭建你自己的 AI 网站
2. 模型下载
3. 汉化插件下载
4. 生成你的真人图片
4.1 生成真人图片
4.2 不同风格图片生成
4.3 动画视频生成
5. 让你生成的图片开口说话
01、搭建你自己的AI网站
本篇我们将单刀直入教各位最快搭建出一个质量不错的 AI 网站,如果各位想了解相关的原理、技术点,可以留言告诉我们。下文会提及的模型、插件和源码,我们也一并提前为各位整理~大家看到文末添加一下,即可领取。
第一步,我们可以直接使用 GitHub 仓库:
stable-diffusion-webui。
首先,在电脑上安装 python 3.10.6,如果已经安装了其他 python 版本,可以利用 conda 安装多一个 3.10 的虚拟环境版本:
conda create -n novelai python==3.10.6
接下来下载该仓库的代码:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
再安装对应的 GPU 版本的 Pytorch,直接进入网站:
pytorch.org/get-started…
进入刚刚创建的虚拟环境”novelai“:
执行刚刚的命令:
./python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
安装成功后,可以测试自己的 pytorch 版本是否可以跑通。
进入刚刚下载的 Github 仓库的代码文件夹,安装第三方依赖:
python -m pip install -r requirements.txt
02、模型下载
有了网站之后,就需要下载对应的 AI 模型进行有效生成。一些网友已经利用网上大量的图片训练好的模型,并分享到网站上。我们举个例子:
civitai.com/
这个大名鼎鼎的网站被人们称为「C 站」,里面有很多你意想不到的模型。
可以在这个网站上找到很多已经训练好的模型。例如找一个生成真人图片的模型:ChilloutMix。从网页上下载对应的模型后,把该模型放到工程目录:models/Stable-diffusion。
03、汉化插件下载
stable-diffusion-webui 这个项目还支持下载第三方插件。例如我们可以下载对应的汉化插件。其下载地址如下:
文末领取!
登陆上面网站后,就可以下载插件的安装包:
然后将文件解压放到 extensions 目录下:
接着,就需要对网页进行重启服务:
在扩展这里,把插件勾上:
在“设置”选项里,找到 zh_CN,最后需要重新启动网页,就可以生效了:
04、生成你的真人图片
启动主程序"launch.py",等待一定的时间出现网页地址就可以了。
打开网址时,有时候可能模型没有更新。因此可以尝试一下多次重启。需要选择刚刚下载的模型:ChilloutMix。
这样就已经完成前期的部署工作了。接下来详细教大家怎么生成自己想要的图片。
4.1 生成真人图片
在c站上,已经有很多大神利用 promt 生成图片了,因此我们就可以对这些进行参考。例如找一个好看的图片,对下面的 Prompt 词语进行复制:
其中 Prompt 词语放在提示词框内,消极 Prompt 词语放在对应的方框内。同时调整对应的参数,最后就可以生成真人图片:
4.2 不同风格图片生成
在 C 站上,还有很多 Lora 模型可以进行下载。这是一种可以帮助你调整画风的小模型。主要是放到 Prompt 中进行使用。例如我们可以在网站上下载原神的 Lora 模型:
下载完成后,把模型放到 models/Lora 路径下:
按照图片下的步骤,选中模型后,会看到具体的 Prompt 在方框内了:
把步骤 4.1 中的 Prompt 词语加入到这里,就可以生成一个原神风格的图片:
4.3 动画视频生成
首先需要安装插件 “deforum” 这个插件能够根据多个生成的图片构造成视频动画。
在当前 stable-diffusion 目录下,执行下面命令,就会发现 extensions 多了新的插件:
git clone https://github.com/deforum-art/deforum-for-automatic1111-webui extensions/deforum
同时重启新的网页,会发现多了 deforum 这个选项:
可以先执行简单的生成,在提示词上,已经默认填写了语句:
{
"0": "tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, by tomasz alen kopera",
"30": "anthropomorphic clean cat, surrounded by fractals, epic angle and pose, symmetrical, 3d, depth of field, ruan jia and fenghua zhong",
"60": "a beautiful coconut --neg photo, realistic",
"90": "a beautiful durian, trending on Artstation"
}
Prompt 词语模板解释如下:
//Abstracted Example
{
"0": "Prompt A --neg NegPompt"
"12": "Prompt B"
}
其中“0”和“12”提示在插值中解析的关键帧。Prompt A 和 B 是肯定提示,NegPrompt 是否定提示。当然,也可以直接用上面 C 站下载下来的模型,生成真人动画。
05、让你生成的图片开口说话
从上面我们已经得到了生成的图片。那么就可以利用这张图片,创建自己的 AI 说话视频。登陆这个网址:
studio.d-id.com/
选择刚刚生成的图片,然后输入自己想要说的话,之后生成就可以了:
最后就可以得到比较逼真的真人 AI 说话视频了。
有了这个技术,就可以批量制作二次元甚至是真人说话视频。这对于 AICG 这个行业是一个颠覆性的技术,相信未来这个技术在多个领域上都能够推广开来。
写在最后
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。