大家好,我是 Jack。
2023 年,AI 真的杀疯了。短短不到一年的时间,当我们还在感慨 AI 一键生成的二次元画作精美万分的时候,它已经进化到了写实美照也能手到擒来的地步。
更多的效果,可以看刚刚发布的视频,求个免费的赞啦~
https://www.bilibili.com/video/BV1X24y1n77u/
今天分享一下可以学习的资源。
本文档可以随意分享给你的好基友/好闺蜜,AI绘图走起!
1、Stable Diffusion WebUI
这个项目是 Stable Diffusion 算法的 Web 版,就是增加了一个 Web 交互界面,方便运行算法。
我出过这个项目的部署视频,不了解的可以先看这个视频:
https://www.bilibili.com/video/BV1q84y1i78L/
视频提到的一键安装包,已经有些老了,可以用最新的:
https://pan.baidu.com/s/1raISOqEcYi9M_3E68kcuow?pwd=jack
想要运行代码,需要有 python 环境,这个自己安装吧,视频有讲解,然后运行指令:
python launch.py
这样就能启动 Web 页面了。
里面已经包含了文章开头的所展示的真人生成模型、Lora模型等。
还有汉化插件、ControlNet插件等。
2、模型分享网站
网友很强大,训练好的模型,还有一些 prompt 参数,都有人分享。
模型资源很多,可以看看这里:
https://civitai.com/
比如第二个 ChilloutMix,就是一个效果非常好的真实图片生成模型。
点击这里就能下载了。
下载好后的模型,需要放到工程目录的:models/Stable-diffusion 里。
这个我已经打包好了。
除了这种模型可以下载,还能下载 Lora 模型,可以理解为这个是一种画风的小模型,可以配合 Stable Diffusion 模型一起使用,放在 prompt 中。
比如我已经安装好了一个 koreanDollLikeness_v10 Lora 模型,就可以使用以下步骤找到:
选中这个模型,会自动生成 prompt 指令, <lora:koreanDollLikeness_v10:1>,最后跟着的 1 就是权重,可以是0.1,也可以是1,甚至2,数越大使用的权重越多。
模型也是可以在 civitai 下载:
比如第一个就是上文所展示的 Lora 模型开源页面。下载好的模型,需要放到 models/Lora 目录下:
3、第三方插件
这个项目还支持我们安装第三方扩展插件,比如汉化插件、集成ControlNet的插件。
汉化插件下载地址:
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN
直接打包下载 ZIP 压缩包:
然后将文件解压放到 extensions 目录下:
我们重启 Web 服务:
勾选上插件,就能使用了:
然后在 Show all pages 里:
英文直接搜 local 就能找到,选择 zh_CN 即可完成汉化。
记得设置完,重新 Web 生效。
ControlNet 插件下载同理。
https://github.com/Mikubill/sd-webui-controlnet
直接下载文件,并放到指定目录即可(extensions)。
这个不用额外配置,放到指定目录后,重启就可以看到生效了:
想要使用 ControlNet 需要提前下载好权重文件:
https://huggingface.co/toyxyz/Control_any3/tree/main
比如这个姿态估计模型:
点击下载按钮即可下载,下载好的模型放到工程目录的 extensions/sd-webui-controlnet/models 中即可。
4、其它
1)ChatGPT
chatgpt的使用,我出过一期视频:
https://www.bilibili.com/video/BV1yP4y1Q7PH/
对应的注册教程:
https://docs.qq.com/doc/DT2FEQXNZcE1hUFZ3
2)Wav2lip
Wav2lip就是语音转音频,这个算法老了一些,可以看看是否有更新的。
2020年,这个算法刚出的时候,我第一时间写过简单的文字版教程:
https://mp.weixin.qq.com/s/6AP_Dl4T75lkviPAOJyHDA
项目地址:
https://github.com/Rudrabha/Wav2Lip
3)Chat-GPT-LangChain
已经有集文本对话、语音识别、表情驱动的项目了,虽然目前效果有限,但对这方面感兴趣的,可以提前看看,做个调研够用了:
项目地址:
https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain
5、絮叨
近两年是 AI 爆发的两年,无论是文本领域还是图片领域,都有了突破性的进展。
各种 AI 技术,我会持续分享,感谢各位小伙伴一直以来的关注与支持啦~
期待你在这里有所收获,有所感触,悄悄拔节,惊艳所有~