使用Stable Diffusion进行Ai+艺术设计(以智慧灯杆为例)

news2025/4/13 3:36:05

一. 安装环境

创建并激活一个合适的名为conda的环境：ldm

conda env create -f environment.yaml
conda activate ldm

更新现有的虚拟环境:

conda install pytorch torchvision -c pytorch
pip install transformers==4.19.2 diffusers invisible-watermark
pip install -e .

二. 配置模型

2.1 stable diffusion v1

Stable Diffusion v1 指的是模型架构的特定配置，该架构使用下采样因子 8 自动编码器和 860M UNet 和 CLIP ViT-L/14 文本编码器用于扩散模型。该模型在 256x256 图像上进行预训练，然后在 512x512 图像上进行微调。
模型一共有四个尺度：
1.sd-v1-1.ckpt:在laion2B-en上分辨率为256x256迭代了237k 步。在laion512x512高分辨率上迭代了194k 步（来自 LAION-5B 的分辨率为>= 1024x1024的 170M 的示例。
2.sd-v1-2.ckpt: 从 sd-v1-1.ckpt微调得到。在laion-aesthetics v2 5+上分辨率为512x512迭代了515k 步（laion2B-en 的一个子集，具有估计的美学分数> 5.0，并另外过滤到具有原始大小>= 512x512和估计水印概率< 0.5的图像。水印估计来自LAION-5B元数据，美学分数是使用LAION-Aesthetics Predictor V2估算的）。
3.sd-v1-3.ckpt: 从sd-v1-2.ckpt微调得到。512x512“laion-aesthetics v2 5+”分辨率为512x512迭代了195k 步，文本条件下降 10%，以改进无分类器指导采样。
4.sd-v1-4.ckpt: 从sd-v1-2.ckpt微调得到。“laion-aesthetics v2 5+”分辨率为512x512迭代了225k 步，文本条件下降 10%，以改进无分类器指导采样。
本次测试使用的模型是sd-v1-1.ckpt。
在这里插入图片描述

2.2 运行并测试生成效果

获得stable-diffusion-v1-*-original权重后，将它们链接起来：

mkdir -p models/ldm/stable-diffusion-v1/
ln -s <path/to/model.ckpt> models/ldm/stable-diffusion-v1/model.ckpt

或者直接把模型放在models/ldm/stable-diffusion-v1/ 下面。
测试一下从文本到图像：

python scripts/txt2img.py --prompt "a photograph of an astronaut riding a horse" --plms

默认情况下，以 50 步渲染大小为 512x512的图像。
测试一下从图像到图像：

python scripts/img2img.py --prompt "A fantasy landscape, trending on artstation" --init-img <path-to-img.jpg> --strength 0.8

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/130045.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

使用Stable Diffusion进行Ai+艺术设计(以智慧灯杆为例)

目录

一. 安装环境

二. 配置模型

2.1 stable diffusion v1

2.2 运行并测试生成效果

相关文章

来自2022的年终总结，迎接新的2023

java多线程（11）：线程同步线程协作

CSS——结构和布局

win10录屏文件在哪？怎么更改win10录屏保存位置

智能车|直流电机、编码器与驱动器---驱动器

ahooks中的核心hook-useRequest（上）

基础知识总结

Android App加固原理与技术历程

【图像处理】图像的锐化操作 | 边缘检测sobel算子，拉普拉斯算子，Canny算子| opencv

【unity笔记】图解 Vector3.SignedAngle()方法的返回值

Java Object 类

Python采集股票数据信息

图像属性操作

排序算法：堆排序，快速排序，归并排序。内附完整代码和算法思路详解。

JSP ssh学习管理系统myeclipse开发mysql数据库MVC模式java编程计算机网页设计

MMDetection框架入门教程之环境部署

SQLSERVER，求平均数，最大，最小，中位数，众数

ArcGIS Python 影像批量裁剪

【再学Tensorflow2】TensorFlow2的高层封装

ti3090安装cuda113+cudnn+anaconda+yolopose过程