通过学习扩散模型了解到了统计学的美好,然后顺便记录下我之前文生图的基础流程~
扩散模型简介
这次是在DataWhale的组队学习里学习的,HuggingFace开放扩散模型学习地址
扩散模型训练时通过对原图增加高斯噪声,在推理时通过降噪来得到原图,整体可以认为是一个马尔可夫过程,最近普遍用于文生图中,比GAN效果要好但速度慢一些
通过gpt4生成提示词
没有gpt4的可以在 LinkAI 使用(Midjourney也可以在LinkAI里找到)
比如输入 赛博朋克猫,得到的提示词为:
【PandaAI Prompt】A cyberpunk cat, sleek and mysterious, prowling through a neon-lit cityscape. Its fur, a mix of deep purples and electric blues, catching the vibrant lights that surround it. The cat’s eyes, glowing with an otherworldly light, reveal its heightened senses in this futuristic world. Illustration, isometric view, cyberpunk, Unreal Engine, shot with a Nikon Z6, using a wide-angle lens, lit by the glow of holographic billboards, f/2.8 aperture, ISO 800, 1/200 sec, 16K UHDP --iw 1.5 --ar 9:16 --s 400 --v 5.2
消耗70积分,成本0.07元
登录AutoDL平台
一个在线用卡的平台,AutoDL 在此处租用A5000(42GB显存,1.24元/小时)
选择一个可用的SD镜像,比如 stable-diffusion-webui 然后点击右侧【AutoDL创建实例】
之后按提示启动webui就能生成图片啦~
用30分钟的话,成本 0.62元
结束
最后,我们成功用七毛不到的价格生成了一张壁纸,1080p的图片15秒一张(所以理论上可以有几十张壁纸)