记录 AI绘图 Stable Diffusion的本地安装使用,可搭建画图服务端

news2024/10/2 3:22:56

开头

最近刷短视频看到了很多关于AI绘图,Midjourneygittimg.aiStable Diffusion等一些绘图AI工具,感受到了AI绘画的魅力。通过chatGPT生成关键词再加上绘图工具,真是完美,文末教大家如何用gpt提词

Midjourney 算是体验最好的了,生成的图片也特别完美,使用也简单,它是在线网页,计算在云服务器上

新人有 25 次免费使用次数,不加入特定指令的情况下,是能生成四合一的图片的(算一次),单独挑出其中一张选择U或V(U是放大图片,U1\U2\U3\U4 分别指的是放大四张图片中的某一张,V是采用图片的构图形式,重新生成),只需要在输入框输入“/imagine”就可以开启AI智能图片之旅。输入指令 /info 能查看剩余分钟,订阅信息。Midjourney

gittimg.ai是一套神奇的 AI 工具,可以大规模生成原始图像、修改照片、将图片扩展到原始边界之外,或创建自定义 AI 模型

平台提供了20多个基于Stable Diffusion的AI模型。特别友好的是,每个用户每月免费提供了100张图片生成。几秒钟就能生成一张图片,还是很快的。getimg.ai

Stable Diffusion 开源免费,出图速度与电脑配置有关

和Midjourney功能差不多,可以文字转图片。电脑显卡越好出图越快。不过安装过程挺费劲的,花费了一天的时间才安装好,本篇文章将围绕Stable Diffusion从安装到使用的过程来介绍。项目地址

由AI画出来的人物,够真实吧

image.png

还有风景图,这个是用默认模型画的

image.png

AI绘图

什么是AI绘图

AI绘图是指使用人工智能(AI)技术生成或辅助创建图像和视觉内容的过程。AI绘图工具通常利用深度学习算法,如生成对抗网络(GANs)、变分自编码器(VAEs)和其他神经网络架构,以生成新的图像、对现有图像进行风格迁移、涂色,甚至根据文本描述生成相应的图像。

  1. 艺术创作:AI可以生成独特的艺术作品,模仿著名画家的风格,或者根据用户输入的指导进行创作。
  2. 设计:AI辅助设计工具可以帮助设计师更快地创建图标、插图、海报等视觉元素。
  3. 动画与游戏:AI可以自动生成游戏角色、场景和物品,减轻开发人员的负担,并提高创作效率。
  4. 影像处理:AI可以用于自动进行图像修复、去噪、涂色等操作,提高处理质量和效率。
  5. 图像生成:基于文本描述生成图像的AI模型可以为广告、社交媒体和其他平台提供定制的视觉内容。

Stable Diffusion

介绍 Stable Diffusion 是一个开源的工具,我们可以用文字来描绘 并将文字发给它,它就能帮我们生成对应的图片,同时它还支持图生图功能,等等。

模型

使用这个工具需要使用模型,官方也提供了对应的图像模型,下载即可。同时还可以去C站下载小模型来绘制不同领域的图片

配置

这个工具对硬件要求不是特别高,所以在我们个人电脑也能跑,不过生成的速度取决于电脑配置,显卡越好速度越快。由于该工具比较复杂,然后我们需要借助Stable Diffusion web ui 可视化工具来操作

安装

在线使用

在线使用需要借助谷歌的服务:stable-diffusion-webui-colab。需登录谷歌账户,然后点击页面中的启动 即可直接使用。在线使用本期先不细讲

image.png

本地安装使用

这里我使用的设备是笔记本电脑,window11,RTX20250,16g内存,12代因特尔处理器,生成一张图大概20秒

Stable Diffusion web ui依赖于Python3.10.6,所以需要先下载安装Python

安装Python

Python下载地址www.python.org/downloads/w…

我这里下载的是安装版本,安装时候记得勾选添加到PATH,这样省得自己添加环境变量了

下载Stable Diffusion web ui

如果你没有安装git,那么需要安装一下git 下载地址

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

安装依赖

直接运行项目目录下的webui-user.bat文件,它将会自动安装所有的依赖,这里最好打开科学上网(git走的是终端的网络,上网工具需要开网卡模式),不然下载很慢还容易失败。

安装完依赖后会自动启动,因为首次要安依赖所以很慢,下次启动就会很快了

image.png

终端出现127.0.0.1:7860字样就代表启动成功了,然后使用浏览器访问即可,安装好默认是英文的

image.png

设置语言为中文

  • 选择 Extension 选项卡,点击 Install from URL 子选项卡
  • 复制git仓库地址
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN

  • 点击install按钮 进行安装。如图 image.png
  • 然后重启webui,以确保插件载入成功。选择Settings,点击Reload UI重启 image.png
  • Extensions 选项卡,确定已勾选本扩展☑️;如未勾选,勾选后点击Apply and restart UI橙色按钮启用本扩展

image.png

  • 切换语言包(zh-CN)

  • Settings 选项卡中,找到 User interface 子选项

  • 然后去页面最底部,找到 Localization (requires restart) 小项,找到在下拉选单中选中 zh_CN (如果没有就按一下🔄按钮),如图 image.png

  • 然后按一下 页面顶部左边的 橙色 Apply settings 按钮 保存设置,再按 右边的 橙色 Reload UI 按钮 重启webUI

image.png

到这里就完成了设置中文,重启webui后就切换为中文界面了

image.png

下载模型

模型说明

大模型 画图主要就是使用大模型的一些数据来生成图片,小模型lord的功能就是对大模型的一些参数做一些微调

大模型

下载官方提供的大模型github.com/camenduru/s…

打开页面后,滑动到下面。如图。我这里下载的是1.5版本,稳定版

image.png

然后跳转页面,往下滑,找到Download,选择4.27G的这个

image.png

如果你想要绘制人物,那么推荐下载这个模型,绘制美女就用这个模型chilloutmix是日本的一位作者开发的AI人像模型,符合亚洲用户喜好的美女人像,上面的美女就是本模型画出来的

image.png

然后将下载的大模型放到 指定的文件内\stable-diffusion-webui\models\Stable-diffusion

image.png

小模型Lora

我们可以去C站找喜欢的小模型下载Civitai

image.png 找到你喜欢的图像,然后点击进去,选择下载,一般小模型就几百M

image.png

小模型我们放到 Lora文件夹\stable-diffusion-webui\models\Lora

image.png

以下是一些使用chilloutmix模型画出来的的图

image.png

使用

Stable Diffusion web ui 功能很多,我们主要用到如下两个功能

  1. 文生图(text-img)就是通过描述词来画图
  2. 图生图(img-img)导入图片,然后在加上描述词进行画一张新的图片
文生图

(如何下载导入模型在前面的安装篇章有说)

如图,页面左上角这里,选择大模型,我们可以切换想要的大模型。我选择官方默认模型

image.png

输入一些正面提示词

green sapling rowing out of ground,mud,dirt,grass,high quality,photorealistic,sharp focus,depth of field

image.png

使用chilloutmix模型

首先去C站找到喜欢的模型图片,然后点击图片右下角叹号

image.png

小模型下载说明在前面已经讲了。然后将提示信息,和对应的参数 在Stable diffusion web ui 上填写,然后就可以生成啦

image.png

启动参数

可以编辑项目目录下的 webui.bat文件,加入一行参数,如图

image.png

这里加的参数意思分别为

  • --listen启用局域网访问,这样就可以在别的电脑访问啦

  • --port 8888设置端口号为8888

  • --use-cpu设置使用cpu来处理,没显卡的电脑需要设置一下,因为默认是使用显卡GPU

如果想要通过api调用来生成图片,可以使用--api参数,启动webui后,在url地址上加上/docs就能看见api接口文档了。这样就能自己编写代码来调用文生图等等一些功能了接口详细文档

还有很多参数可以查阅官方文档

其它

默认使用的是GPU,如果没独显可能需要配置一下参数选择使用cpu处理

关于提示词

负面提示词

通用负面提示词: (deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck

正面提示词

利用chatGPT生成正面提示词的方法,将下面这段描述发给GPT-4即可

以下提示用于指导Al绘画模型创建图像。它们包括人物外观、背景、颜色和光影效果,以及图像的主题和风格等各种细节。这些提示的格式通常包括带权重的数字括号,用于指定某些细节的重要性或强调。例如,"(masterpiece:1.4)"表示作品的质量非常重要。以下是一些示例: 1.(8k, RAW photo, best quality, masterpiece:1.2),(realistic, photo-realistic:1.37), ultra-detailed, 1girl, cute, solo, beautiful detailed sky, detailed cafe, night, sitting, dating, (nose blush), (smile:1.1),(closed mouth), medium breasts, beautiful detailed eyes, (collared shirt:1.1), bowtie, pleated skirt, (short hair:1.2), floating hair, ((masterpiece)), ((best quality)), 2.(masterpiece, finely detailed beautiful eyes: 1.2), ultra-detailed, illustration, 1 girl, blue hair black hair, japanese clothes, cherry blossoms, tori, street full of cherry blossoms, detailed background, realistic, volumetric light, sunbeam, light rays, sky, cloud, 3.highres, highest quallity, illustration, cinematic light, ultra detailed, detailed face, (detailed eyes, best quality, hyper detailed, masterpiece, (detailed face), blue hairlwhite hair, purple eyes, highest details, luminous eyes, medium breats, black halo, white clothes, backlighting, (midriff:1.4), light rays, (high contrast), (colorful). 仿照之前的提示,写一段描写如下要素的提示:车水马龙的城市

image.png

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1549648.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Anaconda的GEE环境中安装torch库

打开Anaconda,点击运行,打开terminal 输入pip install torch 而且由于anaconda中自己配置好了镜像源,在pip时自动使用清华镜像源

2024年4月份 风车IM即时通讯系统APP源码 版完整苹果安卓教程

关于风车IM,你在互联网上能随便下载到了基本都是残缺品, 经过我们不懈努力最终提供性价比最高,最完美的版本, 懂货的朋友可以直接下载该版本使用,经过严格测试,该版本基本完美无缺。 下载地址:…

【正点原子FreeRTOS学习笔记】————(4)FreeRTOS中断管理

这里写目录标题 一、什么是中断?(了解)二、中断优先级分组设置(熟悉)三、中断相关寄存器(熟悉)四、FreeRTOS中断管理实验(掌握) 一、什么是中断?(…

华为数通 HCIP-Datacom H12-831 题库补充(3/27)

2024年 HCIP-Datacom(H12-831)最新题库,完整题库请扫描上方二维码,持续更新。 如图所示,关于R4路由器通过IS-IS计算出来的IPv6路由,哪一选项的描述是错误的? A:R4通过IS—IS只学习到…

【企业动态】吉利雷达汽车来访东胜物联,考察交流,洽谈车联网生态合作

近日,我们非常高兴接待吉利雷达汽车一行莅临东胜物联位于湖州市的生产工厂,进行参观考察,并就未来的合作展开深入商讨与交流。 雷达新能源汽车隶属于吉利控股集团,是一家专注于户外生态的中高端新能源智能汽车企业。雷达通过共享吉…

【启发式算法】同核分子优化算法 Homonuclear Molecules Optimization HMO算法【Matlab代码#70】

文章目录 【获取资源请见文章第4节:资源获取】1. 算法简介2. 部分代码展示3. 仿真结果展示4. 资源获取 【获取资源请见文章第4节:资源获取】 1. 算法简介 同核分子优化算法(Homonuclear Molecules Optimization,HMO)是…

网页版短信系统后台开发要点|短信平台软件开发搭建

在开发网页版短信系统的后台时,有一些关键要点需要注意,以确保系统的稳定性、安全性和高效性。以下是一些开发网页版短信系统后台时的重要要点: 用户管理:实现用户权限管理功能,包括用户注册、登录、角色分配等&#x…

Redis为什么快

引言 Redis是一个高性能的开源内存数据库,以其快速的读写速度和丰富的数据结构支持而闻名。作为一个轻量级、灵活的键值存储系统,Redis在各种应用场景下都展现出了惊人的性能优势。无论是作为缓存工具、会话管理组件、消息传递媒介,还是在实时数据处理任务和复杂的分布式系…

YOLOv9改进策略:卷积魔改 | SPD-Conv,低分辨率图像和小物体涨点明显

💡💡💡本文改进内容:SPD-Conv由一个空间到深度(SPD)层和一个无卷积步长(Conv)层组成,特别是在处理低分辨率图像和小物体等更困难的任务时。 💡💡💡SPD-Conv在多个数据集验证能够暴力涨点&#x…

python3字典的排序

创建一个字典 dict1{a:2,b:3,c:8,d:4} 1、分别取键、值 取字典的所有键,所有的值,利用dict1.keys(),dict1.vaules(), 由于键,值有很多个,所以要加s,另外注意这里要加括号,这样的小…

java spirng和 mybatis 常用的注解有哪些

当在Java Spring和MyBatis中进行开发时,常用的注解对于简化配置和提高开发效率非常重要。以下是更多常用的注解以及它们的详细说明和用途: 在Spring中常用的注解: Component: 用途:表明一个类会作为组件被Spring容器管…

YOLOv9改进策略:block优化 | Transformer架构ConvNeXt 网络在检测中大放异彩

💡💡💡本文改进内容:Transformer架构 ConvNeXt 网络在图像分类和识别、分割领域大放异彩,同时对比 Swin-T 模型,在多种任务中其模型的大小和准确率均有一些提升,模型的 FLOPs 较大的减小且 Acc …

创建AI智能体

前言 灵境矩阵是百度推出的基于文心大模型的智能体(Agent)平台,支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。开发者可以通过 prompt 编排的方式低成本开发智能体&am…

保姆级指导0基础如何快速搭建“对话机器人”类ChatGPT

参考了CDSN上的文章,但发现不work, 不是这里有问题,就是那里有问题,查阅了大量的资料,做了无数次试验,终于整理出来了一个完整的教程,保可用,保真~~~~~如果各位遇到什么问题&#xf…

哈希的一些题目

题目1:星空之夜 1402. 星空之夜 - AcWing题库 刚开始看到这个题目感觉一懵,因为这个哈希是关于形状的哈希,不知道要怎么表示。 但是这道题的数据范围比较小,暴力也可以过。 暴力的方法是:搜索每一个连通块并保存下来…

Redis中的客户端(一)

客户端 概述 Redis服务器是典型的一对多服务器程序:一个服务器可以与多个客户端建立网络连接,每个客户端可以向服务器发送命令请求,而服务器则接收并处理客户端发送的命令请求,并向客户端返回命令回复。通过使用由IO多路复用技术实现的文件…

LeetCode:1319. 连通网络的操作次数(并查集 Java)

目录 1319. 连通网络的操作次数 题目描述: 实现代码与解析: 并查集 原理思路: 1319. 连通网络的操作次数 题目描述: 用以太网线缆将 n 台计算机连接成一个网络,计算机的编号从 0 到 n-1。线缆用 connections 表示…

JAVA面试大全之JVM和调休篇

目录 1、类加载机制 1.1、类加载的生命周期? 1.2、类加载器的层次? 1.3、Class.forName()和ClassLoader.loadClass()区别? 1.4、JVM有哪些类加载机制? 2、内存结构 2.1、说说JVM内存整体的结构?线程私有还是共享的? 2.2…

.NET高级面试指南专题二十三【 B+ 树作为索引有什么优势】

B 树作为索引有许多优势,这些优势使其成为许多数据库管理系统中首选的索引结构之一。以下是 B 树作为索引的一些主要优势: 高效的查询性能:B 树是一种平衡树结构,具有良好的平衡性和高度平衡的性质,这使得在 B 树上进行…

JaveSE—IO流详解:对象输入输出流(序列化及反序列化)

一. 基础理论知识 📌怎么理解对象输入输出流 ? ○ 把java中的对象输出到文件中,从文件中把对象输入到程序中. 📌为什么要这样做(目的) ? 当我们创建一个对象时, 如new Student( "小张",20 ); 数据存储在…