生命在于折腾——Stable Diffution(Mac端)

news2024/9/24 9:27:32

在这里插入图片描述

一、前言

最近一段时间研究了一下Stable Diffution,Windows和MAC端都搭建成功了,也尝试了各种功能,后续会学习新的使用姿势,写一篇文章记录一下。

二、介绍

1、Stable Diffution是什么

Stable Diffusion,是一种AI绘画生成工具。Stability AI 于2023年6月发布新闻稿,宣布推出 SDXL 0.9 版本更新,升级了 Stable Diffusion 文本生成图片模型。(来源百度百科)
也就是说,我们可以通过自己输入文字描述,选择适合的模型,便可以生成想要的图片。

2、模型

要会使用Stable Diffution(后面简称SD),就要知道基本模型的分类。

(1)什么是模型

SD之所以能绘画,是因为收集了大量世界上已存在的图片来训练,这些图片训练得到的结果就是模型。可想而之,使用什么图片训练出来的模型,就只能画什么样的图,假设有一个只用了狗的图片训练出来的模型,那么我们使用这个模型就没法画出人的照片,因为它的训练数据中没有人的元素。

(2)模型分类

a.大模型

大模型一般都会比较大,差不多几个G,他决定了AI图片的主要风格,常见后缀:ckpt、safetensors。

b.Lora模型

比较小,一般几百MB,要结合大模型使用,使用的时候注意看介绍使用的哪个大模型,常见后缀:ckpt、safetensors、pt。

c.VAE美化模型

名字中带VAE,常见后缀:ckpt、pt。

d.Embeddings和Hypernetworks个性化模型

Embeddings也是属于微调模型,Hypernetworks比较少,常见后缀:pt。

e.其他模型

(3)模型下载

我常用两个网站下载:
https://civitai.com/
https://aituzhan.com/

三、搭建安装

1、安装Homebrew

可以使用官网的pkg,或者以下命令:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

下面是国内的gitee:

/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"

在这里插入图片描述

2、安装Python3.10

使用brew即可安装python:

brew install cmake protobuf rust python@3.10 git wget

3、克隆webui的软件包

以下是命令:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

在这里插入图片描述

4、放入SD的基础模型

也可以后面直接放入下载好的模型。
对应的模型文件目录在:SD文件夹/models/下面,大模型放Stable-diffusion文件夹,lora就放lora文件夹。
以下是我的一些模型:
在这里插入图片描述

5、打开用户界面

进入SD文件夹,打开终端,输入./webui.sh回车,第一次会很慢,需要下载加载项,我记得下载的过程中会有千奇百怪的错误。
在这里插入图片描述
逐一解决。

(1)Installing gfpgan报错

网络错误,这里可以使用https://ghproxy.com/下载这个包,然后解压放到SD文件夹里面,改成对应的名字:

gfpgan:https://github.com/TencentARC/GFPGAN/archive/8d2447a2d918f8eba5a4a01463fd48e45126a379.zip

(2)ERROR: No matching distribution found for GitPython==3.1.30

重试一遍,发现好了。

(3)ERROR: Could not install packages due to an OSError: [Errno 13] Permission denied: ‘/usr/local/dev.txt’

继续重试一遍

(4)终端不能挂代理,这个脚本不能挂代理,否则会报错,报错内容没截到。

(5)生成的时候一直报错,没有进度条

在这里插入图片描述
需要科学。

最后会以Running on local URL: http://127.0.0.1:7860” 结束:
在这里插入图片描述
然后可以在浏览器打开http://127.0.0.1:7860,就可以看到界面了:
在这里插入图片描述

6、安装PS插件

先下载下来PS的扩展:

https://github.com/AbdullahAlfaraj/Auto-Photoshop-StableDiffusion-Plugin

注意:这个插件最低支持PS24版本。
然后放入到/Applications/Adobe Photoshop (Beta)/Plug-ins文件夹下面。

7、启动的时候需要加–api参数

这次才可以连接:
在这里插入图片描述
在这里插入图片描述

四、详细使用

1、简单使用

在这里插入图片描述

2、文生图(txt2img)

选择一块区域,选择文生图,正向提示词一直可爱的猫,然后生成:
在这里插入图片描述
生成效果:
在这里插入图片描述

3、图生图(img2img)

图生图,可以重构该图片,但整体结构不变。
原先文生图生成的图片:
在这里插入图片描述
本来想生成一只白色的猫,结果给我生成一个妹子,但可以看出和原先猫的结构是不变的:
在这里插入图片描述
这下正常了:
在这里插入图片描述

4、局部重绘(inpaint)

可以用来修改小细节:
选中区域,ctrl+j,新建这个区域,使用画笔涂成白色,然后框选图片,生成,提示词不变。
原图:
在这里插入图片描述
重绘后的图片:
在这里插入图片描述

5、外绘,也可以重绘(outpaint)

选中选区,使用橡皮擦擦掉想重绘的地方,然后修改提示词,生成。
原图:
在这里插入图片描述
生成后:
在这里插入图片描述

五、总结

本篇为简单安装和基本使用,后续会有进阶使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1079555.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

阿里云服务器经济型e实例规格云服务器性能介绍

阿里云服务器ECS推出经济型e系列,经济型e实例是阿里云面向个人开发者、学生、小微企业,在中小型网站建设、开发测试、轻量级应用等场景推出的全新入门级云服务器,CPU采用Intel Xeon Platinum架构处理器,支持1:1、1:2、1:4多种处理…

Apipost一大波新功能来袭!连接数据库、TCP协议、MySQL DDL数据导入

本次Apipost带来数据库功能、TCP协议调试等重量级功能,感兴趣的话大家升级试试吧~ 数据库配置 Apipost提供了数据库连接功能,以便开发者可以在接口调试中可以使用数据库获取入参或进行断言校验 目前7.2.2的Apipost支持Mysql、SQL Sever、Or…

asp.net饭店订餐管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio计算机设计定制

一、源码特点 asp.net 饭店订餐管理系统 是一套完善的web设计管理系统,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为vs2010,数据库为sqlserver2008,使用c#语 言开发 asp.net饭店订餐系统 二、功能介…

IP/SIP网络有源吸顶喇叭 20W扬声器 可供POE供电

IP/SIP网络有源吸顶喇叭 20W扬声器 可供POE供电 深圳锐科达SV-7043VP 20W网络有源吸顶喇叭。该设备配备了10/100M以太网接口,内置了高品质扬声器,通过内置的功放和喇叭输出,可提供高达20W的音效功率。SV-7043VP作为SIP系统的播放终端&#…

Unity MRTK Hololens2眼动交互

/** ** UnityVersion : 2021.3.6f1* Description : 眼部交互基类* Author: * CreateTime : 2023-10-11 09:43:20* Version : V1.0.0* * */using System.Collections.Generic; using Microsoft.MixedReality.Toolkit.Input; using UnityEngine;namespace MRTKExtend.EyeTrackin…

C++教程(4)

C 注释 程序的注释是解释性语句,您可以在 C 代码中包含注释,这将提高源代码的可读性。所有的编程语言都允许某种形式的注释。 C 支持单行注释和多行注释。注释中的所有字符会被 C 编译器忽略。 C 注释一般有两种: // - 一般用于单行注释。…

使用Tensorrt的一般步骤

使用Tensorrt的一般步骤 TensorRT的使用包括两个阶段:build and deployment。 build:该阶段主要完成模型转换(从caffe或TensorFlow到TensorRT),如下图所示,在模型转换时会完成前述优化过程中的层间融合&am…

【日常】一名开发人员总结的好习惯,欢迎补充

文章目录 前言首先需要考虑(重要)设计和架构代码质量测试和调试性能优化 编程的好习惯代码可读性模块化和重用性单一职责异常处理注释和文档常见的Java编码规范的例子下面是一个示例代码,展示了一些编码规范的应用还有一些其他的编码规范值得…

C++项目:【负载均衡式在线OJ】

文章目录 一、项目介绍 二、技术栈与开发环境 1.所用技术: 2.开发环境: 三、项目演示 1.运行代码 2.进入项目首页 3.题目列表 4.点击具体一道题 5.编辑代码并提交 四、项目思维导图 五、项目宏观结构 六、Comm公共模块 1.日志工具log.hpp 2.其他工具…

html与css知识点

html 元素分类 块级元素 1.独占一行,宽度为父元素宽度的100% 2.可以设置宽高 常见块级元素 h1~h6 div ul ol li dl dt dd table form header footer section nav article aside 行内元素 1.一行显示多个 2.不能设置宽高,宽高由元素内容撑开 常见行内…

“桥接模式”和“NAT模式”以及“host-only模式(仅主机模式)”

使用虚拟机的时候,我们常看到网络链接配置中,有【桥接】、【NAT】、【仅主机】的选项,今天就来介绍一下这三种网络链接模式。 关于虚拟机中配置网络的内容可以看这篇博客: 深入浅出的介绍一下虚拟机VMware Workstation——part2…

update语句没有用到主键索引会带来的问题

准备材料 建一张表,数据列不建立索引。并写入1万条数据 CREATE TABLE identity.t2 (id INT NOT NULL COMMENT Id,a INT NULL,PRIMARY KEY (id),KEY idx_a (a) );delimiter // create procedure gen_data() begin declare i int default 0; set i0; start transact…

2021-07-31 - 需要打印出来的图表 - 含各种机制

1.应用场景 主要用于帮助自己记住知识点,能随时记起,有时候就是要记住,每次靠查询是不可靠的~ 2.学习/操作 1.文档阅读 08 | 数据库优化方案(一):查询请求增加时,如何做主从分离&a…

0基础学习VR全景平台篇 第107篇:全景图调色和细节处理(上,地拍)

上课!全体起立~ 大家好,欢迎观看蛙色官方系列全景摄影课程! 今天教给大家的课程是地拍全景图调色和细节处理,下面我们就开始吧! 1.把照片快速导入LR软件 选择【图库】模块 打开软件后,点击【导入】按…

制造业进销存管理怎么做?

进销存是什么?生产制造业如何进行进销存管理?制造进销存都能为企业提供什么?进销存管理系统的优势?本文将带大家深入浅出的聊聊制造进销存,全面剖析制造进销存的前世今生。 接下来我会通过一些例子为大家深入浅出的讲…

Java架构师缓存架构设计

目录 1 导学2 高性能概述3 多级缓存设计4 缓存技术方案5 如何进行缓存拆分6 缓存持久化和集群1 导学 本章的主要内容呢是大型系统架构设计难点之一的高性能。它里面的缓存架构设计相关的一些知识,落到项目上,就是订单系统的高性能缓存架构设计。在本章学习当中,首先我们会去…

压铸机泵控比例PQ阀放大器

比例PQ阀是电液比例一压力流量复合阀,它能够对执行元件(液压缸或液压马达)的不同工作状态进行速度和输出力或力矩进行比例控制。它是一种新型的节能型复合阀,既能实现具有确定增益系统的开环控制,又能实现自调整的闭环…

户外led显示屏中的裸眼3D效果是怎么做出来的?

近几年,裸眼3D成了一个热点词汇,但凡它出现的地方都会迅速成为网络热门话题和网红打卡点。裸眼3D大屏凭借其立体逼真的画面显示效果,带给人们新颖震撼的视觉体验,不仅成为户外广告的“新宠”,还成为了城市的新地标&…

红队专题-Cobalt strike 4.x - Beacon重构

红队专题 招募六边形战士队员重构后 Beacon 适配的功能windows平台linux和mac平台C2profile 重构思路跨平台功能免杀代码部分sysinfo包packet包config.go命令的执行shell、run、executepowershell powerpick命令powershell-importexecute-assembly 堆内存加密字符集参考链接 招…

STM32使用HAL库驱动TA6932数码管驱动芯片

TA6932介绍 8段16位,支持共阴共阳LED数码管。 2、STM32CUBEMX配置引脚 推挽配置即可。 3、头文件 /******************************************************************************************** * TA6932:8段16位数码管驱动 *******************…