神秘山洞惊现AI绘画至宝Stable Diffusion残卷

news2024/9/23 5:19:17

最近听到不少大宗门纷纷发声:随着AI神器的现世“程序员职业将不复存在”,“设计师将要失业”。

至此,不少修士开始担忧起来,现出世的AI神器会不会取代掉我辈修士。

其实,至女娲天神创造人类以来,在这漫漫修仙路上,人类在不断的进步。在炼器界不少大修士或隐世宗门炼制出不少法宝,如炼制石器法宝、到铁器法宝、到蒸汽机法宝。。。

每一次炼器界的冲破,无不给各修仙界带来巨大的影响。但法宝虽强,终究是法宝只是辅助我辈修士,终不可能代替我们,AI即使是神器也需我们修士输入真元和法诀加于操控才能发挥出法宝真正威力。

在如今的修仙界,最大的至宝莫过于GPT。GPT已有初级的器灵,虽无灵智,但修士能够以文字为引,让GPT转化出自己想要的答案。

当然在图片处理方面也已经有修仙大派炼制出如:Stable Diffusion、DALL-E、Midjourney等法宝

 

a9b0781db20e379c573707646238fae5.png

我偶然在一神秘的山洞里发现一份残缺的Stable Diffusion法宝的炼制玉简,上面有记载Stable Diffusion法宝的炼制术。下面我们一起来探索这份神秘的玉简,揭开Stable Diffusion绘图法宝的神秘面纱。

 

de1b787bc628fb4ed9de8bd77878014b.png

SD秘籍入门篇

SD起源

Stable Diffusion法宝最初源自于Latent Diffusion之术,由慕尼黑路德维希-马克西米利安大学和海德堡大学的宗师炼制。Stable Diffusion的第一个卷本(v1)由CompVis宗派炼制出来。

SD卷本

 

8f7b2cd67c15550057443e6a603b000b.png

添加图片注释,不超过 140 字(可选)

  • Stable Diffusion v1: CompVis团队发布的原始卷本。

  • Stable Diffusion v2.0: Stability AI资助和炼制的更新卷本。

  • Stable Diffusion XL (SDXL): 在Stable Diffusion的基础上进行了扩展和改进。

  • SDXL Turbo: SDXL Turbo是SDXL的超快模型,改变了用户与技术的交互方式。

  • Stable Diffusion v3: 最新的卷本,目前处于早期预览阶段。

SD秘籍炼制篇

Windows法器卷本

 

8e5f5d520a3d5f6c39fc3a3ce83ee894.png

大家看到这个风格,一定会感觉这好像并不是Stable Diffusion宗派的风格啊。

的确,Stable Diffusion宗派并没有提供相应的Windows法器上的卷本,我们来看看它是怎么来的。

在修仙的B站界中,有一名声名鹊起的up主,名为秋叶。他近日炼制出了一款名为Stable Diffusion整合包v4的阵法,此阵法使得SD的炼制变化简便易用和一键启灵之特性,深受修仙者们的青睐。

下载时,如果只是简单的体验,只需下载这两个文件,其它的就不用了。因为这些文件都比较大

 

6d24265e3abc35946f7fb75228ae9f25.png

如果你的电脑时第一次安装,需要先下载启动器运行依赖,双击安装就可以

 

071b00bee44096e8a020f9616e42ae89.png

解压sd-webui-aki-v4.8文件夹后,双击打开“A绘世启动器.exe”程序。

 

db64e1e332e67b3d53241e1a902dba72.png

中间有提示就点确认,然后就出现此窗体了

 

995567e46cbe21183a2054821d315658.png

等待一会,就会自动弹出浏览器页面:http://127.0.0.1:7860/

 

f567fa7a97d0c63bc78c22649ad1fe2a.png

至此就炼制完成了

秋叶WEBUI整合包免费下载地址:

网盘:https://pan.quark.cn/s/2c832199b09b

解压密码:bilibili@秋葉aaaki

到这里不少修士应该会一直带着一个疑问,我是普通电脑没有英伟达的显卡,能不能搭建SD,答案是肯定的,可以。不过就是CPU和内存基本会被拉满,还过还是可以体验的。

 

c472522b55e80316733d20f578387288.png

Linux法器卷本

 

27957e7ac1f28f5f7757bb8b70d7e5b9.png

环境配置: 首先,更新现有的潜在扩散环境,运行以下命令:

安装xformers: 为了在GPU上提高效率和速度,强烈推荐安装xformers库。需要较新卷本的nvcc和gcc/g++,可以通过以下命令获取:

然后,运行以下命令(编译可能需要长达30分钟):

下载权重: 下载SD2.1-v和SD2.1-base模型的权重。

文本到图像: 使用以下命令从SD2.1-v模型中采样:

这些步骤是从页面中提取的关键信息,用于安装和运行Stable Diffusion模型。请确保按照指示操作以避免安装问题。如果需要更多帮助,请参考页面上的详细文档。

SD秘籍秘诀篇

SD官方API

打开官方秘籍

 

11ae42b60a4222d9dea9a9cfbaca827c.png

点击进入API篇

 

244db78b44b9c5a079b4c63fd14a59df.png

找到API key替换掉代码中的数据

 

ad0adbd378a07f00fa1614cfd56f5f69.png

点击API key链接,这里需要一个账号登录,比如使用自己的google账号登录

 

8af6cc30273e30e5b677702baa513658.png

复制这里的API key,替换掉代码中的,这里我选择使用的是Python的调用方式。

prompt:dog wearing black glasses

提示词:戴黑色眼镜的狗

 

43f7240c013264054e4ac0f657996dc5.png

这是接口返回的结果

 

07d182fefbce0a5b921bab66e14423e9.png

我们来更换prompt试试效果:

增加描述性细节:如颜色、场景、风格、光照等的描述

prompt:A sleek black dog wearing stylish black sunglasses, standing on a beach at sunset.

提示词:一个圆滑的黑色狗戴着时髦的黑色太阳镜,站在日落的海滩。

 

404b870570dc5eb24480718ee8a992f6.png

使用高级词汇:使用专业的词汇来代替通用词汇。

prompt:A confident Border Collie wearing aviator-style black glasses, captured in a dynamic action shot.

提示词:一个自信的边境牧羊犬戴着飞行员风格的黑色眼镜,捕捉到了一个动态的动作镜头。

 

36ad44d1e7ea982865c1a4ab66e8aed5.png

再增加一些场景与氛围

prompt:a photorealistic image of a friendly golden retriever dog wearing stylish black glasses and a red bow tie, sitting in a bright and modern office environment。

提示词:一张写实风格的图片,展示一只友好的金毛寻回犬戴着时尚的黑色眼镜和红色领结,坐在明亮现代的办公环境中。

 

9daa73358a90bab48724c2f2847996da.png

再利用对比和比喻手法:通过对比或比喻手法,增强图像的视觉效果。

prompt:A photorealistic picture showing a super cute white dog with stylish black glasses and suave manners sitting on a sunny family balcony with flowers and greenery.

提示词:一张写实风格的图片,展示一只超级可爱的白毛小狗,戴着时尚的黑色眼镜和温文尔雅的举止,坐在带有鲜花、绿植的阳光家庭阳台环境中。

 

eaa462f26b075a289abe5a9e3a473858.png

可以看到prompt非常的神奇,这就是我们驱动法宝的“法诀”,它能够将修士的真意传给SD,然后转化为栩栩如生的图像。

也就是当下流传比较广的“法诀在手,天下我有”....

然而,

法诀却非万能的。修士们常常发现,即便使用了法诀,所绘之图却与心中所想相去甚远,甚至反复调整并尝试,结果依旧不尽人意。这是因为,AI所修炼的模型之中,尚未吸纳足够的知识库,以至于无法理解修士的真意。

若遇此困境,可以看看这个,机会难得,别错过。

有没有人能详细介绍一下Stable Diffusion AI绘画? - 知乎

除了上面基础接口外,官方宗门还提供了很多其它的接口,大家都可以尝试着调用

 

00545887ee42ed1f001330c4e191a17d.png

自建webui

上面已经搭建好自己的Stable Diffusion,下面来直接使用一下:

 

8afb6231d5d8d5c62cdc5cb4893fd21c.png

这是第一个由Stable Diffusion生成的图片,生成一只猫女。

不过这画质是相当的不错.....

换一换,法诀。如果说我不知道如何写法诀,怎么办?webui上收录了大量的法诀:

 

ffd8683517cd56d52065356defcc1cde.png

然后,看看生成的效果

 

0182c3e16170b1b034195ab85581628e.png

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1701924.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RabbitMQ 交换机类型

常用交换机 发布订阅(Publish/Subscribe)交换机 一个生产者给多个队列发送消息,X 代表交换机。 交换机的作用:类似网络路由器,主要提供转发功能,解决怎么把消息转发到不同的队列中,让消费者从不…

基于Java+MySQL+Swing的学生管理系统

1.系统简介和开发背景 该同学工作积极主动、高效,学习认真,待人诚恳,能够做到服从指挥、认真听取老同志的指导,不怕苦、不怕累,表现有较强的求知欲,积极观察、体验、思考,并能够灵活运用自己的知…

Web安全技术期末考查-vulhub靶场搭建及漏洞复现

一、实验目的与要求 能根据报告找到难度适中的漏洞,搭建弱点环境,并验证该漏洞; 2.能给出该漏洞的修复建议。 二、实验原理与内容 漏洞原理 漏洞原理通常指的是计算机系统、软件、网络或其他技术系统中存在的安全缺陷,这些缺陷…

rapidssl泛域名https600元一年

泛域名https证书也可以称之为通配符https证书,指的是可以用一张https证书为多个网站(主域名以及主域名下的所有子域名网站)传输数据加密,并且提供身份认证服务的数字证书产品。RapidSSL旗下的泛域名https证书性价比高,申请速度快,…

浅谈JMeter体系结构

JMeter体系结构详解 JMeter是一款功能强大的开源性能测试工具,广泛应用于Web应用、数据库、FTP服务器等多种场景下的负载和压力测试。其灵活的体系结构设计使得测试计划的创建、执行与结果分析变得高效而直观。本文将深入解析JMeter的三维空间体系结构,…

SSE(Server Sent Event) 踩坑留念

整条链路是 客户端A --> 服务端 A —> 服务端 B 我负责服务端 A 此时要注意 Client 中的 processes 的写法 Post(value “/v2/xx”, processes MediaType.TEXT_EVENT_STREAM) 这样写是一直报错的 改成下面的写法才可以 Post(value “/v2/xx”, processes MediaT…

HTTP 协议的基本格式和Fidder的简单使用

HTTP协议诞生于1996(开玩笑哈,诞生于1991年),http协议用于网页和手机app和服务器交互的场景。通过HTTP协议,客户端(例如网页浏览器或手机应用)可以向服务器发送请求,服务器则会响应这…

10个最佳人物素材网站推荐,免费获取第一个PNG文件!

人物素材是设计中应用最广泛的元素之一。无论是网页设计还是移动终端设计,人物素材的插画设计都比文字信息更容易吸引用户的注意力。作为内容呈现,还可以增加设计的艺术属性。为了节省大家寻找人物素材的时间成本,本文立即为大家整理了10个宝…

数据结构的直接插入排序(C语言版)

一.直接插入排序的基本概念 1.直接插入排序的基本思想 将数组分为已排序和未排序两部分。 每次从未排序部分取出一个元素,将其插入到已排序部分的合适位置,使得已排序部分保持有序。 重复步骤2,直到整个数组有序。 2.排序的工作原理 假设前 i-1 个元素已经有序,现在要将第…

【Django】开发个人博客系统【1】

使用Django开发个人博客系统,博客系统包括用户(博主)注册和登录、博主资料信息、图片墙功能、留言板功能、文章列表、文章正文内容和Admin后台系统。 1. 项目架构设计 下一步将上述设置写入Django的配置文件settings.py,当Django…

利用C#中WinForm设计一个小游戏:DoYouLoveMe???

目录 一、WinForm 二、功能实现 三、代码部分 一、WinForm Windows 窗体是用于生成 Windows 桌面应用的 UI 框架。 它提供了一种基于 Visual Studio 中提供的可视化设计器创建桌面应用的高效方法。 利用视觉对象控件的拖放放置等功能,可以轻松生成桌面应用。 使…

适合大学生低成本创业的又一个项目推荐(宿舍小卖部)

​ 大学生的时间是非常充裕的,这也导致了大学生非常的懒惰,每天除了娱乐(打游戏,针对大部分人),也没有其它爱好了,就连吃饭都要抽时间来吃,所以这就给同学在宿舍做点小生意带来了机会…

如何在忘记密码的情况下解锁 iPhone? 6 种方法分享

您是否因为没有密码而无法解锁您的 iPhone? 别担心,这种情况比你想象的更常见!忘记密码是 iPhone 用户面临的最常见问题之一,而且可能非常令人沮丧 - 但不要绝望。 在这篇文章中,我们将与您分享绕过 iPhone 屏幕密码…

保时捷经销商造反,都怪小米SU7们?

文 | Auto芯球 作者 | 雷慢 造反啦,保时捷的经销售造反啦, 现在时候买合资进口豪车,估计亏得爹妈都不认得了, 放在三年前,打死我也不敢相信豪华车会有今天这样的闹剧, 这两天,保时捷中国的…

Moto和Inter字节序

inter: 低地址按照start_bit位放低字节依次往高字节填充 MotoLsb: 低地址按照start_bit位放高字节,依次往低字节填充MotoMsb:高字节按照start_bit位放低地址,依次往高字节填充

【机器学习】Python中的决策树算法探索

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 Python中的决策树算法探索引言1. 决策树基础理论1.1 算法概述1.2 构建过程 2. P…

软件3班20240527

JDK 版本与 Tomcat 的 兼容性

谷歌忙于手动删除自己搜索引擎中奇怪的人工智能答案

该公司确认正在“迅速采取行动”消除人工智能工具的一些奇怪反应。 社交媒体上充斥着谷歌新的人工智能概述产品的例子,这些产品说了一些奇怪的话,从告诉用户在披萨上涂胶水到建议他们吃石头。混乱的推出意味着,随着各种表情包的发布&#xf…

bootstrap实现天平效果

之前提到了,最近,孩子的幼儿园让家长体验“半日助教活动”,每个家长需要讲授15-20分钟的课程。作为一名程序员,实在没有能教的课程,只能做了一个小游戏,带着小朋友们熟悉数字。 在上一章博客中&#xff0c…

解决mysql5.7版本中,子查询order by后,对子查询进行group by分组获取最新记录无效的问题

目录 场景简介原因示例mysql5.7之前的版本mysql5.7之后的版本解决1、使用having2、使用limit3、使用子查询获取目标数据ID 场景简介 子查询order by后,对子查询进行group by分组获取最新记录失败 应用场景:一对多的关系,通常需要取最新、最…