Stable Diffusion 2.0 来了

news2024/9/24 13:26:20

Stable Diffusion 一经发布,就立刻在业界掀起巨大的波浪。我个人后知后觉,直到 Stable Diffusion V1.4 版本发布,才接触 Stable Diffusion (之前使用的是 Disco Diffusion)。这段时间,SD 团队也没闲着,很快就发布了 V2 版本。下面看看 SD V2 版本给我们带来了哪些惊喜。

9d3de6ffe4639252967f90c6b73e3e87.png

全新的文本到图像扩散模型

Stable Diffusion 2.0 版本包括使用全新文本编码器 (OpenCLIP) 训练的强大的文本到图像模型,该模型由 LAION 在 Stability AI 的支持下开发,与早期的 V1 版本相比大大提高了生成图像的质量。此版本中的文本到图像模型可以生成默认分辨率为 512x512 像素和 768x768 像素的图像。

这些模型在 Stability AI 的 DeepFloyd 团队创建的 LAION-5B 数据集的美学子集上进行训练,然后使用 LAION 的 NSFW 过滤器进一步过滤以删除成人内容。

某些人可能会有所失望,不能再使用最新模型来生成色图了。

下面是使用 Stable Diffusion 2.0 生成的图像示例,图像分辨率为 768x768。

34ef9ab8cf36cc42356b1d9ff65186f5.png

超分辨率 Upscaler 扩散模型

Stable Diffusion 2.0 还包括一个 Upscaler Diffusion 模型,该模型将图像的分辨率提高了 4 倍。下面是低分辨率生成图像 (128x128) 放大为更高分辨率图像 (512x512) 的示例。

9c8b46ad41d2d92c75b29af613fac912.png

其实在 V1 版本中,也可以引入额外的步骤进行图像放大,所以这一项改进算不上惊喜。当然,现在可以一步到位,Stable Diffusion 2.0 可以生成分辨率为 2048x2048 甚至更高的图像。

深度图像扩散模型

这个称为 depth2img 的模型,实际上就是 V1 之前的图像到图像功能的升级,也是现在网友玩得很嗨的一个功能,也就是使用一张图片作为提示,生成一幅结构类似的作品。

如下图所示,左边的输入图像可以产生几个新图像(右边)。可以看出,右边生成的图像保持输入图像的结构和形状,但内容上又有所不同。

6979e146fc25753a92a21a620d71cf15.png

Depth-to-Image 的玩法很多,可以产生出无数看起来与原始图像截然不同,但又相似的“克隆”版本:

b36b122f6fb20873f3775505d2adc016.gif

更新修复扩散模型

Stable Diffusion 2.0 还包括一个新的文本引导修复(text-guided inpainting)模型,这也是上一版本的改进。具体说来,就是如果我们对生成作品整体比较满意,但某些部分可能存在瑕疵(比如说眼睛),那我们可以只针对瑕疵的部分进行重新生成,而其它部分保持不变。或者反过来使用,保持某个部分不变,对其它部分重新生成,这样可以得到非常有趣的结果。网上诸多恶搞作品就使用了这种技巧。

c4f88ed74a592ccadce596146fef7573.gif

小结

一般来说,软件发布的主版本更新,通常意味着重大改进,如果要体验这一功能,请访问官方发布版本:

https://github.com/Stability-AI/StableDiffusion

我之前体验的开源项目 InvokeAI,也开始进行了 V2 模型的支持工作,目前还不够稳定,并没有合并到主分支。

后续我将持续关注 Stable Diffusion 开发方面的进展,希望能使用最新的工具创作出更好的艺术作品,敬请关注。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/56968.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【华为上机真题 2022】停车场车辆统计

🎈 作者:Linux猿 🎈 简介:CSDN博客专家🏆,华为云享专家🏆,Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我,关注我,有问题私聊! &…

【Python】推荐三个好玩的图像处理库

1. 引言 Python是一门高级语言,它可以实现很多功能。Python强大的原因是什么?某种程度上,在于它所拥有的现成的库,使其在编程的各个方向上都易于使用。在本文中,我将向大家展示一些Python库,这些库非常有用…

node.js的模块化

目录 一、模块化的概念 1.什么是模块化 2.编程领域中的模块化 二、node.js中模块的分类 三、require() 加载模块 四. 模块作用域 五、module对象 六、module.exports对象 七、exports对象 八、CommonJS规定: 九、关于包(第三方模块) 十、解决…

阿里P8高级专家,耗时多年整理SpringBoot指南文档

前言 相信程序员们已经看过甚至动手操作过很多的springboot项目,在项目操作中需要各种插件的支持,其实,可能还有很多大家不知道的但是很方便的操作,小编今天就给大家把这份PDF分享出来,绝对是你以前没有见到过的。 1、…

springboot读取yml文件中的list列表、数组、map集合和对象

前言 springboot配置文件yml类型简单的风格,十分受大家的欢迎,支持字符string类型,支持列表list类型,支持集合map类型,支持数组array类型,支持类对象类型,下面我们来实战下这些形式的配置如何取…

聚观早报 | 国美电器被申请破产清算;首款太阳能汽车投入生产

今日要闻:网传国美电器被申请破产清算;全球首款太阳能汽车投入生产;苹果头显配套系统已改名为xrOS;马斯克计划植入脑机接口设备;特斯拉即将推出自动驾驶出租车网传国美电器被申请破产清算 12 月 2 日消息,据…

网站都变成灰色,有哪些方法可以快速实现?

有些时候我们需要把网站页面变成黑白色或灰色,特别是对于一些需要悼念的日子,以及一些影响力很大的伟人逝世或纪念日的时候,都会让网站的全部网页变成灰色(黑白色),以表示我们对逝者或者英雄的缅怀和悼念。…

在校大学生如何申请软著,手把手教会你(内有免费模板)

目录 一.前言 二.以学校为单位全流程申请(以我的学校为例) 1.问问导员谁负责管软著申请这块的,联系他,问需要什么。 2.为了防止学生买软著转头申请 3.按以下要求准备材料 4.没问题就发给老师,一般要破费一下 5.…

View基础知识-位置大小和滑动

前言 这篇文章可以作为基础看看,但是有时候基础就是细节,不一定所有人都记得,所以基础也要记录一下。都熟悉的话也可以看看其他系列文章: View事件分发机制(源码分析篇) Android一步一步追踪View的工作原…

【车辆动力】基于Matlab模拟停车动力学

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

Python 音频处理以及可视化 Amplitude,MFCC,Mel Spectrogram, librosa 库

利用python库 librosa库对于音频文件进行预处理,以及可视化操作。 1. Load Audio Data 导入音频 将音频文件(这里使用苹果录音文件 .m4a 格式)导入librosa,音频格式可以为其它(甚至视频文件mp4也是可以的&#xff09…

【Docker】Dockerfile:常见保留字、使用案例

Dockerfile是用来构建Docker镜像的文本文件,是由一条条构建镜像所需的指令和参数构成的脚本。 官网:链接 构建三步骤 编写Dockerfile文件构建镜像:docker build用镜像运行容器实例:docker run 一、常用的保留字 二、使用案例 要…

Spring MVC统一异常处理的3种方式(附带实例)

在 Spring MVC 应用的开发中,不管是对底层数据库操作,还是业务层或控制层操作,都会不可避免地遇到各种可预知的、不可预知的异常需要处理。 如果每个过程都单独处理异常,那么系统的代码耦合度高,工作量大且不好统一&a…

html5期末大作业:基于html+css+javascript+jquery+bootstarp响应式图书电商HTML模板网上书店(25页)

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

STC 51单片机51——直流电机PWM

//开发板按钮K3和K4用于调速,直流电机接部件电机模块Vcc和O1 #include"reg52.h" #define u8 unsigned char #define u16 unsigned int sbit O1P1^0;//ULN2003 sbit K3P3^2; //减速 sbit K4P3^3; //加速 u8 Flag; u16 T, PWM, Temp;//T为控制周期…

Java项目:ssm赛事打分系统

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 赛事评分系统,SSM框架。该项目分管理员、裁判、选手三个用户角色。 管理员主要功能: 首页、选手管理、裁判管理、赛事管…

【2022世界杯开源项目实战】使用docker部署world-cup-2022-cli-dashboard数据看板工具

【2022世界杯开源项目实战】使用docker部署world-cup-2022-cli-dashboard数据看板工具一、world-cup-2022-cli-dashboard介绍1.工具介绍2.数据看板的内容二、检查本地docker环境1.检查docker版本2.检查docker状态三、构建world-cup-2022-cli-dashboard的镜像1.下载world-cup-20…

如何用蓝牙实现无线定位(四)--远程定位显示

1. 待救援定位设备 按照下面的针脚使用杜邦线将待救援定位设备的主蓝牙、从蓝牙连接到主控板上,和本地显示时的连接针脚是一样的,但是由于不需要连接OLED,因此不需要堆叠Bigfish。 参考视频 烧录程序如下(human.ino)&a…

善网ESG周报(第三期)

ESG报告: 陆金所控股发布2021年ESG报告 以可持续商业模式创造社会价值 从11月28日发布的报告来看,其公司2021年累计帮助超310万小微企业主并开展170场环保公益活动和超610场金融科普活动。 金融界联合济安金信发布首份《京津冀ESG绿色标杆企业报告》&a…

Keras深度学习高级(四)

本篇涉及的内容 如何将模型的结构由层升级成图如何使用 Keras 的回调函数在训练过程中监控模型,并根据模型状态采取行动使用TensorBoard将模型可视化什么是批标准化、深度可分离卷积和残差连接为什么应该使用超参数优化和模型集成 第一部分 Keras的函数式API 一、…