AI绘画兴起,Stable Diffusion脱颖而出,来一探究竟

news2025/1/11 17:51:17

近几年,AI图像生成风靡全球,它能够根据文字描述生成精美图像,这极大地改变了人们的图像创作方式。众多专业人士说该技术正在引领着新一轮深度学习创意工具浪潮,并有望彻底改变视觉媒体的创作。

AI绘画兴起

Stable Diffusion脱颖而出

目前文生图的主流AI绘画平台主要有三种:Midjourney、Stable Diffusion、DALL-E。

2022年4月,OpenAI发布了DALL-E 2,引发社交媒体热议。因为它能够将用文字编写的场景(成为“提示”)转换为无数视觉风格,有人使用这个工具创作了骑在马背上的宇航员,在古埃及购买面包的泰迪熊等。

DALL-E 2生成图像

之后不久,Google和Meta宣布了他们自己的文本到图像AI模型。

MidJourney自2022年3月起作为Discord服务器提供,几个月后向公众开放,因此上手有一点难度,不过是收费的,所以在默认情况下,MidJourney绘画质量更高。但它对于硬件性能的要求较高,甚至同一个指令每次得到的结果都不尽相同。

MidJourney生成图像

然后8月22日,Stability AI发布了Stable Diffusion。它使用来自LAION-5B数据集的512x512图像进行训练,已经过数十亿张图像的训练,可以产生与DALL-E 2和MidJourney相当的结果。

仅在发布后的一周后,媒体上就涌现了数十个将Stable Diffusion推向全新方向的项目。人们使用一种名为“img2img”的技术取得了意想不到的效果,该技术升级了MS-DOS游戏艺术、将Minecraft图形转换为逼真图形、将阿拉丁的场景转换为3D、将童趣涂鸦转换为丰富的插图等等。

Stable Diffusion生成图像

完全免费开源

还能自定义训练风格模型

Stable Diffusion核心技术来源于AI视频剪辑技术创业公司Runway的Patrick Esser,以及慕尼黑大学机器视觉学习组的Robin Romabach。

相较于DALL-E等其他平台,Stable Diffusion完全免费开源,目前有超过一千种模型可供下载,所有代码均在GitHub上公开,任何人都可以拷贝使用。

Stable Diffusion生成图像

在实际工作中应用AI绘画,图像的精准控制和风格控制是影响绘画效果生成的两个重要因素。Stable Diffusion中就拥有众多选项可供用户“定制化”个人图像,例如更改图像大小、生成图片数量、种子值、采样器等,同时支持prompt和negative prompt,能够提高提示中关键词的权重。

Stable Diffusion的强大之处还在于能够自定义训练风格模型,如果现有风格无法满足要求,可以自己训练特定风格模型。并且除了生成图像外,Stable Diffusion还能用在图像编辑、修复、超分辨率、风格迁移等众多方面。

Stable Diffusion生成图像

集成DCC工具

构建更庞大的生态系统

Stable Diffusion逐渐火爆的同时,Stability.ai官方和CG业内大佬还发布了一系列免费插件,例如AI Render、Stability等,来将Stable Diffusion集成到Blender、Houdini等DCC应用程序中

AI Render

这些插件可以帮助用户使用Blender、Houdini等3D内容创建工具内部的开源AI图像生成模型,将简单块状几何体的渲染转换为详细的插图和概念艺术。

用户还能从动漫和线条艺术等基础风格,到超现实主义、包豪斯等美术风格等一系列预设视觉风格中进行选择,并在Blender、Houdini这些工具内调整Stable Diffusion参数以调整最终图像的外观。

预设视觉风格

自公布以来,Stable Diffusion依靠其支持本地化运行的特性以及强悍的性能,正以肉眼可观的速度爆红AI圈,已经被艺术家、开发人员和爱好者等社区广泛采用。与此同时,对GPU算力的需求也越来越高

Stable Diffusion基本上是基于使用NVIDIA制造GPU而设计的,所以这项「黑科技」在NVIDIA GPU就有着最好的效率表现。赞奇与华为携手共创的赞奇云工作站,所有机型均配备NVIDIA专业级显卡,具有高达153.4 TFLOPS的Tensor Performance参数性能,对深度学习中的计算性能和效率有着更高的支持度,更有能力处理AI任务。

赞奇云工作站客户端

同时,奇云工作站(www.zanqicloud.com)还能整合打通设计者前端生态应用和设计业务全流程,全面调用云计算资源运用于AI(人工智能)的应用场景。高性能算力机器按需使用,灵活租赁,稳定性强。基于域控的安全策略,还可以免受病毒攻击,并且提供自动多副本可靠性机制。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/424041.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[Django] 后台管理系统

浏览之前,请先阅读以下文章 1.Django项目创建 2.Django路由系统 在项目目录下的urls.py文件中,我们会看到这样一个url的配置 启动服务,在浏览器中输入网址http://127.0.0.1:8000/admin/,结果如下 Django提供了一个非常强大的管…

前端解析Excel中的数据进行操作

技术要点:Vue、Element、JSON 功能描述:读取Excel中的数据,利用JavaScript技术奖数据转成Json格式进行操作! 功能描述:只能用前端操作数据,并未实现将数据传送至后端处理! 注意注意注意 如果…

Dapper——分布式跟踪系统

分布式跟踪系统 背景 当代的互联网的服务,通常都是用复杂的、大规模分布式集群来实现的。互联网应用构建在不同的软件模块集上,这些软件模块,有可能是由不同的团队开发、可能使用不同的编程语言来实现、有可能布在了几千台服务器&#xff0…

常用加密算法

目录 常见的加密算法可以分成三种: 对称加密算法 DES 3DES AES 非对称加密 RSA ECC Hash算法 MD5 SHA1 算法对比 算法选择 常见的加密算法可以分成三种: 对称加密算法;非对称加密算法;Hash算法;接下来我们…

论文 : Multi-Kernel Broad Learning systems Based on Random Features

Multi-Kernel Broad Learning systems Based on Random Features:A Novel Expansion for Nonlinear Feature Nodes 基于核方法的强大性能,本文提出了一种基于多核的BLS系统扩展方法。首先,将多核形式的非线性特征映射合并为广义学习系统的特征节点; 然后…

液晶显示器输入信号接口(一) —— VGA

VGA1. 简介2. VGA接口3. VGA线4. 技术原理4.1 信号传输4.2 模拟信号的扫描方式4.3 参数本文主要介绍VGA,其它输入输出信号接口介绍可从以下链接跳转: 液晶显示器输入信号接口(二) —— DVI 液晶显示器输入信号接口(三) —— HDMI 液晶显示器输入信号接口…

Mysql高级 学习笔记分享

索引:Index是帮助Mysql高效获取数据的数据结构 索引是一种数据结构 ---排好序的快速查找数据结构 、 某种满足特定查找算法的数据结构、以某种方式指向数据 两大功能:查找快、排好序 目的在于提高查询效率,类比字典 如果没有索引&a…

【Vue】学习笔记-列表渲染/数据监视

列表渲染/数据监视基本列表Key的作用与原理列表过滤列表排序Vue 数据监视原理基本列表 v-for指令 用于展示列表数据语法:v-for“(item,index) in xxx” :key“yyy”可遍历:数组,对象,字符串(用的很少)&am…

中国农业大学821数据结构经验贴

中国农业大学821经验贴目录个人情况说明初试复习经验数学二英语二政治数据结构复试复习经验目录 个人情况说明 初试成绩 复试成绩 复试成绩在平均水平,综合成绩第五 本科经历 河南双非GPA:3.79,专业排名第6竞赛经历:CCPC省银&…

Matlab进阶绘图第16期—三维填充折线图

三维填充折线图是在三维折线图的基础上,对其与XOY平面之间的部分进行颜色填充,从而能够更好地刻画细节变化。 由于Matlab中未收录三维填充折线图的绘制函数,因此需要大家自行设法解决。 本文使用自制的FilledPlot3小工具进行三维填充折线图…

计算机网络第一章(概述)【湖科大教书匠】

1. 各种网络 网络(Network)由若干**结点(Node)和连接这些结点的链路(Link)**组成多个网络还可以通过路由器互连起来,这样就构成了一个覆盖范围更大的网络,即互联网(互连网)。因此,互联网是"网络的网络(Network of Networks)"**因特…

扩散模型的Prompt指南:如何编写一个明确提示

Prompt(提示)是扩散模型生成图像的内容来源,构建好的提示是每一个Stable Diffusion用户需要解决的第一步。本文总结所有关于提示的内容,这样可以让你生成更准确,更好的图像 一个好的提示 首先我们看看什么是好的提示…

MCM箱模型建模方法及大气O3来源解析

详情点击链接:MCM箱模型建模方法及大气O3来源解析一、大气中O3形成、MCM和Atchem 2原理及Linux系统安装1.大气中O3形成的原理 2、MCM原理及基本流程3、Atchem 2 下载安装4、Linux系统安装5、Atchem 2 运行需要的其他工具A、Fortran;B、Python&#xff1…

小程序分包(普通分包、独立分包)

普通分包和独立分包的区别 当小程序从普通的分包页面启动的时候,首先需要下载主包独立分包是不依赖看于主包就可以运行,提升分包的执行速度,一个小程序可以有多个独立分包。 独立分包属于分包的一种。普通分包的所有限制都对独立分包有效。独…

基于LDA+SVM实现人脸识别模型

基于LDASVM实现人脸识别模型 描述 人脸识别(图像识别)是机器学习领域十经典的应用,在本质上,人脸识别属于监督学习中的分类问题。前面章节中我们已经学习了支持向量机(SVM),该算法在图像分类领…

专为智能设备安全打造 | 基于ACM32 MCU的智能断路器方案

随着我国电网建设的快速发展,数字化变电站成为建设和研究的热点,数字化变电站的核心在于一次设备的智能化与二次设备的网络化,对于断路器这种极其重要的电力一次设备而言,其智能化的实现有十分重要的意义,断路器智能化…

耗时半月,终于把牛客网上的软件测试面试八股文整理成了PDF合集(测试基础+linux+MySQL+接口测试+自动化测试+测试框架+jmeter测试+测试开发)

大家好,最近有不少小伙伴在后台留言,近期的面试越来越难了,要背的八股文越来越多了,考察得越来越细,越来越底层,明摆着就是想让我们徒手造航母嘛!实在是太为难我们这些程序员了。 这不&#xf…

【Git】速食Git,一文学会Git使用

1.什么是版本控制 版本控制是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。【通俗来说就跟我们所玩的游戏一样,不断地更新迭代游戏内容,比如…

微服务高级篇学习【4】之多级缓存

文章目录前言一 多级缓存二 JVM进程缓存2.1 案例导入2.1.1 使用docker安装mysql2.1.2 修改配置2.1.3 导入项目工程2.1.4 导入商品查询页面2.1.5 反向代理2.2 初识Caffeine2.3 实现JVM进程缓存三 Lua脚本入门3.1 安装Lua3.2 Lua语法学习四 实现多级缓存4.1 OpenResty简介4.2 Ope…

STK实例场景创建及TLE文件导入

学习过程主要参考杨颖、王琦老师的《STK在计算机仿真中的应用》。(值得注意的是,书中的STK版本为5.X,我使用的版本为11.6) 创建实例场景 在默认的工具条单击第一个按钮(或File→New),并设置场…