Stable Diffusion V3测评

news2024/10/6 16:25:50

1.引言

3月5号,Stability AI发布了介绍Stable Diffusion V3的研究论文,链接地址:戳我
在这里插入图片描述

这是目前他们发布的最先进、功能最强大的图像生成器,与一年多前发布的令人印象深刻的 Stable Diffusion V2.1 相比有了大幅升级。SD3所带来的新功能如下:支持文本渲染、性能更优、更好的图像生成质量。

外网有博客尝试把SD3 生成的图像与两款最流行、功能最强大的人工智能图像生成器Midjourney V6Dall-E 3 做了比较,这里对测评结果进行了相应的转述。

2.测评一

测试一的文本提示词如下:

Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat

一张红色球体位于蓝色立方体之上的照片。后面是一个绿色三角形,右边是一只狗,左边是一只猫

我们先来看下SD3的生成效果:
在这里插入图片描述

让人眼前一亮的是猫和狗脖子上的绿色色调。看来 SD3 能够理解环境并模拟光的反射。

相比之下,Midjourney V6Dall-E 3 的图像虽然给人留下了深刻印象,但却在不同方面有所欠缺。二者根据上述提示词所生成的图像分别如下:

在这里插入图片描述
在这里插入图片描述

对比上述结果,Midjourney V6 奇怪地将动物放在蓝色方块上,而 Dall-E 3 的结果则令人费解,文不对题。在这一轮比赛中,SD3 以实际符合提示要求而获得第一名。

3.测评二

实验二的文本提示词如下所示:

Resting on the kitchen table is an embroidered cloth with the text ‘good night’ and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic

灶台上放着一块刺绣布,上面写着 "晚安 "和一只刺绣小老虎。布的旁边有一支点燃的蜡烛。灯光昏暗而富有戏剧性

按照惯例,我们先来看下SD3的表现:

在这里插入图片描述

这张特写照片非常漂亮。我喜欢它将边缘模糊化,而将重点放在老虎和文字上。刺绣的细节也非常棒。大家几乎可以感觉到针脚的刮擦纹理,以及随着针脚变化所带来的模糊效果。

接下来我们看下竞争对手的效果,依次为MidjourneyDall-E3的效果:
在这里插入图片描述
在这里插入图片描述

Midjourney 一如所料,采用了标志性的暗色调和精准的灯光。Dall-E 3在这方面也做得很好,尽管他们都增加了一些提示中没有的其他元素。

个人看法,SD3严格遵守了提示词的要求,所以这一轮测评中它是赢家…不过, Midjourney 的艺术诠释也很让人着迷。

4.测评三

实验三的文本提示词如下所示:

Photo of an 90’s desktop computer on a work desk, on the computer screen it says “welcome”. On the wall in the background we see beautiful graffiti with the text “SD3” very large on the wall.

办公桌上 90 年代台式电脑的照片,电脑屏幕上写着 “欢迎”。背景墙上有美丽的涂鸦,"SD3 "字样非常醒目。

首先,我们先来看下SD3的表现:
在这里插入图片描述

巨大的文字与背景融合得天衣无缝。注意字体的一致性。看起来就像是直接从 Photoshop 中生成的插图。

现在,让我们看看 Midjourney Dall-E 3 的表现:

在这里插入图片描述
在这里插入图片描述

就风格和细节而言,Midjourney很容易入选。但提示要求在墙上写很大的文字,而Midjourney在细节上没有做到这一点。因此,就连贯性而言,SD3 是最佳选择。Dall-E 3 的结果相对逊色不少。

5.总结

从测试图像来看,SD3 显然在文本生成和提示词连贯性方面表现出色,可以说超越了其强大的竞争对手。不过,就图像质量和风格而言,我仍然认为 Midjourney在一些场景下也不容小觑。 但是,与竞争对手不同,Stable Diffusion 一直是开源的,完全免费!这意味着大家很快就能下载 SD3 并在本地免费运行。但这也有一个巨大的弊端,那就是可能会引发严重的社会伦理问题。试想一下,更令人难以区分的深度伪造图像和视频的危害性有多大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1494739.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

redis进阶(一)

文章目录 前言一、Redis中的对象的结构体如下:二、压缩链表三、跳跃表 前言 Redis是一种key/value型数据库,其中,每个key和value都是使用对象表示的。 一、Redis中的对象的结构体如下: /** Redis 对象*/ typedef struct redisO…

软考65-上午题-【面向对象技术】-面向对象分析、设计、测试

一、面向对象分析OOA 1-1、面向对象分析的定义 面向对象分析的目的:为了获得对应用问题的理解。理解的目的是确定系统的功能、性能要求。 面向对象分析包含5个活动:(背!) 认定对象;(重要一点…

爆肝!Claude3与ChatGPT-4到底谁厉害,看完你就知道了!

前言: 相信大家在pyq都被这张图片刷屏了把~ 昨天,为大家介绍了一下什么是Claude,今天咱终于弄到号了(再被ban了3个号之后终于是成功的登上去了,如果各位看官觉得咱文章写的不错,麻烦点个小小的关注~你们的…

android开发基础有哪些,985研究生入职电网6个月

不好意思久等了 这篇文章让小伙伴们久等了。 一年多以来,关于嵌入式开发学习路线、规划、看什么书等问题,被问得没有一百,也有大几十次了。但是无奈自己对这方面了解有限,所以每次都没法交代,搞得实在不好意思。 但…

Linux conntrack和iptables技术解析

Linux虚拟文件系统管理技术 1. netfilter解析1.1 netfilter的基础原理1.2 netfilter的相关hook 2. conntrack解析2.1 conntrack的基础原理2.2 conntrack的表记录解析 3. iptables解析3.1 iptables基础原理3.2 融合conntrack表的iptables规则 4. 疑问和思考4.1 conntrack和iptab…

【vue3之组合式API】

组合式API 一、setup1.写法2.如何访问3.语法糖4.同步返回对象 二、reactive()和ref()1.reactive()2.ref() 三、computed四、watch函数1侦听单个数据2.侦听多个数据3. immediate4. deep5.精确侦听对象的某个属性 五、生命周期函数六、组件通信1.父传子2. 子传父 七、模版引用1. …

【C++精简版回顾】20.模板的使用

1.模板起源 1.模板的定义 1.针对函数属性模板 //针对函数属性 template <class VOID > VOID print1(int a) {cout << a << endl; } 2.针对数据属性模板 //针对数据属性 template <typename INT,typename FLOAT> void print2(INT a,FLOAT b) {cout <…

网工内推 | 华为成都研究所,24届应届生人才储备计划

华为成都研究所 招聘岗位 网络工程师&#xff08;2024应届&#xff09; 岗位要求 24届的学员 本科公办院校 英语4/6级 有HCIP优先 工作地点 成都 私信小编&#xff0c;回复【内推】&#xff0c;获取内推名额申请资格~ 想获取更多『 思科 | 华为 | 红帽 认证真题 』、『 网…

正向代理和反向代理区别

正向代理和反向代理的区别&#xff1a; 特点正向代理反向代理位置位于客户端和目标服务器之间位于目标服务器和客户端之间代理对象代理服务器代表客户端发送请求到目标服务器代理服务器代表目标服务器接收客户端的请求配置客户端需要手动配置代理服务器客户端不需要知道代理服…

Redis(5.0)

1、什么是Redis Redis是一种开源的、基于内存、支持持久化的高性能Key-Value的NoSQL数据库&#xff0c;它同时也提供了多种数据结构来满足不同场景下的数据存储需求。 2、安装Redis&#xff08;Linux&#xff09; 2.1、去官网&#xff08;http://www.redis.cn/&#xff09;下…

7、Redis-事务、持久化、内存淘汰机制和过期key处理

目录 一、事务 二、持久化 三、内存淘汰机制 四、过期key处理 一、事务 Redis的事务本质上就是一个批量执行命令的操作。分为三个步骤&#xff1a; 开始事务&#xff1a;multi命令入队&#xff1a;正常输入命令即可执行事务&#xff08;依次执行命令&#xff09;&#xf…

最近开发中遇到的一些问题

puppeteer下载失败问题 使用的淘宝镜像&#xff0c;但执行命令npm i puppeteer之后&#xff0c;报错&#xff1a; npm ERR! code 1 npm ERR! path E:\项目-临时\test_install_puppeteer\node_modules\puppeteer npm ERR! command failed npm ERR! command C:\WINDOWS\system3…

Android开发教程入门,那些被大厂优化的程序员们

Binder原理 1、概述 Android系统中&#xff0c;涉及到多进程间的通信底层都是依赖于Binder IPC机制。例如当进程A中的Activity要向进程B中的Service通信&#xff0c;这便需要依赖于Binder IPC。不仅于此&#xff0c;整个Android系统架构中&#xff0c;大量采用了Binder机制作…

数据库原理(关系代数)

1.集合运算符基础 要求&#xff1a; 具有相同的目n&#xff08;即两个关系都有n 个属性&#xff09;相应的属性取自同一个域t是元组变量&#xff0c; t R表示t是R的一个元组 1.1并 符号&#xff08;&#xff09; R∪S { t|t R∨t S } 结果特征&#xff1a; 仍为n 目关…

长度为n的数组a初始值全为0,目标是把数组a变为数组b(1<=bi<=n), 可以进行任意次操作:选择长度为k的数组c,(1<=ci<=n且两两不同)

对于1<i<k, 把 a[c[i]] 改为c[i % k 1]。给定n&#xff0c;k和数组b&#xff0c;判断能否得到数组b。 题目 思路&#xff1a; #include <bits/stdc.h> using namespace std; #define int long long #define pb push_back #define fi first #define se second #d…

python使用zmail实现邮件发送

一&#xff1a;zmail介绍 1、Zmail的优势 自动填充大多数导致服务端拒信的头信息&#xff08;From To LocalHost之类的)将一个字典映射为email&#xff0c;构造信件就像构造字典一样简单自动寻找邮件服务商端口号地址&#xff0c;自动选择合适的协议&#xff08;经过认证的&am…

docker 安装 portainer

小编给友友们总结了一下 Portainer 的好处以下 Portainer是Docker的图形化管理工具&#xff0c;提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作&#xff08;包括上传下载镜像&#xff0c;创建容器等操作&#xff09;、事件日志显示、容器控制台操作、Swar…

CAPL - 如何实现弹窗提示和弹窗操作

目录 函数介绍 TestWaitForTesterConfirmation Example 使用方法一 使用方法二

Hack The Box-Perfection

目录 信息收集 nmap dirsearch gobuster whatweb WEB 信息收集 ffuf 漏洞探索 漏洞发现 模板注入 反弹shell 提权 get user and flag 信息收集 ssh登录&get root and flag 信息收集 nmap 端口探测┌──(root㉿ru)-[~/kali/hackthebox] └─# nmap -p- 10…

Maven入门(作用,安装配置,Idea基础maven,Maven依赖,Maven构建项目)【详解】

目录 一. Maven的作用 1.依赖管理 2.统一项目结构 3.项目构建 二.Maven安装配置 1. Maven的仓库类型 2 加载jar的顺序 3. Maven安装配置 4.安装Maven 5.配置仓库 三.idea集成maven 1.给当前project集成maven 2.给新建project集成maven 3.创建maven项目 4.pom…