openAI发布基于ChatGPT的AI绘画模型DALL·E3,话说stable-diffusion还香吗?

news2024/11/25 14:20:05

前期的文章,我们介绍过stable-diffusion的相关操作,stable diffusion模型是Stability AI开源的一个text-to-image的扩散模型,其模型在速度与质量上面有了质的突破,玩家们可以在自己消费级GPU上面来运行此模型,本模型基于CompVis 和 Runway 团队的Latent Diffusion Models。stable diffusion模型核心数据集在 LAION-Aesthetics 上进行了训练,该模型在Stability AI 4,000 个 A100 Ezra-1 AI 超集群上进行了训练,能够在消费级10 GB VRAM GPU 上运行,可在几秒钟内生成 512x512 像素的图像。

而stable diffusion模型的缺点是我们需要写很多的prompt,优化关键词,才能输出自己想要的图片。但是这里总感觉怪怪的,其输入的prompt都是一些关键词,并不是一个完整的句子,这跟人类的思路并不一样。能不能不用输入关键词,只是跟模型进行聊天式的操作,让模型输出自己想要的图片?

ChatGPT是一个已经火了大半年的对话聊天模型,当然,此模型不仅仅应用在对话聊天上面,随着GPT-4模型以及相关插件的加持,让ChatGPT系列模型有了质的飞跃。

既然ChatGPT这么了解人类的对话,是否可以直接让ChatGPT用作输入,跟AI绘画模型结合起来,是不是以上的问题就迎刃而解了。近日openAI预发布DALL·E3模型,让ChatGPT加持AI绘画,让文本生图模型又有了一大步的飞跃。

DALL·E2是OpenAI发布的一个绘画模型,但是由于stable diffusion以及midjourney等模型的大火,其DALL·E2绘画模型稍微略显逊色。但随着ChatGPT的大火,OpenAI考虑把ChatGPT的功能与AI绘画结合起来,让模型更加了解人类的需求,且输入的句子,可以按照人类聊天的方式。这就是OpenAI即将发布的DALL·E3模型,虽然模型还没有正式发布,但是官网已经放出了相关的技术细节与样张图片。

与DALL·E2相比,即使输入同样的一句prompt,其DALL·E3输出的图片,更加符合人类的预期,且效果惊人。

“An expressive oil painting of a basketball player dunking, 
  depicted as an explosion of a nebula.”

左:DALL·E2,右:DALL·E3

DALL·E 3 原生构建于 ChatGPT 之上,我们可以直接使用 ChatGPT 作为输入,并让DALL·E 3输出我们想要的图片,当年ChatGPT发布的时候,很多人诟病说ChatGPT只能输出文字,不能输出图片,还有各路大牛出教程让ChatGPT输出图片。这不,它来了,基于ChatGPT的DALL·E 3可以满足你想要的需求。

ChatGPT 将自动为 DALL·E 3 生成定制的详细提示prompt。 如果你喜欢某个特定的图像,但它不太正确,这里可以在 ChatGPT 中,输入几句话就可以进行调整。DALL·E 3 将于 10 月初向 ChatGPT Plus 和 Enterprise 客户提供。

https://openai.com/dall-e-3 # 参考链接
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:启示AI科技
微信中复制如下链接,打开,免费体验chatgpt
 
https://wx2.expostar.cn/qz/pages/manor/index?id=1137&share_from_id=79482&sid=24

 动画详解transformer 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1071010.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023年能跨平台同步的笔记软件

对于当今的职场人士来说,记录和管理大量的信息已经成为了日常工作中不可或缺的一部分。无论是会议笔记、读书笔记、重要工作任务还是工作注意事项,如何高效地记录和管理这些内容,成为了职场人士关注的焦点。 如何记录这些笔记内容更加简单方…

定时器的基本原理和应用

题目背景 利用51单片机的定时/计数器T0的模式1实现间隔定时,每隔1秒L1指示灯闪烁一下,也就是亮0.5秒,熄灭0.5秒;每隔10秒L8指示灯闪烁一下,也就是也就是亮5秒,熄灭5秒。 分析 计数初值。 定时/计数器&…

《C++ Primer》第5章 语句

参考资料: 《C Primer》第5版《C Primer 习题集》第5版 5.1 简单语句(P154) 在一个表达式的末尾加上 ; 就构成了表达式语句,其作用是执行表达式并丢弃结果。 空语句 由单独的 ; 构成的语句为空语句。空语句常用于语法上需要一…

Nuget 镜像源地址过期,腾旭镜像源地址替换

Nuget过期 国内镜像源地址ssl认证过期了。Nuget无法搜索,一直还原报错 解决方法,替换腾旭镜像源地址 tencent_mirrors https://mirrors.cloud.tencent.com/nuget/

婴幼儿腹泻的原因与应对

引言: 腹泻是婴幼儿常见的健康问题之一,尤其在早期生活阶段,由于他们的消化系统尚未完全发育,容易受到各种因素的影响。腹泻不仅给婴幼儿带来不适,还可能导致脱水和营养不良。因此,了解婴幼儿腹泻的原因是…

【LeetCode刷题笔记】排序

905. 按奇偶排序数组 解题思路: 1)额外数组 两次遍历,第一遍将所有的 偶数 放到结果数组 res 的前面,第二遍将所有的 奇数 接着放到结果数组 res 的后面。也可以使用 对撞指针 往结果数组里存,在 一次遍历 内搞定。 2…

Ubuntu20.04 配置 yolov5_ros 功能包记录

文章目录 本文参考自博主源801,结合自己踩坑后修改 项目地址:https://github.com/mats-robotics/yolov5_ros 1.新建工作空间 新建一个工作空间 yolo_ros(名字可自定义),在 yolo_ros 下新建文件夹 src 并catkin_make进行编译 2. 安装相机驱动,可以选用较为主流的 usb_cam 或…

2024年杭州电子科技大学工商管理硕士/工程管理硕士联考网报指南

2024年MBA/MEM考试网上报名流程网报时间根据《2024年全国硕士研究生招生工作管理规定》要求,研招统考网上正式报名时间为2023年10月8日至10月25日,每天9:00—22:00。网上预报名时间为2023年9月24日至9月27日,每天9:00—22:00(报名…

S5PV210裸机(四):按键中断

本文主要探讨轮询按键和中断安按键的相关知识。 按键 无按下,GPIO引脚处高电平,电路断开 按下,GPIO引脚接低电平,电路导通 SoC内部通过检测GPIO电平高低判断按键作为SoC的输入信号 按键响应 轮询…

IPETRONIK数据采集设备携手Softing Q-Vision软件致力于ADAS测试方案

一 背景 汽车ADAS技术是当下国内外的重点研究方向,且ADAS的发展水平和市场竞争力紧密相关,因此一套完善的ADAS测试方案对各整车厂而言非常重要。然而,国内ADAS测试却面临着很多阻碍,主要原因在于:相关测试设备昂贵&am…

关于LinkedBlockingQueue的offer的正确用法,如何保证阻塞

我们在做一些并发操作时,常常会使用到LinkedBlockingQueue 也会使用offer方法来往队列中插入数据 我们一直觉得使用offer后,当队列满了,新增加的元素会阻塞插入线程,然后一直等待到队列有空间后再插入。然而测试后发现并不是这样。…

7. Java本项目知识基础---上篇

Java本项目知识快速入门 1. idea项目打开、关闭、复制 正常关闭: 正常打开: 正常复制: 2. idea快捷键 保存:ctrls 撤销:ctrlz 还原:ctrlshiftz 复制:ctrlc 粘贴:ctrlv 快速复制粘贴:ctrld 删除行:c…

MySQL MVCC多版本并发控制机制原理详解

目录 一、前言二、MVCC解决了什么问题三、MVCC核心 Undo Log 和 Read View 介绍3.1、Undo Log(日志版本链)3.2、Read View(一致性视图)3.2.1、设计思路3.2.2、ReadView判断规则 四、数据准备五、举例探究MVCC机制5.1、例子执行流程…

直流负载箱的维护和保养方法有哪些?

直流负载箱的维护和保养方法主要包括以下几个方面: 日常要定期清洁负载箱的外壳和散热器,确保散热良好,避免灰尘积累影响散热效果。还要定期检查负载箱的连接器,确保连接良好,避免接触不良或松动导致故障。根据使用要求…

信创之国产浪潮电脑+统信UOS操作系统体验3:使用 visual studio code搭建Python开发环境

☞ ░ 前往老猿Python博客 ░ https://blog.csdn.net/LaoYuanPython 一、引言 老猿原来在windows下开发python程序,要么使用python自带的IDLE,要么使用pycharm,IDLE用来开发很不方便,而pycharm对开发支持比较好,换成…

我做了一个简易P图(参数图)分析软件

P图(即参数图,Parameter Diagram),是一个结构化的工具,帮助大家对产品更好地进行分析。 典型P图格式 P图最好是和FMEA软件联动起来,如国可工软的FMEA软件有P图分析这个功能。 单纯的P图分析软件很少,为了方便做P图分…

vue-1

一、为什么要学习Vue 1.前端必备技能 2.岗位多,绝大互联网公司都在使用Vue 3.提高开发效率 4.高薪必备技能(Vue2Vue3) 二、什么是Vue 概念:Vue (读音 /vjuː/,类似于 view) 是一套 构建用户界面 的 渐进式 框架 …

检验样品数量

声明 本文是学习GB-T 586-2015 船用法兰铸钢止回阀. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 4 要求 4.1 材料 止回阀的主要零件材料见表4。 表4 止回阀的主要零件材料 零 件 名 称 材 料 名 称 牌 号 标 准 编 号 阀体 阀体 铸钢 ZG275-485…

使用docker-compose部署Redis(单机部署)

目录 一、查看Redis镜像版本二、拉取自己需要的镜像版本三、创建挂载目录四、添加配置文件五、编写 docker-compose.yml 文件六、启动容器七、连接测试 一、查看Redis镜像版本 先去Docker Hub查看Redis镜像有那些版本,我部署的时候Redis最新已经到7.x的版本了&…

23.4 Bootstrap 框架5

1. 背景颜色 1.1 背景颜色样式 在Bootstrap 5中, 可以使用以下类来设置背景颜色: * 1. .bg-primary: 设置为主要的背景颜色(#007bff, 深蓝色). * 2. .bg-secondary: 设置为次要的背景颜色(#6c757d, 灰色). * 3. .bg-success: 设置为成功的背景颜色(#28a745, 绿色). * 4. …