海睿思分享 | ChatGPT梦幻联动,解锁企业数字化转型新可能

news2024/11/26 4:34:55

在当今这个充满活力和变化的世界里,人工智能 (AI) 的迅速发展正在改变着我们的生活方式。它不仅提高了我们的工作效率,而且正在重新定义我们的日常生活,以前所未有的方式提高了我们的生活质量。其中,以ChatGPT为代表的语言生成模型横空出世,通过强大的机器学习能力,渗透于我们生活的方方面面。而Midjourney,则作为一个新兴的AI作画程序收到了世界各地的关注。这两款工具,一款聚焦语言交流,一款专注艺术创作,当它们发生碰撞的时候,又会发生什么呢?

本篇推文我们就来介绍一下以Midjourney为主、ChatGPT为辅的创作流程可以为企业工作数字化、智能化带来怎样的艺术火花。

Midjourney与AI作画

早在60年代,AI艺术的概念和相关系统就产生了,其中就包括绘画与音乐作品等,而使用文字生成画作的方式属于AI艺术的一种形式。Midjourney作为这样一种智能作画系统,使用深度学习和神经网络的技术,将输入的描述性词句转化为多种风格的画作呈现出来,与之类似的有OpenAI开发的DALL-E2,微软的NUWA-infinity,以及著名的Stable Diffusion开源模型。

Midjourney于2023年5月4日新发布的5.1版本支持对输入文本的自然语言理解,并提高了作画的精度,减少无关信息的生成。虽然其技术尚未公布,但公众推测与现有AI绘画系统相类似,如通过使用LDM渲染模型等对大量的图片样本进行机器学习后得出结果。

Midjourney详解

Midjourney人工智能程序嵌入于一个名叫Discord的交流平台,通过输入指令的方式支持语义理解、修改版本和风格、提升分辨率、效仿用户上传图片风格(喂图)等。

以下为利用Midjourney生成UI收入看板的演示:

指令:/imagine UI design for income board --s 250 --v 5.1

输出:(Midjourney一次性输出四张备选)

从以上范例我们不难发现:

1. Midjourney目前主要适合英文输入,中文输入会造成语义理解错误

2. 如果指令的描述不够具体,生成的四张图片会有较大差异,由于生成的随机性,可能无法呈现使用者想要的画面效果

3. Midjourney在指令正确且合理的情况下只可以给出图片格式的结果,但无法直接转换为矢量图用于编辑

针对以上几个特点,如果我们需要生成更为具体的内容或者包含特定的元素,如何写好指令是重点,这也是为什么我们在后续考虑使用ChatGPT辅助我们生成指令。

ChatGPT与Midjourney的联合运用

由于Midjourney的指令理解系统尚有缺陷,我们可以通过训练ChatGPT写出适用于Midjourney的指令,从而解决以下几个问题:

  • 句段式语句要素提取与完善
  • 搜索合适专业术语丰富指令内容
  • 语言翻译
  • ……

以上一部分的UI页面设计为例,如果我们需要ChatGPT从主体、场景、风格、质量等方面完善对“UI收入看板”的描述,首先可以通过举例的方式让ChatGPT了解生成指令的形式,之后只需输入我们的要求即可自动生成。

ChatGPT优化前:UI design for income board

ChatGPT优化后:Crisp, clean UI design for income board, sophisticated data visualization with interactive income graphs, delineation of various revenue streams, real-time data synchronization, professionally styled user profile, subdued corporate color palette, intuitive user-friendly navigation, tactile response on button selection, structured grid layout, high-definition, pixel-perfect icons, seamless transitions, high-quality 4K resolution, and state-of-the-art rendering

输出:

通过选择最满意的作品并利用Midjourney自带的优化功能,我们可以获得风格和内容更类似、精确度更高的四幅备选作品。而ChatGPT生成的指令加入了更多的描述性字句,如“对交互式收入图表进行数据可视化”“结构化网格布局”“高质量 4K 分辨率”等等。这些都使对图片生成的需求更为细致具体,从而逐渐还原理想中画作的布局和构造。

AI作画在未来的应用

从之前的例子中可以看出,类似于Midjourney的AI创作软件已经可以做出最基本的界面和配色设计,但是生成的例子无法直接使用,因此需要后续处理后才能投入使用。除此之外,从社会角度来说,AI作画软件给大多数人提供了一种易于创造的机会,从而激发创造力与相关产业。而AI作画软件本身仍有不足之处,优化语义理解功能、细节或绘画逻辑的完善等方面仍需要更多的研发投入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/722645.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Golang的数据类型及数据类型间转换整理

Golang 更明确的数字类型命名,支持 Unicode,支持常用数据结构。 Go 语言中数据类型分为: 基本数据类型 和 复合数据类型 基本数据类型有:整型、浮点型、布尔型、字符串 复合数据类型有: 数组、切片、结构体、函数、m…

【QT】——定时器QTimer的使用

目录 常见的函数 构造函数 获取/设置定时器间隔时间 启动/停止定时器 信号 设置定时器的时间的两种方法 设置定时器精度 其他函数 静态函数 实例 QTimer是QT框架中的定时器类型,它的使用方法如下: 定义一个调用QTimer对象,调用st…

华为OD机试真题 Python 实现【找出通过车辆最多颜色】【2023Q1 100分】,附详细解题思路

目录 一、题目描述二、输入描述三、输出描述四、解题思路五、Python算法源码六、效果展示1、输入2、输出3、说明 一、题目描述 在一个狭小的路口,每秒只能通过一辆车,假如车辆的颜色只有3种,找出n秒内经过的最多颜色的车辆数量。 三种颜色编…

深度学习在Li电池RUL、SOH和电池热管理中的研究进展与应用

公众号:尤而小屋作者:Peter编辑:Peter 大家好,我是Peter~ 今天给大家分享一篇关于深度学习在Li电池RUL、SOH和电池热管理中的研究进展与应用的文献综述。文献基本信息介绍: 本文系统介绍了Deep Learning深度学习的不同…

大厂题第1辑——虚函数七题精讲之3:纯虚函数

什么是纯虚函数?什么是抽象类?纯虚函数可以提供实现吗?有什么意义? 题6-什么是纯虚函数? C中有两种继承:接口继承和实现继承。二者的第一个区别是:基类都干了些什么? 如果基类啥实…

15.2 BP神经网络实现图像压缩——基于BP神经网络的图像压缩(matlab程序)

1.简述 BP神经网络的图像压缩原理 数字图像压缩实际上是以较少的比特数有损或者无损的来表示原来像素矩阵的一种图像处理技术,实际上就是减少图像数据中的时间冗余,空间冗余,频谱冗余等等作为目的,从而同过减少上述的一种或者多种冗余的信息而达到更加高效的存储与传输数据.图…

目标检测的评估指标

Precision(精确率/查准率):是指在所有被预测为正的样本中,确实是正样本的占比。当Precision越大时,FP越小,此时将其他类别预测为本类别的个数也就越少,可以理解为预测出的正例纯度越高。Precision越高,误检…

LLM驱动的智能体#Mixcopilot的迭代演进

论文: Generative Agents: Interactive Simulacra of Human Behavior shadow 前阵子在一场线下活动,我们展开了对生成式智能体的分享和研讨,同时也介绍了Earth在实现智能体系统的思考和实践。 最近有一篇文章把LLM驱动的智能体的构成讲解的很…

centos7安装图形化界面

一键安装并生效脚本 #!/bin/bash # 安装X(X Window System) yum groupinstall -y "X Window System"# 安装图形界面软件 yum groupinstall -y "GNOME Desktop"# 设置开机进入图形界面 systemctl set-default graphical.target# 进入图形界面 startx安装 …

Windows | [出现错误 2147942402 (0x80070002) (启动“ubuntu2004.exe”时)]

Windows | [出现错误 2147942402 (0x80070002) (启动“ubuntu2004.exe”时)] C:\WINDOWS\system32\wsl.exe -d Ubuntu-20.04

Verilog基本语法之数据类型

Verilog 是一种用于数字逻辑电路设计的硬件描述语言,可以用来进行数字电路的仿真验证、时序分析、逻辑综合。 既是一种行为级(可用于电路的功能描述)描述语言又是一种结构性(可用于元器件及其之间的连接)描述语言。 …

深度了解机器人行业全貌

产品分类 机器人主要可分为工业机器人、服务机器人和特种机器人,主要产品如下图所示。 机器人主要分类 资料来源:36氪、华泰证券《机械设备行业专题研究-商用服务机器人:曙光已现蓝海可期-220105》。 其中工业机器人的主要种类及应用领域如下图所示。 工业机器人主要类型及…

docker安装失败 应用程序无法启动,因为应用程序的并行配置不正确

问题描述 报错“应用程序无法启动,因为应用程序的并行配置不正确”。 配置:windows10 解决过程 网上的解决方案有三种: 启动windows服务Windows Modules Installer。运行sxstrace.exe。安装visual c相关依赖。下载visual studio installer…

Python基础 —— 输入输出

〇、概述 当我们编写代码时,必不可少地需要通过敲击键盘来向电脑输入数据,然后显示器将把我们想要的内容显示出来;这其中需要很多复杂的知识,为了简化操作,便有人将其封装成了 print() 和 input() 两个函数。 一、输出…

LiDAR SLAM 闭环——BoW3D论文详解

标题:BoW3D: Bag of Words for Real-Time Loop Closing in 3D LiDAR SLAM 作者:Yunge Cui,Xieyuanli Chen,Yinlong Zhang,Jiahua Dong,Qingxiao Wu,Feng Zhu 机构:中科院沈阳自动化研究所 来源:2022 RAL 现算法已经开源&#…

linux查看文件夹的命令

第一种: 最简单的查看方法可以使用ls -ll、ls-lh命令进行查看,当使用ls -ll,会显示成字节大小,而ls- lh会以KB、MB等为单位进行显示,这样比较直观一些。 ls -ll ls -lh 第二种: 通过命令du -h –max-de…

微信小程序视图层莫名出现”竖线“

写完视图层后&#xff0c;发现页面上莫名其妙的出现了一些“竖线”&#xff0c;如下图所示&#xff1a; 这段html代码是这样写的&#xff1a; <view class"other-des"><view class"section"><text class"section-num">{{cou…

服务器财务系统数据库被locked勒索病毒攻击后如何怎么办?如何快速解密恢复数据

在当今的数字化时代&#xff0c;信息安全问题已成为企业面临的重大挑战之一。企业的服务器财务系统数据库是企业最核心的资金管理和财务决策平台&#xff0c;一旦遭受勒索病毒攻击&#xff0c;重要财务数据并被锁定&#xff0c;可能导致严重的经济损失和业务中断。近期&#xf…

企业为什么需要软件的应用框架?

软件框架是可用来构建软件的结构。它充当系统的基础&#xff0c;使开发者不必从头开始创建&#xff0c;比如非必要的额外逻辑。框架还类似于模板&#xff0c;你可以对其进行修改并添加某些特性和更高级功能&#xff0c;然后创建许多人可以使用的复杂而普适的项目。 软件的应用…

python 笔记 math包

abs 绝对值 acos 反余弦函数 acosh 反双曲余弦函数 asin 反正弦函数 asinh 反双曲正弦函数 atan 反正切函数 atanh 反双曲正切函数 cos 余弦函数 cosh 双曲余弦函数 e 自然常数 exp e的几次方 fabs 绝对值 gcd 最大公约数 log log2 log10 modf 取小数、取整数部分 …