AI作画:文心一格赋能艺术与设计创作

news2024/9/24 11:23:15

针对视觉内容创作门槛高、耗时长等行业痛点问题,百度推出了基于文心大模型的AI艺术创作产品文心一格。通过文心一格核心系统的技术创新,让AI作画普惠大众,提升创作效率。目前,文心一格产品已经对外发布使用,大众用户均可使用。

4245e6e522eb9dd5921659f6e49a3ee2.png

视觉内容创作门槛高、耗时长

众所周知,画画、制图、设计等都属于视觉内容创作,但一般情况下,视觉内容创作门槛高、耗时长。比如对于普通大众来说,他们在日常生活中很难进行自主创作,更多时候通过搜索引擎检索使用网上图片,而对于专业内容创作者来说,视觉内容创作的制作流程复杂,往往需要花费大量时间。

如下图右侧的几张插图,创作者需要花费数年时间才能完成,由此可见通过AI技术提升图像创作效率将对视觉内容创作产生巨大价值。

c7edbf4b60f95fd287bfd7564ae180ce.jpeg

对此,百度推出了基于文心大模型的AI艺术创作产品——文心一格。用户在体验该产品时只需要输入一句话,AI就能够自动生成创意画作。因此,创作者不再需要设计整个复杂过程和图像制作,而只需要输入语言,这使整个创作效率实现了大幅提升。

4a6416533e9955145628c73cadc77e62.jpeg

通过文心一格,我们能够让AI作画普惠大众,提升创作效率。对于大众用户来说,实现了零门槛的艺术创作体验,同时能够生成大量个性化作品,并且直接使用在日常生活中。下图左侧展示了部分文心一格用户的AI画作作品。

b4cedf02061df7ecb67dd006e2f93cec.jpeg

而对于专业内容创作者来说,他们也可以使用文心一格提升创作效率,通过人机共创的方式激发灵感。比如一些用户使用文心一格在数天内完成了数千张AI画作,并且进一步激发灵感,完成最终的图像制作。

为了实现AI作画应用实际落地,我们主要面临三方面的挑战:

  • 创作需求理解,即如何准确地理解用户需求,降低用户输入描述的难度。

  • 图像原创生成,即如何支持用户艺术、写实等多样化的画作生成需求。

  • 创作需求满足,即如何对生成结果优化,高质量满足用户创作需求。

73b081e44d025f4fe3d0605de23c8622.jpeg

187f486a765bf6091b839dfba10cf792.png

文心一格核心系统的技术创新

为此,百度飞桨文心一格研发了一个核心文生图系统,这个系统是基于语言与知识驱动的原创生成与二次创作。整个系统是基于文心大模型实现的,包括文本、视觉和跨模态三个方面。

对应落地应用面临的三方面挑战,整个系统也进行了三大技术创新。

  • 基于知识的Prompt学习。对用户输入的文字,通过自动创意规划,能够大幅提升易用性。

  • 文本跨模深度融合的文生图。在图像生成中,通过文本和跨模态的深度融合,模型兼具整体复杂构图和局部细节刻画能力。

  • 文本驱动的图像编辑。通过文本驱动的图像编辑,允许用户进行多轮交互,提升画作质量。

8b2b5f2a7838c55a5580783b2c70cd6b.jpeg

具体技术创新如下:

  • Prompt自动学习

文心一格基于知识的理解与扩充,大幅提升易用性。首先,当用户输入一个文本Query,文心一格通过面向Prompt工程的Query理解,能够进行多角度识别,进而根据识别结果进行扩充,把整个描述丰富化,包括风格、构图、视觉要素等。同时,这两个过程也可以通过端到端生成实现,这里,两种方式都是基于知识图谱得以实现。最后,文心一格通过Prompt排序获得比较好的Prompt,再输入给文生图环节,最终生成精美的AI画作图片。

36b4991744acaeb1603a5b7740ccc6bd.jpeg

  • 统一图像生成

文心一格提出文本语义驱动和跨模态匹配联合引导的模型,兼具意象和具象的生成。在文生图上通常存在两方面的问题,一个是整体的复杂构图,另一个是细节的刻画。整体上,这两方面分别对应着两个流派重点关注的问题,一个是类似Stable Diffusion这类文本引导的模型;另一个是基于跨模态匹配模型,类似与DiscoDiffusion,也即由跨模态模型进行在线引导和迭代优化模型。这两个模型分别擅长细节刻画和整体艺术生成。因此,文心一格提出了一个联合模型UPainting,该模型同时使用文本先验引导与跨模态引导,同时兼具两类模型的优势效果。

fea4ac552bef38918ac639b6f936b033.jpeg

  • 统一图像编辑

在图像生成后,有时生成结果可能不尽人意,用户会希望对图片进行一定修改。对此,文心一格也支持文本驱动的图到图生成。下图左侧是模型效果,通过引入对输入文本的注意力机制,就能够让扩散生成模型更加关注用户希望修改的部分,实现图像的二次生成和创作。文心一格具有三种编辑能力:一是元素修改,即对一幅图像的局部进行修改;二是实现风格转化与迁移;三是进行相似图的二次生成。

baaa90f6c6250e25a8845c91b5856a75.jpeg

基于以上技术,目前文心一格已经同时具备复杂构图与细节刻画两种不同模式的艺术创作,并且兼具多种风格。下图左侧两张图更关注于整体构图,中间三张图更多注于细节刻画,右侧两张图既有复杂构图,也有细节刻画。目前,针对各种不同艺术风格的图,文心一格都能较好完成。

ec1ac05e32508e072b0f8066380439b8.jpeg

4577f6896559309c1deb12c7428a5ce4.png

文心一格开放使用和对外合作

目前,文心一格除了开放对外使用以外,也参与了一些重要场合的合作共创,下面展示的是文心一格与人民日报合作创作的视频,主题是AI描绘未来中国。通过对二十大报告的一些关键词,自动生成图片,并最终剪辑成视频。

此外,文心一格也在很多重要活动多次亮相,业界反响热烈。比如在万象大会上发布首支全AIGC生成的MV《启航星》、在世界人工智能大会上发布的上海印象系列画作、与朵云轩合作拍卖AI续画陆小曼未尽稿,以及跟时尚COSMO合作发布的首个AI时尚封面等等。

58a2096615a969aff5974d311c8e1c6d.jpeg

目前,文心一格已经对外开放,欢迎点击阅读原文访问下方链接前往官网体验。

文心一格网址

https://yige.baidu.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/187787.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker容器基本操作

docker中的容器就是一个轻量级的虚拟机,是镜像运行起来的一个状态,本文就先来看看容器的基本操作。 查看容器 查看容器 启动docker后,使用docker ps命令可以查看当前正在运行的容器: 查看所有容器 上面这条命令是查看当前正在…

[强网杯 2019]高明的黑客

目录 信息收集 正则测试 python脚本 getshell 信息收集 $_GET[ganVMUq3d] ; eval($_GET[ganVMUq3d] ?? ); $_GET[jVMcNhK_F] ; system($_GET[jVMcNhK_F] ?? ); $_GET[cXjHClMPs] ; echo {$_GET[cXjHClMPs]}; 下载gz解压后得到几千个php文件,简单看…

【项目实战】count(1) 、count(col)、count(*) 如何选择?

一、背景 有时候会看业务执行的情况,如查看多少用户已经领取了礼品等,需要看数据库的计数或统计用户使用情况时,往往会使用聚合函数COUNT(),聚合函数有很多种,列出如官网的截图 而其中常用的聚合函数主要是包括以下&…

Linux常用命令——readelf命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) readelf 用于显示elf格式文件的信息 补充说明 readelf命令用来显示一个或者多个elf格式的目标文件的信息,可以通过它的选项来控制显示哪些信息。这里的elf-file(s)就表示那些被检查的文件。可以支持…

java基于ssm滑雪场门票在线售票系统的设计与实现

基于jsp技术设计并实现了滑雪售票系统。该系统基于B/S即所谓浏览器/服务器模式,应用SSM框架,选择MySQL作为后台数据库。系统主要包括个人中心、用户管理、票务信息管理、购票信息管理、技巧交流、系统管理等功能模块。 性能测试主要通过模拟系统运行环境…

蓝桥杯刷题017——轨道炮(贪心)

2019国赛轨道炮 题目描述 小明在玩一款战争游戏。地图上一共有 N 个敌方单位,可以看作 2D 平面上的点。其中第 i 个单位在 0 时刻的位置是 (Xi​,Yi​),方向是 Di​ (上下左右之一, 用U/D/L/R 表示),速度是 Vi​。 小明的武器是轨道炮&#x…

我来告诉你,ChatGPT 该怎么对接到自己的项目中!

作者:小傅哥 博客:https://bugstack.cn 沉淀、分享、成长,让自己和他人都能有所收获!😄 1. 项目介绍 《ChatGPT AI 问答助手》 开源免费项目,涵盖爬虫接口、ChatGPT API对接、DDD架构设计、镜像打包、Dock…

六十年间中国经济总量增长245倍

中国GDP(现价美元)走势图回顾2022年,中国经济顶住了来自防控疫情及国际变化的巨大压力,全年GDP实现3%的同比增长,其中年末冬季GDP同比增长2.9%。从主要指标显示,12月第三产业、投资、地产都有不同程度的改善…

HTB_Base_php弱类型与find命令提权

至此,startpoint部分就完成了,也初步建立的渗透测试的思路和体系 温故而知新,可以为师矣 文章目录信息收集php弱类型 & strcmp绕过GTFOBins 二进制常用命令find提权信息收集 nmap -sC -A -Pn ip开放端口22、80 dirsearch 扫描目录&…

一文5000字手把手教你使用jenkins搭建一个中小企业前端项目部署环境

本文你能学到什么? 传统发布和现在发布的对比和区别 项目案例-手动上传服务器,使用jenkins上传服务器 配置不同的发布环境 配置域名 配置https 配置钉钉机器人通知【文末有配套资源领取】 服务器购买:抢占式实例 Jenkins 安装 示例服务器为 阿里…

系统移植 tf-a

1、从ST官网下载TF-A源码,将TF-A源码拷贝到ubuntu中并进行解压。 2、进入tf-a源码,阅读README.HOW_TO.txt帮助文档。 3、分析帮助文档。 分析文档可得,移植tf-a到开发板中步骤为:对tf-a源码进行解压;打补丁&#xff…

ElasticSearch从入门到出门【上】

文章目录初识elasticsearch了解ESelasticsearch的作用ELK技术栈elasticsearch和lucene为什么不是其他搜索技术?倒排索引正向索引倒排索引正向和倒排ES的一些概念文档和字段索引和映射mysql与elasticsearch安装elasticsearch部署单点es部署kibana安装IK分词器在线安装…

SpringBoot 使用自定义的方式整合Druid数据源(powernode document)(内含源代码)

SpringBoot 使用自定义的方式整合Druid数据源(powernode document)(内含源代码) 源代码下载链接地址:https://download.csdn.net/download/weixin_46411355/87404561 目录SpringBoot 使用自定义的方式整合Druid数据源…

SQLSERVER 的 nolock 到底是怎样的无锁?

一:背景 1. 讲故事 相信绝大部分用 SQLSERVER 作为底层存储的程序员都知道 nolock 关键词,即使当时不知道也会在踩过若干阻塞坑之后果断的加上 nolock,但这玩意有什么注意事项呢?这就需要了解它的底层原理了。 二:n…

python之np.sum()用法详解

python库numpy提供的求和方法np.sum(),可以对数组和矩阵进行求和。sum方法可以接收多个参数,主要是数组a,坐标轴axis,数据类型dtype,初始值initial。其中,axis对于我们来说比较容易迷糊,这个值对求和有什么影响?一般来…

Linux常用命令——rcp命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) rcp 使在两台Linux主机之间的文件复制操作更简单 补充说明 rcp命令使在两台Linux主机之间的文件复制操作更简单。通过适当的配置,在两台Linux主机之间复制文件而无需输入密码,就像本地文…

React基础入门(一)

1、React简介 官网 英文官网: https://reactjs.org/ 中文官网: https://react.docschina.org/ 描述介绍 用于动态构建用户界面的 JavaScript 库(只关注于视图) 由Facebook开源 React特点 1、声明式编码 2、组件化编码 3、React Native 编写原生应用 4、高效(优秀…

苹果不小心删了照片怎么恢复?苹果照片删除后如何恢复

苹果不小心删了照片怎么恢复?请保持冷静,不要往mac中写入新的东西,以防丢失的照片被覆盖。接下来,我们一起来探讨一下mac照片恢复的技巧。 方法一、从“最近删除”文件夹中恢复照片 使用照片管理应用程序(例如Mac上的…

百趣代谢组学分享Lip-SMap:绘制代谢物和蛋白相互作用图谱的新方法

百趣代谢组学文献分享,自2014年瑞士苏黎世联邦理工学院的Picotti和她的研究小组开始用Lip-SRM法测量复杂蛋白质混合物的大量结构改性蛋白质以来[1];该研究小组随后对方法进行改进,研究了复杂细胞基质中几种生物蛋白质的热稳定性,并…

袁树雄和唐磊关系迎来转折,王勇把他们两个和杨语莲拉进一个群

自从《早安隆回》火爆全网之后,创作者袁树雄就遭遇各种非议,就是他的同行唐磊老师,也勇敢站出来点评。唐磊老师也是一名音乐人,当年他凭借《丁香花》,一夜之间响彻大江南北,成为了家喻户晓的大明星。 虽然唐…