AI 作画领域中的“神笔马良”是怎样炼成的?

news2024/11/26 8:52:47

本文由行者AI携手亚马逊云科技共同推出

刷爆朋友圈的 AIGC 是什么?

AI Generated Content (AIGC,利用人工智能技术来生成内容),是继专业生产内容(PGC, Professional-generated Content)、用户生产内容(UGC, User-generated Content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势。

 

2022年是 AIGC 爆火的一年,迭代速度更是呈现出指数级爆发,年初还处于技艺生疏阶段,几个月之后有些作品就达到专业级别,足以以假乱真,这给职业创作人带来了惊喜和灵感。无可否认的一点是,AIGC 正在逐步渗透越来越多的生活场景,短视频、直播、主持、晚会舞台等领域随处可见 AIGC 的痕迹,AIGC 也给如文字创作、图像创作、视频创作、音频剪辑、游戏开发和代码生成等内容生态注入了新鲜血液。近期 AI 作画火遍全网,只要简单输入几个关键词,几秒钟内一幅画作就能诞生,且绝大多数人都难以看出其究竟是人手所作还是 AI 所作。在今年的某次人工智能大会上,AI 甚至以闪电般的速度复原了《富春山居图》,技惊四座。这背后深度学习模型的不断完善、开源模式的推动、大模型探索商业化的可能,都成为了 AIGC 发展的“加速度” 。

AIGC 为什么会火出天际?

从产品和技术层面出发,AIGC 之所以在2022年实现破圈,Stable Diffusion 的开源功不可没。Stable Diffusion 在2022年下半年开源后引发了广泛关注并长期霸占 GitHub 热榜第一名,在短短几个月时间内出现了大量基于 Stable Diffusion 模型的二次开发。Stable Diffusion 开源的不仅仅是代码,还有其已经训练好的模型,这意味着后继开发者能更好地借助这一开源项目,挖掘出更丰富的内容生态,从而大幅降低用户使用 AIGC 进行创作的门槛,提升创作效率。

另外,Stable Diffusion 的开源,也为更广泛的 C 端用户普及起到至关重要的作用,AIGC 绘画之所以能够帮助大众画出各种天马行空的画作,背后离不开大量深度学习模型的不断完善。未来,随着模型的稳定,开源将成为 AIGC 成熟的催化剂,开源模式有望让相关模型成为海量应用和服务的基础,应用层面的创造力有望迎来拐点。

AIGC 目前的挑战有哪些?

数据、算力、算法是驱动 AIGC 发展的三驾马车,要实现 AIGC 的发展,这三者缺一不可,但每一项的发展,都需要企业投入大量的资金,尤其是前期的硬件投资更是占企业投入资金的大多数,这就导致 AIGC 初创企业的经营成本居高不下。以新晋独角兽企业 Stability AI 为例,该公司为维护一个拥有4000块英伟达 A100 GPU 组成的算力群,总计花费超5000万美元。

从 AI 生成图像到 AI 生成视频要用到大量数据训练模型,对算力要求呈指数级的提升,同时也需要快速高效的方式来处理数据集,所以在云中训练和部署人工智能模型也成了很多 AIGC 公司的新选择。过去的经验表明,较高的前期投入要求 AIGC 的企业用户规模需要迅速扩张,因为只有行业用户规模达到一定体量,才能够摊平成本,扭亏为盈。而云计算的高可用性、高扩展性、根据业务规模按需扩展、按用量付费等优势,恰恰为 AIGC 的发展注入了新的机遇。对于很多中小型公司来说,在使用云服务的同时,也能够利用这些平台提供的 AI 服务完成自己所需要的功能架构。

亚马逊云科技一站式机器学习平台

Amazon SageMaker 助力 AIGC

亚马逊云科技提供完全托管的一站式机器学习平台 Amazon SageMaker,它提供了从数据工程到模型开发、训练、调优、部署、持续管理等方面的各项核心功能,以及全球首个面向机器学习的集成开发环境 SageMaker Studio,化繁为简,让开发高质量 AIGC 模型(比如 Stable Diffusion 模型)变得更加轻松,让“一个人”的团队也可以轻松实现 AIGC 算法的生产化。

此外,Amazon SageMaker 不仅支持多种算力机型,还可以实现资源的弹性扩张,能够敏捷适配业务扩展不同阶段的需求。同时,Amazon SageMaker 同一终端节点部署多模型的方式可以帮助企业节省实时部署成本,其异步推理形式还支持“从0扩展”,从而进一步降低推理成本,大大加快客户应用机器学习技术的速度。另外,SageMaker JumpStart 最新提供两种最先进的模型:Stable Diffusion 和 Bloom,用于图像和文本的生成。用户可以通过 JumpStart 一键部署或微调众多预训练模型,轻松开发高质量模型并缩短部署时间。

在全球市场研究机构 IDC 最新发布的《2022年亚太地区(不含日本)AI 生命周期软件工具和平台供应商评估》中,凭借 Amazon SageMaker 强大、丰富且灵活的功能,广泛的交付能力及对开源项目的持续贡献,亚马逊云科技获评 AI 生命周期软件领导者。

行者 AI 基于 Amazon SageMaker

实现快速高效的 AI 作画解决方案

成都潜在人工智能科技有限公司(行者 AI)成立于2020年5月20日,致力于使用人工智能和机器学习技术提高游戏和文娱行业的生产力,并持续改善行业的用户体验。公司业务领域涵盖游戏 AI、智能内容安全系统、智能数据平台等多个方面。针对海内外游戏、UCG 平台、现代素质教育、数字化社会建设等多行业,行者 AI 致力于用数十年沉淀的专业 AI 技术,与亚马逊云科技 SageMaker 深度绑定,可结合产品为用户及行业提供全栈式解决方案,致力成为人机交互中的“神笔马良”。

行者 AI 基于 Amazon SageMaker 构建 AIGC SaaS 平台,利用 Amazon SageMaker Notebook 将 AIGC 模型发布至 SageMaker Inference Endpoint,通过输入作画关键词直接调用这些模型并生成用户需要的图片。SageMaker Inference Endpoint 会自动根据平台调用情况进行底层 GPU 实例的弹性伸缩, 保证平台能够随时支持平台用户使用。另外,平台也可以上传样本图片进行模型微调(Fine-Tunning),触发自动化工作流,自动调用SageMaker 训练任务进行训练,并且可以将微调后的模型进行自动部署,用户调用相应接口即可获得符合预期的图片。

“通过与亚马逊云科技的合作,我们将大量的训练和线上生产环节转移到 Amazon SageMaker 中,可以帮助我们将算力资源很好地分配给开发人员。让我们惊喜的是,我们将研发完成的模型进行上线部署的时候,可以很方便地实现一键部署和版本管理。这种与云上机器学习服务进行优势结合的方法使我们相信能够让众多游戏企业客户在更短的时间内获得 AIGC 所带来的价值。”

——成都潜在人工智能科技有限公司 COO

陈洪宇

行者 AI 作画解决方案的主要优势:

提高美术及内容创作行业效率。平台的定位并不是取代专业的美术以及内容创作行业人员,AI 对于行业来讲,更多的是提高生产效率。一幅要花2天时间画出来的画只需要数秒完成,让以前需要花数周的工作流程缩短到几天时间。

  • 扩大图文生产力,帮助自媒体及 UCG 平台的内容创作者摆脱图文主题不匹配、图片成本高和版权受限等困境。为追求量化、标准化输出需求的用户提供耳目一新的视觉灵感和画面呈现,以最简易的操作门槛实现美术创作。
  • 提供教育美术的智能学习平台。采用人工智能技术,在绘画过程中注入互动性与趣味性。以提升学生的兴趣、想象力、理解力为先导,提升美术教育的学习效率,让学生用绘画探索和认识世界。
  • 可支持 AIGC 技术辅助社交平台软件。让大众用户在发帖、分享、交流的过程中使用 AI 作画成品,刺激增长用户的留存及日活,帮助平台搭建更加完善的生态社交系统。
  • 配合 AI 音乐支持影音行业生产创作。针对音频、文字、游戏 CG 和背景的现实场景智能生成绘画、背景音乐以及视频,帮助企业降本增效的同时优化场景艺术概念、迸发创作灵感、提高创作能效。

目前,行者 AI 不仅在 2D 平面美术生成方面持续努力,还在 3D 资产生成生成方面都有所涉猎,包含 3D 环境、单体建筑、人物角色模型、虚拟数字人等复杂内容生成,为游戏、广告传媒、元宇宙等内容创作行业提供丰富多彩、生动形象的资产内容。

行者 AI 作画作品案例展示:

实例:灯光、黄昏、街边的复古花店

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/52076.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

万字详细总结 Promise(期约)及其方法

万字详细总结 Promise(期约)及其方法 ES6之前的异步编程 异步行为是 javascript 的基础操作。我们在开发的过程中往往需要执行一个操作并得到一个结果(例如从后端请求数据),但是由于 javascript 是单线程&#xff0c…

[附源码]Python计算机毕业设计Django个性化名片网站

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

视频播放 (二) 自定义 MediaPlayer

1. 说明 1.1 使用Mediaplayer和surfaceView进行视频播放&#xff0c;并实现&#xff1a;感应生命周期、支持无缝续播、宽高比适配以及全屏模式 1.2 创建一个播放控制View&#xff0c;并以ViewModel驱动 2. 配置信息 2.1 AndroidManifest.xml 添加网络权限 <uses-permission…

Docker入门-上篇

Docker容器技术的使用&#xff0c;现在它已经不仅仅只是运维人员的专属技能了&#xff0c;对于我们开发人员同样需要具备&#xff0c;在很多中小公司中云环境的项目搭建和项目部署依然还是我们开发人员干的事&#xff0c;所以多学一门技术总是没错的。 1.Docker介绍 Docker最…

Ubuntu下解压文件(提取文件总是报错)文件是zip 格式

删除非空文件夹&#xff1a;在该目录下打开终端&#xff1a;sudo rm -r 文件夹名 回到不能解压问题&#xff08;unzip总是容易出问题&#xff09; 安装7zip&#xff1a;sudo apt-get install p7zip-full 解决办法1&#xff08;解压出来好的数据&#xff09;: 使用7z解压文件&…

附录6-JS中的一些概念

1 深拷贝与浅拷贝 在这几个地方涉及到了拷贝 23. 节点_Suyuoa的博客-CSDN博客 复制节点 node.cloneNode() 深拷贝实质上是拷贝要拷贝的对象自身&#xff0c;浅拷贝实质上是对要拷贝对象的引用。 当你浅拷贝复制A为B的时候&#xff0c;改动B会给A造成影响 当你深拷贝复制A…

极速Go语言入门(超全超详细)-进阶篇

基础篇可访问此链接: 基础篇1:https://blog.csdn.net/asd1358355022/article/details/127905011?spm1001.2014.3001.5501 基础篇2:https://blog.csdn.net/asd1358355022/article/details/128039005?spm1001.2014.3001.5501 文章目录GO语言类型断言文件操作打开、关闭、读取文…

第二证券|券商12月金股出炉!多只地产股成热门,科创仍是中长期主线

跟着券商12月金股战略陈述连续出炉&#xff0c;主流组织的配备风向也浮出水面。 到券商我国记者发稿时&#xff0c;已有10多家券商发布12月金股战略陈述&#xff0c;从职业散布来看&#xff0c;信息技术、工业范畴的金股数量最多&#xff0c;其次是材料、可选消费、医疗。值得一…

前端二倍图

物理像素&物理像素比&#xff1a; 物理像素点指的是屏幕显示的最小颗粒&#xff0c;是物理真实存在的&#xff0c;这是厂商在出厂时设置好了我们开发时候1px不是一定等于1个物理像素的Pc端页面&#xff0c;1px等于1个物理像素点&#xff0c;但是移动端就不尽相同一个px能显…

打包发布自己的app

创建自己的app 一、 安装HBuilderX 二、 引入代码&#xff0c;引入组件 三、 配置app信息 四、 云打包 1、第一步 2、第二步 3、证书创建是用的jdk8创建的&#xff0c;软件里带教程&#xff0c;也可以用公共测试证书。 五、打出的包是apk文件&#xff0c;配合我的搭建网…

ROG幻15电脑开机自动安装软件怎么U盘重装系统

ROG幻15电脑开机自动安装软件怎么U盘重装系统。今天和大家一起来分享如何解决ROG幻15电脑开机的时候会自动安装软件的问题。用户反馈开机之后自动后台安装很多软件&#xff0c;导致无法操作卡死。这个情况我们可以使用U盘来重装一些系统&#xff0c;这样就可以解决问题&#xf…

(二)正则表达式——捕获

&#xff08;二&#xff09;正则表达式——捕获 正则捕获的懒惰性 实现正则捕获的方法&#xff1a;exec exec返回的结果&#xff1a; 懒惰性 这就是正则捕获的懒惰性&#xff1a;默认只捕获第1个 lastIndex&#xff1a;下次匹配的开始位置 懒惰的原因&#xff1a;默认lastIndex…

视频播放 (一) VideoView的使用

1. 配置参数 1.1 AndroidManifest.xml 文件添加网络权限 <uses-permission android:name"android.permission.INTERNET" /> 1.2 http 明文请求设置 android:usesCleartextTraffic"true" 1.3 activity 配置屏幕变化&#xff0c;不重新加载 Activity …

多数据中心多活相关知识

Cell&#xff1a;业务可封闭收敛最小执行分片&#xff1b;业务对请求空间按一定维度&#xff08;比如会员、门店等&#xff09;划分分片。 LDC&#xff1a;逻辑数据中心&#xff0c;是由多个业务可封闭 cell 组成的集合单元&#xff0c;拥有独立的基础中间件系统&#xff08;包…

树莓派4b通过docker安装部署jenkins

借鉴&#xff1a;https://blog.csdn.net/wz_coming/article/details/113523610 树莓派的docker安装及其他操作请看&#xff1a;https://blog.csdn.net/weixin_44578029/article/details/127987795 前言 我的环境是树莓派4b&#xff0c;安装的官方64 debian11系统 arm架构 4h…

[附源码]SSM计算机毕业设计疫情状态下病房管理平台JAVA

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

Kafka第一讲:应用场景及架构设计详解

本节是Kafka专题第一篇&#xff0c;主要介绍Kafka的发展历史、应用场景以及Kafka的基本架构&#xff0c;后续还会对Kafka的生产者、Broker、消费者、集群做详细讲解&#xff0c;敬请期待。 1.kafka的发展历史及应用场景 1.1kafka的定位 可以实现如下功能&#xff1a; 1.2为什…

『航班乘客满意度』场景数据分析建模与业务归因解释 ⛵

&#x1f4a1; 作者&#xff1a;韩信子ShowMeAI &#x1f4d8; 数据分析实战系列&#xff1a;https://www.showmeai.tech/tutorials/40 &#x1f4d8; 机器学习实战系列&#xff1a;https://www.showmeai.tech/tutorials/41 &#x1f4d8; 本文地址&#xff1a;https://www.sho…

vue+elementUI实现级联表格el-table级联多选

vueelementUI实现级联表格el-table级联多选 <template><div id"app"><el-button type"primary" click"getAllSelect()">获取选中集合</el-button><el-table:data"renderDynamic"ref"lendontable"…

DataFun: 微信NLP算法微服务治理

管理问题 性能问题 PyInter&#xff1a;暂未开源&#xff0c;有开源打算 调度问题 P50&#xff1a; 响应的中位数P999&#xff1a;耗时最慢的千分之一 让p999下降为p50的1.5倍