2022,我们追逐群星,也在追逐AIGC的无尽可能

news2024/11/17 9:31:23

ecc66c7467ed296e72ba678151f7d4a7.jpeg

2022年,是中国人追逐群星的里程碑之年。

今年10月31日,中国天宫空间站的第二个科学实验模块——梦天实验舱,搭载长征五号B遥四运载火箭发射升空。随着之后天实验舱成功与之前发射的天和核心舱完成精准对接,中国空间站历史性地完成了“合体”。至此,中国空间站距离建成仅剩一步之遥。

从天舟四号到天舟五号,从问天舱到梦天舱,从神舟十四号到神舟十五号,取得一系列航天成果的2022,同时也是中国载人航天工程立项实施30周年。三十年奋进勃发,让中国人史无前例地接近星辰,接近宇宙中的无限可能。

38c1784c403aca6c21fca50edaca6ef1.png

而在科技赛场的另一条关键跑道上,2022同样至关重要。近日,新华社与百度文心一格联合推出了一支AIGC视频——《AI描绘天宫盛宴》。这支视频画面全部由AI自动生成,用充满中国韵味的笔触,回顾了中国载人航天的三十年辉煌历程。众多网友感叹,AIGC竟然在极短时间内就达成了这种效果,实在难以想象。

2022年,被业界称为AIGC元年。伴随着AI作画大规模商业化落地,这一能力开始为全球用户所接受。AIGC的饱含巨大商业价值的下一站,就是AI生成内容。而在AIGC的“宇宙探索”中,中国人同样不落人后。以百度文心大模型为代表的中国力量,正在带领全球AI产业接近AIGC的无限可能。

2022年,文心大模型在AI生成内容这条赛道上不停探索,给出了一系列让人眼前一亮的成绩。在其背后,既可以看到大模型在AI作画领域的技术趋于完备,又可以看到中文、中国文化背景下的AIGC全面发展。面向AIGC的群星,文心大模型已经成为中国AI产业的一座“空间站”。

f2aefe3c08d37dd31767fdc0ec87066a.png

探索AIGC更多可能,

文心大模型的成绩单

在全球经济普遍遇冷的2022,AI技术却是一片繁荣。从AI作画到AI对话,各种AI技术创新在全球范围内火爆出圈。而所有AI能力中最让人看好其商业前景的,则是AIGC的下一站——生成内容。

我们处在一个被短视频颠覆和重构的时代。短视频平台已经在全球范围内形成了用户最多、影响力大的媒介形式。AI与视频的结合,正变成新的巨型风口。在2022年,百度文心大模型先后带来了一系列视频生成作品,其完善的效果与创意性地表达,赢得了业界与公众的一致认可。

在百度2022万象大会期间,数字人度晓晓作词作曲演唱的MV《启航星》正式上线。这也成为成为首支全AIGC生成的音乐MV。《启航星》MV视频依托百度推出的AI艺术和创意辅助平台——文心一格,根据歌词自动生成画面。其不仅探索了数字人、AI生成内容等技术的边界,更为MV制作、AI与音乐产业结合展现出了清晰的路径。

dd8b0d928285a673a4fd812c4ea9bac5.png

10月20日,《人民日报》发布AI根据二十大报告中部分词语描绘的未来中国图景视频,该视频由百度飞桨、文心一格提供技术支持。根据内容描述,文心大模型准确描绘出了未来中国的发展图卷。笔触老练自然,完全没有传统意义上认为AIGC内容会有的生涩感与不和谐。

等到《AI描绘天宫盛宴》到来,我们可以看到文心大模型生成的视频内容更加具有整体性风格,画面调动也更有逻辑性,并且内容能够与中国传统文化,比如《西游记》中蟠桃盛宴,进行有机且巧妙的结合。

在这一个个AI生成内容背后,我们可以看到文心大模型走出了两条路:技术之路,与文化之路。

AI生成内容的技术难点,

正被一个个打破

afd36530b918d0b94b5c2e3904df5a88.png

“最先进的 AI 动画生成技术在中国”。

这句话,是今年8月文心ERNIE-ViLG 2.0模型通过百度API服务的方式进行开放公测后,一位外国开发者留在评论区的。几个月之后,这样的肯定依旧令我们振奋。数年前,绝大部分人可能会觉得中国难以在AI生成内容中实现领先,但现在这一切已经做到了。

究其根本,在于文心大模型持续面向AIGC的技术挑战发起一波波冲锋。今年在文心大模型支持的多部破圈视频里,我们可以看到其中的技术力表现持续升级。简单感、不流畅、缺乏创意风格等AI生成内容的传统问题,正在一个个被文心打破。

e1987b40f29b820beb2b85e428165c15.png

在这背后,是文心大模型ERNIE-ViLG 2.0跨模态图文生成能力的帮助和支持。基于ERNIE-ViLG 2.0,可以实现从文本内容到视频内容中,转化的可控性与细节描述能力不断提升。而这源于秉承着百度在文心大模型当中探索的知识增强方向,为ERNIE-ViLG 2.0找到了核心的升级方向。ERNIE-ViLG 2.0采用基于知识增强算法的混合降噪专家建模,是全球首个将知识增强与AIGC相互结合的大模型。其最终表现,在权威评测集 MS-COCO 和人工盲评上均超越了 Stable Diffusion、DALL-E 2等主流模型,在AI生成内容等方面,取得全球业界的最佳效果,在语义可控性、图像清晰度等方面均展现出了显著优势。

从《AI描绘天宫盛宴》中,我们可以看到画面可控性、复杂构图和细节刻画能力都达到了新的水平高度。AI生成内容不再是生成一帧帧图片合成视频,而是基于统一风格,完整、连续地展现出了视频全貌。这就是知识增强路径为AIGC带来的不同之处。

当时间来到2023,中国AI行业、AI开发者,以及广大视频创作者,将得到全球领先的AI生成内容能力作为发展引擎——这就是文心大模型,这座“空间站”的战略意义。

d6f24dd6e67cc36e9bce211b300fc631.png

更懂中国,更懂未来

另一方面,我们可以在《AI描绘天宫盛宴》看到一种我们非常熟悉的审美风格,其神韵非常类似1961年上海美术电影制片厂制作的《大闹天宫》。那既是中国动画史的开端,也是深刻国民DNA的文化记忆。

用这种审美意蕴展现中国航天三十年的故事,是非常容易获得国人共鸣,产生审美与文化认同的。这一点其实非常重要,AIGC的最终价值在于文化传播。试想一下,如果AI生成的内容不懂一个国家的语言、文化、典故以及审美意味,那么最终做出来的内容是否可能实现高效率、有认同的传播?

3411c38c7eb028ddd2d87ffb6f5d8e4b.png

从这个角度看,中国的AI大模型发展与AIGC能力建设就显得更加富有不可替代性。我们不能等到AI生成内容大规模落地时,一味照搬符合他国文化与英语语言习惯的内容给中国观众看。而文心对中文数据、中文知识的学习,以及对中国文化、中国审美的理解,则适当地填补了这个空白。从文心一格对中文的理解能力,以及最终生成内容中展现的中国意境,就可以看到目前适合中国环境的AIGC。我们不需要在基础能力和技术上进行漫长的模仿与追赶,而是可以站在更高点,直视AIGC最前沿、最令人激动的可能性。

2022年,是中国人追逐群星之年,也是中国人追逐AIGC之梦的一年。伴随着更多AI生成内容火爆出全,更多AIGC的行业化方案落地,更多平台化能力开放,文心一格正在打开科技与文化融合创新的想象空间,文心大模型正在成为AIGC发展的新引擎。

在文心这座“空间站”,我们已能看到智能世界的浩瀚星空。

97ded9f617edc6502a4b4b2a1f6d0d19.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/130191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用支付宝沙盒 nodejs

1、 进入官网 https://auth.alipay.com/login/index.html 登录 2、下载秘钥转换工具 https://render.alipay.com/p/f/fd-jwq8nu2a/pages/home/index.html 3、生成密钥 注意,此时得到的应用私钥的格式是不对的,应用格式转换转换格式 4、通过3中的应用公钥…

并发编程——2.Java 线程

目录2.Java 线程2.1.创建和运行线程2.1.1.方法一:直接使用 Thread 类2.1.2.方法二:使用 Runnable 接口配合 Thread2.1.3.方法三:使用 FutureTask 配合 Thread2.2.观察多个线程同时运行2.3.查看进程线程的方法2.4.原理之线程运行2.5.线程的常见…

React学习06-React Router 6

React Router 6 概述 React Router 以三个不同的包发布到 npm 上,它们分别为: react-router: 路由的核心库,提供了很多的:组件、钩子。react-router-dom: 包含react-router所有内容,并添加一些专门用于 DOM 的组件&…

Elasticsearch处理表关联关系的N种方式

Elasticsearch处理表关联关系是比较复杂的问题,处理不好会出现性能问题、数据一致性问题等; 今天我们特意分享一下几种方式,对象类型(宽表)、嵌套类型、父子关联关系、应用端关联,每种方式都有特定的业务需…

CycloneDDS(3)安全Security

本规范定义了符合DDS实现的安全模型和服务插件接口(SPI)架构。DDS安全模型通过DDS实现调用这些SPI来实现。 构成DDS安全模型的三个插件是: 1、身份验证服务插件 提供验证调用DDS操作的应用程序和/或用户身份的方法。包括在参与者之间执行相互身份验证和建立共享秘密的设施…

深度学习模型训练的tricks总结

学习率角度 学习率是一个非常非常重要的超参数,这个参数呢,面对不同规模、不同batch-size、不同优化方式、不同数据集,其最合适的值都是不确定的,我们无法光凭经验来准确地确定lr的值,我们唯一可以做的,就…

从零开始配置vim(30)——DAP的其他配置

很抱歉这么久才来更新这一系列,主要是来新公司还在试用期,我希望在试用期干出点事来,所以摸鱼的时间就少了。加上前面自己阳了休息了一段时间。在想起来更新就过去一个多月了。废话不多说了,让我们开始进入正题。 在前一章&#…

JUC 并发进阶学习(一)

该学习笔记是本人依据相关的学习视频整体汇总,相关的视频学习可以自己去搜看看。 【狂神说Java】JUC并发编程最新版通俗易懂_哔哩哔哩_bilibili 一、什么是JUC 从中就可以看出JUC,实质就是三个包,后面晖详细说明三个包下各个类功能。 java.…

程序员的测试课

git项目地址:GitHub - dreamhead/geektime-todo: Geektime Todo is a demo todo project for Geektime column. 1、实现一个Todo应用 设计规范 1、对于输入参数的检测,由入口部分代码进行处理。如空字符串。 2、Repository 的问题以运行时异常 的形式抛…

Django+Celery+Flower实现异步和定时任务及其监控告警

用Django框架进行web开发非常的快捷方便,但Django框架请求/响应是同步的。但我们在实际项目中经常会碰到一些耗时的不能立即返回请求结果任务如:数据爬取、发邮件等,如果常时间等待对用户体验不是很好,在这种情况下就需要实现异步…

SOFA Weekly|2023 我们一起加油、本周 Contributor QA

SOFA WEEKLY | 每周精选 筛选每周精华问答,同步开源进展欢迎留言互动~SOFAStack(Scalable Open Financial Architecture Stack)是蚂蚁集团自主研发的金融级云原生架构,包含了构建金融级云原生架构所需的各个组件&#…

RocketMQ 搭建

目录 1、什么是MQ?为什么要用MQ? 2、MQ的优缺点 3、几大MQ产品特点比较 4.RocketMQ在Windows的启动 1.下载RocketMQ 4.7.1版本 2.解压到本地磁盘并配置好JAVA_HOME和ROCKETMQ_HOME 3.修改runserver.cmd 4.启动server 5.修改runbroker.cmd 6.启动…

ROS2 基础概念 服务

ROS2 基础概念 服务1. Services2. 服务类型3. 查找服务4. 服务请求1. Services 服务基于 请求-应答 模型,而不是话题的 发布-订阅 模型 虽然话题允许节点订阅数据流并获得持续更新,但服务 仅在客户端专门调用时提供数据 还是启动海龟及其遥控节点为例&…

[标准库]STM32F103R8T6 点灯以及按键扫描

刚开始学32的时候,选择了基于HAL库进行开发,原因是HAL比较容易上手,像点灯、输出PWM、按键输入这种操作都很快捷。但是到ADCDMA这部分的时候发现,HAL库有一些地方我认为不是很合理和方便。比如DMA中断这部分,ST官方给出…

音视频开发系列--H264编解码总结

一、概述 H264,通常也被称之为H264/AVC(或者H.264/MPEG-4 AVC或MPEG-4/H.264 AVC) 对摄像头采集的每一帧视频需要进行编码,由于视频中存在空间和时间的冗余,需要用算法来去除这些冗余。H264是专门去除这些冗余的算法…

王者荣耀崩溃解决记录

王者荣耀竟然崩溃了 上周玩王者荣耀,突然就进不去了,点击开始游戏后应用直接就崩溃退出了。 第一反应,肯定是反馈给游戏客服。但是果然腾讯的游戏是找不到真客服的,全部都是机器人处理的,给了我一个毫无用处的官方回…

springboot中配置文件优先级以及分类,这你都可以不会吗?不会赶紧进来学( ̄(∞) ̄)

各位小伙伴大家好呀┗( ▔, ▔ )┛,马上过年了,但是感觉没啥期待的哈哈哈哈哈,现在的年说实话真的挺没劲的呜呜。 言归正传,我们大家在使用springboot时难免会写各种各样的配置信息,比如port,jdbc啊这些&am…

2022这一年:阳了、变轨和逆风

又到年末了,2022这一年应该会让人记忆深刻,于我而言这一年的感受有明显的分界线,在此之前的世界温暖一些,提供着能量,让人心生探索它的纷繁多彩;今年世界变得寒冷了,展示着它的严酷与无情。阳了…

再学C语言20:循环控制语句——for循环

在while循环中,建立一个重复执行固定次数的循环涉及到3个动作: 1)初始化一个计数器 2)计数器与某个有限的值比较 3)每次执行循环,要在循环体中让计数器的值递增 其中,计数器的初始化在循环之…

【pandas】教程:6-如何计算摘要统计

Pandas 计算摘要统计 本节使用的数据为 data/titanic.csv,链接为 pandas案例和教程所使用的数据-机器学习文档类资源-CSDN文库 加载数据 import pandas as pdtitanic pd.read_csv("data/titanic.csv") titanic.head()PassengerId Survived Pclass \…