“君子知道”复旦大学EMBA前沿论坛上,复旦大学计算机学院肖仰华教授曾为企业家同学进行过主题分享。他认为,Sora只是开始,AI或让人类文明进入“盘整期”。
在人工智能的浩瀚世界中,Sora也只是冰山一角。当AI技术“高歌猛进”,当人们为AI的无限潜能感到惊叹,更加深远的思考也随之而来:人类文明或许将因为AI迎来一段“盘整期”。
当下,科技与生活的融合程度前所未有地增强,人类的社会经济结构乃至伦理标准是否会迎来巨变?
AI正在“造世界”,而人类是唯一尺度
·Sora绝不仅仅是视频生成工具,它本质上是现实世界的模拟器,能够对物理世界、人类社会以及人与世界的复杂关系进行逼真模拟与生成。
早在ChatGPT诞生后不久,AI专家们就预判了大模型技术势必要从单一的文本模态向多模态发展的基本趋势。Sora的出现代表了文生视频、视频编辑与生成的最新进展,某种意义上可谓“水到渠成”。
Sora绝不仅仅是视频生成工具,它本质上是现实世界的模拟器,能够对物理世界、人类社会以及人与世界的复杂关系进行逼真模拟与生成。Sora的诞生宣告了人工智能在对现实世界的模拟方面能力达到了前所未有的水平,对传统相关工具形成了降维打击态势。
当然,我们也不得不承认,Sora对物理世界的模拟仍存在一些局限。例如老太太吹灭蜡烛时,蜡烛“吹而不灭”,违背了现实世界的物理常识。这些问题从根本上来讲可以归结于高质量、高精度数据的缺失,或者是相应物理场景的数据稀缺。但相信只要建立合理的诊断与发现机制,很快就可以通过增强长尾场景的样本供给,增强合成数据,以解决相应问题。
Sora的重大意义在于宣告了AGI技术路线在世界模拟这一能力上已然走通,这是具有战略意义的事件,剩下的“细枝末节”提升与完善总体而言属于战术层面。
人人都能创作的时代即将到来。在未来,只要有足够创意并能用自然语言表达自己的创作脚本,小学生也可以制作出属于自己的影视作品。
但是值得注意的是,创造过程的另一个必要环节在于评价。要符合人类的真善美标准,仍然需要以人类的尺度与标准进行检视。人是万物的尺度,在AI时代仍然适用。对于AI生成内容,人类是唯一合格的评价者,人是AI的造物主,也是AI的尺度。
超级认知能力,将刷新人类创造力的边界
·对机器而言,精准建模就是“理解”世界的基本方式。机器对于世界的建模或认知可能比人类更接近世界本原之真相,机器对于世界认知能力将显著超越人类个体,用好机器的这种超级认知能力将给人类发展创造全新机遇。
AI的建模能力可以视作其对世界的“理解”能力。比如“在东京街头行走的时尚女性”,便可被视作具备一定的理解能力。
Sora借助数据驱动方式取得了对现实世界的惊人建模与模拟能力,这种能力甚至远超人类对世界的认知能力,机器对于世界的建模或认知可能比人类更接近世界本原之真相,机器对于世界认知能力将显著超越人类个体。
人类的认知总体而言是线性的、有限的、简单的。在复杂决策时,人能同时考虑的决策变量是十分有限的,所谓的抓大放小、抓住主要矛盾的决策方式,本质上都是人类认知能力不足情况下的妥协之计。然而,AI却可以在数以百万计、千万计的决策变量下进行决策。
随着人工智能的进一步发展,机器的感知维度也更加多元。
人类对物理世界、人类社会皓首穷经所积累的全部知识,在发展机器智能面前似乎显得毫无价值,甚至起着负作用。人类对于发展机器智能的真正价值似乎只在于设定一个认知世界先验载体(Transformer等模型架构),准备好训练素材(高质量训练数据),使用大规模算力进行训练。想想人类社会代际间的经验与知识传承,我们这代人的知识与经验又有多少会被我们的下一代所认可而继承呢?
Sora也在刷新我们对于人类创造能力的理解。在大模型里的生成过程可以视作是在更大语义空间上进行高效的内容枚举或检索,这个语义空间可能比人类所能理解的语义空间大得多,这也将帮助人类拓展想象空间,提升人类的创造力。
深融实体经济,启发学科发展
·Sora背后的技术与传统行业的深度融合将进一步释放生成式AI的产业价值,进一步推动AI与实体经济的深度融合,也有利于AI技术自身的进一步迭代演进。
无人驾驶离不开无人驾驶汽车的感知设备(包括雷达和摄像头),对汽车行驶路况和周边环境进行实时感知和建模,而借助海量的驾车数据、交通摄像头数据,Sora从原理上有可能在无人驾驶场景对汽车行驶环境进行高精度模拟和建模。一旦能在无人驾驶形成应用,无疑会给大模型产业注入全新推动力。
同时,Sora对现实世界的建模与模拟能力,相信很快就会在具有更高价值、更为广阔的场景中取得应用。例如,工业制造、游戏引擎、数字孪生、教学仿真以及元宇宙等,都将从Sora背后的生成式世界模拟能力中受益。
工业制造需要大量专业性极强的仿真和模拟,才能对设备运行进行诊断与预测。借助传统工业机理模型的样本合成,再借助Transformer架构一个面向特定工业场景的Sora模拟器,从而极大提升工业场景模拟能力的泛化性,似乎是一个可行的技术路线。Sora背后的技术与传统行业的深度融合将进一步释放生成式AI的产业价值,进一步推动AI与实体经济的深度融合,也有利于AI技术自身的进一步迭代演进。
“打鸡血”的同时,警惕AI无孔不入
·人类文明或许将进入一个“乱糟糟”的盘整期,其基本特征是“剪不断,理还乱”。在这个盘整期我们需要重新划定AI应用的边界,建立AI应用的准则。人必须也终将成为AI的尺度,AI的发展只能以人类的福祉为唯一依据与标准。
从长远来看,AI也可能带来一些潜在的社会问题。“人人皆可创造”看似将带来所谓“AI平权”的美好未来,但也意味着由此产生的艺术作品总量可能远超出生命的长度。
生活中如果时刻都被AI赋能,恐将加速人类生存意义的毁灭。无孔不入的AI应用,不加节制的AI滥用,让“每时每刻”都是“高光时刻”会从根本上毁灭高光时刻对于人生的意义。
伴随通用人工智能技术的进一步发展,人类文明或许将进入一个“乱糟糟”的盘整期,其基本特征是“剪不断,理还乱”。
在AI技术之前,人类的精神世界百分百体现的是人类自身的意志。而Sora在人类有限提示下完成的视频生成,内容却已经不是人类意志的完整体现。因为同一段提示,不同的AI工具,甚至同一个工具的不同版本或不同轮次,生成结果都会有差异,这个差异所在就是机器的“意志”体现。
当AI生成以假乱真,人类的感觉和知觉系统已经无法判断真伪。现实世界和虚拟世界的边界日益模糊,将造成人类感知与认知功能紊乱与障碍。一个人类文明盘整期的到来似乎是必然的,在这个盘整期我们需要重新划定AI应用的边界,建立AI应用的准则。
很多人认为AI是平权的机会,但如果不加以合理干预和监管,AI更可能成为集权的利器。人类在科幻电影中不止一次表达“超级英雄”很容易被超能力反噬的担忧,当AI被视为人类发展的“超能力”,如果不加以合理干预和监管,人类同样会被这种能力反噬。
没有对于AI的积极干预、引导与规范,AI有可能成为人类社会发展“不可承受之重”。所以,人必须也终将成为AI的尺度,AI的发展只能以人类的福祉为唯一依据与标准。
复旦管院EMBA 复旦EMBA 复旦大学EMBA https://www.fdsm.fudan.edu.cn/emba