OpenAI文生视频物理世界模型——Sora降世,AI视频领域降维打击令五大行业一夜变天!

news2024/12/24 13:23:54

年初六,OpenAI发布了“文生视频”的工具,Sora。AI技术变革又一次震撼了整个世界。或许你又开始担心,AI发展那么快,将会取代自己。但请记住,危机时代也是变革时代,变革就是机会。开工第一天,相信多数朋友已经坐在工位上,冥思苦想今年该怎么干,才能有个好结果。

往后望去,在过往几年中,大环境由牛转熊,干啥都事倍功半。往前看去,未来充满了不确定性,让多数人看空不看多。客观危机固然存在,但机会真的没有吗?我们该如何做多自己?Sora或将是我们2024年做多、做大自己的最好机遇!

来源:笔记侠

教程专区:
AI绘画,AI视频,AI写作等软件类型AI教程,

AI工具专区:
+AI工具-喜好儿aigc

一、Sora,构建另外一种现实

如果用一句话来形容,Sora带给人们的震撼,那就是:以前不相信是真的,现在不相信是假的。
一年前,AI生成了一个威尔·史密斯(will smith)吃意大利面的视频。用一种诡异、尴尬的姿势将意大利面铲进一张抽搐、不似人类的嘴里。

由此,全网都在嘲笑AI其实是人工智障。大佬纷纷发言,AGI(通用人工智能)来临之前,还有很长的路要走。而仅仅一年后,Sora的横空出世,驳斥了我们一年前对AI的看法,AGI或将提前到来。那么,Sora具体厉害在哪?例如,对Sora输入以下文字:

一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子,手拿黑色手袋,在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜,涂着红色口红。街道潮湿而有反光效果,色彩缤纷的灯光仿佛在地面上创造了镜面效果。许多行人在街上来往。

Sora:

 0:00 / 00:59

速度

洗脑循环

00:00

无论是人物脸上的雀斑,还是水中的倒影都显得极其逼真。让人怀疑,这是实拍的吧?不像是AI生成。如果说,之前的AI“文生视频”工具是“模拟现实”,Sora则是“构建现实”。两者的区别在于,前者是对现实的模仿,难以捕捉现实世界的物理规则、动态变化。

后者,则是在虚拟世界里,构建另外一种现实。其学习的不仅是像素与画面,还有现实世界的“物理规律”。

举个例子。
我们每咬下一口食物,食物上会有咬痕,这是现实世界的物理规则。Sora生成的视频,就能做到“咬下去有痕迹”。

 0:00 / 00:15

速度

洗脑循环

00:00

而之前AI文生视频工具,则需要不断的调教,才能产出较为逼真的视频。否则,就会出现如上文威尔·史密斯吃意大利面的尴尬场景。这就是Sora的独到之处,理解运动中的物理世界,一个通用的“物理世界模拟器”,也就是“世界模型”。

二、即将遭受冲击的五大领域

具体来讲,以下五大领域将首先受到Sora带来的颠覆级改变:

1.娱乐影视领域

原先动画影视公司为让动物的数百万根毛发、皮肤纹理、衣物等细节在3D建模中表现得如现实场景般真实。需要投入不菲的成本和时间才能得以实现。

而如今,Sora只需要一行描述、几次提示便能自动完成。原本传统影视行业,分工极其精细。从前期到后期。从舞美、化妆、道具到灯光、摄像、摄影,从演员、编剧、剧务到动画特效,哪一环节出问题,就可能功亏一篑。而如果AI视频按照现在的发展速度,在不久的将来,完全可能实现一个想法创作出一部电影,省去高昂的成本。可以说游戏、电影、动画等内容创作,在被Sora模型快速生成的情境之下,将迎来颠覆性变革。

2.教育学习领域

对于教育学习领域的影响大致分为两方面。一方面,不少大学都开设了如影视制作、动画设计、多媒体设计、数字媒体艺术等专业。Sora的到来,可能会使学了四年的专业技艺的学子们,比不上一个懂得如何指挥AI的门外汉。

另一方面,老师可以利用Sora模型,将文字教材转化为生动的视频教程。提高学生的学习兴趣和效果,为特殊教育群体提供个性化的学习材料,帮助他们更好地融入社会,加速教育普适性和均衡性。

3.广告营销领域

Sora模型可以快速生成吸引人的广告视频,帮助品牌在竞争激烈的市场中脱颖而出,同时降低制作成本。例如,我们看到某些品牌的广告片,短短几分钟的视频,传统广告公司报价基本在百万级别。Sora的到来,将使品牌方成本压缩到一个极致。而对于广告公司来说,这或许意味着商业模式的直接变革。

4.新闻社交领域

新闻社交领域讲究时效性,也就是要速度。倘若今天发生的热点事件,后天报道也就不叫新闻了,在这一过程中影响时效性的通常有三部分,采访、编辑、播出。利用Sora直接生成画面,至少能省略其中两个环节,保障了时效性。

对于短视频、自媒体等社交领域。跟进热点,仅仅需要一句指令,就快速生成相关的虚拟视频内容,保障了时效性,也就保证了一定的流量。

另一方面,Sora或将拉进头部创作者与尾部创作者的创作成本。我们或许将来到一个创意与特色比拼的时代。倘若从业者缺少创意或者没有特色,将很难应对这股浪潮。

5.科学研究领域

Sora是根据现实物理规则建立的模型,也就是说能在一定程度上模拟现实物理现象。例如,在物理学、化学、生物学等领域,科研人员可以利用Sora创建复杂的动态模拟,再现难以在实验室条件下实现或观察的过程。将科学实验的变得虚拟化和可视化。

三、面对浪潮恐惧无用,先干起来

看到这,你或许会想:Sora功能如此厉害,AI技术发展那么快,自己要被取代了怎么办?面对浪潮,恐惧只会让我们伫立在原地,被巨浪吞噬。要去主动适应它,不被恐惧束缚,动起胳膊动起脚,才不会被淘汰。

1.越拥抱变化,越开挂

变化是常态,个人的意愿无法阻止变化来临。灯夫永远也无法阻挡电的普及、马车夫永远无法阻止汽车的普及、打字员永远无法阻止个人电脑的普及。这些变化,可以说是时代趋势为个人带来的危机,也可以说是机遇。

这意味着,起跑线被一定程度上重置了。AI浪潮势不可挡,这时候,就看谁先出发,谁就占据了先机,获胜得概率也就越大。

我们不必跟从业人员比,先跟自己比,再跟周围人比。写文案、做PPT、剪视频时先试着用一下AI。时间久了,也就精通了,比别人快了一步。

2.超级个体户时代来临

网红效应算是这个时代,创业最好用的“杠杆”。一位素人可以一夜爆红,日入百万。一家濒临倒闭的工厂,可以通过网红带货,起死回生。ChatGPT、Midjourney、Sora,从文本内容到设计封面,再到如今的文生视频。AI技术为个人供了更低门槛的内容创作工具,这意味将“网红效应”当做杠杆的成本大大降低,超级个体户时代来临的条件接近成熟。

《一人企业》的作者保罗·贾维斯,从企业网页设计师起步,成为了著名的互联网咨询顾问。在书中,贾维斯提出了一个观点:在这个时代,创业不一定越大越好,灵活安全的“一人公司”才是普通人的创业目标。一人公司,也就是超级个体户,不是说只有自己一个人,而是指把成本尽可能降低的小规模经营模式。

仍有三个关键不可忽视

首先是产品。

当你决定创业,那么必须尽快做出一个“最简化可实行产品”(MVP),并不断优化。

比如,某位创业者的最初产品是课程,她通过自己所在的团队不断试课,从助理讲师一直成为主要讲师,然后开始对外承接课程,最后拥有了自己独立的客户群。

其他的创业也是一样,即使你要做一个家庭“西点”师,你也需要先做出几款自己的“主打产品”,不断让人试吃、改进,然后再推向市场。

其次是规划。给公司设定上限。

是的,你没看错,是上限而不是“下限”。大多数公司会给自己设定目标和下限,比如本季度必须完成1000万的销售收入、必须开拓5个县市级市场等等。但“一人公司”刚好相反,你一定要规定自己能承受的上限。这个上限,以不牺牲产品质量和特色为原则。

比如你做家庭“西点”师,就一定要控制好自己每天制作的产品上限,原料、品种和数量都要尽量固定,关键是口感和质量绝对要保持稳定。只有这样,才能拥有长久稳定的客户群,从而让自己的公司能够长远经营下去。

千万不要为了拓展更多客户,去盲目追求数量,甚至“以次充好”,这会让喜欢你的顾客失望甚至流失。

在日本,有很多经营几十年的小店,都是这种稳定经营的小而美的“一人公司”,长期经营某个品种的食品,每天出售的数量都是固定的,品质也始终如一。

然后是保持个性。

也就是说,你的产品(服务)一定要有独特的个性,不要试图取悦所有顾客。采用适合自己的方式,去经营公司。那些经营时间长的食品、西点小店,你会发现,它们都有自己的产品偏好和特点,不会所有品类都覆盖。比如在某条街道上,有一家营业了二十多年的甜品店,常年只做有限的几种甜点,味道稳定,很少开发新品。

为什么呢?

店主的看法是,网红产品的收益与付出不成正比,店面的主要群体是附近的居民,现在的产品都是最受欢迎的,所以没有必要追求网红产品。另外,想做“一人公司”,也不能盲目乐观。

一人公司局限于一些行业,比如信息产业、服务行业、教育咨询等等。也就是说,靠的是个人的根本价值,靠智慧和知识。重点不是硬件,而是软件。还有,必须有自己的核心竞争力。

换句话说,你必须充分认识自我,建立自己的专业,弄清楚自己的家底:你有什么可以拿去交换的?

四、总结

周鸿祎认为,“一旦人工智能接上摄像头,把所有电影、视频都看一遍,其对世界的理解将远超文字学习。AGI真的就不远了,不是10-20年的问题,可能一两年就能实现。”

仅从技术角度来说,这意味着在不久的将来,不再是某一领域遭到颠覆性变革,而是人类社会、世界的变革。Sora的来临或许可以理解为,AGI真正来临前的号角。回顾历史,我们总会发现,危与机总是并存的。

未来的世界是怎样的?未来的公司是怎样的?未来的个体是怎样的?我们很难去预测。但善用工具,一直以来都是人类的天性,从火种到石器,从蒸汽机到电力技术。再到如今的Sora,未来的AGI。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1457664.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

搜狗的workflow的简单使用

workflow是一个网络库,是一个基于C在在线服务引擎 GitHub官网 运行hello world 1,创建一个server,构造函数入参传入一个入参是task的lamda函数,函数的内容会拿到response,并且可以在response中写body 2、server启动,…

Vue中$root的使用方法

查看本专栏目录 关于作者 还是大剑师兰特:曾是美国某知名大学计算机专业研究生,现为航空航海领域高级前端工程师;CSDN知名博主,GIS领域优质创作者,深耕openlayers、leaflet、mapbox、cesium,canvas&#x…

XR行业首家|李未可科技通过深度合成服务算法备案

2月18日,国家网信办发布第四批深度合成服务算法备案。 根据《互联网信息服务深度合成管理规定》第十九条规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。…

探索海洋世界,基于YOLOv5全系列【n/s/m/l/x】参数模型开发构建海洋场景下海洋生物检测识别分析系统

前面的博文中,开发实践过海底相关生物检测识别的项目,对于海洋场景下的海洋生物检测则很少有所涉及,这里本文的主要目的就是想要开发构建基于YOLOv5的海洋场景下的海洋生物检测识别系统。 前文相关的开发实践如下,感兴趣的话可以…

【DDD】学习笔记-应用服务

Eric Evans 为运用领域驱动设计的系统架构划定了层次,在领域层和展现层之间引入了应用层(Application Layer):“应用层要尽量简单,不包含业务规则或者知识,而只为下一层(指领域层)中…

左右联动布局效果

效果图&#xff1a; <template><el-dialog :modelValue"modelValue" :before-close"close" fullscreen :close-on-click-modal"false"><div class"farmer_detail"><div class"info_content"><di…

STM32入门教程:新建工程

本博文是基于建立好STM32的keil5软件后建立工程&#xff0c;如果还没下载软件建议先下载好该软件&#xff0c;在 B站江科大32教学有&#xff0c;并把相关文件下好。 STM32的开发方式有&#xff1a;基于寄存器的方式&#xff0c;基于标准库也就是库函数的方式&#xff0c;基于…

MySQL错误-this is incompatible with sql_mode=only_full_group_by完美解决方案

项目场景 有时候&#xff0c;遇到数据库重复数据&#xff0c;需要将数据进行分组&#xff0c;并取出其中一条来展示&#xff0c;这时就需要用到group by语句。 但是&#xff0c;如果mysql是高版本&#xff0c;当执行group by时&#xff0c;select的字段不属于group by的字段的…

NLP_BERT与GPT争锋

文章目录 介绍小结 介绍 在开始训练GPT之前&#xff0c;我们先比较一下BERT和 GPT 这两种基于 Transformer 的预训练模型结构&#xff0c;找出它们的异同。 Transformer架构被提出后不久&#xff0c;一大批基于这个架构的预训练模型就如雨后春笋般地出现了。其中最重要、影响…

【PHP】web服务器支持PHP_环境配置

一、PHP运行目前为止主要有4方式 &#xff08;1&#xff09;以模块加载的方式运行&#xff0c;初学者可能不容易理解&#xff0c;其实就是将PHP集成到Apache服务器&#xff0c; 以同一个进程运行。 &#xff08;2&#xff09;以CGI的方式运行&#xff0c;CGI英文叫…

【MATLAB】BiGRU神经网络回归预测算法

有意向获取代码&#xff0c;请转文末观看代码获取方式~也可转原文链接获取~ 1 基本定义 BiGRU神经网络回归预测算法是一种基于双向门控循环单元&#xff08;GRU&#xff09;的多变量时间序列预测方法。该方法结合了双向模型和门控机制&#xff0c;旨在有效地捕捉时间序列数据中…

两个发散级数的和是否发散?

1、两个发散级数的和可能是收敛的也可能是发散的。 例子&#xff1a; 发散级数 ∑ 1 n \sum\frac{1}{n} ∑n1​和发散级数 ∑ ( 1 n 2 − 1 n ) \sum(\frac{1}{n^{2}}-\frac{1}{n}) ∑(n21​−n1​)的和是收敛级数&#xff1b; 发散级数∑(1/n) 和发散级数 ∑(1/n1/n) 的和是…

HarmonyOS 鸿蒙应用开发(十一、面向鸿蒙开发的JavaScript基础)

ArkTS 是HarmonyOS&#xff08;鸿蒙操作系统&#xff09;原生应用开发的首选语言。它是用于构建用户界面的一种TypeScript方言&#xff0c;扩展了TypeScript以适应HarmonyOS生态系统的UI开发需求。ArkTS 融合了TypeScript的静态类型系统和现代UI框架的设计理念&#xff0c;为开…

Redis 缓存(Cache)

什么是缓存 缓存(cache)是计算机中的一个经典的概念在很多场景中都会涉及到。 核心思路就是把一些常用的数据放到触手可及(访问速度更快)的地方&#xff0c;方便随时读取。 这里所说的“触手可及”是个相对的概念 我们知道&#xff0c;对于硬件的访问速度来说&#xff0c;通常…

通过VSCode开发Python项目

一、插件准备 Python 插件&#xff0c;必须 autoDocstring 生成注释&#xff0c;和Pycharm一样输入三个引号"""会生产注释结构 Todo Tree 高亮显示 TODO/FIXME 二、python相关设置 一&#xff09;设置python环境 按"F1"打开命令面板&#xff08;…

19. 【Linux教程】nano 编辑器

前面小节介绍了如何使用 vim 编辑器&#xff0c;相比于 vim 编辑器&#xff0c;nano 编辑器就比较简单了。nano 是 UNIX 系统中的一个文本编辑器&#xff0c;大部分 Linux 发行版本默认都安装了 nano 文本编辑器。 和 vim 编辑器相比&#xff0c;nano 编辑器就没有那么强大&am…

centos7 arm服务器编译安装onnxruntime-gpu

前言 ONNX Runtime是适用于Linux,Windows和Mac上ONNX格式的机器学习模型的高性能推理引擎,但在arm服务器上,onnxruntime只有CPU版的,GPU版的没有,因此需要自行去编译GPU版本的才可以。 环境准备 1、python3.8 2、cmake:2.26.0版本以上,可以直接下载aarch64版本的进行…

LeetCode42.接雨水(单调栈)

题目 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&#xff0c;计算按此排列的柱子&#xff0c;下雨之后能接多少雨水。 示例 &#xff1a; 输入&#xff1a;height [0,1,0,2,1,0,1,3,2,1,2,1] 输出&#xff1a;6 解释&#xff1a;上面是由数组 [0,1,0,2,1,0,1,3,2,…

​中国手游发行商收入TOP30!

SensorTower 数据 2024年1月中国手游发行商&#xff0c;全球多款游戏在收入和用户增长方面取得的显著成绩。 1. 中国手游发行商全球表现&#xff1a;2024年1月&#xff0c;共有38个中国厂商入围全球手游发行商收入榜TOP100&#xff0c;合计收入达到19.6亿美元&#xff0c;占榜单…

PDF控件Spire.PDF for .NET【安全】演示:如何在 PDF 中添加签名字段

Spire.PDF for .NET 是一款独立 PDF 控件&#xff0c;用于 .NET 程序中创建、编辑和操作 PDF 文档。使用 Spire.PDF 类库&#xff0c;开发人员可以新建一个 PDF 文档或者对现有的 PDF 文档进行处理&#xff0c;且无需安装 Adobe Acrobat。 E-iceblue 功能类库Spire 系列文档处…