OpenAI 发布 Sora,可快速生成视频

news2024/12/23 16:27:01

作者:苍何,前大厂高级 Java 工程师,阿里云专家博主,CSDN 2023 年 实力新星,土木转码,现任部门技术 leader,专注于互联网技术分享,职场经验分享。
🔥
热门文章推荐:

  • (1)对程序员来说,技术能力和业务逻辑哪个更重要?
  • (2)搭建GitHub免费个人网站(详细教程)
  • (3)itchat实现微信聊天机器人
  • (4)嗖嗖移动业务大厅(源码下载+注释全 值得收藏)

image.png

大家好,我是苍何。今天看到 OpenAI 发布了 Sora,到处都在飞传,我去了解了下,好家伙,直接炸开,惊艳的无话可说!!!Sora 是一种文字生成视频的技术,从演示看,效果还是相当不错的,和真实世界拍出来的基本无区别。

当然,你可能会说,这算啥,AI视频又不是什么新东西,但这次真的不一样,它的能力超过我们的想象,就连刘润、周鸿伟等大佬都纷纷坐不坐了,均来为这次的发布发声。

我们可以用三个词来总结 Sora,那就是“60s超长长度”,“单视频多角度镜头”,和“世界模型”。

Sora 可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示。

ps:
目前文生成视频技术,能做到一分钟的很少很少,基本没有。所以 Sora 还是很强的。

如今,仅有官方邀请的人员才可使用。官方还授予了一些视觉艺术家、设计师和电影制作人访问权限,目的是获取他们的反馈,了解如何改进模型,以便对创意专业人士更有益。

官方正尽早分享研究进展,目的是开始与非OpenAI成员合作并获取他们的反馈,同时让公众了解即将推出的AI功能。

让我们先来看下效果

提示词:一位时尚的女人走在东京的街道上,街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红。她自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果。许多行人四处走动。

在这里插入图片描述

Sora 是一款能够生成复杂场景的先进模型,它不仅能创造出多个角色特定类型的动作,还能精确描绘主题和背景的细节。这个模型深刻理解用户的需求,并且知道这些元素在真实世界中是如何存在的。

通过对语言的深入理解,Sora 能够精确解读用户的指令,并创造出充满生动情感的引人入胜的角色。它甚至能在同一个视频中切换不同的镜头,以确保角色和视觉风格的一致性。

不过,Sora 也有它的局限性。它在模拟复杂场景的物理特性时可能会遇到困难,有时也难以理解具体的因果关系。比如,一个角色吃饼干的动作可能不会在饼干上留下咬痕。此外,它在处理空间细节(如区分左右)和描述随时间变化的事件(比如特定的相机移动轨迹)时也可能遇到挑战。

在将 Sora 引入 OpenAI 产品线之前,官方将采取多项安全措施。正与专门处理错误信息、仇恨内容和偏见等问题的红队专家合作,进行对抗性测试。

官方也在开发工具来识别误导性内容,例如构建分类器以判断视频是否由 Sora 生成,并计划在未来的产品中加入 C2PA 元数据,以增强内容的透明度。

为了确保技术安全可靠,借鉴了在开发 DALL·E 3 时的经验,同样的方法也将应用于 Sora。例如,一旦产品面市,将使用文本分类器来过滤掉违反使用政策的请求,比如那些包含极端暴力、色情内容、仇恨图像、名人肖像或侵犯他人知识产权的内容。官方还开发了强大的图像分类器,对生成视频的每一帧进行审查,确保展示给用户的内容符合标准。

openai 还计划与全球的政策制定者、教育工作者和艺术家合作,了解他们的关切,并探索这项技术的积极应用场景。虽然已经进行了广泛的研究和测试,但认识到,无法完全预测人们会如何利用或滥用这项技术。这就是为什么 openai 认为,从实际使用中不断学习和改进,是确保人工智能系统越来越安全的关键。

提示词:无人机视角,海浪拍打着大苏尔加雷角海滩崎岖的悬崖。汹涌澎湃的蓝色海水掀起白色的波浪,而夕阳的金色光芒照亮了岩石海岸。远处有一个带灯塔的小岛,绿色的灌木丛覆盖着悬崖的边缘。从公路到海滩的陡峭落差是一项戏剧性的壮举,悬崖的边缘突出在海面上。这张照片捕捉到了海岸的原始美景和太平洋海岸公路崎岖的景观。

Sora 底层技术:

给官方的文档做了下简单翻译

Sora 是一种先进的视频生成技术,它开始时使用的视频看起来就像是静态的噪声。然后,它通过多个步骤逐步去除这些噪声,最终将视频转变得清晰起来。

这项技术能够一次性生成完整的视频,或者将已生成的视频延长,使其更加丰富多彩。Sora 通过同时处理许多视频帧,巧妙解决了保持视频中主题连续性的挑战,即使这个主题暂时从画面中消失也能够保持一致。

就像 GPT 技术一样,Sora 采用了一种叫做transformer的架构,这使得它的处理能力大大增强。

我们把视频和图片分解成了很多小块,叫做“补丁”,每一个“补丁”就像是 GPT 中的一个“字”。通过这种方式统一数据表示,我们能在更广泛的视觉数据上进行训练,覆盖不同的时长、分辨率和比例。

Sora 是基于 DALL·E 和 GPT 模型发展而来的。特别是,它用到了 DALL·E 3 的技术,这项技术能为视觉内容生成非常详细的描述。因此,Sora 能够更准确地根据用户的文本描述生成视频

不仅如此,Sora 还能够接收静态图片,并根据这些图片生成视频,精确地将图片内容动态化,同时注重细节。它甚至能够对现有的视频进行扩展,或者填补缺失的帧。想要了解更多信息,请查看我们的技术报告。

Sora 是我们向理解和模拟现实世界迈出的一大步。我们相信,这种能力将成为实现人工通用智能(AGI)的一个关键里程碑。🚀

体验地址:

https://openai.com/sora
目前还没开放,关注苍何,待开放后,将会第一时间体验。如果你对 AI 感兴趣,或者想通过 AI 提效搞钱,欢迎你加入我的免费星球:https://t.zsxq.com/1771Yxf33

苍何个人介绍.png

创作不易,如果本文对你有帮助,欢迎点赞、收藏加关注,你的支持和鼓励,是我创作的最大动力。
文章最下方关注图片.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1453035.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

点亮代码之灯,程序员的夜与电脑

在科技的海洋里,程序员是那些驾驶着代码船只,穿梭于虚拟世界的探险家。他们手中的键盘是航行的舵,而那台始终不愿关闭的电脑,便是他们眼中永不熄灭的灯塔。有人说,程序员不喜欢关电脑,这究竟是为什么呢&…

Rust 学习笔记 - 注释全解

前言 和其他编程语言一样,Rust 也提供了代码注释的功能,注释用于解释代码的作用和目的,帮助开发者理解代码的行为,编译器在编译时会忽略它们。 单行注释 单行注释以两个斜杠 (//) 开始,只影响它们后面直到行末的内容…

阿里云服务器租用价格 2024年新版活动报价及租用收费标准

2024年最新阿里云服务器租用费用优惠价格表,轻量2核2G3M带宽轻量服务器一年61元,折合5元1个月,新老用户同享99元一年服务器,2核4G5M服务器ECS优惠价199元一年,2核4G4M轻量服务器165元一年,2核4G服务器30元3…

模拟电子技术——同相比例运算放大电路、反向运算比例放大电路、反向加法器电路、差分减法器电路

文章目录 一、同相比例运算放大电路什么是比例运算放大电路线性区与非线性区电压跟随器 二、反向运算比例放大电路什么是反比例运算放大器电路及特点 三、反向加法器电路什么是反向加法器电路及特点及参数计算电路及特点及参数计算 四、差分减法器电路什么是差动减法器 总结 提…

备战蓝桥杯---图论之建图基础

话不多说,直接看题: 首先,这个不是按照字典序的顺序,而是以只要1先做,在满足后让2先做。。。。 就是让数字小的放前面做拓扑排序。 我们可以先做1,看看它的前驱。 举个例子: 我们肯定要把1放…

BIOS and UEFI

BIOS : Basic Input/Output System UEFI: Unified Extensible Firmware Interface Notes: 1. 两者都是主板上的firmware. 2. 两者的作用都包括开机后检查硬件,从硬盘上寻找bootloader(用于加载操作系统,例如GRUB). # 操作系统的启动过程&#xff1a…

VS2022创建控制台应用程序后没有Main了,该如何解决?

用VS2022创建一个控制台应用后,没有名称空间和Main函数了,只有一个WriteLine,如下所示。 // See https://aka.ms/new-console-template for more information Console.WriteLine("Hello, World!");首先说明一下原因,在…

sqlserver对已有的表插入列

现有如下的一个表; 现在要插入一个 人员id 列;如下图在设计视图的行首单击,选择 插入列; 然后添加一个 人员id 列; 保存,出现下图提示,不能保存设计; 这就直接使用sql语句更改&#…

使用 Coze 搭建 TiDB 助手

导读 本文介绍了使用 Coze 平台搭建 TiDB 文档助手的过程。通过比较不同 AI Bot 平台,突出了 Coze 在插件能力和易用性方面的优势。文章深入讨论了实现原理,包括知识库、function call、embedding 模型等关键概念,最后成功演示了如何在 Coze…

wayland(xdg_wm_base) client 使用 dmabuf 最简实例

文章目录 前言一、zwp_linux_dmabuf_v1 协议二、wayland client 使用 zwp_linux_dmabuf_v1 协议传递dma-buf代码实例1. wayland_dmabuf.c 代码实例2. xdg-shell-protocol.c 和 xdg-shell-client-protocol.h3. linux-dmabuf-unstable-v1-client-protocol.h 和 linux-dmabuf-unst…

清华AutoGPT:掀起AI新浪潮,与GPT4.0一较高下

引言: 随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了一个又一个突破。最近,清华大学研发的AutoGPT成为了业界的焦点。这款AI模型以其出色的性能,展现了中国在AI领域的强大实力。 目录 引言&…

SQL32 截取出年龄(substring_index函数的用法)

代码 select substring_index(substring_index(profile,,,3),,,-1) as age ,count(device_id) from user_submit group by age知识点 substring_index(FIELD, sep, n)可以将字段FIELD按照sep分隔: (1).当n大于0时取第n个分隔符(n从1开始)之前的全部内容&#xff1…

高速列车的空气动力学问题概述

1 高速铁路定义 高速铁路目前尚无全球统一的标准,普遍认定标准为新建线路上列车速度可达 250 km/h,或者既有线改造后可达 200 km/h 即可视为高速铁路。由于车辆、轨道、桥隧、调度、安全等多方面原因,当前没有用于货运用途的高速铁路&#x…

前端秘法进阶篇----这还是我们熟悉的浏览器吗?(浏览器的渲染原理)

目录 一.浏览器渲染原理 二.渲染时间点 三.渲染流水线 1.解析html(Parse HTML) 1.1解析成DOM树(document object model) 1.2解析成CSSOM树(css object model) 2.样式计算(Recalculate Style) 3.布局(Layout) 4.分层(Layer) 5. 绘制(Paint) 6.分块(Tiling) 7. 光栅化…

Leetcode1423.可获得的最大点数

文章目录 题目原题链接思路(逆向思维) 题目 原题链接 Leetcode1423.可获得的最大点数 思路(逆向思维) 由题目可知,从两侧选k张,总数为n张,即从中间选n - k张 nums总和固定,要选k张最…

深度学习基础之《TensorFlow框架(4)—Operation》

一、常见的OP 1、举例 类型实例标量运算add,sub,mul,div,exp,log,greater,less,equal向量运算concat,slice,splot,canstant,rank&am…

【TC3xx芯片】TC3xx芯片SMU模块详解

目录 前言 正文 1.SMU功能概述 1.1 SMU架构 1.2 SMU_core 1.3 SMU_stdby 2. SMU功能详述 2.1 SMU_core 2.1.1 Reset类型 2.1.2 接口(Interfaces)概述 2.1.2.1 SMU_core到SCU的接口 2.1.2.2 SMU_core到IR的接口 2.1.2.3 SMU_core到Ports(Err…

ClickHouse--06--其他扩展MergeTree系列表引擎

其他扩展MergeTree系列 MergeTree 系列表引擎 --种类 MergeTree 系 列 表 引 擎 包 含 : MergeTreeReplacingMergeTreeSummingMergeTree(汇总求和功能)AggregatingMergeTree(聚合功能)CollapsingMergeTree&#xff08…

Stable Diffusion webui安装详细教程

上一篇文章介绍了sd主流的ui,相信大家已经有所了解,下面为大家介绍sd-webui的安装详细教程 文章目录 一、 安装包说明二、对电脑的要求三、安装文件介绍四、安装步骤五、电脑问题与云主机六、界面简要说明及通用反向提示词 一、 安装包说明 通常我们使…

使用Python编写脚本-根据端口号杀掉进程

我的GitHub:Powerveil - GitHub 我的Gitee:Powercs12 - Gitee 皮卡丘每天学Java 从前段开始遇到一个问题,服务在启动的时候总是端口被占用,发现还是Java程序,但是当时并没有启动Java程序,电脑出问题了。 一…