全球AI视频技术竞赛加速:Runway即将推出更优更快的第三代AI视频模型|TodayAI

news2024/11/17 14:47:22

Runway即将在未来几天推出其更优更快的第三代AI视频模型,这是新一代模型中最小的一个。据公司透露,这款名为Gen-3的模型将带来“在真实度、一致性和动态效果上的重大提升”,同时在速度上也有显著的加快。

去年六月,Runway首次推出了商业化的文本到视频AI模型Gen-2,开启了合成视频技术的全球革命。现在,Runway与Pika Labs、Haiper、Luma Labs以及尚未发布的Sora等公司展开竞争。 

 

第三代模型是Runway以及整个AI视频领域的一次重大进步。该模型从底层完全重建,采用了专为大规模多模式训练而设计的全新基础设施。这一新模型同时在图像和视频上进行训练,极大地提升了真实感。

公众将很快能够体验到Gen-3模型的Alpha版本。Runway的首席技术官兼联合创始人Anastasis Germanidis表示,这是得益于新的训练基础设施而来的新一代前沿AI模型中最小的一个。

Runway第三代带来了哪些惊喜?

Runway Gen-3在视频中控制动作的能力得到了改进,同时它还能更好地理解现实世界的运动和物理法则。结合其接近真实的视觉效果,Gen-3能够创造出几乎无法与现实区分的视频。

团队在第一次使用完成训练的Gen-3时,其场景创作方式带来了一些惊喜,这得益于至少10秒的视频创作时间,而前一代的最长时间仅为四秒。Germanidis透露:“创造不寻常过渡的能力是我们在内部使用Gen-3 Alpha时最有趣和令人惊讶的方式之一。这款模型能够整合并理解环境中的剧烈变化,并取得非常令人满意的结果。”

此外,用户在改变场景和环境时拥有更大的时间控制能力,因为它是通过每个场景多个高度描述性的标题进行训练的,这使得它能够生成具有不寻常且有趣的环境和行动过渡的视频,以及对特定时间元素进行精确的关键帧设置。

Germanidis还指出,这些模型改进与现有的控制模式如运动笔刷、高级相机控制和导演模式相结合,为用户提供了前所未有的控制能力。无论是从图像、文本还是视频开始,Gen-3都支持多种输入方式,而且无论使用哪种方式,Gen-3 Alpha在时间一致性方面都有显著的改进,并且相比Gen-2在形态变化上有了大幅减少。

构建“通用世界模型”

Germanidis还向外界透露,这是Runway从头开始训练的下一代基础模型中的第一个,未来的版本将达到甚至超过大型语言模型的规模。Runway正朝着构建“通用世界模型”迈进,这种模型是AI系统,能够构建环境的内部表现,并使用它来模拟该环境中未来的事件,旨在表现和模拟现实世界中遇到的各种情况和互动。

尽管Gen-3还处于初期阶段,但它已经迈出了构建开放世界模型的第一步。Germanidis提醒,尽管Gen-3在处理复杂的角色和物体互动时可能会遇到挑战,且生成的结果并不总是严格遵循物理定律,但这只是一个开始。

全球AI视频技术突破

全球AI视频生成技术迎来了多项重大突破,其中包括快手的可灵(Kling AI)、以及Luma AI的梦机器(Dream Machine),各自推动了视频内容创造的新高度。这些模型展示了从简短文本到复杂场景生成的惊人能力,标志着AI视频技术的一大飞跃。

由快手推出的可灵AI,能够生成高达两分钟、1080p质量的视频。这个模型特别注重真实模拟和高级视频质量,能够基于简单的文本提示创造出极具现实感的视频。目前,可灵AI处于公开测试阶段。

梦机器(Dream Machine)由Luma AI开发,这款模型能够从文本指令和图片中创建高质量、逼真的视频镜头。它代表了AI视频生成领域的一个重大里程碑,尽管具体的性能细节较少公开,但它被看作是与OpenAI的Sora等竞争产品的重要竞争者​ 。

这些技术的推出不仅为内容创作者提供了更多工具,还预示着未来视频制作和虚拟现实领域的巨大潜力。随着AI视频模型的不断进步,未来的视频内容创造将更加多元化和生动,为广告、娱乐及教育行业带来前所未有的变革。

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1839166.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis 集群 - 数据分片算法

前言 广义的集群:只要是多个机器构成了一个分布式系统,都可以被称为集群。 狭义的集群:redis 的集群模式,这个集群模式下,主要是解决存储空间不足的问题。 Redis 集群 redis 采用主从结构,可以提高系统的可…

ABAP 搜索帮助F4IF_INT_TABLE_VALUE_REQUEST

F4IF_INT_TABLE_VALUE_REQUEST 一般用于在选择屏幕提供搜索帮助 可以看到设置的是物料与物料描述的对应关系,而且对话类型是立即显示值,所以才能够实现如上的效果 有两种搜索帮助,这里选择基本索引帮助即可 然后填上对应的文本表和字段即可 然后在选…

【非常实验】Android模拟x86_64系统——安装Alpine虚拟机

安卓是一款功能强大的操作系统,为什么不试试它的极限呢? 百无聊赖中,我发现了各种 Android 修补项目。这激起了我对 DevOps 的好奇心,促使我探索在该平台上运行容器。这种好奇心又把我带入了另一个兔子洞:在 Android 上运行虚拟机。这其中经历了许多曲折,也许以后有必要…

cs144 LAB1 基于滑动窗口的碎片字节流重组器

一.StreamReassembler.capacity 的意义 StreamReassembler._capacity 的含义: ByteStream 的空间上限是 capacityStreamReassembler 用于暂存未重组字符串片段的缓冲区空间 StreamReassembler.buffer 上限也是 capacity蓝色部分代表了已经被上层应用读取的已重组数…

计算机专业毕设-springboot论坛系统

1 项目介绍 基于SSM的论坛网站:后端 SpringBoot、Mybatis,前端thymeleaf,具体功能如下: 基本功能:登录注册、修改个人信息、修改密码、修改头像查看帖子列表:按热度排序、按更新时间排序、查看周榜月榜查…

棱镜七彩荣获CNNVD两项大奖,专业能力与贡献再获认可!

6月18日,国家信息安全漏洞库(CNNVD)2023年度工作总结暨优秀表彰大会在中国信息安全测评中心成功举办。棱镜七彩凭借在漏洞方面的突出贡献和出色表现,被授予“2023年度优秀技术支撑单位”与“2023年度最佳新秀奖”。 优秀技术支撑单…

Gobject tutorial 七

The GObject base class GObject是一个fundamental classed instantiatable type,它的功能如下: 内存管理构建/销毁实例set/get属性方法信号 /*** GObjectClass:* g_type_class: the parent class* constructor: the constructor function is called by g_object…

最新技术:跨境电商源码,应对多国市场需求,让您轻松开展全球业务!

随着全球化进程的不断推进,跨境电商已成为企业拓展国际市场的重要途径。为了满足不同国家和地区消费者不断增长的需求,跨境电商源码应运而生,为企业提供了便捷高效的全球化业务发展方案。 一、全球化运营的关键 跨境电商源码的核心功能在于…

极具吸引力的小程序 UI 风格

极具吸引力的小程序 UI 风格

小白速成AI大模型就看这份资源包

前言 在数字化浪潮席卷全球的今天,人工智能(AI)技术已成为推动社会进步的重要引擎。尤其是AI大模型,以其强大的数据处理能力和广泛的应用前景,吸引了无数人的目光。然而,对于初学者“小白”来说&#xff0…

ProtoBuf序列化协议简介

首先,常见的序列化方法主要有以下几种: TLV编码及其变体(tag, length, value): 比如ProtoBuf。文本流编码:XML/JSON固定结构编码:基本原理是,协议约定了传输字段类型和字段含义,和TLV类似&…

MyBatis框架基础

文章目录 1 MyBatis概述2 MyBatis入门2.1 相关依赖2.2 properties配置文件2.3 预编译SQL 3 基本操作3.1 新增操作3.2 删除操作3.3 更新操作3.4 查询操作 4 动态SQL4.1 XML映射文件4.2 if/set/where标签4.3 foreach标签4.4 sql/include标签 5 参考资料 1 MyBatis概述 MyBatis是…

入侵检测系统(IDS)

入侵检测 入侵检测(Intrusion Detection)是指发现或确定入侵行为存在或出现的动作,也就是发现、跟踪并记录计算机系统或计算机网络中的非授权行为,或发现并调查系统中可能为视图入侵或病毒感染所带来的异常活动。 入侵检测系统 …

XL5300 dTOF测距模块 加镜头后可达7.6米测距距离 ±4%测距精度

XL5300 直接飞行时间(dToF)传感器是一个整体方案dTOF 模组,应用设计简单。片内集成了单光子雪崩二极管(SPAD)接收阵列以及VCSEL激光发射器。利用自主研发的 SPAD 和独特的ToF 采集与处理技术,XL5300模块可实…

NV-Embed论文阅读笔记

这是NVIDIA的一篇论文,LLM通常使用的是GPT的decoder范式作为一个生成模型,文章探讨如何利用这样的decoder生成模型来实现BERT这样的encoder的功能,即提取有效的embedding。现有的方法提取embedding的方式无非是 1 mean pooling; 2…

无线领夹麦克风哪个牌子好用?一文揭秘哪种领夹麦性价比最高!

​无线领夹麦克风,无疑是现代音频技术的杰出代表。它摆脱了传统有线麦克风的束缚,让声音的传播更加自由、灵活。无论是追求极致音质的音乐爱好者,还是需要高效沟通的商务人士,无线领夹麦克风都能满足你的需求,让你的声…

HarmonyOS 角落里的知识 —— 状态管理

一、前言 在探索 HarmonyOS 的过程中,我们发现了许多有趣且实用的功能和特性。有些总是在不经意间或者触类旁通的找到。或者是某些开发痛点。其中,状态管理是ArkUI开发非常核心的一个东西,我们进行了大量的使用和测试遇到了许多奇奇怪怪的问…

AD层次原理图绘制

一、在原理图中添加端口 二、添加层次图 三、更新层次图 四、也可以先画层次图,再绘制原理图,这里就不做演示了

天地图 uniapp使用笔记

官网地址&#xff1a;天地图API 效果&#xff1a; <template><view><!-- 显示地图的DOM节点 --><view id"container" class"content"></view><!-- END --><!-- 数据显示 --><h3>城市名称(IP属地)&#x…

关于归一化能量与归一化功率(连续与离散+1)

前言&#xff1a; ① 周期信号 与 直流信号 都是功率信号 ②一个信号可以既不是能量信号也不是功率信号&#xff0c;但不可能既是能量信号又是功率信号 归一化能量 对于一个连续时间信号 ( x(t) )&#xff0c;归一化能量 ( E ) 的定义为&#xff1a; E lim ⁡ T → ∞ ∫ −…