突发!Meta重磅发布Movie Gen入局视频生成赛道!

news2024/11/25 22:25:44

引言

Meta于2024年10月4日首次推出 Meta Movie Gen,号称是迄今为止最先进的媒体基础模型。Movie Gen 由 Meta 的 AI 研究团队开发,在一系列功能上获取最先进的效果,包括:文生视频、创建个性化视频、精准的视频编辑和音频创作。

无论是渴望在好莱坞闯出一片天地的新晋电影人,还是热衷于为观众制作视频的创作者,每个人都应该有机会使用能够增强创造力的工具。Meta公司隆重推出Movie Gen,这是在媒体生成人工智能研究方面的突破性成果,涵盖了图像、视频和音频等多个模态。最新研究展示了如何通过简单的文本输入来制作定制视频和声音、编辑现有视频,以及将个人图像转化为独特的视频。在人工评估中,Movie Gen在这些任务上的表现优于业界类似模型。

小窗幽记机器学习

记录机器学习过程中的点点滴滴和坑坑洼洼

公众号

背景

这项工作是Meta长期与社区分享基础人工智能研究的成果之一。第一波生成式人工智能工作始于Make-A-Scene系列模型,实现了图像、音频、视频和3D动画的创建。随着扩散模型的出现,第二波工作Llama Image基础模型应运而生,能够生成更高质量的图像和视频,并进行图像编辑。Movie Gen作为第三波成果,巧妙结合了所有这些模态,并以前所未有的方式为使用者提供了更精细的控制。与前几代模型类似,这些模型有望支持各种新产品,加速创意的实现。

尽管这些基础模型有许多令人兴奋的用途,但值得注意的是,生成式人工智能并不能取代艺术家和动画师的工作。分享这项研究的目的在于相信这项技术能帮助人们以新的方式表达自己,并为可能缺乏机会的人提供新的可能性。未来,或许每个人都能利用Movie Gen实现自己的艺术愿景,创作高清视频和音频,让创意的火花绽放得更加璀璨。

简介

作为最先进和沉浸式的讲故事模型套件,Movie Gen具备四种核心功能:视频生成、个性化视频生成、精确视频编辑和音频生成。这些模型的训练采用了经过授权和公开可用的数据集组合。虽然研究论文中详细阐述了技术细节,但本篇博文将重点分享每种功能的出色表现。后续会补充该论文的技术细节,感兴趣的小伙伴可以留意下。

视频生成

通过给定文本提示,Movie Gen能利用经过文本到图像和文本到视频优化的联合模型,创建高质量和高清晰度的图像和视频。这个拥有300亿参数的transformer模型能够以每秒16帧的速度生成长达16秒的视频。研究发现,这些模型可以推理物体运动、主体-客体交互和相机运动,并且能为各种概念学习合理的运动,使其成为同类中最先进的模型。

个性化视频

Movie Gen进一步扩展了上述基础模型,支持个性化视频生成。通过将一个人的图像作为输入,并与文本提示结合,该模型能生成包含参考人物和由文本提示提供丰富视觉细节的视频。在保留人物身份和动作方面,该模型达到了最先进的效果。

精准视频编辑

同一基础模型的编辑变体将视频和文本提示作为输入,精确执行任务以生成所需的输出。它巧妙结合了视频生成和高级图像编辑,能执行本地编辑(如添加、删除或替换元素)和全局更改(如背景或风格修改)。与需要专业技能的传统工具或缺乏精确性的生成工具不同,Movie Gen能保留原始内容,只针对相关像素进行编辑。

音频生成

最后,Movie Gen还包含一个130亿参数的音频生成模型,可接受视频和可选的文本提示,生成长达45秒的高质量和高保真音频,包括环境声、音效(拟音)和器乐背景音乐——所有这些都与视频内容完美同步。此外,该模型还引入了一种音频扩展技术,可为任意长度的视频生成连贯的音频。总体而言,在音频质量、视频到音频对齐和文本到音频对齐方面,Movie Gen都达到了最先进的性能水平。

结果

这些基础模型的开发需要在架构、训练目标、数据配方、评估协议和推理优化等多个技术领域实现突破性创新。

下面展示了四种功能的A/B人工评估比较结果。正净胜率表明人类更倾向于Movie Gen的模型结果,而非竞争对手的行业模型。更多详细信息和评估可参阅相关研究论文:https://ai.meta.com/static-resource/movie-gen-research-paper。

尽管今天分享的研究展示了未来应用的巨大潜力,但不可否认当前的模型仍存在局限性。值得注意的是,仍有许多优化空间,可进一步减少推理时间并通过扩展来提高模型质量。

未来之路

随着模型的不断改进和潜在的未来发布,Movie Gen的开发团队将与电影制作人和创作者密切合作,整合他们的反馈。通过采取协作方式,旨在确保创造的工具能帮助人们以前所未有的新方式增强他们固有的创造力。想象一下,使用文本提示制作并编辑一个"生活中的一天"视频来分享在网络上,或者为朋友创建一个定制的动画生日祝福并通过微信发送给他们。随着创造力和自我表达占据主导地位,可能性将变得无限广阔。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2190463.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

递归--C语言

1 递归定义 函数自己调用自己的过程,称为递归。 2 递归的必要条件 1.必须要有终止条件。达到条件就停止递归,退出函数。2.每次调用自己都要越来越接近这个终止条件。 因此写函数的时候,也分两部分 第一部分:写终止条件&#x…

点击按钮提示气泡信息(Toast)

演示效果&#xff1a; 目录结构&#xff1a; activity_main.xml(布局文件)代码&#xff1a; <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"xmlns:app"http:…

【第三版 系统集成项目管理工程师】第15章 组织保障

持续更新。。。。。。。。。。。。。。。 【第三版】第十五章 组织保障 15.1信息和文档管理15.1.1 信息和文档1.信息系统信息-P5462.信息系统文档-P546 15.1.2 信息(文档)管理规则和方法1.信息(文档)编制规范-P5472.信息(文档)定级保护-P5483.信息(文档)配置管理-P549练习 15.…

38 文件包含(标准库头文件、自定义头文件)、相对路径与绝对路径、条件编译(#if、#ifdef、#if define、#ifndef)

目录 1 文件包含 1.1 #include 指令 1.2 包含标准库头文件 1.3 包含自定义头文件 1.3.1 使用相对路径 1.3.2 使用绝对路径 2 条件编译 2.1 #if … #endif 2.1.1 语法格式 2.1.2 功能说明 2.1.3 流程分析 2.1.4 案例演示&#xff1a;#if 0 ... #endif 2.1.5 案例演…

关于懒惰学习与渴求学习的一份介绍

在这篇文章中&#xff0c;我将介绍些懒惰学习与渴求学习的算法例子&#xff0c;会介绍其概念、优缺点以及其python的运用。 一、渴求学习 1.1概念 渴求学习&#xff08;Eager Learning&#xff09;是指在训练阶段构建出复杂的模型&#xff0c;然后在预测阶段运用这个构建出的…

分布式锁--redission 最佳实践!

我们知道如果我们的项目服务不只是一个实例的时候&#xff0c;单体锁就不再适用&#xff0c;而我们自己去用redis实现分布式锁的话&#xff0c;会有比如锁误删、超时释放、锁的重入、失败重试、Redis主从一致性等等一系列的问题需要自己解决。 当然&#xff0c;上述问题并非无…

3dsMax合并FBX的时候相同的节点会被合并(重命名解决),3Ds MAX创建空物体(虚拟对象或者点)

3dsMax合并FBX的时候相同的节点会被合并 3dsamax的文档&#xff0c;但是并没有说FBX的合并如何处理 https://help.autodesk.com/view/3DSMAX/2024/CHS/?guidGUID-98146EB8-436F-4954-8682-C57D4E53262A模型节点信息&#xff0c;yase&#xff0c;Points&#xff0c;Mesh 都是点…

【优选算法】(第二十一篇)

目录 外观数列(medium) 题目解析 讲解算法原理 编写代码 数⻘蛙&#xff08;medium&#xff09; 题目解析 讲解算法原理 编写代码 外观数列(medium) 题目解析 1.题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 2.题目描述 给定⼀个正整数n&#xff0…

openpnp - 坐标文件中的元件0角度如果和编带规定的角度不一样,需要调整贴片任务中的元件旋转角度

文章目录 openpnp - 坐标文件中的元件0角度如果和编带规定的角度不一样&#xff0c;需要调整贴片任务中的元件旋转角度笔记查看自己图纸中的封装的0角度方法贴片任务的角度值范围编带规定的0角度根据编带规定的元件0角度来调整贴片的元件旋转角度如果是托盘飞达备注备注END ope…

电脑失声,一招搞定

早已习惯了Edge浏览器的“大声朗读”功能&#xff0c;今天值班&#xff0c;值班室用的两台电脑只配有耳机&#xff0c;没有音箱&#xff0c;顿时感觉不适。 先找了一个带功放的老音箱&#xff0c;发现少了电箱到功放的音频线。 一顿搜索&#xff0c;在找到音频线的同时&#…

2024年计算机视觉与艺术研讨会(CVA 2024)

目录 基本信息 大会简介 征稿主题 会议议程 参会方式 基本信息 大会官网&#xff1a;www.icadi.net&#xff08;点击了解参会投稿等信息&#xff09; 大会时间&#xff1a;2024年11月29-12月1日 大会地点&#xff1a;中国-天津 大会简介 2024年计算机视觉与艺术国际学术…

基于SpringBoot+Vue+MySQL的装修公司管理系统

系统展示 管理员后台界面 员工后台界面 系统背景 随着信息技术的快速发展&#xff0c;装修行业正面临数字化转型的关键时刻。传统的装修管理方式存在信息管理混乱、出错率高、信息安全性差等问题&#xff0c;已无法满足现代市场的需求。因此&#xff0c;开发一套高效、便捷的装…

仿《11773手游》源码/手机游戏软件下载门户网站模板/帝国CMS 7.5

帝国CMS 7.5仿《11773手游》源码&#xff0c;手机游戏软件下载门户网站模板。简洁漂亮的手游下载网站模板&#xff0c;采用帝国CMS7.5核心&#xff0c;同步刷新M端。 该模板带同步生成插件&#xff0c;整站干净大气界面漂亮&#xff0c;简单不失简约&#xff0c;模板中的典范&…

css 简单网页布局(一)

1. 三种布局方式 1.1 标准流 1.2 浮动的使用 1.3 简述浮动 1.3.1 浮动三大特性 <style>.out {border: 1px red solid;width: 1000px;height: 500px;}.one {background-color: aquamarine;width: 200px;height: 100px;}.two {background-color: blueviolet;width: 200px;h…

Chromium 中JavaScript Fetch API接口c++代码实现(二)

Chromium 中JavaScript Fetch API接口c代码实现&#xff08;一&#xff09;-CSDN博客 接着上一篇继续介绍调用&#xff0c;上函数堆栈。 1、打开http://192.168.8.1/chfs/shared/test/test02.html 此标签进程ID12484&#xff0c; 2、打开vs附加上此进程ID12484 3、点击页面测…

华为 HCIP-Datacom H12-821 题库 (31)

&#x1f423;博客最下方微信公众号回复题库,领取题库和教学资源 &#x1f424;诚挚欢迎IT交流有兴趣的公众号回复交流群 &#x1f998;公众号会持续更新网络小知识&#x1f63c; 1. 默认情况下&#xff0c;IS-IS Level-1-2 路由器会将 Level-2 区域的明细路由信息发布到Lev…

YOLOv8 基于NCNN的安卓部署

YOLOv8 NCNN安卓部署 前两节我们依次介绍了基于YOLOv8的剪枝和蒸馏 本节将上一节得到的蒸馏模型导出NCNN&#xff0c;并部署到安卓。 NCNN 导出 YOLOv8项目中提供了NCNN导出的接口&#xff0c;但是这个模型放到ncnn-android-yolov8项目中你会发现更换模型后app会闪退。原因…

【STM32 Blue Pill编程实例】-OLED显示HC-SR04超声波测距结果

OLED显示HC-SR04超声波测距结果 文章目录 OLED显示HC-SR04超声波测距结果1、HC-SR04超声波传感器介绍2、硬件准备及接线模块配置3.1 定时器配置3.2 OLED I2C接口配置3.3 HC-SR04引脚配置4、代码实现在本文中,我们将 HC-SR04 超声波传感器与 STM32 Blue Pill 开发板结合使用,并…

Python-函数与数据容器超详解

1.函数的定义 函数是&#xff1a;组织好的、可重复使用的、用来实现特定功能的代码段。它的优点&#xff1a;将功能封装在函数内&#xff0c;可供随时随地重复利用&#xff0c;提高代码的复用性&#xff0c;减少重复代码&#xff0c;提高开发效率 Python函数的定义方式&#…

Perforce演讲回顾(上):从UE项目Project Titan,看Helix Core在大型游戏开发中的版本控制与集成使用策略

日前&#xff0c;Perforce携手合作伙伴龙智一同亮相Unreal Fest 2024上海站&#xff0c;分享Helix Core版本控制系统及其协作套件的强大功能与最新动态&#xff0c;助力游戏创意产业加速前行。 Perforce解决方案工程师Kory Luo在活动主会场&#xff0c;带来《Perforce Helix C…