字节、快手、Vidu“打野”升级,AI视频小步快跑

news2024/11/14 3:40:27

文|白    鸽

编|王一粟

继9月份版本更新之后,光锥智能从生数科技联合创始人兼CEO唐家渝朋友圈获悉,Vidu大模型将于本周再次进行版本升级,Vidu-1.5版本即将上线。

此版本更新方向仍是重点延伸大模型的泛化能力和主体一致性问题。上一版本重点是单一主体的一致性,而最新版本则能够理解和整合人物、物体、环境等多个概念,遵循用户指令30秒内生成多个主体融合的相关视频结果,率先实现视频创作中的多主体一致性生成。

除Vidu外,自今年9月份以来,据不完全统计,包括字节旗下即梦AI、快手可灵AI、Runway、智谱清影、爱诗科技PixVerse、Pika等主流的AI视频生成平台,都已经进行了版本更新。

当前,在爆火的AI视频生成赛道中,大模型创企、互联网大厂等纷纷入局,而在经过前期各家密集进行产品发布阶段后,如今已进入产品迭代升级比拼阶段。

通过各家版本更新的内容,不难发现,AI视频生成大模型能力迭代的大方向,仍是生成视频的时长、画面的稳定性、连续性和主体前后的一致性上。

但与此同时,各个玩家又在实际功能应用中,开始出现“分野”,各有侧重,部分中小玩家也开始找到自己的细分市场。

比如Runway最新版本中更新了可将真人面部表情精确复刻给AI角色的Act-One,以能够实现3D化的AI摄像头控件。PixVerse则上线了各种万圣节特效、毒液特效等。

对此轮各AI视频生成平台的更新,星贤文化创始人、AI原创玄幻IP《山海奇镜》制作人陈坤认为:“最大的更新应该是Act-One这种表情迁移,提供了人物表演的基础可能性。”而对于人物主体的一致性和稳定性,“有进步,但并没有代际型进步。”

在AI视频创作者尾鳍Vicky看来,相比上半年初代产品,最新更新的AI视频平台,除了在底层模型能力上的迭代之外,在功能上也进行了更新,比如首尾针、画质和帧率的补足、配音等功能,“这些功能的完善,实际上是比上半年更全面。”

如果说2024上半年,是AI视频生成赛道的军备竞赛,那么下半年则是进入小步快跑的版本更新周期。

而在此阶段,字节和快手的交锋仍在激烈进行中,中小厂商开始找到自己独特赛道,而一些企业专注走海外市场,也实现了“国内开花,墙外香”的效果。

无疑,这一阶段的厮杀,看似温和,但却实质性的影响平台自身的定位和未来发展的方向,以及后续用户群体和数量规模的可持续增长。

字节狂追,快手抢跑

“即梦有些掉队。”这是AI视频生成平台用户给出的客观评价。

作为去年第一批的AI视频生成平台,以及字节旗下的产品,即梦AI的视频生成效果一直备受使用者诟病,处于被Runway、Pika等同一批玩家吊打的状态。

今年6月,字节在短视频领域的直接竞争对手——快手,正式在官网上线了“可灵”视频生成大模型,并火速出圈。同时,越来越多AI视频生成平台如雨后春笋般推出,AI视频生成赛道彻底爆火。

在强大竞争压力之下,作为国内AI产品第一梯队,补上视频生成这一块短板,已成为字节跳动面临的当务之急,而其奋起直追的速度也超乎想象。

9月24日,2024火山引擎AI创新巡展深圳举办,原抖音艺术负责人陈欣然以即梦AI及剪映市场和运营负责人的身份亮相,并宣布即梦AI已经接入了豆包最新的视频生成模型。

同期,字节跳动发布豆包模型家族的两款视频生成模型Seaweed和Pixeldance,并通过即梦 AI、火山引擎分别面向创作者和企业客户小范围邀测。

11月8日,字节跳动旗下的AI内容平台即梦AI宣布,由字节跳动自研的视频生成模型Seaweed面向平台用户正式开放。

据字节跳动方面介绍,本次开放使用的豆包视频生成模型Seaweed是该款模型的标准版,仅需60秒即能生成时长5秒的高质量AI视频,领先国内业界3至5分钟的所需生成时间。

即梦AI还透露,近期Seaweed和Pixeldance两款视频生成模型的Pro版也将开放使用。Pro 版模型能实现自然连贯的多拍动作与多主体复杂交互,攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,适配电影、电视、电脑、手机等各种设备的比例。

字节抖音和快手,作为国内短视频平台的领军者,双方的竞争已经从短视频、电商转移至AI领域,客观来说,抖音在各方面都压快手一头。但唯独在AI领域,快手给出了漂亮的反击。

自6月一鸣惊人之后,快手可灵其实已经有数次的小版本的迭代。

但在底层大模型能力上,今年9月20日,快手发布可灵1.5版本,接入新一代模型,实现了画质和动态质量都大幅提升,原有的模型也加入了新功能——运动笔刷,生成效果可控性增强。

“可灵1.5很强,可以说是所有模型里面最真实的,吊打Runway,基本上已经克服了之前人物变形的问题。”AIGC创业者洋芋酱AIgen(艺名)如此对光锥智能说道。

在实际生成的视频效果中,对比可灵和Runway,可以看到,同一个提示词,两者在实际人物主体的稳定性上效果都很强,但可灵生成出的视频效果能够自动解锁面部表情。

“Runway其实也能自主生成面部表情,但效果非常诡异。”洋芋酱AIgen如此说道,不过,可灵AI和Runway这种能力是随机的,并不固定。

这其实也能够看到,可灵AI和Runway在实际生成效果上更胜一筹,而在对提示词的理解上,可灵AI也确实走在前列,但未来也仍需要不断迭代升级,才能将这一能力固化下来。

不过,此次即梦上线最新视频生成大模型之后,尾鳍Vicky则认为其在模型能力和UI设计上,与可灵差距不大。同时,在内测即梦平台Pro版模型的时候,其能够轻松控制画面的运动幅度和动作。

作为国内头部的短视频平台,快手和字节,在AI视频生成赛道的布局,终局目的是要吸引和留住用户的注意力,而这就需要不断生产出新颖、有质量、有创意的内容。

基于此,AI短剧,也成为字节即梦和快手可灵竞争的焦点之一。

今年7月份,由“可灵AI”创作出的AI短剧《山海奇镜之劈波斩浪》引发广泛关注,该短剧成为国内首部AIGC原创奇幻微短剧。

9月,快手星芒短剧联合“可灵AI”推出了“星有灵犀-AI短剧创作大赛”。据悉,大赛以流量奖励、荣誉奖励、内容签约等多项举措激励更多人加入AI短剧创作。

字节同样不甘示弱,即梦AI在联手博纳影业发布首部AIGC生成科幻短剧《三星堆:未来启示录》的同时,也在联手抖音平台多位“超级创作者”实现共创,邀请平台上有高质量粉丝及高影响力的达人,共同加入“超级创作者联盟”计划,希望借此打造国内最大的虚拟创作社群。

但现阶段不管是抖音,还是快手,其视频平台的影视创作者创作的内容,“很难破圈儿。”尾鳍Vicky如此说道,“因为现在整个市场尚未形成,C端用户并不知道用它来干嘛。头部会有一些商业化需求,但需求并不多,整体并不稳定。”

毕竟,现阶段全球的专业创作者还比较少,且AI视频生成大模型技术尚处于早期阶段。

因此,作为头部视频平台,字节和快手之间的竞争也日趋激烈,而除了底层AI技术、产品之争外,更重要的则在于谁能够率先探索出技术赋能内容之路。毕竟,平台如果能够聚集更多具有创新意识的内容创作者,就能够打造出一个更受用户关注和喜爱的社区生态。

当然,除了字节和快手之外,在AI视频生成赛道中的其他玩家,也开始出现“分野”,部分中小厂商,也开始探索并走出了一条属于自己的差异化竞争之路。

细分市场崛起,找准自身定位是王道

在抖音、快手等短视频平台上,一些创作者创作的内容可能破圈儿难度比较大,但一些包含鬼畜特效的视频,却异常的火爆,比如由AI生成的何炅和黄磊突然打架的视频。

对于AI视频生成赛道的玩家来说,如果字节和快手,是全方位的技术和内容生态体系的竞争,而其他中小玩家更多的则是聚焦在细分赛道,找准自身平台和产品定位,则成为生存发展的基础。

10月底,Runway的CEO在公开信中明确表示, Runway并不是一家AI公司,而是一家媒体和娱乐公司,“我认为 AI 公司的时代已经结束了。”

基于此,在各大公司争相卷AI视频生成长度、逼真度、流畅度的时候,Runway显然已经在AI视频赛道中走出了自己的特色——做专门服务于艺术、媒体和娱乐的AI。

从Runway的实际视频生成效果来看,其在人物稳定性、一致性上的效果可以说走在前列。而除了基础技术能力外,在最新的版本更新中,Runway上线的2个新功能虽小,但都将为动画师、游戏开发者和电影制作人提供非常大的便利、节约巨大的成本。

Runway可以说是最受影视从业者欢迎的产品之一,除技术实力之外,更重要的还在于性价比。

“ Runway实在是太香了,我们用可灵都是省着用,但是Runway是无限次数的,每天抽个几百次都无所谓。”洋芋酱AIgen表示,“AI视频的随机性还是很强的,如果按次收费,普通创作者可能很难承受起这个成本。”

反观可灵,如果用1000元购买积分,能够购买15000可灵值,每次用35可灵值,1000元只能生成428次。对于真正的创业者来说,基本不够用,“按照我在Runway每天要生成两百多次视频的频率来看,可灵1000元购买的积分基本2天就烧完了。”洋芋酱AIgen如此说道。

在光锥智能上一篇《爆“卷”的AI视频,大厂向左,创企向右》文章中也提到过,对于现阶段各平台采用的会员制收费方式,对于不能够商业化闭环的创业者而言,后续的付费率和付费意愿都不会很高。而现如今看来,对于即使能够实现商业化闭环的创业者而言,性价比也是影响其使用产品的关键因素。

而除了Runway之外,Pika和Pixverse也找到了自己的赛道。从他们最新更新的版本中可以看到,这两家重点是训练了一些用户能够直接使用的特效效果,“虽然比喻可能会不太恰当,但是有点接近之前抖音做的那种贴纸。”洋芋酱AIgen说道。

比如在10月底万圣节期间,PixVerse V3版本新增了不少万圣节主题的特效,包括僵尸模式、巫师帽和怪物入侵等主题效果,还有类似于Pika很火的AI捏捏特效,视频延长功能,用户可以为已有视频额外增加5-8秒的内容,并能精确控制新增片段的内容走向。

而随着最近《毒液:最后一舞》电影的上映,PixVerse基于最新视频模型PixVerse V3推出了新特效“我们是毒液”的视频效果,能够一键将图片生成酷炫毒液动画。

当前,在社交平台上,这种鬼畜特效非常受用户欢迎。此前Pika在1.5版本中,就推出了AI捏捏的特效,一经推出,就备受用户喜爱,其也靠着这一波特效,实现了弯道超车。而和Pika差不多时间开始增长的海螺AI,其实也是靠人物表演和meme表情包直接拉爆了海外舆论,弯道超车。

Pika的AI捏捏特效

事实上,尽管海螺AI推出时间较晚,但行业从业者对海螺AI的评价并不低。“海螺AI在人物动作上的表现很厉害,最近何炅和黄磊打架的AI生成视频,就是通过海螺AI生成。”洋芋酱AIgen说道。

不过,海螺AI更重要的是实现了“国内开花,墙外香”的效果。作为国内AI公司MiniMax在海外推出的AI视频生成平台,其一经推出,搜索热度持续攀升。

据“AI产品榜”统计,海螺AI网页版9月访问量大涨860%,登顶9月全球及国内增速榜首。海外用户纷纷在社交平台分享使用体验,普遍认为海螺AI是目前市面上最出色的AI视频生成工具之一。

而凭借产品在海外市场的爆火,MiniMax在商业化能力上,已经走在大模型六小虎的前列。

相比较来说,像Vidu和智谱清影这一类的平台,在主体一致性和人物稳定性中,视频生成时长等方向上正在不断进化,但尚未形成专属于自己风格的赛道和独特的竞争优势。

尽管AI视频生成技术正不断进化,并衍生出具有特色的细分赛道。但信达证券研报也显示,AI视频生成技术在人物一致性、所需时长、画面质量等方面仍需进一步提升,以满足商业化水准。

同时,目前主流AI视频工具还处在视频生成竞争的阶段,且大多数为单一功能产品,仍需要多种不同的视频创作工具串联使用才能达到直接输出可商业化视频的效果。

未来,AI视频生成大模型平台,仍需要不断迭代进化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2239882.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

matlab建模入门指导

本文以水池中鸡蛋温度随时间的变化为切入点,对其进行数学建模并进行MATLAB求解,以更为通俗地进行数学建模问题入门指导。 一、问题简述 一个煮熟的鸡蛋有98摄氏度,将它放在18摄氏度的水池中,五分钟后鸡蛋的温度为38摄氏度&#x…

React Query在现代前端开发中的应用

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 React Query在现代前端开发中的应用 React Query在现代前端开发中的应用 React Query在现代前端开发中的应用 引言 React Query …

汇总常用的114款AI视频创作工具,堪称运营神器,收藏备用!

随着AI工具的使用起来起广泛,国内各个互联网大厂都开始在圈内出围。过去我们写文案、做视频、拍视频、剪辑视频、画漫画、处理图片等,都需要手工一点一点地精雕细琢。现在通过AI工具,零基础也能做出很多精致的作品。 前面我在上个月的28号分…

在vue中,完成@wangeditor/editor组件的大数据量加载,解决卡顿

背景 简单说一下需求,一个页面中只存在一个Editor组件,但是需要通过选择不同类型展示不同的content的数据,不过直接通过提供的Editor组件加载的时候,在数据量大(测试数据226KB)的情况下, 切换类…

通义千问API调用测试 (colab-python,vue)

文章目录 代码(来自官网)colab中用python测试Qwen2.5在官网上查看并确定过期时间这里看到我的免费额度到25年5月在同一个页面,点击API示例 前端调用直接在前端调用的优缺点以vue为例(代码是基于官网node.js的代码转换而来&#xf…

使用 Elasticsearch 构建食谱搜索(一)

作者:来自 Elastic Andre Luiz 了解如何使用 Elasticsearch 构建基于语义搜索的食谱搜索。 简介 许多电子商务网站都希望增强其食谱搜索体验。正确使用语义搜索可以让客户根据更自然的查询(例如 “something for Valentines Day - 情人节的礼物” 或 “…

微服务各组件整合

nacos 第一步&#xff0c;引入依赖 <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId></dependency> 第二步&#xff0c;增加配置 spring:application:name: …

【大数据学习 | HBASE高级】hive操作hbase

一般在查询hbase的数据的时候我们可以直接使用hbase的命令行或者是api进行查询就行了&#xff0c;但是在日常的计算过程中我们一般都不是为了查询&#xff0c;都是在查询的基础上进行二次计算&#xff0c;所以使用hbase的命令是没有办法进行数据计算的&#xff0c;并且对于hbas…

modbus协议 Mthings模拟器使用

进制转换 HEX 16进制 (0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F表示0-15) dec 10进制 n(16进制) -> 10 abcd.efg(n) d*n^0 c*n^1 b*n^2 a*n^3 e*n^-1 f*n^-2 g*n^-3&#xff08;10&#xff09; 10 -> n(16进制) Modbus基础概念 高位为NUM_H&…

列表(list)

一、前言 本次博客主要讲解 list 容器的基本操作、常用接口做一个系统的整理&#xff0c;结合具体案例熟悉自定义内部排序方法的使用。如有任何错误&#xff0c;欢迎在评论区指出&#xff0c;我会积极改正。 二、什么是list list是C的一个序列容器&#xff0c;插入和删除元素…

Sam Altman:年底将有重磅更新,但不是GPT-5!

大家好&#xff0c;我是木易&#xff0c;一个持续关注AI领域的互联网技术产品经理&#xff0c;国内Top2本科&#xff0c;美国Top10 CS研究生&#xff0c;MBA。我坚信AI是普通人变强的“外挂”&#xff0c;专注于分享AI全维度知识&#xff0c;包括但不限于AI科普&#xff0c;AI工…

zabbix监控端界面时间与服务器时间不对应

1. 修改系统时间 # tzselect Please select a continent, ocean, "coord", or "TZ".1) Africa2) Americas3) Antarctica4) Asia5) Atlantic Ocean6) Australia7) Europe8) Indian Ocean9) Pacific Ocean 10) coord - I want to use geographical coordina…

大数据新视界 -- 大数据大厂之 Impala 性能提升:高级执行计划优化实战案例(下)(18/30)

&#x1f496;&#x1f496;&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎你们来到 青云交的博客&#xff01;能与你们在此邂逅&#xff0c;我满心欢喜&#xff0c;深感无比荣幸。在这个瞬息万变的时代&#xff0c;我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

P2356 弹珠游戏

铁子们好呀&#xff0c;博主好久没更新了&#xff0c;今天给大家更新一道编程题&#xff01;&#xff01;&#xff01; 题目链接如下&#xff1a;P2356 弹珠游戏 好&#xff0c;接下来&#xff0c;我将从三个方面讲解这道例题。分别是 题目解析算法原理代码实现 文章目录 1.题…

项目管理十大知识领域:如何提升项目执行力

项目管理是一门复杂的学科&#xff0c;涉及到多个领域的知识与技能。有效的项目管理不仅能够确保项目按时、按质、按预算完成&#xff0c;还能提升团队协作、提高效率&#xff0c;甚至在面对风险和变化时保持项目的稳定性和成功率。项目管理十大知识领域是构建成功项目的基石&a…

【miniMax开放平台-注册安全分析报告-无验证方式导致安全隐患】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 暴力破解密码&#xff0c;造成用户信息泄露短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造成亏损无底洞…

HBuilder使用虚拟机

按文档的连接一直不成功 没找到Simulator&#xff0c;原来是因为我电脑之前没安装过虚拟机版本 安装模拟器Simulator | uni-app官网 找到settings,左下角安装需要的对应版本的虚拟机就好了&#xff0c;然后重启hb

vcenter service基本异常处理

服务&#xff1a;vcenter service 版本&#xff1a; 7.0.3 问题描述&#xff1a;无法访问vcenter ui 排障思路&#xff1a; 1. 登入vcenter所在服务器执行基础排查&#xff1a;内存、cpu、磁盘、网络等&#xff0c;发现磁盘日志目录已经爆满&#xff0c;删除180天前的日志恢…

WordPress中最佳的无障碍插件:入门级指南

在今天的互联网时代&#xff0c;网站对所有用户都友好和可访问是非常重要的。对普通用户&#xff0c;特别是对有视力、听力或其他障碍的用户&#xff0c;为他们提供无障碍的体验显得尤为重要。使用WordPress建立网站的用户&#xff0c;有一些非常好的插件可以帮助你轻松实现这一…

科技前沿:汽车智能玻璃,开启透明显示新纪元

根据QYResearch调研团队最新发布的《全球汽车智能玻璃市场报告2023-2029》显示&#xff0c;预计到2029年&#xff0c;全球汽车智能玻璃市场的规模将攀升至0.5亿美元&#xff0c;且在未来几年内&#xff0c;其年复合增长率&#xff08;CAGR&#xff09;将达到5.5%。 以下图表展…