3个月9次迭代,快手可灵AI面向全球发布1.5模型

news2024/9/20 14:46:12

9月19日,可灵AI迎来重磅升级,视频生成新增可灵1.5模型,在画质质量、动态质量、美学表现、运动合理性以及语义理解等方面均有显著提升。与此同时,可灵AI还引入了全新的“运动笔刷”功能,进一步提升视频生成的精准控制能力。

首先是基座模型再次升级,新增可灵1.5模型,支持在高品质模式下,直出1080p高清视频,挑战大屏清晰度与质感。与可灵 1.0 模型相比,1.5模型在画面质量、动态质量、文本响应度等方面有显著效果提升,其内部评测整体效果提升95%。

此前,可灵1.0模型在高品质模式可生成720p视频,本次升级后,1.5模型高品质模式可直接生成1080p高清视频。通过输入提示词“女孩看着车窗”,对比左右两个版本视频生成的效果,可以发现,可灵1.5新模型的画面质量提升显著:画面清晰度有直观可感,画面右侧的女孩面部细节更清晰丰富,车窗的水雾、整体光影表现等也都更加出色。同时,新模型下画面整体构图也进一步优化,画面更具美感。

在动态质量方面,新模型也有显著提升。例如,对比可灵AI此前火爆出圈的吃面案例,输入提示词“小男孩吃面”,右侧1.5模型生成的视频中,面条从被夹起到入口这一过程中,在弹性、垂坠感等方面有非常真实的物理表现,同时小男孩右手握住筷子和吃面时的咀嚼动作,也都较左侧1.0模型更加自然流畅,整体运动合理性大大增强。

在图生视频方面,可灵全新的1.5模型可以响应更复杂的文本描述要求。例如通过一张没有人物的食物照片和提示词“镜头拉远,一个小男孩走到桌前拿起勺子开始吃饭”。在生成的视频中,随着镜头的微微晃动,一个勺子“入场”,然后画面聚焦到握着勺子的小男孩,看他将一勺饭菜送到嘴里,勺子在碗里拨开饭粒的细节也都被细致地呈现了出来,显示出强大的图生视频理解能力。

本次升级,可灵AI还带来了强大的“运动笔刷”功能,大幅提升了图生视频时创作者对运动效果的控制能力。“运动笔刷”功能支持为图片中的元素(人或物体等)指定运动轨迹,用户只需将图片中需要控制运动方向的部分勾勒出来,然后画一个示意运动方向箭头,就可实现精准运动控制。该功能支持上传图片后最多为图中的 6 个元素(人或物体等)指定运动轨迹。此外,还可以为某些元素额外指定静止区域,让视频内容有更好的运动控制及运动表现。

目前,横屏(16:9、4:3)、竖屏(9:16、3:4)、方屏(1:1)等多种尺寸格式的图片,都支持使用「运动笔刷」生成视频,生成视频时长为5秒。大量用户和媒体的评测显示,可灵AI的运动笔刷功能,在易用性、效果表现等方面均为业内领先。

实际上,可灵AI近期还进行了一系列其他功能升级,诸如支持一次性生成最多 4 条视频,方便创作者快速选取到最优生成结果;“图生视频”功能新增支持 10 秒时长并在标准模式下支持增加尾帧;“AI图片”功能支持“画质增强”。此外,官方还上线了使用指南,帮助用户更好地掌控可灵AI。

据「TMT星球」了解,自今年6月发布以来,这已经是可灵AI累计第9次迭代升级。本次升级也将同步面向全球展开,今年7月,可灵AI宣布国际版1.0正式上线,正式面向全球用户开放,随后又推出了全球会员体系。

目前,可灵AI已经累积了大量的国内外用户,快手高级副总裁、主站业务与社区科学线负责人盖坤此前在快手投资者日上披露,已有累计超260万人使用过可灵AI,并累计生成超2700万个视频、5300万张图片。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2149172.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电能计量,三相电基础

1. 三相交流电基础 三相交流电由三个频率相同、振幅相等、相位依次互相差120的交流电势组成。这样组织的三相电有一个特点,就是任何一个时刻,三相电的电压之和都等于零。这个特性使得本来需要六根导线来传输三组电压的减少到了三根导线,这样…

访问者模式:将算法与对象结构分离的设计模式

在软件开发中,我们常常需要对对象结构中的各个元素进行不同的操作。比如在编译器中,我们可能需要对抽象语法树(AST)的各个节点进行语法检查、代码生成、优化等操作。如果将这些操作直接嵌入到节点类中,会导致类的职责过…

一、桥式整流电路

桥式整流电路 1、二极管的单向导电性: 伏安特性曲线: 理想开关模型和恒压降模型 2、桥式整流电流流向过程 输入输出波形: 3、计算:Vo,lo,二极管反向电压。 学习心得

数字病理图像处理:分割、合成与数据增强研究|顶刊精析·24-09-20

小罗碎碎念 今日精析:Medical Image Analysis 这篇文章介绍了一种结合了先进分割模型和生成对抗网络的病理切片图像分析流程,用于提高癌症诊断的准确性和效率。 作者角色姓名单位名称(中文)第一作者Muhammad Jehanzaib博阿齐奇大学…

安卓13修改设置设备型号和设备名称分析与更改-android13设置设备型号和设备名称更改

总纲 android13 rom 开发总纲说明 文章目录 1.前言2.问题分析3.代码分析4.代码修改5.编译6.彩蛋1.前言 用户要定制一些系统显示的设备型号和设备名称,这就需要我们分析设置里面的相关信息来找到对应的位置进行修改了。 2.问题分析 像这种信息要么是config.xml里面写死了,要…

一、编译原理(引论)

目录 【一】、引论 一、编译器 1、编译器 2、编译器与解释器 3、编译器结构 【一】、引论 一、编译器 1、编译器 (1)编译器:将人类易懂的 高级语言 翻译成 硬件可执行的目标机器语言 (2) 高级语言 ⚫ 直接面…

数据结构------二叉树简单介绍及实现

如果不是满二叉树或者完全二叉树,就要用链式存储 //搜索二叉树:左子树的所有值比根小,右子树的所有值比根大 // 实现查找,最多找高度次(类似二分法) //二分查找存在的问题&#xff1a…

【C++】——多态详解

目录 1、什么是多态? 2、多态的定义及实现 2.1多态的构成条件 ​2.2多态语法细节处理 2.3协变 2.4析构函数的重写 2.5C11 override 和 final关键字 2.6重载—重写—隐藏的对比分析 3、纯虚函数和抽象类 4、多态的原理分析 4.1多态是如何实现的 4.2虚函数…

TESSY创建需要高级桩的测试用例

需要打高级桩的情况如下: 1) 使用到桩函数的返回值; 2) 如果函数有形参,并且需要接口传参检测; 我们以tessy5.1 IDE为例,给大家展示编写一个需要高级桩的测试用例过程。 1、前期的准备工作 可以参考以下文章&…

mac命令行分卷压缩与合并

mac下默认可用命令行分卷压缩 例:一个900k的压缩包名为hello.zip,将其分割为每500K一个zip zip - hello.zip | split -b 500k -a 3 - file.zip.part_ 其他可自定义分割体积,如 -b 10m -b 10g k,m,g无视大小写 打包结果如图所示 分卷合并 #合成一个大文件 cat file.zip.part…

中电信翼康基于Apache Dolphinscheduler重构“星海·济世医疗数据中台”实践经验分享

文章作者:尚志忠 编辑整理:曾辉 行业背景 随着大数据、云计算、5G、人工智能等技术的快速发展,以及医疗信息化建设的不断深入,数据中台作为打通医疗数据融合壁垒、实现数据互通与共享、构建高效数据应用的关键信息平台&#xf…

U 盘显示需要格式化才能用?一针见血的修复方法在这里!速看!

在日常使用电脑的过程中,我们常常会遇到各种让人头疼的问题,其中之一就是当插入 U 盘时,突然弹出提示 “U 盘需要格式化才能使用”。这可让很多人慌了神,毕竟 U 盘里可能存储着重要的文件资料。别着急,下面就为大家介绍…

基于eBPF的procstat软件追踪程序垃圾回收(GC)事件

在性能敏感的应用程序中,偶尔遇到程序无故卡顿是开发者们常见的挑战之一。这种现象可能会表现为突然的延迟、系统响应时间增加、吞吐量的下降。这类问题的根源可能是编程语言的垃圾回收(Garbage Collection,GC)导致,尤…

超易用的AI训练页面!训练推理一体化助你快速炼制AI模型!

模型训练页面展示 AI绘画的热度也不是一天两天了。之前很火的粘土画风转换、AI漫画风格图像等等也都是由AI绘画来实现的。但要想训练一个模型需要很多繁琐的步骤,甚至很多小白都找不到训练模型的资源。 不过现在这个问题已经不需要担心了,厚德云推出了一…

vue websocket 使用

基于webSocket通信的库主要有 socket.io,SockJS 关于SockJS的使用 先安装 sockjs-client 和 stompjs npm install sockjs-client npm install stompjs import SockJS from sockjs-client; import Stomp from stompjs; export default { data () { …

一文看懂Elasticsearch的技术架构:高效、精准的搜索神器

一、概述 Elasticsearch 以其强大的全文本搜索功能而闻名。速度之所以这么快,因为 Elasticsearch 核心采用的是倒排索引;它功能之所以这么强大,是因为采用了可调相关度分数、高级查询 DSL 以及可提升搜索能力的诸多功能。 然而全文本搜索只是…

OpenCV特征检测(4)检测图像中的角点函数cornerHarris()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 Harris 角点检测器。 该函数在图像上运行 Harris 角点检测器。类似于 cornerMinEigenVal 和 cornerEigenValsAndVecs,对于每个像素 (…

LeetCode[中等] 54.螺旋矩阵

给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 思路:定义方向数组,按照顺时针顺序:右(0,1),下(1,0),左(0,-1),上(0,-1) 从矩阵的左上角开始遍历…

卷积参数量计算公式

1. 普通卷积(Standard Convolution) 普通卷积的参数量计算包括卷积核的权重和可能的偏置项。 2. 深度卷积(Depthwise Convolution) 深度卷积是逐通道的卷积操作,每个输入通道都有一个独立的卷积核。 3. 逐点卷积&…

骨传导耳机哪个牌子好?盘点口碑最好的5款骨传导耳机!

在快节奏的现代生活中,耳机成为了我们与外界沟通的重要桥梁,无论是在通勤路上、健身锻炼,还是在工作学习中,耳机都扮演着不可或缺的角色。而在众多耳机类型中,骨传导耳机以其独特的声音传导方式和健康舒适的佩戴体验&a…