国产Sora真的来了!免费体验!实测快手可灵Kling文生视频大模型(附申请方法)

news2024/11/18 12:44:50

文章首发于公众号:X小鹿AI副业
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~

自从年初(2024.2) OpenAI 发布 Sora 模型到现在,已经过去将近 4 个月的时间了。至今依然没能体验上 Sora(除了极少部分人)。

真是吊足了人们胃口!

而就在最近,国内第一个可以和 Sora 相媲美的 AI 视频生成模型发布了——它就是快手的可灵(Kling)

图片

相比之下,快手可就「实在」多了。

快手可灵(Kling)视频生成大模型上线后,立马就开放了内测。

在快影 APP 的「AI创作」下面,可以看到「AI生视频」的模块,点击就可以申请加入内测了。大概在申请后半天的时间就通过了。

图片

快手可灵生成视频的方法也非常简单:

输入想生成的画面的文字描述,点「生成视频」,就可以等待生成了。

而且可以同时生成多个视频,减少等待时间。

图片

下面这些,都是使用快手可灵(Kling)生成的:

大海.gif

斗转星移.gif

海底世界.gif

快手可灵有哪些突出表现

快手可灵(Kling)视频生成大模型,采用和 Sora 相似的技术路线,并结合了多项自研技术。

下面是可灵(Kling)官网对该视频生成大模型特点的描述。

更多特性的示例视频可以移步官网查看。

1、大幅度的合理运动

可灵(Kling)利用 3D 时空联合注意力机制,可以更精确地建模复杂的时空运动。比如像下面这个「一位男子在草原上骑马的视频」。

可以看到运动幅度是非常大的。

骑马.gif

2、长达 2 分钟的视频生成

得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵(Kling)大模型能够生成长达 2 分钟的视频,且帧率达到 30 fps

在官网给出的示例中,可以看到最长生成了一个长达 2 分多钟的视频,来模拟人坐在列车里看车窗外风景的场景。

不过目前在快影 APP 中,生成的视频是 5s。

3、模拟物理世界特性

基于自主研发的模型架构和 Scaling Law,可灵(Kling)拥有强大的建模能力,能够模拟现实世界的物理特性,生成符合物理规律的视频内容。

比如下面这个,往杯子里到啤酒的画面:

啤酒.gif

4、强大的概念组合能力

可灵(Kling)通过对文本-视频语义的深刻理解,结合 Diffusion Transformer 架构,可生成真实世界中不会出现的的场景。

比如下面,猫咪开车上路了。这在现实世界中基本是不可能出现的。

猫咪开车.gif

5、电影级的画面生成

借助自主研发的 3D VAE,可灵(Kling)可以生成 1080p 分辨率的电影级视频,宏大的场景和特写镜头都可以生动地表现出来。

6、支持自由的输出视频宽高比

可灵(Kling)采用了可变分辨率的训练策略,支持自由的输出视频宽高比。

不过在快影 APP 中暂不支持视频比例的设定,目前生成的视频都是 16:9 的。

不足

1、对于语义的理解,还不是特别好

目前对于语义的理解,还不是特别好。

比如想生成「一只大熊猫在开心地吃粽子」,快手的可灵貌似并不知道粽子长什么样子,生成了几个大水饺。

熊猫吃粽子.gif

再比如,想生成几只猫咪赛龙舟的场景,它要么完全忽略了猫咪的存在:

图片

要么直接把龙舟开到了地面上:

图片

都没有表现得很完美。

2、真实性

虽然在大部分场景下,生成的视频还是非常真实的,尤其像一些风景类的视频,完全辨不出真假。

但也不得不承认,有些视频确实还是可以看出是 AI 生成的。

比如下面面视频中人物面部,以及马蹄的部分:

骑马-2.gif

也是需要不断抽卡,来获得更好的视频效果。但这个运动幅度,快手的可灵相对之前用过的 AI 视频工具来说,已经算是不错的了。

结束语

快手可灵(Kling)作为目前国内唯一可以和 Sora 媲美且还真正可用的视频生成模型,整体来说,各方面都表现出了非常不错的实力。

毕竟可灵刚刚上线不久,各方面都还在不断完善,相信后续一定会更加出色。一起期待一下~


之前也介绍过其他的一些 AI 视频生成工具。更多 AI 视频相关内容,可以在「AI 视频」专栏查看。目前已更新了 10 余种 AI 视频工具教程。持续更新。

觉得文章有帮助,请帮忙点赞收藏关注一下呦~

我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也是一名 AIGC 爱好者,欢迎一起交流~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1811926.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于STM32开发的智能鱼缸控制系统

目录 引言环境准备智能鱼缸控制系统基础代码实现:实现智能鱼缸控制系统 4.1 水温传感器数据读取4.2 水泵与加热器控制4.3 水位传感器数据读取4.4 用户界面与数据可视化应用场景:水族箱管理与优化问题解决方案与优化收尾与总结 1. 引言 智能鱼缸控制系…

iOS18首个Beta测试版发布,功能介绍附beta升级办法!

今天凌晨,一年一度的苹果WWDC24开发者大会正式开幕,发布了iOS 18、iPadOS 18、macOS Sequoia、watch OS11等新系统。 大会结束后,苹果火速发布了首个iOS 18开发者Beta版,目前有开发者资格的用户已经可以下载体验尝鲜了。 本次更新…

SpringSecurity入门(二)

8、获取用户认证信息 三种策略模式,调整通过修改VM options // 如果没有设置自定义的策略,就采用MODE_THREADLOCAL模式 public static final String MODE_THREADLOCAL "MODE_THREADLOCAL"; // 采用InheritableThreadLocal,它是Th…

VSFTP本地用户访问-设置

1、本地用户基本配置档设置如下 vim /etc/vsftpd/vstfpd.conf local_enableYES -------允许本地用户登陆 write_enableYES -----允许执行FTP命令,如果禁用,将不能进行上传、下载、删除、重命名等操作 local_umask022 ---------本地用户上传umask值…

公用nacos,实现只调用本机相应服务,不出现负载均衡到别人机器上

当我们有两个研发同时在调试一个微服务模块时,你和对方本地都会启动服务,这就导致在nacos会同时注册两个实例。默认情况下请求这个服务,具体处理请求的程序会在你和对方之间来回轮询,即一下你的服务一下对方的服务。 其结果就导…

重学java 66.IO流 转换流

且敬我疯狂,生命中不败的篇章 —— 24.6.11 一、字符编码 计算机中储存的信息都是用二进制数表示的,而我们在屏幕上看到的数字、英文、标点符号、汉字等字符是二进制数转换之后的结果。[按照某种规则,将字符存储到计算机中,称为编…

10_3、C++继承与派生:派生类成员访问

派生类成员访问 作用域分辨符虚基类概念及用法虚基类派生类的构造函数 赋值兼容规则 作用域分辨符 如果派生类中存在和基类中完全相同的函数,将发生同名覆盖。如果在派生类中存在一个和基类某数据成员同名的数据成员,或者和基类某成员函数的名称和参数表…

采用PHP语言(医院安全不良事件上报系统源码)医院不良事件 各类事件分析、分类、处理流程

医疗安全不容忽视! 医疗安全(不良)事件是指在临床诊疗活动中以及医院运行过程中,任何可能影响患者的诊疗结果、增加患者的痛苦和负担并可能引发医疗纠纷或医疗事故,以及影响医疗工作的正常运行和医务人员人身安全的因…

我给KTV服务生讲解防抖,他竟然听懂了

端午节三天假期,的最后一天,我和朋友闲来无事,想着去唱会儿歌吧,好久不唱了,于是吃了午饭,石景山就近找了一家KTV,我们团好了卷就过去了。 装修还算不错,很快找到服务生&#xff0c…

【创建SpringBoot项目常见问题】保姆级教程(踩过的坑)

文章目录 特别提醒无效目标发行版 18类文件具有错误的版本 61.0, 应为 52.0Spring 项目运行,控制台乱码Spring 配置文件乱码引入插件,idea找不到 在创建第一个SpringBoot项目时,我出现了很多的配置错误,接下来与大家分享一下解决方法。希望我…

讯方技术与华为终端签署鸿蒙合作协议,将为企业助培百万鸿蒙人才

1月18日,鸿蒙生态千帆启航仪式在深圳举行,华为宣布HarmonyOS NEXT鸿蒙星河版开发者预览面向开发者开放申请,这意味着鸿蒙生态进入第二阶段,将加速千行百业的应用鸿蒙化。讯方技术总裁刘国锋、副总经理刘铭皓应邀出席启航仪式&…

基于esp8266_点灯blinker_智能家居

文章目录 一 实现思路1 项目简介2 项目构成3 代码实现4 外壳部分 二 效果展示UI图片 一 实现思路 摘要:esp8266,mixly,点灯blinker,物联网,智能家居,3donecut 1 项目简介 1 项目效果 通过手机blinker app…

17- Redis 中的 quicklist 数据结构

在 Redis 3.0 之前,List 对象的底层数据结构是双向链表或者压缩列表,然后在 Redis 3.2 的时候,List 对象的底层改由 quicklist 数据结构实现。 其实 quicklist 就是【双向链表 压缩列表】组合,因为一个 quicklist 就是一个链表&…

解锁 DevOps 精通:成功的综合指南

在动态的软件开发领域,要掌握 DevOps,需要对其核心原则有细致的了解,并采取战略性实施方法。DevOps 是一种协作方法,它将软件开发 (Dev) 和 IT 运营 (Ops) 结合起来,以自动化和简化软件交付流程。它旨在缩短开发周期、…

双模蓝牙芯片TD5165A功能介绍—拓达半导体

拓达芯片TD5165A是一颗支持U盘&TF卡的双模蓝牙芯片,此颗芯片的亮点在于同时支持音频蓝牙与BLE数传,芯片在支持蓝牙无损音乐播放的同时,还支持 APP和小程序,通过BLE通道对芯片进行控制,同时也支持通过蓝牙串口透传数…

抖动的评估(TJ 和 TIE 的关系)

TIE:时间间隔误差(Time Interval Error,简称TIE)抖动,即在很长的一串波形中,每次边缘的位置相对理想clk 的抖动。 TJBER :TJ(Total Jitter)总体抖动,为某误码率(Bit Error Ratio&am…

网络流常用示意图及基本概念

【网络流简介】 ● 网络流基本概念网络:网络是一个有向有权图,包含一个源点和一个汇点,没有反平行边。网络流:是定义在网络边集上的一个非负函数,表示边上的流量。网络最大流:在满足容量约束和流量守恒的前…

..\USER\stm32f10x.h(298): error: #67: expected a “}“

原keil4的示例工程在用keil5打开之后出现报错: ..\USER\stm32f10x.h(298): error: #67: expected a "}" 在去掉手动添加的一个宏定义STM32F10X_HD后即可正常编译,因为KEIL5已经自动添加了

VR 大厦巡检机器人:开启智能化巡检新时代

在现代城市的高楼大厦中,保障建筑物的安全和功能正常运作是至关重要的。随着建筑结构日益复杂,隐蔽角落和繁杂管道线路的存在使得传统人工巡检面临诸多挑战和局限。电路老化、狭窄通道、拐角等潜在安全隐患,往往难以通过人工巡检完全覆盖&…

【STM32HAL库学习】定时器功能、时钟以及各种模式理解

一、文章目的 记录自己从学习了定时器理论->代码实现使用定时->查询数据手册,加深了对定时器的理解以及该过程遇到了的一些不清楚的知识。 上图为参考手册里通用定时器框图,关于定时器各种情况的工作都在上面了,在理论学习和实际应用后…