CogVideo 实测,智谱「清影」AI视频生成,全民免费,连 API 都开放了!

news2024/9/20 17:46:56

不得不说,AI 视频生成界最近非常火热~

前有快手「可灵」开放内测,一下子带火了老照片修复,全网刷屏:

怕是你还没拿到内测资格,被称为 “国货之光” 的「可灵」就结束了免费无限量模式。每天只有66点的免费额度,对应 6 次 5 秒视频,也就够你尝个鲜~

就在昨天,国产大模型头部玩家智谱震撼出手,推出了自家的视频生成工具 -「清影」,底层是自家的视频生成大模型 CogVideo。

划重点:全民免费,不用排队,不限次数! 连 API 都开放了,开发者的福音。

生成速度怎么样?

据官方介绍,6s 的 1440x960 视频,只需 30s,这推理速度,杠杠的~

要知道,前天分享的阿里开源的视频生成模型 EasyAnimate-v3,猴哥本地亲测,足足需要 188s !

话不多说,上链接,感兴趣的小伙伴可以去试试~

https://chatglm.cn/video

实测体验

首次使用,需要申请内测资格,不到 5 分钟就审核通过了。

功能介绍

目前支持「文生视频」和「图生视频」,两个 Tab 切换,非常简洁,简单是小白零门槛。

  • 文生视频:只需要输入提示词,选择视频风格、情感氛围、运镜方式,点「生成视频」即可

  • 图生视频:需要上传一张底图,输入提示词,点「生成视频」即可。

万事俱备,只差输入提示词了~ 可是:我不会写提示词,怎么办?

其实,无论是 AI 对话AI 绘画,还是这里的 AI 视频生成,提示词的套路都有一个核心原则:

那就是:结构化!结构化还有一个好处,就是让你的思路变得条理清晰。

对于 AI 视频生成 而言:

  • 简单结构:[摄像机移动]+[建立场景]+[更多细节]

  • 复杂结构:[镜头语言] + [光影] + [主体 (主体描述)] + [主体运动] +[场景 (场景描述)] +[情绪/氛围/风格]

为了帮助大家写好 提示词,官方还贴心地出了份文档,需要的小伙伴可以前往查看:

https://zhipu-ai.feishu.cn/wiki/MFxywuqcbiKmOrkXwJzcEuqwnJd

怕你连文档都没时间看,官方直接制作了两个「帮你写提示词」的智能体!免费取用~

  • 文生视频:https://chatglm.cn/main/gdetail/669911fe0bef38883947d3c6

输入简单的描述,智能体就给出了 3 个不同风格的提示词。

“您是否需要更换 3 个风格?” 不满意,随意换!

  • 图生视频:https://chatglm.cn/main/gdetail/669fb16ffdf0683c86f7d903

使用方法也是类似的,输入图像主体,选择一个风格即可。

就目前的体验而言,尽管视频只有6s,无论从流畅度、可控性来看,基本可以达到以假乱真的程度了,那么「清影」是怎么做到的?

API 调用

对于开发者而言,最关心的还是:有没有开放的 API,方便集成到自己的应用中。

答案是肯定的,前往智谱 AI 开放平台注册一个账号,新用户会赠送 18 元额度,后续使用中注意账户余额哦,不过体验是绰绰有余了~

智谱 AI 开放平台:https://open.bigmodel.cn/

接下来,需要拿到智谱的 API Key。

如果之前注册过,直接在这里取用:

如果没有,点击这里,新生成一个:

拿到 API Key 之后,我们前往模型中心,发现CogVideoX已经上线了:

由于视频生成时间较长,所以该接口是异步调用的。

也就是返回给你的是一个任务订单号-id,然后你根据这个 id 去查询是否生成成功。

这里我们以 Python 为例,实现 文生视频 功能:

from zhipuai import ZhipuAI
  client = ZhipuAI(api_key="") # 请填写您自己的APIKey

  response = client.videos.generations(
    model="cogvideox",
    prompt="比得兔开小汽车,游走在马路上,脸上的表情充满开心喜悦。"
)
print(response)

如果是图生视频,还需要传入底图的 image_url,支持通过 URL 或 Base64 编码传入图片,图片大小不超过 5 M。

返回的 response 的示例:

id='8868902201637896192' request_id='654321' model='cogvideox' task_status='PROCESSING'

接下来,我们根据这个 id 去查询结果(注意不是 request_id):

from zhipuai import ZhipuAI
 client = ZhipuAI(api_key="") # 请填写您自己的APIKey

response = client.videos.retrieve_videos_result(
    id="8868902201637896192"
)
print(response)

返回的 response 示例:

{
    "model": "cogvideox",
    "request_id": "8868902201637896192",
    "task_status": "SUCCESS",
    "video_result": [
        {
            "cover_image_url": "https://sfile.chatglm.cn/testpath/video_cover/4d3c5aad-8c94-5549-93b7-97af6bd353c6_cover_0.png",
            "url": "https://sfile.chatglm.cn/testpath/video/4d3c5aad-8c94-5549-93b7-97af6bd353c6_0.mp4"
        }
    ]
}

写在最后

Sora 的出现引爆了 AI 视频生成,那时国内的视频生成工具还屈指可数~

直至今天,AI 视频生成已经在国内遍地开花,比如字节跳动的即梦(Dreamina),快手的可灵,爱诗科技的 PixVerse。

智谱的清影,继续为国产 AI 视频生成 + 1

后续打算出一篇汇总文: 盘点那些好用的 AI 视频生成工具,包括国外的、国内的;开源的、闭源的…

感兴趣的小伙伴敬请关注~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1951964.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小程序的运营方法:从入门到精通

随着科技的快速发展,小程序已成为我们日常生活和工作中不可或缺的一部分。小程序无需下载安装,即用即走的特点深受用户喜爱。那么,如何运营好一个小程序呢?下面就为大家分享一些小程序的运营方法。 一、明确目标用户 在运营小程序…

sqlserver 连接数据4064

用sa登录,找到对应的登录名,右键属性,设置默认数据库

Android APP 音视频(03)CameraX预览与MediaCodec编码

说明: 此CameraX预览和编码实操主要针对Android12.0系统。通过CameraX预览获取yuv格式数据,将yuv格式数据通过mediacodec编码输出H264码流(使用ffmpeg播放),存储到sd卡上。 1 CameraX 和 MediaCodec简介 1.1 CameraX…

【区块链】如何发行自己的加密货币到以太坊测试网络,remixIDE发行自己的数字货币

如何发行自己的加密货币到以太坊测试网络 环境 reminx在线编辑器:https://remix.ethereum.org/安装有小狐狸钱包插件(MetaMask) 如何部署代币? 创建一个名字叫做HelloMyToken.sol的文件。编写好智能合约,这边我要发…

RedHat9 | Ansible 处理任务失败

环境版本说明 RedHat9 [Red Hat Enterprise Linux release 9.0]Ansible [core 2.13.3]Python [3.9.10]jinja [3.1.2] 1. 忽略任务失败 Ansible评估各任务的返回代码,从而确定任务是成功还是失败通常而言,当任务失败时,Ansible将立即在该主…

【2024年国际高等学校数学建模竞赛IMMCHE】问题 A:金字塔石块的运输 问题分析及数学模型及求解代码

【2024 年国际高等学校数学建模竞赛(IMMCHE)】问题 A:金字塔石块的运输 问题分析及数学模型及求解代码 Problem A: Transportation of Pyramid Stones 1 题目 建造金字塔是古埃及文明的杰出成就之一。它们不仅是建筑奇迹,也是人…

1.C基础_计算机基础知识

计算机构成 计算机是由输入设备、输出设备、内存储器、外存储器、CPU构成,具体框图如下: 输入设备:将其他信号转换为计算机能识别的电信号的设备,如传感器 输出设备:将电信号转换为其他信号,如显示器 存…

SAM与OpenAI发布的CLIP强强联手(SAM2CLIP 和 CLIP2SAM),实现22000类的分割与识别

Abstract CLIP 和 Segment Anything Model(SAM)是卓越的视觉基础模型(VFMs)。SAM 在各种领域的分割任务中表现出色,而 CLIP 以其零样本识别能力而闻名。本文深入探讨了将这两种模型整合到一个统一框架中的方法。具体而…

2024101读书笔记|《飞花令·冬》——三冬雪压千年树,四月花繁百尺藤

2024101读书笔记|《飞花令冬》——三冬雪压千年树,四月花繁百尺藤 《飞花令冬(中国文化古典诗词品鉴)》素心落雪 编著,飞花令得名于唐代诗人韩翃《寒食》中的名句“春城无处不飞花”,类似于行酒令,是文人们…

Java 面试相关问题(下)——JVM相关问题GC相关问题

1. 类加载1.1 类的生命周期说一下?1.2 介绍下生命周期中的加载?1.3 介绍下生命周期中的验证?1.4 介绍下生命周期中的准备?1.5 介绍下生命周期中的解析?1.6 介绍下生命周期中的初始化?1.7 介绍下生命周期中的…

MySQL大框架总结

1.DDL,DML,DQL,DCL的区别 (由于DCL是关乎用户的,以下内容重点讲述数据库,表与数据的操作,所以对DCL不详细赘述) DDL DML DQL DCL 中文/英文 数据库定义语言 data definition language 数据库操作语言 data mani…

04-用户画像+sqoop使用

优点 sqoop的作用是实现数据的导入和导出,主要是对数据库和数据仓库之间的操作 只要是支持jdbc连接的数据库都可以使用sqoop操作 添加Sqoop到环境变量中 export SQOOP_HOME/export/server/sqoop export PATH$PATH:$SQOOP_HOME/bin:$SQOOP_HOME/sbinsource /etc/…

Spark RDD 介绍

什么是 RDD ? 弹性分布式数据集,是 Spark 中最基本的数据处理模型。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合; 特性: 弹性: 存储弹性:内存与磁盘的…

CentOS 7.x 的 YUM 仓库问题

背景 CentOS Linux 7 的生命周期(EOL)已经于 2024 年 6 月 30 日终止这意味着 CentOS 7.x 的官方镜像站点将不再提供服务,导致在使用 yum 安装或更新程序时可能会遇到 错误。本文将介绍如何解决这一问题,使得你可以继续在 CentOS…

实验八: 彩色图像处理

目录 一、实验目的 二、实验原理 1. 常见彩色图像格式 2. 伪彩色图像 3. 彩色图像滤波 三、实验内容 四、源程序和结果 (1) 主程序(matlab (2) 函数FalseRgbTransf (3) 函数hsi2rgb (4) 函数rgb2hsi (5) 函数GrayscaleFilter (6) 函数RgbFilter 五、结果分析 1. …

shell脚本相关应用

编写一个简单的脚本,以及运行脚本 301 vim helloworld.sh #!/bin/bash echo "hello world!" ls -lh /etc/ 执行的方式如下: 302 bash helloworld.sh 303 sh helloworld.sh 304 chmod x helloworld.sh 305 ./helloworld.sh…

【计算机网络】数据链路层实验

一:实验目的 1:学习WireShark软件的抓包操作,分析捕获的以太网的MAC帧结构。 2:学习网络中交换机互相连接、交换机连接计算机的拓扑结构,理解虚拟局域网(WLAN)的通信机制。 3:学习…

stm32入门-----TIM定时器(输入捕获模式——下)

目录 前言 一、C语言编程初始化步骤 1.开启时钟 2.配置GPIO口 3.配置时基单元 4.配置输入捕获单元(主模式) 5.配置触发源于从模式 6.开启定时器 二、项目实操(测周法) 1.定时器测量方波 2.定时器测量方波的占空比 前言 接…

nginx的学习(二):负载均衡和动静分离

简介 nginx的负载均衡和动静分离的简单使用 负载均衡配置 外部访问linux的ip地址:80/edu/a.html地址,会轮询访问Tomcat8080和Tomcat8081服务。 Tomcat的准备 准备两个Tomcat,具体准备步骤在nginx的学习一的反向代理例子2中,在Tomcat8080…

搜索引擎项目构建与解析(一)

这是源码,大家可以下载下来作为参考,一起食用效果更佳:SearchEngine 王宇璇/submit - 码云 - 开源中国 (gitee.com)https://gitee.com/yxuan-wang/submit/tree/master/SearchEngine搜索引擎项目总体来看内容比较简单,代码量也比较…