CogVideoX环境搭建推理测试

CogVideoX环境搭建推理测试

news2026/2/14 15:28:19

引子

智谱AI版Sora开源，首个可商用，18G显存即可运行。前文写了Open-Sora1.2的博文，感兴趣的童鞋请移步（Open-Sora1.2环境搭建&推理测试_open sora 1.2-CSDN博客）。对于这种占用资源少，且效果不错的多模态模型那么肯定不容错过。OK，我们开始吧。

一、模型介绍

CogVideoX是清影同源的开源版本视频生成模型。

下表展示目前我们提供的视频生成模型列表，以及相关基础信息:

模型名	CogVideoX-2B
提示词语言	English
单GPU推理 (FP-16) 显存消耗	18GB using SAT 23.9GB using diffusers
多GPU推理 (FP-16) 显存消耗	20GB minimum per GPU using diffusers
微调显存消耗 (bs=1)	42GB
提示词长度上限	226 Tokens
视频长度	6 seconds
帧率（每秒）	8 frames
视频分辨率	720 * 480
量化推理	不支持
下载地址 (Diffusers 模型)	Huggingface ModelScope
下载地址 (SAT 模型)	SAT

二、环境搭建

模型下载

魔搭社区

代码下载

git clone https://github.com/THUDM/CogVideo.git

环境安装

docker run -it -v /datas/work/zzq/:/workspace --gpus=all pytorch/pytorch:2.4.0-cuda12.4-cudnn9-devel bash

cd /workspace/CogVideo/CogVideo-main

pip install -r requirements.txt -i Simple Index

pip install imageio -i Simple Index

pip install omegaconf -i Simple Index

三、推理测试

python inference/cli_demo.py --model_path /workspace/CogVideo/CogVideo-main/CogVideoX-2b/ --prompt "A man is running in the sea"

好吧，显存爆了，需要24G显存，我这边可用显存只有22G+

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2043991.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ThreeJs学习笔记--坐标系，光源，相机控件

ThreeJs学习笔记--坐标系，光源，相机控件

坐标系一、创建添加坐标系给场景添加坐标系THREE.AxesHelper()的参数表示坐标系坐标轴线段尺寸大小，你可以根据需要改变尺寸 const axesHelper new THREE.AxesHelper(200)//数值是坐标的尺寸 scene.add(axesHelper)//添加到场景里坐标系包含三个坐标轴&…

阅读更多...

HarmonyOS NEXT - Toast和Loading使用

HarmonyOS NEXT - Toast和Loading使用

demo 地址: https://github.com/iotjin/JhHarmonyDemo 代码不定时更新，请前往github查看最新代码 HarmonyOS NEXT - Toast和Loading使用效果图调用方式JhProgressHud.ets 完整代码官方有个toast但是比较单一（官方toast promptAction）&#…

阅读更多...

【TiDB】10-对 TiDB 进行 TPC-C 测试

【TiDB】10-对 TiDB 进行 TPC-C 测试

目录 1、安装bench工具 2、插入数据 3、运行测试 4、测试结果分析 4.1、总体性能概览 4.2、事务类型详细性能 4.3、错误事务分析 4.4、结论与建议 5、清理测试数据 TPC-C 是一个对 OLTP（联机交易处理）系统进行测试的规范，使用一个商…

阅读更多...

C语言学习笔记 Day13（复合类型/自定义类型）

C语言学习笔记 Day13（复合类型/自定义类型）

Day13 内容梳理： 目录 Chapter 9 复合类型（自定义类型） 9.1 结构体 （1）结构体变量定义、初始化 （2）嵌套结构体 （3）结构体赋值 （4）结构体和…

阅读更多...

C Primer Plus 第4章习题

C Primer Plus 第4章习题

你该逆袭了红色标注的是：错误的答案蓝色标注的是：正确的答案绿色标注的是：做题时有疑问的地方练习题一、复习题1、我的答案：正确答案： 2、3、4、5、6、7、8、9、10、11、12、二、编程练习1、2、第4问我不会a、b、…

阅读更多...

基于轨迹的汽车跟随系统横向控制方法

基于轨迹的汽车跟随系统横向控制方法

A Trajectory-Based Approach for the Lateral Control of Vehicle Following Systems 基于轨迹的汽车跟随系统横向控制方法 Abstract Abstract| A crucial task for steering an autonomous vehicle along a safe path in a vehicle following scenario is the lateral cont…

阅读更多...

ubuntu查看CPU、内存、硬盘

ubuntu查看CPU、内存、硬盘

1、查看CPU cat /proc/cpuinfo 我这台机器CPU是2核，所以这里是2核或者使用如下命令也可以查看 lscpu 查看CPU使用率 top 2、查看内存查看内存信息： free -h 查看内存使用情况： vmstat 3、硬盘查看硬盘使用情况： df -…

阅读更多...

用视频文件模拟摄像头进行抖音、视频号直播的无人直播机（虚拟摄像头）推流器使用说明详细介绍

用视频文件模拟摄像头进行抖音、视频号直播的无人直播机（虚拟摄像头）推流器使用说明详细介绍

无人直播机是嵌入式软硬件一体化设计，支持远程修改设备参数，远程回放设备录像，还支持3.5mm音频实时互动，以及多个视频随机轮播或者顺序轮播。无人直播机不仅稳定还节能，支持7*24小时运行，不死机不卡顿。一…

阅读更多...

求职利器：高频面试题与算法详解

求职利器：高频面试题与算法详解

干货分享，感谢您的阅读！ （暂存篇---后续会删除，完整版和持续更新见高频面试题基本总结回顾（含笔试高频算法整理）） 备注：引用请标注出处，同时存在的问题请在相关博客留言…

阅读更多...

vue3父子组件双向数据绑定v-model；父组件调用子组件事件

vue3父子组件双向数据绑定v-model；父组件调用子组件事件

效果： 父far.vue <template><div><div>父组件内容<pre>value1:{{ value1 }}</pre><el-button type"primary">flag1:{{ flag1 }}</el-button><pre>obj1:{{ obj1 }}</pre><el-input v-model&q…

阅读更多...

Java 入门指南：接口（Interface）

Java 入门指南：接口（Interface）

引言在Java编程中，接口（Interface）是一种非常重要的概念，它不仅是面向对象编程（OOP）的基石之一，也是实现高内聚、低耦合设计原则的关键工具。接口定义了一组方法，但不提供这些方法…

阅读更多...

@Mapper报红

@Mapper报红

检查pom.xml，导入 org.mybatis.spring.boot 依赖： <dependency><groupId>org.mybatis.spring.boot</groupId><artifactId>mybatis-spring-boot-starter</artifactId><version>3.0.3</version></dependency…

阅读更多...

Java-EE 网络编程（1）

Java-EE 网络编程（1）

目录一、网络初识二、协议协议的定义协议分层协议分层的好处 TCP/IP五层模型五层协议协议之间如何配合工作的三、网络编程套接字 TCP/UDP特点 UDP回显服务器 UDP的socket api 回显服务器回显客户端一、网络初识先了解一些核心概念： 局域网…

阅读更多...

CsvExport：一个.Net高性能、低内存的CSV导出开源库

CsvExport：一个.Net高性能、低内存的CSV导出开源库

在我们项目开发中，导出CSV数据功能是非常常见的。今天推荐一个高性能、低内存的CSV导出开源库。 01 项目简介 CsvExport是一个基于C#非常简单和快速的CSV导出开源库。该开源库的核心特点： 导出功能兼容性高（自动检测分隔符，…

阅读更多...

CSC7720 可正、负应用5V2.1A同步整流

CSC7720 可正、负应用5V2.1A同步整流

CSC7720是一款同步整流芯片，可以代替肖特基二极管提高反激变换器的效率。CSC7720 支持工作在非连续模式（DCM）的反激变换器中，其内部集成了低 RDS（ON ）的 N 沟道功率MOSFET，外围应用简单&#xf…

阅读更多...

STM32—SPI通信

STM32—SPI通信

1.SPI简介四根通信线：SCK(Serial Clock)(时钟线)、MOSI(Master Output Slave Input)、MISO(Master Input Slave Output)、SS(Slave Select) 同步、全双工支持总线挂载多设备（一主多从） 所有SPI设备的SCK、MOSI、MISO分别连在一起主机…

阅读更多...

【Python学习-UI界面】PyQt5 小部件13-Slider 拖动条

【Python学习-UI界面】PyQt5 小部件13-Slider 拖动条

高级布局管理器，允许通过拖动边界来动态改变子小部件的大小。 Splitter控件提供一个手柄，可以拖动以调整控件的大小样式如下: 常用方法如下： 序号方法描述1addWidget将小部件添加到拆分器的布局中2indexOf返回布局中小部件的索引3insetW…

阅读更多...

炖羊肉

炖羊肉

炖羊肉必备的两种香辛料，白胡椒、白芷，让你炖出的羊肉软嫩，汤汁鲜美在烹饪艺术的广阔领域中，炖羊肉作为一道经典佳肴，其风味的层次与深度往往取决于所选香辛料的精妙搭配。其中，白胡椒与白芷作为炖羊肉时…

阅读更多...

fun状态上传,并可手动控制

fun状态上传,并可手动控制

文章目录引言上传原因:矛盾点:基础工程源码: 代码实操fun状态上传fun状态下发控制引言上传原因: 续上一节, 我们把fun像小灯一样, 加入了预警工程, 但是我们fun其实还有其他用处, 比如我们人工手动开风扇, 排风, 所以我们需要把fun的状态上传, 然后也可以通过服务器手动控制…

阅读更多...

EmguCV学习笔记 VB.Net 2.3 Mat类

EmguCV学习笔记 VB.Net 2.3 Mat类

版权声明：本文为博主原创文章，转载请在显著位置标明本文出处以及作者网名，未经作者允许不得用于商业目的。 EmguCV学习笔记目录 Vb.net EmguCV学习笔记目录 C# 笔者的博客网址：VB.Net-CSDN博客教程相关说明以及如何获得pdf教…

阅读更多...

推荐文章

最新文章