FancyVideo

news2025/7/3 2:00:30

一、模型介绍

合成运动丰富且时间一致的视频仍然是人工智能领域的一项挑战，尤其是在处理较长的持续时间时。现有的文本到视频 (T2V) 模型通常采用空间交叉注意进行文本控制，等效地指导不同帧的生成而无需特定于帧的文本指导。因此，模型理解提示中传达的时间逻辑并生成具有连贯运动的视频的能力受到限制。为了解决这一限制，我们引入了 FancyVideo ，这是一种创新的视频生成器，它通过精心设计的跨帧文本指导模块 (CTGM) 改进了现有的文本控制机制。具体而言，CTGM 分别在交叉注意的开始、中间和结束时结合了时间信息注入器 (TII)、时间亲和力细化器 (TAR) 和时间特征增强器 (TFB)，以实现特定于帧的文本指导。

二、模型搭建流程

基础环境最低要求说明：

环境名称	版本信息1
Ubuntu	22.04.4 LTS
CUDA	12.1
Python	3.10
NVIDIA Corporation	RTX 3090
模型大小	超过 100G，需要数据盘扩容

1. 根据需求选择主机和镜像，进行一键创建实例

租用实例 --》一键使用 --》进入“应用社区”–》搜索并选择“FancyVideo” 大模型 –》选择RTX 3090 GPU，即可在平台进行实例创建。

2. 进入网页端命令行

项目实例 --》点击“WebSSH”–》执行“启动 web 页面”的相关命令

3. 下载预训练模型

在启动应用程序之前，运行以下命令以自动下载所需的模型：

# 递归复制FancyVideo目录及其所有子目录和文件到/root/sj-tmp/目录下  
cp -r /FancyVideo/ /root/sj-tmp/  
  
# 切换到/root/sj-tmp/FancyVideo/目录，假设上一步成功执行，这个目录现在存在  
cd /root/sj-tmp/FancyVideo/   
  
# 安装Git LFS（Large File Storage），这是一个Git的扩展，允许你版本控制大文件  
# 注意：这一步通常在你打算使用Git LFS来管理大文件时才需要  
git lfs install  
  
# 尝试从https://hf-mirror.com/qihoo360/FancyVideo克隆一个Git仓库到当前目录  
# fancyvideo-ckpts & cv-vae & res-adapter & longclip & sdv1.5-base-models
git clone https://hf-mirror.com/qihoo360/FancyVideo

下载成功如下图

移动模型：

mv FancyVideo/resources/models resources/

继续下载模型

git lfs install
git clone https://hf-mirror.com/runwayml/stable-diffusion-v1-5 resources/models/stable-diffusion-v1-5

下载模型后，你的资源文件夹如下：

📦 resouces/
├── 📂 models/
│   └── 📂 fancyvideo_ckpts/
│   └── 📂 CV-VAE/
│   └── 📂 res-adapter/
│   └── 📂 LongCLIP-L/
│   └── 📂 sd_v1-5_base_models/
│   └── 📂 stable-diffusion-v1-5/
├── 📂 demos/
│   └── 📂 reference_images/
│   └── 📂 test_prompts/

4. 启动 webgui.py 文件

# 导航到项目目录
cd /root/sj-tmp/FancyVideo/

# 激活 fancyvideo 虚拟环境  
conda activate fancyvideo

# 运行 app.py 文件
python app.py

5. 获取端口号

6. 进入 web 页面

将获取到的链接复制到本地浏览器：

# 比如当前获取的地址如下：
http://xn-a.suanjiayun.com:30992

复制下方网址，进入算家云，选择模型，一键开启 AI 之旅！

算家云应用社区 www.suanjiayun.com/container/#/mirror

首页.png

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2087439.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

FancyVideo

一、模型介绍

二、模型搭建流程

1. 根据需求选择主机和镜像，进行一键创建实例

2. 进入网页端命令行

3. 下载预训练模型

4. 启动 webgui.py 文件

5. 获取端口号

6. 进入 web 页面

相关文章

经典算法之链表篇（二）

在线考试系统源码功能分析

Leetcode JAVA刷刷站（101）对称二叉树

微信小程序：手机联调同一个网段无法找到本地接口

【HarmonyOS NEXT开发】鸿蒙开发环境准备，ArkTS基础语法入门

Mini型LoRa DTU远距离无线传输“小体积大作为”

（三）Kafka离线安装 - ZooKeeper开机自启

如何在知行之桥上通过业务单号查找原始报文？

window上部署kafka3.6.1，并配置sasl认证

基于tkinter实现学生管理系统（四）

04：创建PADS Logic软件逻辑库

SQLi-LABS靶场46-50通过攻略

【功能自动化】使用HTMLTestRunner生成测试报告

【Go高性能】测试（单元测试、基准测试）

Leetcode 第 408 场周赛题解

Pycharm can‘t open file ‘D:\\Program‘: [Errno 2] No such file or directory

【计算机网络】TCP IP 模型（与OSI参考模型的差异）

react学习之useState和useEffect

Vulkan进阶系列1 - Raytracing 光线查询

Linux进程间的通信（一）exec函数族，getenv获取系统环境变量，system和popen的区别，文件和记录锁定通信