一、模型简介
DynamiCrafter 是一种(文本-)图像到视频/图像动画的方法,旨在从条件图像和文本提示中生成短视频片段(约 2 秒),可以将静止图像转换为动画。它使用了一种称为视频扩散先验的技术,可以生成逼真的、具有动态效果的视频。
开发者 :香港中文大学 & 腾讯 AI 实验室
资助方 :香港中文大学 & 腾讯 AI 实验室
模型类型 :生成性(文本-)图像到视频模型
模型资源:
Github 仓库(https://github.com/Doubiiu/DynamiCrafter),其中包含了详细的实现代码。
仓库链接 :https://github.com/Doubiiu/DynamiCrafter
论文链接 :https://arxiv.org/abs/2310.12190
二、模型搭建流程
1. 容器镜像一键使用
(1)在算家云“应用社区”中搜索或找到“DynamiCrafter”模型,或者在左侧“视频生成”选项功能中单击选择“图生视频”
(2)进入“租用实例”页面后之后会自动匹配模型,选择 3090 卡或其他性能优于 3090 的显卡,点击“立即创建”即可创建实例
2.启动项目
(1)实例创建成功之后,点击“项目实例”再点击“WebssH”开启终端(小黑屏)
使用下列命令运行项目:
激活虚拟环境:
conda activate DynamiCrafter
打开文件:
cd DynamiCrafter
运行模型:
本地 Gradio 演示,图片到视频生成。
在终端中输入以下命令(根据所需的分辨率:1024、512 或 256 选择一个模型)
python gradio_app.py --res 1024
3.开启外部访问
返回“项目实例”列表,选择并点击对应实例的“开放端口”操作。
有两种访问方式可以选择:本地私密访问和对外开放端口。
(1)本地私密访问:选择 ssh 工具访问,登录之后填写各选项,点击“开启代理”
(2)对外开放端口:请按照下图操作
4.访问获取的地址,开始使用
开放端口后,点击模型运行结束下方的“http://0.0.0.0”,进入网站搜索页面,将“0.0.0.0:8080”改为“127.0.0.1:8080”搜索,即可进入UI界面使用
以上就是在算家云搭建DynamiCrafter的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。
复制下方网址,进入算家云,选择模型,一键开启 AI 之旅!
算家云应用社区 www.suanjiayun.com/container/#/mirror