使用 ModelScope 本地部署图片变视频模型

news2024/11/13 9:08:27

最近在抖音上看到很多视频可以让图片动起来,搜了一下,stabilityai/stable-video-diffusion-img2vid-xt 这个模型可以实现图片到视频,可以生成 25 帧的视频。Kling 和 Runway 都支持从图片生成视频,本文将通过 ModelScope 搭建一个可以运行在本地的图片到视频的模型。
请添加图片描述

运行 ModelScope

这里使用容器的方式运行 ModelScope,关于容器的信息,详见官网介绍
https://modelscope.cn/docs/%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85

  1. /opt/modelscope/models:/mnt/workspace/.cache, 将模型下载路径映射到主机上,模型数据可以保留
  2. /opt/modelscope/notebook:/notebook,notebook 数据进行保留
  3. -p 8890:8888 -p 8891-8895:8891-8895,根据需要映射端口
docker run --rm --runtime=nvidia  --shm-size=32g --gpus all  -p 8890:8888 -p 8891-8895:8891-8895 \
-v /opt/modelscope/models:/mnt/workspace/.cache \
-v /opt/modelscope/notebook:/notebook \
 -it registry.cn-beijing.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.1.0-py310-torch2.1.2-tf2.14.0-1.13.1 /bin/bash 

运行模型

下载模型

from diffusers import DiffusionPipeline
from modelscope import snapshot_download

model_dir = snapshot_download("AI-ModelScope/stable-video-diffusion-img2vid-xt")

运行模型

import torch
from diffusers import StableVideoDiffusionPipeline
from diffusers.utils import load_image, export_to_video
pipe = StableVideoDiffusionPipeline.from_pretrained(model_dir, torch_dtype=torch.float16, variant="fp16")

pipe.enable_model_cpu_offload()

# Load the conditioning image
image = load_image("route-fifty-lead-image.jpg")
image = image.resize((1024, 576))

generator = torch.manual_seed(44)
frames = pipe(image, decode_chunk_size=8, generator=generator).frames[0]

export_to_video(frames, "generated.mp4", fps=7)

原图
在这里插入图片描述
生成的视频

请添加图片描述

总结

ModelScope 最大的优点就是安装了所有运行模型需要的依赖库,可以说是一键运行。下载模型速度也非常快,能够快速体验所有的模型,如果本地没有资源也可以是使用 ModelScope 提供的工作空间,需要付费。

本文使用的环境

操作系统 Ubuntu、GPU 2080ti 22G。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1970668.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何下载Maven指定版本

下载Maven指定版本的步骤如下:‌ 1.访问Maven官网:‌首先,‌需要访问Maven的官方网站,‌即https://maven.apache.org/。‌ 2.选择下载链接:‌在官网首页,‌找到“Download”选项并点击进入下载页面。‌ …

你真的懂二分吗?

二分简述: 二分算法,又称为二分搜索或折半搜索,是一种在有序数组中查找特定元素的搜索算法。其基本思想是将数组分成两半,然后根据目标值与中间元素的大小关系来决定是继续在左侧还是右侧进行搜索。这个过程会不断重复&#xff0…

YOLOv8改进 | 激活函数 | 十余种常见的激活函数一键替换【完整代码】

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 专栏目录 :《YOLOv8改进有效…

HDU1089、1090、1091、1092、1093、1094、1095、1096、——A+B for Input-Output Practice

目录 HDU1089——AB for Input-Output Practice (I) HDU1090——AB for Input-Output Practice (II) HDU1091——AB for Input-Output Practice (III) HDU1092——AB for Input-Output Practice (IV) HDU1093——AB for Input-Output Practice (V) HDU1094——AB for Inpu…

VSCode上安装C#环境教程

本章教程,教你如何在vscode上,可以快速运行一些基础的c#代码。 1、下载 .NET Code SDK 下载地址:https://dotnet.microsoft.com/zh-cn/download/dotnet/sdk-for-vs-code?utm_source=vs-code&utm_medium=referral&utm_campaign=sdk-install 根据自己的操作系统,选择…

NSSCTF-Web题目27(Nginx漏洞、php伪协议、php解析绕过)

目录 [HNCTF 2022 WEEK2]easy_include 1、题目 2、知识点 3、思路 [NSSRound#8 Basic]MyDoor 4、题目 5、知识点 6、思路 [HNCTF 2022 WEEK2]easy_include 1、题目 2、知识点 nginx日志漏洞执行系统命令 3、思路 打开题目,出现源码 题目要我们上传一个fi…

堆内存申请 - 华为OD统一考试(D卷)

OD统一考试(D卷) 分值: 100分 题解: Java / Python / C++ 题目描述 有一个总空间为100字节的堆,现要从中新申请一块内存,内存分配原则为: 优先分配紧接着前一块已使用的内存,分配空间足够时分配最接近申请大小的空闲内存。 输入描述 第1行是1个整数,表示期望申请的…

星环科技与宁夏银行“大数据联合实验室”揭牌,持续打造金融科技新范式

5月30-31日,2024向星力未来数据技术峰会期间,在峰会现场来宾共同见证下,星环科技与宁夏银行“大数据联合实验室”正式揭牌,宁夏银行股份有限公司首席信息官崔彦刚与星环科技副总裁邱磊共同为联合实验室揭牌。 星环科技与宁夏银行借…

后端开发和你聊聊 JVM 如何优化

作者:京东零售京麦研发 马万全 首先应该明确的是JVM调优不是常规手段,JVM的存在本身就是为了减轻开发对于内存管理的负担,当出现性能问题的时候第一时间考虑的是代码逻辑与设计方案,以及是否达到依赖中间件的瓶颈,最后…

16.1 微信支付

1. 概述 2. 微信支付时序图与流程 官方开发文档 Native支付文档 2.1 Native支付时序图 3. 订单表 单独开发一个支付平台,其他平台遇到支付业务需求时,可调用支付平台完成相应的支付业务 演示:平台有支付平台、商户平台 客户在商户平台发起Vip开通的支付请求,商户平台生成…

IDEA配置Tomcat,解决jsp页面显示问题(Please, configure Web Facet first!)和(There is no configured/running web-se)

在学校,大部分老师还是使用eclipse,他们使用的jsp页面,而我却想使用idea,来操纵jsp页面,可是为什么我将jsp放入项目当中,会出现报错,例如: 又或者: 哎呀,那怎…

数据结构与算法-二分搜索树遍历

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 文章目录 引言一、二分搜…

Halcon 边缘提取(亚像素)

Halcon提供多种边缘提取算法。像素提取方法有常用的边缘提取算子或深度学习分割模型等。考虑到精度问题可能需要提取亚像素边缘。当然也可以提取轮廓:线、圆、椭圆等。本文只讨论提取轮廓。 1 基本概念 正常情况下,无需特殊操作即可提取边缘轮廓。 1…

这些天,有多少人去电影院看巴黎奥运会?

近期,巴黎奥运会的赛况频频登上热搜,中国奥运健儿们的奋勇拼搏令人热血沸腾。而许多观众,或由于租房情况不便于用投影仪观赏比赛,或由于期待更佳的观赛体验,因此有不少人去电影院观赛。由于实时数据的更新性和统计的复…

[Bugku] web-CTF靶场-计算器

计算器 1.开启环境 理论上来说题目最多只能填0-9的答案,如果需要填大于9的需要修改maxlength参数 得出flag

「码」上行动 一物一码+TPM让“多进货多卖货”不再是口号

“门店进货量翻倍,一些门店一个月连续补货3次!”在与纷享销客产品经理的电话交流中,X饮品企业的张总难掩喜悦之情。 他兴奋地表示,在北方城市推出的基于一物一码的门店进销双激励码营销试点取得了显著成果,所有参与试…

开放原子校源行 | 武汉大学师生一行走进麒麟信安,开展社会实践交流活动

“开放原子校源行”是开放原子开源基金会作为国家级开源公益平台发起的长期性开源教育推广公益项目。项目拟通过资助高校设立开源社团、推广开源课程、设置开源助学金、引导开源实践等方式培育开源人才,加快将开源文化、理念和技术融入校园,引导广大师生…

CST软件如何实现S-parameter随其他参数变化的1D曲线

本期的FAQ更新一个非常高频的问题,如何实现S-parameter随其他参数变化的1D曲线。有的时候也不一定是S参数,可能是用户关心的阻抗结果,也可能是VSWR等。 在老版本的时候,CST软件有个后处理的宏可以很容易的将某一频点下的0D转换成…

引领未来交通新纪元:综合智慧监管平台

引领未来交通新纪元:综合智慧监管平台 在21世纪的今天,随着科技的飞速发展,交通运输行业作为国民经济的命脉,正经历着前所未有的变革与挑战。面对日益增长的运输需求、复杂多变的交通环境以及公众对安全、高效、绿色出行的迫切期…

AcWingTrie树

字典树的应用背景: 看以下几个题: 1、给出n个单词和m个询问,每次询问一个单词,回答这个单词是否在单词表中出现过 答:简单!map,短小精悍。 好。下一个 每次询问一个前缀,回答询问是多少个单词的前缀。2、给出n个单词和…