Stable Video Diffusion(SV3D)安装和测试(windows10)

news2024/11/25 4:19:06

SVD 安装教程

1.安装miniconda

https://docs.anaconda.com/free/miniconda/index.html
在这里插入图片描述

2.创建python环境

conda create --name sv3d python==3.10

conda activate sv3d

3.安装triton==2.0.0

下载地址:https://huggingface.co/r4ziel/xformers_pre_built/resolve/main/triton-2.0.0-cp310-cp310-win_amd64.whl

安装

pip install ./triton-2.0.0-cp310-cp310-win_amd64.whl

这个包,安装一直有问题,所以单独安装

4.安装requirements/pt2.txt

在requirements/pt2.txt文件中删除下面的包
删除triton==2.0.0
删除 torch相关包:

triton==2.0.0
torch>=2.0.1
torchaudio>=2.0.2
torchdata==0.6.1
torchmetrics>=1.0.1
torchvision>=0.15.2

单独安装pytorch

conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.7 -c pytorch -c nvidia

安装其他依赖包

pip install -r requirements/pt2.txt

5.获取clip模型

百度网盘下载 cache文件夹,放到用户跟目录 修改文件名为: .cache
C:\Users\ads.cache

我下载好的模型

链接:https://pan.baidu.com/s/1Y7WjpUBzyR11XAk3KA3Ntg 
提取码:oo20 

6.下载模型

我在linux下安装遇到这个问题, 在windows上没有,请自我修正。

Downloading data from 'https://github.com/danielgatis/rembg/releases/download/v0.0.0/u2net.onnx' to file '/root/.u2net/u2net.onnx'.

7.安装ffmpeg

https://www.geeksforgeeks.org/how-to-install-ffmpeg-on-windows/
在这里插入图片描述

报错

报错1

AttributeError: module 'sgm.modules.diffusionmodules.guiders' has no attribute 'TrianglePredictionGuider'. Did you mean: 'LinearPredictionGuider'?

在这里插入图片描述

报错2

TypeError: TiffWriter.write() got an unexpected keyword argument 'fps'

在这里插入图片描述
安装

pip install imageio==2.19.3
pip install imageio-ffmpeg==0.4.7

报错3

[in#0 @ 000002b06e26b400] Error opening input: No such file or directory
Error opening input file 'outputs/demo/vid/sv3d_u\samples\000003.mp4'.
Error opening input files: No such file or directory

在这里插入图片描述

打开文件

scripts\demo\streamlit_helpers.py

os.system(f"ffmpeg -i '{video_path}' -c:v libx264 '{video_path_h264}'")

修改为

os.system(f"ffmpeg -i {video_path} -c:v libx264 {video_path_h264}")

一直以为是 ffmpeg的包安装问题,反复折腾了,才发现是单引号的问题。这个地方有点坑,可能只是程序处理字符串出了点问题,在ubuntu下是没问题的,在windows下就报错。 姑且这样处理吧,按道理来说 有单引号应该没问题,但跑起来就是挂。
参看:https://video.stackexchange.com/questions/27885/ffmpeg-no-such-file-or-directory-problem
END

加群交流,备注:进AIGC群
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1591463.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AndroidAutomotive模块介绍(一)整体介绍

前言 Android Automotive 是一个基本 Android 平台,可运行 IVI 系统中预安装的 Android 应用以及可选的第二方和第三方 Android 应用。 本系列文档将会系统的介绍 Android Automotive 的功能、架构、逻辑等。模块逻辑将从 应用api接口、系统服务、底层服务&#x…

Arduino _按键点亮——led

int8_t led_pin13;int8_t led2_pin12; void setup() {// put your setup code here, to run once:pinMode(led_pin, INPUT);//输入pinMode(led2_pin, OUTPUT);//输出 }void loop() {// put your main code here, to run repeatedly:if(digitalRead(led_pin)1){//digitalRead(…

校园通用型发生网络安全事件解决方案

已知校园多教学楼、多教学机房、非标网络机房缺乏防护设备、检测设备、安全保护软件(杀软) 切断所有外网,断网处理!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 部署路由系统可选择爱快、routeros、openwrt。等。可将日志上传到日志分析系统。《这项非必要的》 部署开源防火…

弱口令入侵FE企业管理平台【附口令】

漏洞描述 飞企互联-FE企业运营管理平台 druid路径弱口令,攻击者可能通过尝试弱口令,非法进入系统,恶意操作或者收集信息进一步攻击利用。 漏洞复现 1、Fofa app"飞企互联-FE企业运营管理平台"2、零零信安 (html_banner360浏览…

使用Docker Registry-v2搭建镜像仓库详细教程

我们使用docker来部署私有化镜像仓库… 1、下载 registry:v2 镜像 docker pull registry:22、在私有仓库所在的主机目录新建一个文件夹,用于持久化保存仓库中的镜像 mkdir -p /opt/registry3、启动registry镜像 使用docker镜像启动私有仓库容器服务,…

突破编程_前端_SVG(circle 圆形)

1 circle 元素的基本属性和用法 SVG 的 <circle> 元素用于在SVG文档中绘制圆形。它具有几个基本属性&#xff0c;允许定义圆形的大小、位置、填充颜色和边框样式。以下是 <circle> 元素的基本属性及其详细解释&#xff1a; 1.1 cx 和 cy 描述&#xff1a;这两个…

嵌入式|蓝桥杯STM32G431(HAL库开发)——CT117E学习笔记13:RTC实时时钟

系列文章目录 嵌入式|蓝桥杯STM32G431&#xff08;HAL库开发&#xff09;——CT117E学习笔记01&#xff1a;赛事介绍与硬件平台 嵌入式|蓝桥杯STM32G431&#xff08;HAL库开发&#xff09;——CT117E学习笔记02&#xff1a;开发环境安装 嵌入式|蓝桥杯STM32G431&#xff08;…

用Python编写GUI程序将JPEG文件按文件名顺序插入PDF文件

在Python编程中&#xff0c;处理文件和图像是常见的任务之一。最近&#xff0c;我遇到了一个有趣的问题&#xff1a;如何通过编写一个GUI程序来将一个文件夹中的JPEG文件按文件名顺序插入到一个新的PDF文件中&#xff1f;在这篇博客中&#xff0c;我将分享我使用Python、wxPyth…

基于springboot+vue+Mysql的论坛管理系统

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…

【vue】v-model.lazy等(非实时渲染)

v-model&#xff1a;实时渲染v-model.lazy&#xff1a;失去焦点/按回车后&#xff0c;才渲染v-model.number&#xff1a;值转换为数字v-model.trim&#xff1a;去除首尾空格 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8&qu…

1.汉诺塔问题

C力扣 汉诺塔 class Solution { public:void hanota(vector<int>& a, vector<int>& b, vector<int>& c) {dfs(a,b,c,a.size());}void dfs(vector<int>& a, vector<int>& b, vector<int>& c,int n){if(n1){c.push…

图片批量高效缩放,批量缩放GIF图片并在缩放后以bmp位图保存

在这个数字化时代&#xff0c;图片已经成为我们生活和工作中不可或缺的一部分。无论是制作海报、设计网站&#xff0c;还是日常分享&#xff0c;我们都需要对图片进行处理。然而&#xff0c;面对大量的GIF图片&#xff0c;如何高效地进行缩放并转换为BMP位图&#xff0c;成为了…

链表中是否有环【c语言】

定义两个指针&#xff0c;一个每次跳跃两个节点&#xff08;快指针&#xff09;&#xff0c;另一个每次跳跃一个节点&#xff08;慢指针&#xff09;。如果存在环&#xff0c;他们最终会在环中的某个点相遇。如果链表无环&#xff0c;快指针将先到达链表尾端。 #include <s…

【智能算法】教与学优化算法 (TLBO)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2012年&#xff0c;RV Rao等人受到班级内教师教学和学生学习启发&#xff0c;提出了教与学优化算法&#xff08;Teaching-learning-based Optimization, TLBO&#xff09;。 2.算法原理 2.1算法思…

2024最方便申请SSL证书方法介绍

申请SSL证书其实就像你去官方机构办个身份证&#xff0c;证明你的网站是合法且安全的。这里给你白话一点的简单步骤&#xff1a; 步骤一&#xff1a;确定需求 1. 域名&#xff1a;确保你有一个要申请证书的域名&#xff0c;就是你的网站地址&#xff0c;比如 www.example.com。…

【C++算法模板】数论:欧拉筛,线性查找质数的算法

文章目录 1&#xff09;传统找质数的方法&#xff08;优化筛选次数&#xff09;2&#xff09;欧拉筛 1&#xff09;传统找质数的方法&#xff08;优化筛选次数&#xff09; bool isPrime(int num) {for(int i2;i<sqrt(num)) {if(num%i0)return false;}return true; }如果要…

SSL、TLS和HTTPS:网络安全的重要基石

随着互联网的快速发展&#xff0c;网络安全问题日益凸显。为了保护数据在传输过程中的安全&#xff0c;各种加密协议和技术应运而生。SSL&#xff08;安全套接层&#xff09;、TLS&#xff08;传输层安全&#xff09;和HTTPS&#xff08;超文本传输安全协议&#xff09;是三个最…

Git 解决分支冲突

一、前言 一直习惯于 add commit push 的三步走&#xff0c;偶然间看到了一个评论说在 push 之前还有一个 pull&#xff0c;小小的疑问就埋在了我的心里。于是我就先了解了 pull 的工作原理&#xff0c;就是先拉取代码&#xff08;fetch&#xff09;再合并分支&#xff08;mer…

Xilinx Zynq UltraScale+ MPSoC无人机控制器

官方术语是无人驾驶飞行器&#xff08;UAV&#xff09;&#xff0c;这显然有点拗口&#xff0c;所以我们更喜欢说无人机。在过去的几十年里&#xff0c;无人机技术有了巨大的进步。我们为一个客户开发了一个无人机的飞行和视频控制器。 客户挑战 客户需要一种混合FPGA/CPU硬件&…