一个令人惊艳的新项目，SVD开源了！

一个令人惊艳的新项目，SVD开源了！

news2026/2/11 11:48:01

大家好，我是 Jack。

对于 Stable Diffusion，想必我的读者朋友们对此都不陌生。

自 Stability AI 公司发布 SD（全称：Stable Diffusion) 以来，受到了很多人的喜爱。

SDXL 效果

SDXL 效果

随后技术升级，又发布了 SDXL，名字很有喜感，XL、XXL、XXXL...

SDXL Logo

SDXL Logo

顾名思义，SDXL 就是 SD 的升级版，图片生成的效果更好、更逼真、分辨率更高！

图片领域做得不错了，Stability AI 再次发力，昨天又发布了 Stable Video Diffusion。

Stability AI 发布

Stability AI 发布

也就是说，通过一句话描述，现在不仅可以生成图片，还可以生成视频了。

举几个例子。

输入：火箭升天

AI 算法直接生成对应的视频：

输入：太空中转动的地球：

AI 算法直接生成对应的视频：

看下更多的例子：

是不是效还不错？Stability AI 把 Stable Video Diffusion 也开源了！

Stable Video Diffusion

一共开源了两个模型：

SVD：能够生成帧率 14、分辨率 576x1024 的视频；

SVD-XT：SVD 的 finetune 升级版，分辨率不变，但能够生成帧率 25 的视频；

前排提醒： 想要本地跑 Stable Video Diffusion，显存得 20G 左右。

1、下载代码库

git clone git@github.com:Stability-AI/generative-models.git
cd generative-models

2、配置 Python 环境

由于第三方依赖库的要求，Python 需要至少是 3.10 版本以上。

推荐使用 conda 新建一个环境。

conda create -n py310 python==3.10

激活环境，并安装相应的依赖。

conda activate py310
python -m pip install -r requirements/pt2.txt

最后再安装 sgm，直接在项目根目录运行即可。

python -m pip install .

如果想要训练模型，还需要安装 sdata，我这里就不说了，毕竟跟我一样训练不起的，应该占绝绝绝绝大多数。

3、模型下载

SVD 模型下载地址：

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid

SVD-XT 模型下载地址：

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt

下载好模型后，将模型放到 checkpoints 目录下。

4、运行算法

可以使用 streamlit 运行：

streamlit run scripts/demo/video_sampling.py --server.port <your_port>

好了，今天就聊这么多吧。

我是 Jack，我们下期见！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1246956.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

mysql查询表的字段，字段名以及注释sql语句

mysql查询表的字段，字段名以及注释sql语句

sql语句如下： selecta.ordinal_position 序号,a.COLUMN_name 字段名,a.COLUMN_type 字段类型,(case a.is_nullable when NO then 是 else 否 end) 是否非空,(case a.column_key when PRI then 是 else 否 end) 是否主键,a.COLumn_comment 注释 frominformation_sch…

阅读更多...

PSP - 蛋白质真实长序列查找 PDB 结构短序列的算法

PSP - 蛋白质真实长序列查找 PDB 结构短序列的算法

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/134599076 在蛋白质结构预测的过程中，输入一般是蛋白质序列(长序列)，预测出 PDB 三维结构，再和 Ground Truth …

阅读更多...

2024深圳电子展，加快粤港澳电子信息发展，重点打造“湾区经济”

2024深圳电子展，加快粤港澳电子信息发展，重点打造“湾区经济”

在“十四五”期间，中国电子信息产业面临着新形势和新特点。随着国家对5G、人工智能、工业互联网、物联网等“新基建”的加速推进，以及形成“双循环”新格局的形势，新型显示、集成电路等产业正在加速向国内转移。这一过程不仅带来了新的应用前…

阅读更多...

日常生活小技巧 -- Win10 系统安装 Linux 子系统

日常生活小技巧 -- Win10 系统安装 Linux 子系统

最新要在win10系统安装linux子系统，看一下教程。参看：Win10 系统安装 Linux 子系统教程(WSL2 Ubuntu 20.04 Gnome 桌面 ） 1、开启开发人员模式 2、适用于linux的Windows子系统勾选下图三个选项，重启。 3、安装 Ubuntu 创建…

阅读更多...

centos系统下，docker安装sqlserver并用本地Navicat连接

centos系统下，docker安装sqlserver并用本地Navicat连接

文章目录一，centos下安装docker二，docker安装sqlserver20192.1 安装遇到的问题2.1.1 修改用户名进不去数据库2.1.2 安装2022版的sqlserver发现启动失败三，Navicat连接centos下的sqlserver3.1 下载ODBC Driver 参考微软网址： 使…

阅读更多...

ELK企业级日志分析平台——elasticsearch

ELK企业级日志分析平台——elasticsearch

集群部署文档：https://www.elastic.co/guide/en/elasticsearch/reference/7.6/index.html 下载：https://elasticsearch.cn/download/ 主机 ip 角色 k8s1 192.168.92.11 cerebro elk1 192.168.92.31 elasticsearch elk2 192.168.92.32 elasti…

阅读更多...

U9二次开发之轻量服务项目开发

U9二次开发之轻量服务项目开发

最近公司要开发一个下载图纸的U9轻量级接口，轻量级接口就是restful api，可以直接通过get、post等方式调用，参数的传送和结果的返回都使用JSON格式，用起来比Webservice接口爽多了。如果是开发新的接口，我建议都用轻量…

阅读更多...

java springboot测试类虚拟MVC环境匹配返回值与预期内容是否相同 (JSON数据格式) 版

java springboot测试类虚拟MVC环境匹配返回值与预期内容是否相同 (JSON数据格式) 版

上文java springboot测试类鉴定虚拟MVC请求返回内容与预期值是否相同我们讲了测试类中虚拟MVC发送请求匹配返回内容是否与预期值相同但是让我意外的是既然没人骂我因为我们实际开发返回的基本都是json数据字符串的接口场景是少数的我们在java文件目录下创建一个 dom…

阅读更多...

系列二、IOC DI

系列二、IOC DI

一、IOC 1.1、概述 IOC的中文意思是控制反转，通俗地讲就是把创建对象的控制权交给Spring去管理，以前是由程序员自己去创建、控制对象，现在交由Spring去创建对象 & 管理对象（维系对象之间的关系），使用I…

阅读更多...

软件测试简历怎么编写项目经历？

软件测试简历怎么编写项目经历？

概述工作这10多年来，也经常做招聘的工作，面试过的人超过50人次了，而看过的候选人的简历则有几百份了，但是清晰且能突出重点的简历，确实很少遇到。这里基本可以说明一个问题，很多候选人是不太清楚如何写…

阅读更多...

python+gurobi求解线性规划、整数规划、0-1规划

python+gurobi求解线性规划、整数规划、0-1规划

文章目录简单回顾线性规划LP整数规划IP0-1规划简单回顾线性规划是数学规划中的一类最简单规划问题，常见的线性规划是一个有约束的，变量范围为有理数的线性规划。如： 使用matlab的linprog函数即可求解简单的线性规划问题，可以参…

阅读更多...

CentOS7磁盘挂载

CentOS7磁盘挂载

1 引言本文主要讲述CentOS7磁盘挂载相关知识点和操作。 2 磁盘挂载步骤1： 查看机器所挂硬盘及分区情况 fdisk -l查询结果： 由上图可以看到该结果包含：硬盘名称、硬盘大小等信息。属性解释说明Disk /dev/vda硬盘名称53.7G磁盘大…

阅读更多...

代码随想录算法训练营第四十五天【动态规划part07】 | 70. 爬楼梯（进阶）、322. 零钱兑换、279.完全平方数

代码随想录算法训练营第四十五天【动态规划part07】 | 70. 爬楼梯（进阶）、322. 零钱兑换、279.完全平方数

70. 爬楼梯 （进阶） 题目链接： 题目页面求解思路： 动规五部曲确定dp数组及其下标含义：爬到有i阶楼梯的楼顶，有dp[i]种方法递推公式：dp[i] dp[i-j];dp数组的初始化：dp[0] 1;确…

阅读更多...

h5小游戏-盖楼游戏

h5小游戏-盖楼游戏

盖楼游戏一个基于JavaScrtipt、Html5 的盖楼游戏效果预览点我下载源代码 Game Rule 游戏规则以下为默认游戏规则，也可参照下节自定义游戏参数每局游戏生命值为3，掉落一块楼层生命值减1，掉落3块后游戏结束，单局游戏无时间限…

阅读更多...

机器学习算法——聚类算法

机器学习算法——聚类算法

目录 1. 概述2. K-MEANS算法2.1 工作流程2.2 代码实践2.3 Mini Batch K-Means2.4 存在问题2.5 K-MEANS可视化 3. DBSCAN算法3.1 基本概念3.2 工作流程3.3 代码实践3.4 DBSCAN算法可视化 1. 概述聚类算法是一种无监督学习方法，用于将数据集中的对象分组或聚集成具有…

阅读更多...

今日现货白银价要素分析

今日现货白银价要素分析

现货白银市场每天走势图上的K线，都是由开盘价、收盘价、最高价、最低价四个价格要素组成。K线作为一种特殊的市场语言，不同具体的形态有不同的含义，当收盘价高于开盘价就形成阳线，反之就形成阴线。如果阳线出现在银价盘整或行情下…

阅读更多...

多线程Thread（初阶三：线程的状态及线程安全）

多线程Thread（初阶三：线程的状态及线程安全）

目录一、线程的状态二、线程安全一、线程的状态 1.NEW Thread：对象创建好了，但是还没有调用 start 方法在系统中创建线程。 2.TERMINATED： Thread 对象仍然存在,但是系统内部的线程已经执行完毕了。 3.RUNNABLE： 就绪状态&…

阅读更多...

红酒按照糖含量怎么分类？

红酒按照糖含量怎么分类？

我们常听人们形容葡萄酒为干型或甜型，这指的是葡萄酒的含糖量。不含糖就是干型，含糖少就是半干型，含糖多就是甜型，这是葡萄酒分类的一种——按糖量分。云仓酒庄的品牌雷盛红酒分享一般分为干型、半干型、半甜型、甜型四种。云仓…

阅读更多...

朋友在阿里测试岗当HR，给我整理的面试总结

朋友在阿里测试岗当HR，给我整理的面试总结

以下是软件测试相关的面试题及答案，欢迎大家参考! 1、你的测试职业发展是什么? 测试经验越多，测试能力越高。所以我的职业发展是需要时间积累的，一步步向着高级测试工程师奔去。而且我也有初步的职业规划，前3年积累测试经验&…

阅读更多...

数据结构：二叉查找树，平衡二叉树AVLTree，红黑树RBTree，平衡多路查找数B-Tree，B+Tree

数据结构：二叉查找树，平衡二叉树AVLTree，红黑树RBTree，平衡多路查找数B-Tree，B+Tree

二叉查找树二叉树具有以下性质：左子树的键值小于根的键值，右子树的键值大于根的键值。对该二叉树的节点进行查找发现深度为1的节点的查找次数为1，深度为2的查找次数为2，深度为n的节点的查找次数为n，因此其平均查找次…

阅读更多...

推荐文章

最新文章