AI 视频 | Stable Video Diffusion 来了！（附体验地址）

AI 视频 | Stable Video Diffusion 来了！（附体验地址）

news2026/2/15 22:02:48

1. 介绍

11 月 21 日，Stability AI 推出了 Stable Video Diffusion，这是 Stability AI 的第一个基于图像模型 Stable Diffusion 的生成式视频基础模型。

目前 Stability AI 已经在 GitHub 上开源了 Stable Video Diffusion 的代码，在 Hugging Face 上也可以找到模型本地运行所需要的 weights。

「GitHub」

https://github.com/Stability-AI/generative-models

「Hugging Face」

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt

目前该视频模型可以很容易地适配下游各种任务，并计划基于此基础模型建立一系列模型，类似于围绕 stable diffusion 建立一个生态系统。

在外部评估中，Stable Video Diffusion 发布的两种图片生视频的模型 SVD 和 SVD-XT，在用户偏好研究中，已经超过了 Runway 和 Pika Labs。

2. 局限性

需要注意的是：

1、Stability AI 强调，此模型现阶段还不适用于实际或者商业应用。

2、网页的体验目前还未向所有人开放，可以在这里申请候补（https://stability.ai/contact）。

另外，stable-video-diffusion-img2vid-xt 还有一些局限性，在 Hugging Face 上也说明了，该模型仅用于研究目的。

局限性：

1、生成的视频相当短（<=4秒），并且该模型无法实现完美的照片级别的视频。

2、当前模型可能会生成没有运动的视频，或非常缓慢的相机平移的视频。

3、无法通过文本控制模型。

4、模型无法呈现清晰的文本。

5、面孔和人物可能无法正确生成。

6、模型的自编码部分是有损耗的。

3. 如何体验

Hugging Face 上的体验地址：https://huggingface.co/spaces/multimodalart/stable-video-diffusion

不过上传图片点生成后，提示「This application is too busy」。

后来看到国外一位开发者 mkshing 的分享：https://colab.research.google.com/github/mkshing/notebooks/blob/main/stable_video_diffusion_img2vid.ipynb

打开链接后，点击「代码执行程序」-「全部运行」就可以了，过程有点慢，感兴趣的小伙伴可以跑一下~

关于 Stable Video Diffusion 更多详细的介绍，可以查看论文：https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets

4. 参考网址

https://stability.ai/news/stable-video-diffusion-open-ai-video-model

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1245732.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

geemap学习笔记013：为遥感动态GIF图添加图名

geemap学习笔记013：为遥感动态GIF图添加图名

前言遥感动态GIF图可以展示地理区域随时间的变化，这对于监测自然灾害、湿地变化、城市扩展、农田变化等方面非常有用，并且可以反复观察图像，以更深入地了解地表的动态变化。本节主要是对遥感动态GIF图添加图名，以便于更好地理解…

阅读更多...

BUUCTF 刷新过的图片 1

BUUCTF 刷新过的图片 1

BUUCTF:https://buuoj.cn/challenges 题目描述： 浏览图片的时候刷新键有没有用呢注意：得到的 flag 请包上 flag{} 提交密文： 下载附件，解压得到一个.jpg图片。解题思路： 1、根据题目提示，结合键盘上…

阅读更多...

Go语言网络爬虫工程经验分享：pholcus库演示抓取头条新闻的实例

Go语言网络爬虫工程经验分享：pholcus库演示抓取头条新闻的实例

网络爬虫是一种自动从互联网上获取数据的程序，它可以用于各种目的，如数据分析、信息检索、竞争情报等。网络爬虫的实现方式有很多，不同的编程语言和框架都有各自的优势和特点。在本文中，我将介绍一种使用Go语言和pholcus库的网络爬…

阅读更多...

qgis添加postgis数据

qgis添加postgis数据

左侧浏览器-PostGIS-右键-新建连接展开-双击即可呈现可以点击编辑按钮对矢量数据编辑后是直接入库的，因此谨慎使用。

阅读更多...

【JavaWeb】HTMLCSSJavaScript

【JavaWeb】HTMLCSSJavaScript

HTML&CSS&JavaScript 文章目录 HTML&CSS&JavaScript一、开发工具及在线帮助文档二、 HTML2.1 HTML&CSS&JavaScript的作用2.2 HTML基础结构2.3 HTML概念词汇解释2.4 HTML的语法规则2.5 常用标签三、CSS3.1 引入方式3.2 CSS选择器3.3 CSS浮动3.4 CSS定位…

阅读更多...

数据结构与算法【B树】的Java实现+图解

数据结构与算法【B树】的Java实现+图解

目录 B树特性实现节点准备大体框架实现分裂实现新增实现删除完整代码 B树也是一种自平衡的树形数据结构，主要用于管理磁盘上的数据管理（减少磁盘IO次数）。而之前说的AVL树与红黑树适合用于内存数据管理。存储一个100w的数…

阅读更多...

CTF PWN-攻防世界level3之libc动态库寻址

CTF PWN-攻防世界level3之libc动态库寻址

文章目录前言动态链接Plt与Got简单例子延迟绑定 level3题目简析EXP构造Getshell 总结前言本题目 level3 延续了 CTF PWN-攻防世界XCTF新手区WriteUp 一文中的 PWN 题目训练，是 level2 题目的衍生。与 level2 不同的是，存在栈溢出漏洞的 level3&#…

阅读更多...

【DevOps】Git 图文详解（九）：工作中的 Git 实践

【DevOps】Git 图文详解（九）：工作中的 Git 实践

本系列包含： Git 图文详解（一）：简介及基础概念Git 图文详解（二）：Git 安装及配置Git 图文详解（三）：常用的 Git GUIGit 图文详解（四）&a…

阅读更多...

2023年亚太地区数学建模大赛问题A

2023年亚太地区数学建模大赛问题A

采果机器人的图像识别技术中国是世界上最大的苹果生产国，年产量约为3500万吨。与此同时，中国也是世界上最大的苹果出口国，全球每两个苹果中就有一个，全球超过六分之一的苹果出口自中国。中国提出了一带一路倡议（BRI&…

阅读更多...

Linux - 文件系统 - 理解目录 - 理解软/硬链接

Linux - 文件系统 - 理解目录 - 理解软/硬链接

前言在上篇博客当中，我们对文件系统和 inode 做了初步了解，本博客将在上篇博客的基础之上，对于文件系统当中的目录进行进步一阐述。 Linux - 进一步理解文件系统 - inode - 机械硬盘-CSDN博客目录一个文件有一个 inode，…

阅读更多...

BUUCTF [WUSTCTF2020]find_me 1

BUUCTF [WUSTCTF2020]find_me 1

BUUCTF:https://buuoj.cn/challenges 题目描述： 得到的 flag 请包上 flag{} 提交。感谢 Iven Huang 师傅供题。比赛平台：https://ctfgame.w-ais.cn/ 密文： 下载附件，得到一个.jpg图片。解题思路： 1、得到一张图…

阅读更多...

vue3-组件传参及计算属性

vue3-组件传参及计算属性

🌈个人主页：前端青山 🔥系列专栏：Vue篇 🔖人终将被年少不可得之物困其一生依旧青山,本期给大家带来vue篇专栏内容:vue3-组件传参及计算属性目录 vue3中的组件传参 1、父传子 2、子传父 toRef 与 toRefs vue3中…

阅读更多...

大数据系列15：lightgbm笔记

大数据系列15：lightgbm笔记

1. 安装建议用conda安装。首先安装miniconda，在官网下载对应的版本。然后将系统的python和pip定位到miniconda文件夹下。然后用conda安装lightgbm，在Mac m2芯片上测试可行。（用pip直接安装通不过编译）。 2. 简单case 将lig…

阅读更多...

php xml数据转数组两种方式

php xml数据转数组两种方式

目录方法一、可以使用simplexml_load_string()函数将XML数据转换为数组。方法二、使用PHP内置的DOMDocument类来将XML数据转换为数组的方法方法一、可以使用simplexml_load_string()函数将XML数据转换为数组。 $xmlData <root><name>John Doe</name>&l…

阅读更多...

Cesium 展示——地球以及渲染数据导出（下载）为图片或 pdf

Cesium 展示——地球以及渲染数据导出（下载）为图片或 pdf

文章目录需求分析新加需求分析第一种方式第二种方式需求将 Cesium 球体以及渲染数据导出为 jpg/png/pdf 分析获取场景 scene 信息，转为image 的 octet-stream 流进行下载为图片 /*** @todo canvas 导出图片* @param {string} dataurl - 地址* @return {Blob}*/ functio…

阅读更多...

杭州银行连接解决方案：集成CRM、用户运营和广告推广系统

杭州银行连接解决方案：集成CRM、用户运营和广告推广系统

自动化与智能化是企业新的增长引擎。在数字化时代，企业需要通过数字化工具来提高效率和效益，这也是杭州银行推出的连接解决方案的初衷。该解决方案集成了CRM、用户运营和广告推广系统，为企业提供全方位的数字化转型支持。杭州银行连接解决方…

阅读更多...

「高并发系统设计」如何提高系统性能

「高并发系统设计」如何提高系统性能

「高并发系统设计」如何提高系统性能参考&鸣谢⾼并发系统如何做性能优化？ 玄明Hanko 高并发系统设计和优化的通用方法论渝言家文章目录「高并发系统设计」如何提高系统性能[toc]一、高并发系统设计三大目标高性能高可用可扩展二、性能优化原则问题导…

阅读更多...

【硬核HeyGen平替】在window平台上使用MyHeyGen

【硬核HeyGen平替】在window平台上使用MyHeyGen

最近在研究HeyGen的平替开源项目，然后发现了MyHeyGen这个项目，但是文档上面并没有说明如果在window平台上使用，考虑到非window平台安装显卡驱动什么的比较繁琐，所以尝试硬着头皮干... 前提开源项目中所需的环境准备要先准备好 1…

阅读更多...

qgis添加xyz栅格瓦片

qgis添加xyz栅格瓦片

方式1：手动一个个添加左侧浏览器-XYZ Tiles-右键-新建连接例如添加高德瓦片地址 https://wprd01.is.autonavi.com/appmaptile?langzh_cn&size1&style7&x{x}&y{y}&z{z} 双击即可呈现收集到的一些图源，仅供参考，其中一…

阅读更多...

中断方式的数据接收

中断方式的数据接收

中断接收简介回顾之前的代码之前的代码是等待标志位RXNE位为1才有数据进而读取数据存放在变量c中再根据c变量的数据是为0还是为1进而编写灯亮灭的代码 if语句但这样的代码明显不符合裸机多任务的编程模型因为在while中为进程进程执行的时间不能大于5ms 但是while&…

阅读更多...

推荐文章

最新文章