如何在算家云搭建Open-Sora1.1(视频生成)

news2024/9/20 19:30:35

一、Open-Sora1.1简介

Open-Sora 1.1 项目是 Colossal AI 团队开发的一个完全开源的视频生成项目,该项目致力于高效制作高质量视频,并通过开源原则实现先进视频生成技术的低成本普及。

1. 项目背景与目标

Open-Sora 项目旨在通过提供开源的模型、工具和内容,简化视频制作的复杂性,使更多人能够参与到内容创作领域的创新、创造和包容中。相比于 1.0 版本,Open-Sora1.1在功能、训练效率和整体灵活性方面进行了显著改进。

2. 主要特性与改进

(1)视频生成能力增强

  • 延长视频长度 :Open-Sora 1.1 能够生成长达 21 秒的视频(部分信息提到为 15 秒,但最新消息显示已提升至 21 秒),与 Open-Sora 1.0 的 2 秒限制相比,这是一个显著的增加。
  • 可变输出 :支持不同分辨率(从 144p 到 720p)和宽高比的视频生成,满足多样化的项目需求。

(2)图像生成功能

  • 除了视频生成外,Open-Sora 1.1 还扩展了图像生成功能,使用户能够在生成视频的同时创建高质量的静态图像。

(3)增强的提示功能

  • 允许用户利用图像和视频作为视频生成的提示,实现图转动画、视频延展、视频编辑和视频拼接等功能。

**(4)模型架构与训练优化 **

  • 模型架构修改 :引入了 ST-DiT-2 模型架构,这是 Open-Sora 1.0 中使用的原始模型架构的改进版本,提高了训练稳定性和整体性能。
  • 多任务学习 :在训练过程中采用多任务学习方法,使模型能够同时处理各种视频属性,包括分辨率、帧长和宽高比。
  • 数据处理流程 :采用了一套细致的数据处理流程,包括原始视频分割、多分数评估、字幕和匹配分数计算、最终过滤和摄像机运动检测等步骤,确保高质量的训练数据。
  • Bucket 系统 :用于在不同分辨率的视频上高效训练模型,通过分桶的方式支持不同批次的动态尺寸,降低计算成本并平衡 GPU 负载。

**(5)技术细节 **

  • 时序注意力 :引入了 RoPE 位置编码,并使用 AdaIN 和 LN 来稳定训练过程。
  • QK-normalization :与 SD3 一样,使用 QK-norm 来稳定半精度训练过程。
  • 支持不同尺寸视频作为训练样本 :增加视频的宽高、时长和 fps 等信息到 text 中作为条件,使模型能够生成具有多种特性的视频。

二、模型搭建流程

下面将以 Open-Sora1.1项目进行部署,由于模型较大建议使用 RTX3090 及以上显卡 。

1. 选择主机和镜像

(1)在“租用实例”页面,点击进入应用社区,选择相应的模型

image.png

image.png

(2)点击“选择”后会自动匹配模型,选择 3090 卡,点击“立即创建”即可创建实例

image.png

2. 进入创建的实例

在“项目实例”页面点击对应实例的“Web SSH”操作

image.png

image.png

以下命令均在该页面进行:

(1)打开文档

cd Open-Sora-Plan-1.1.0

(2)激活虚拟环境 opensora

conda activate opensora

(3)指定端口

export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080

(4) 指定端口,运行 py 文件

export HF_ENDPOINT=https://hf-mirror.com
python -m opensora.serve.gradio_web_server

出现以下界面即为运行成功

image.png

3.开启外部访问获取访问链接

返回“项目实例”列表,选择并点击对应实例“开放端口”操作。

可选择”本地私密访问“进行下载解压ssh工具,打开得到对应界面,选择对应的项目以及实例开放端口即可。也可选择”对外开放端口“,实名认证后即可使用。

点击开放端口在浏览器输入 127.0.0.1:8080即可访问。

image.png

image.png

4.进入 webUI 界面

输入访问网址 127.0.0.1:8080到新网页即可开始 ui 界面的使用

屏幕截图

image.png

以上就是在算家云搭建 OpenSora 1.1 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

复制下方网址,进入算家云,选择模型,一键开启 AI 之旅!

算家云应用社区 www.suanjiayun.com/container/#/mirror

首页.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2120978.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Python】数据可视化之核密度

KDEPlot(Kernel Density Estimate Plot,核密度估计图)是seaborn库中一个用于数据可视化的函数,它基于核密度估计(KDE)这一非参数统计方法来估计数据的概率密度函数。KDEPlot能够直观地展示数据的分布特征&a…

定点荧光标记蛋白:轻松搞定CAR-T阳性率检测

CAR-T细胞疗法在8月份提前进入“丰收季”。8月27日NMPA官网公示,**国内第五款CAR-T细胞疗法——来自传奇生物的西达基奥仑赛注射液获批上市。**这款靶向BCMA的细胞疗法用于治疗复发或难治性多发性骨髓瘤(R/R MM)成人患者。同一天,…

NDP协议是怎样帮助IPv6实现网络安全运行的?

在复杂多变的网络环境中,确保各节点之间能够高效、准确地发现与通信,是构建稳定、可扩展网络架构的基石。那么IPv6是依靠什么实现网络安全运行的呢?今天我将就IPv6中的一个重要协议——NDP协议的基本概念及工作原理展开深入分析。 NDP协议的基…

体育馆管理系统|基于SpingBoot+vue的体育馆管理系统(源码+数据库+文档)

体育馆管理系统 目录 基于SpingBootvue的体育馆管理系统 一、前言 二、系统设计 三、系统功能设计 系统功能实现 1登录 2学生管理页面 3系统主界面模块的实现 4器材管理模块的实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源…

ICM20948 DMP代码详解(11)

接前一篇文章:ICM20948 DMP代码详解(10) 上一回讲解完了icm20948_sensor_setup函数的第1段代码,本回继续往下解析。为了便于理解和回顾,再次贴出icm20948_sensor_setup函数源码,在EMD-App\src\ICM20948\sen…

一文讲清投影,定义投影,投影栅格……

正确的空间坐标系是进行地理分析和处理的基础,投影是其中十分重要的概念。在ArcGIS系列的软件中关于投影的工具有四个,分别是定义投影、投影、投影栅格、批量投影。 你能分清他们吗? 如果不能。别急,下面我来给你一一介绍。 定…

虚拟机卡死问题

升级VMware至15.1.0版本解决Windows 10 1903下VMware Workstation 15 Pro虚拟机死机问题 如题,在几乎全新的Windows 10 1903操作系统下,在VMware Workstation中安装虚拟机经常出现死机现象,主要表现在以下两个方面: 创建好虚拟机后…

【Qt】按钮样式--按钮内部布局(调整按钮文本和图标放置在任意位置)

要求: 有一个按钮,要求按钮的右下角显示开关,点击切换开关状态 ps:注意,要求你添加完了之后,整个按钮的点击区域不变(就是说,点击右下角的文本,也可以触发按钮的点击事件…

.net MAUI应用生命周期

.NET Multi-platform App UI (.NET MAUI) 应用通常有四种执行状态:“未运行”、“运行中”、“已停用”和“已停止”。 当应用从未运行状态转换为运行状态、从运行状态转换为已停用状态、从已停用状态转换为已停止状态、从已停止状态转换为运行状态,以及…

四七层如何获取客户端真实地址

7层代理会对报文进行重新封装,封装过程中可以通过增加XFF的header传递客户端IP。4层转发不会修改报文。在不修改HTTP报文前提下,前置补充代理信息, 格式: PROXY TCP 客户端IP 代理端IP 客户端端口 代理端端口。 nginx 七层代理配置: server …

JavaEE---Spring MVC(6)

如何创建一个spring项目呢 2. 3. 上述步骤结束后就ok了

PLM系统有哪些品牌推荐?国内不错的PLM厂商有哪些?

在当今快速变化的商业环境中,产品生命周期管理PLM系统已成为企业技术创新和管理创新的重要工具。PLM系统涵盖了产品从概念设计到市场推出、使用维护直至最终报废的整个生命周期,通过整合与产品相关的所有信息,助力企业实现高效、协同的产品开…

SuperMap GIS基础产品FAQ集锦(20240909)

一、SuperMap iDesktopX 问题1:镶嵌了一份550GB的DOM,双击加载到地图需要读取550GB的数据,耗时很久,加载到地图后一操作就需要再次读取,请问在不创建金字塔的情况下,如何把这份数据集保存到地图&#xff0…

【Hot100算法刷题集】哈希-03-最长连续序列(含排序、哈希、并查集法未正确使用哈希表导致算法效率降低的分析)

🏠关于专栏:专栏用于记录LeetCode中Hot100专题的所有题目 🎯每日努力一点点,技术变化看得见 题目转载 题目描述 🔒link->题目跳转链接 给定一个未排序的整数数组 nums ,找出数字连续的最长序列&#x…

记录一下linux安装nginx,也是很简单了啦

1、下载nginx 官网下载nginx:http://nginx.org/,这里很简单,下载自己想要的版本就行,这里不罗嗦 1、进入home目录,建一个文件夹nginx rootroot ~]# cd /home rootroot home]# mkdir nginx rootroot home]# cd /nginx2…

什么是智慧箱变动环辅控系统?箱式变电站动环监控@卓振思众

智慧箱变动环辅控系统是一种智能化的辅助控制系统,主要用于对箱变(箱式变电站)等设备的运行环境进行监测和控制。以下是【卓振思众】智慧箱变动环辅控系统的主要功能特点: 一、环境监测方面温度监测:实时监测箱变内的温…

C#编写上位机通过OPC DA读取西门子PLC数据

Sync_RW 引用:Quick.OpcComRcw 文档中原程序会报错: 原因:需要在安装有Simatic NET V14的电脑上运行这个程序。 需要注释掉下面程序,否则读取时会无故障提示退出。 //finally里的程序要注释掉,否则一点击read按钮&a…

招商银行信用卡中心编程练习题题解(全)

第一天 递归:LeetCode21.合并两个有序链表 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x), next(nullptr) {}* ListNode(int x, ListNode…

掌握生成树 (STP、RSTP、MSTP) 最详细配置,轻松优化网络

目录 一. 实验内容 STP配置实验 RSTP配置实验 MSTP配置实验 二. 1 ) STP配置实验 实验拓扑 ​编辑 实验配置 实验结果 2 ) RSTP配置实验 实验拓扑 实验配置 实验结果 3 ) MSTP配置实验 实验拓扑 实验配置 ​编辑 实验结果 三 实验总结 一. 实验内容 1) …

齐齐哈尔医院系统等保测评,安全防护全面升级

随着数字化时代的到来,医疗系统的信息化建设日益重要。然而,随之而来的数据安全问题也成为了医疗机构必须面对的重大挑战。为了保障患者信息的安全以及整个医疗系统的稳定运行,齐齐哈尔市某医院近期进行了等保(等级保护&#xff0…