如何在算家云搭建Kolors(图像生成)

news2024/10/12 6:41:37

一、模型介绍

Kolors 是快手 Kolors 团队基于潜在扩散的大规模文本转图片生成模型。经过数十亿个文本-图片对的训练,Kolors 在视觉质量、复杂语义准确性和中英文文本渲染方面均比开源和闭源模型具有显著优势。此外,Kolors 支持中英文输入,在理解和生成中文特定内容方面表现出色。

具有以下特点

  • 出色的视觉质量 :Kolors 能够生成具有高分辨率和逼真度的图像。例如在生成自然风光、人物肖像等方面,能够呈现出令人惊艳的效果。
  • 复杂语义准确性 :能够准确理解和表达复杂的语义信息,避免生成模糊或错误的图像,当处理包含多个元素和关系的文本描述时,仍能生成符合要求的准确图像。
  • 中英文文本渲染能力 :无论是中文还是英文的文本输入,都能有效地转化为高质量的图片,满足不同语言用户的需求。

二、模型搭建流程

1. 创建容器实例

(1)进入算家云的“应用社区”,点击搜索找到"kolors",点击“创建应用”,即可进入容器平台

【注】模型较大,需扩容数据盘

image.png

image.png

(2)点击进入之后会自动匹配模型,选择显卡,点击“立即创建”即可创建实例

image.png

也可以点击”专业创建“,自主选择 GPU 型号、计费方式等配置

image.png

2. 启动项目

在“项目实例”页面点击对应实例的“WebShell”,进入终端操作页面

image.png

3. 终端操作

进入命令操作页后,输入或者复制粘贴一下命令

【注】模型较大,需扩容数据盘

  • 下载模型及进行推理
cd Kolors
conda activate kolors
python d.py   #下载模型
python3 scripts/sample.py "一张瓢虫的照片,微距,变焦,高质量,电影,拿着一个牌子,写着“可图”"  #进行推理

下载模型:

image.png

进行推理:

image.png

  • 启动webui
export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
python3 scripts/sampleui.py  #打开页面

如图所示:

image.png

注意:模型路径需与推理脚本路径设置一致。

如根据代码行中的路径,脚本路径为

ckpt_dir = '/root/sj-tmp/Kwai-Kolors/Kolors/'

根据需求修改

text_encoder_path = os.path.join(ckpt_dir, 'text_encoder')
vae_path = os.path.join(ckpt_dir, 'vae')
scheduler_path = os.path.join(ckpt_dir, 'scheduler')
unet_path = os.path.join(ckpt_dir, 'unet')

4. 开启外部访问

返回“项目实例”列表,选择并点击对应实例的“更多”-“开放端口”操作。

image.png

5. 获取访问地址,并开始使用

打开浏览器,在地址栏 Ctrl+V 粘贴复制的访问地址进行访问,即可开始使用 kolors。

image.png

image.png

以上就是在算家云搭建 Kolors 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击应用社区(suanjiayun.com) ,选择模型,一键开启 AI 之旅!

971a4f51b8f1c01ea3fc332bef04cbf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2207324.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言基础语法——类型转换

数据有不同的类型,不同类型数据之间进行混合运算时涉及到类型的转换问题。 转换的方法有两种: 自动类型转换(隐式转换):遵循一定的规则,由编译系统自动完成强制类型转换(显示转换)…

http协议概述与状态码

目录 1.HTTP概述 1.1请求报文起始行与开头 ​1.2响应报文起始行 ​ 1.3响应报文开头 ​ 2.http状态协议码 1.HTTP概述 默认端口 80 HTTP超文本传输与协议: 数据请求和响应 传输:将网站的数据传递给用户 超文本:图片 视频等 请求request:打开网站 访问网站 响应r…

Python数据分析-垃圾邮件分类

一、研究背景 随着电子通信技术的飞速发展,电子邮件已经成为人们日常工作和生活中不可或缺的一部分。然而,伴随着这一趋势,垃圾邮件(Spam)的数量也在急剧增加。垃圾邮件不仅会占用用户的邮箱空间,还可能含…

设置dl服务解决github pushTimed out问题

提交代码到GitHub,一直提示提交失败 我们一般是fq挂的dl服务器进行的,而git需要配置下dl,此时我们要将dl服务器对应的IP地址和端口为我们所调用。 查找dl服务器(windows直接搜索dl服务器设置,mac参考官网&#xff09…

【北京迅为】《STM32MP157开发板嵌入式开发指南》-第二十二章 安装VMware Tool 工具

iTOP-STM32MP157开发板采用ST推出的双核cortex-A7单核cortex-M4异构处理器,既可用Linux、又可以用于STM32单片机开发。开发板采用核心板底板结构,主频650M、1G内存、8G存储,核心板采用工业级板对板连接器,高可靠,牢固耐…

学习python自动化——pytest单元测试框架

一、什么是pytest 单元测试框架,unittest(python自带的),pytest(第三方库)。 用于编写测试用例、收集用例、执行用例、生成测试结果文件(html、xml) 1.1、安装pytest pip instal…

【ARM Linux驱动开发】嵌入式ARM Linux驱动开发基本步骤

【ARM Linux驱动开发】嵌入式ARM Linux驱动开发基本步骤 文章目录 开发环境驱动开发(以字符设备为例)安装驱动应用程序开发附录:压缩字符串、大小端格式转换压缩字符串浮点数压缩Packed-ASCII字符串 开发环境 首先需要交叉编译器和Linux环境…

豆包PixelDance指南:字节跳动推出的AI视频生成大模型,突破多主体互动难关

豆包PixelDance是由字节跳动旗下火山引擎发布的AI视频生成大模型。它是业界首个突破多主体互动难关的视频生成模型,支持多风格多比例的一致性多镜头生成。PixelDance基于DiT架构,具备高效的DiT融合计算单元,能够实现复杂的多主体运动交互和多…

【高等数学】 一元函数积分学

1. 不定积分的计算 1.1. 基本积分表 知识点 例题 1.2. 凑微分(第一类换元法) 知识点 本质:利用复合函数求导法则的逆运算 第一步,识别或者凑出来复合函数的导函数 如果被积函数具备以下特点: 1.它由两项相乘来表…

《案例》—— OpenCV 实现2B铅笔填涂的答题卡答案识别

文章目录 一、案例介绍二、代码解析 一、案例介绍 下面是一张使用2B铅笔填涂选项后的答题卡 使用OpenCV 中的各种方法进行真确答案识别,最终将正确填涂的答案用绿色圈出,错误的答案不圈出,用红色圈出错误题目的正确答案最终统计正确的题目数…

PCL用KDtree,给搜索到的邻近点上色

用KDtree&#xff0c;给搜索到的邻近点上色。 #include <pcl/io/pcd_io.h> #include <pcl/point_types.h>#include <pcl/search/kdtree.h> // 包含kdtree头文件 #include <pcl/visualization/pcl_visualizer.h> #include <boost/thread/thread.hpp&…

【MATLAB】基于RSSI的蓝牙定位程序,4个锚点、二维平面

目录 ​编辑 商品描述 主要功能 技术细节 适用场景 下载链接 商品描述 这款基于接收信号强度指示&#xff08;RSSI&#xff09;原理的蓝牙定位程序&#xff0c;专为需要高效、可靠定位解决方案的开发者和研究人员设计。它能够在二维平面内&#xff0c;通过4个锚点实现对未…

ESNP静态路由进阶

0x01 前言 前一篇文章说了一个简单的ESNP静态路由实验&#xff0c;那么后面给了一个进阶拓扑&#xff1a;https://blog.csdn.net/Moxin1044/article/details/142850946 现在我们来解决一下 0x02 拓扑图 在上一个拓扑图基础上&#xff0c;规划了一个新的7.0网段&#xff0c;那…

DGX平台

NVIDIA DGX 平台 文章目录 前言一、优势经过验证的企业 AI 标准体验 DGX 平台的优势1. 先进的 AI 开发平台2. 融入了 NVIDIA AI 专业技术和服务3. 性能卓越、成本可预测二、用例DGX 助力 AI 走向各行各业1. 壳牌推动能源领域不断取得突破2. 宝马借助 AI 重新定义工厂物流3. 索尼…

【Linux】段错误(核心已转储)

原因:linux在安装docker 安装完之后再添加用户就报错了。。。。 各种查原因: 内存问题:系统可能存在内存损坏或不足的问题。磁盘空间不足:系统分区可能没有足够的空间来创建新用户。文件系统错误:文件系统可能存在错误。SELinux或AppArmor:安全模块可能阻止了 useradd 命…

el-table表头加红色星标

代码&#xff1a; <el-table-column prop"name" label"姓名" width"auto"><template #header><span style"color: red; margin-right: 4px">*</span><span>姓名</span></template></el…

Java idea中项目在maven执行install命令后出现Java heap space错误

Java idea中项目在maven执行install命令后出现Java heap space错误 这代表着你的maven需要足够的内存来编译和打包你的项目&#xff0c;而你分配的堆内存却不够用。 解决办法&#xff1a; idea左上角File —> Settings Build —> Build Tools —> Maven —> Run…

【GPT提问技巧】如何高效提问GPT:掌握核心技巧,获取高质量回答的终极指南!

人工智能&#xff08;AI&#xff09;已经成为我们获取知识和信息的重要工具。尤其是GPT&#xff08;Generative Pre-trained Transformer&#xff09;等语言模型&#xff0c;凭借其强大的自然语言处理能力&#xff0c;能够为我们提供丰富的回答。然而&#xff0c;如何向GPT提问…

【论文分享】ShEF: Shielded Enclaves for Cloud FPGAs 22‘ASPLOS

目录 ABSTRACTINTRODUCTIONBACKGROUND AND MOTIVATIONTrusted Execution Environments (TEEs)Conventional FPGA Security MechanismsRemote FPGAs-as-a-ServiceChallenges for Secure and Customized ComputingA lack of asymmetric keys.Presence of an untrusted ShellLack …

【Vue3】 h()函数的用法

目录 介绍 参数 使用案例 1.创建虚拟 DOM 元素 2. 组件的动态渲染 3. 创建功能组件 4.渲染动态属性 5. 使用插槽 6. 创建动态标签 介绍 h() 函数用于辅助创建虚拟 DOM 节点&#xff0c;它是 hypescript 的简称——能生成 HTML (超文本标记语言) 的 JavaScript&#x…