CosyVoice 本地部署详细教程 手把手小白教程

news2024/9/21 1:50:20

CosyVoice 本地部署详细教程

注意事项

  • 所有相关的软件、文件名称不要使用中文名称,也不要有中文路径,也不要有空格。
    包括C盘用户名,不要有中文或空格。

模型部署前准备

  • nvidia显卡,建议显存6G以上
  • AI框架CUDA、cuDNN安装 (已安装可跳过此步骤)
  • Git安装(已安装可跳过此步骤)
  • Miniconda安装(已安装可跳过此步骤)
  • 配套视频教程:cosyvoice本地部署详细教程 手把手小白版

一、AI框架CUDA安装 (已安装可跳过此步骤)

  1. 检查本机是否安装CUDA,以及CUDA版本
  • win+R 打开运行,输入cmd打开命令行窗口

  • 在这里插入图片描述

  • 输入nvcc -V 查看CUDA版本,注意’V’大写,若提示命令不存在,则未安装CUDA

    nvcc -V
    
  • 输入NVIDIA-smi,查看当前显卡支持的CUDA版本,最好高于12.0.

    NVIDIA-smi
    

    在这里插入图片描述

  1. 下载安装CUDA
  • 下载地址:https://developer.nvidia.com/cuda-toolkit-archive

  • 选择合适的版本,这里我选择的是12.4.0,之后依次选择系统windows、x86_64、10、exe(local),自己选择自己对应系统就可以。

  • 在这里插入图片描述

  • 点击安装,默认下一步即可,需要时可以更改安装位置,注意路径不要有中文或空格。

  • 配置环境变量, 搜索环境变量设置,编辑环境变量,将cuda的安装位置添加到系统变量。若安装程序已自动添加,无需更改。

  1. 下载安装cuDNN
  • 下载地址:https://developer.nvidia.com/rdp/cudnn-archive
  • 选择合适的版本,需对应之前安装的CUDA版本,如CUDA版本12.x,下载的对应的v8.9.7。(需要登录NVIDIA账号)
  • 免登录下载办法:找到需要的版本,右键–>复制链接–>导入下载器下载或浏览器新建页面粘贴链接下载
  • 解压压缩包,将文件夹内所有文件复制至之前安装的CUDA根目录,覆盖替换即可。
    D:\MyToolsSoftWare\CUDADevelopment\
    
  • 配置环境变量
    • 新建cuDNN系统环境变量
    • 变量名:CUDNN。变量值为:CUDA根目录、bin目录、include目录、lib\x64目录,中间由英文分号隔开。
      D:\MyToolsSoftWare\CUDADevelopment;D:\MyToolsSoftWare\CUDADevelopment\bin;D:\MyToolsSoftWare\CUDADevelopment\include;D:\MyToolsSoftWare\CUDADevelopment\lib\x64
      
    • 在系统path变量下,同样添加以上目录
    • 在这里插入图片描述
  1. 检查安装结果
  • win+R 打开运行,输入cmd打开命令行窗口
  • 输入nvcc -V 查看CUDA版本,注意’V’大写,若能正确返回CUDA版本号,证明安装成功。
    nvcc -V
    
    在这里插入图片描述

二、Git安装(已安装可跳过此步骤)

  • 下载地址:https://git-scm.com/downloads
  • 选择安装位置,默认安装即可。

三、Miniconda安装(已安装可跳过此步骤)

  • 下载地址:https://docs.anaconda.com/miniconda/

  • 点击页面中“Miniconda3 Windows 64-bit”版本下载

  • 在这里插入图片描述

  • 选择安装位置,建议新建conda文件夹,默认安装,勾选所有选项。

  • 在这里插入图片描述

  • 检查安装结果,win+R 打开运行,输入cmd打开命令行窗口

  • 输入conda --version,若能正确返回conda版本号,证明安装成功。

    conda --version
    

部署模型

注意:以下部署过程中命令均在命令行窗口中执行,如果命令行窗口执行过程中,一直提示SSLError或HTTPSConnectionError错误,则表示无法下载,需设置代理端口克隆和下载三方库:

设置方式:在命令行窗口运行以下指令

set http_proxy=http://127.0.0.1:你的代理端口地址 & set https_proxy=http://127.0.0.1:你的代理端口地址

代理端口需自行获取。

一、下载项目至本地

  1. Git克隆项目文件到本地:
    git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
    cd CosyVoice
    git submodule update --init --recursive
    
    PS:国内用户如果克隆失败,可以多尝试几次。有魔法的话,建议开魔法克隆。
    如果仍无法解决,可以下载压缩包文件(时间2024/9/2),历史版本。
    百度网盘下载:https://pan.baidu.com/s/1lXL6JBZXWFuzHgxUHSzlsg?pwd=1wan 提取码: 1wan
    夸克网盘下载:https://pan.quark.cn/s/f8da3aca0d92
  2. 创建conda环境
  • 在当前文件夹输入cmd,打开命令行窗口
  • 输入以下命令创建并启动虚拟环境
    conda create -n cosyvoice python=3.8
    conda activate cosyvoice
    

二、下载安装第三方依赖库

  1. 安装前需先修改文件夹中requirements.txt内容
    修改前:onnxruntime-gpu==1.16.0; sys_platform == 'linux'
    onnxruntime==1.16.0; sys_platform == 'darwin' or sys_platform == 'windows'
    
    修改后:onnxruntime==1.16.0
    
  2. 执行安装命令
    pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com
    
    上边为官方推荐镜像,速度较慢,推荐使用下方镜像。
    pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
    
  3. 手动安装torch
    安装过程中torch若下载过慢,可以手动下载该文件后,重新激活虚拟环境,手动安装该库。
    • 手动下载该文件(可用浏览器、IDM或迅雷下载),文件地址:https://download.pytorch.org/whl/cu118/torch-2.0.1%2Bcu118-cp38-cp38-win_amd64.whl
    • 重新激活虚拟环境,运行手动安装指令:指令格式为
      pip install 下载文件的完整路径 -i https://pypi.tuna.tsinghua.edu.cn/simple
      例如:
      pip install D:\AI\torch-2.0.1+cu118-cp38-cp38-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
      
  4. 重新执行安装三方库直至全部安装完成
    pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
    
  5. 可能出现的error
  • cython 安装失败

  • 在这里插入图片描述

    解决办法:手动安装

    pip install cython -i https://pypi.tuna.tsinghua.edu.cn/simple
    
  • 各种情况导致的“Failed to build pynini”,pynini安装失败

  • 在这里插入图片描述

    解决办法:conda手动安装

    conda install -c conda-forge pynini=2.1.5
    

三、下载模型

  1. 新建Python程序文件粘贴以下内容保存
    from modelscope import snapshot_download
    snapshot_download('iic/CosyVoice-300M', local_dir='pretrained_models/CosyVoice-300M')
    snapshot_download('iic/CosyVoice-300M-SFT', local_dir='pretrained_models/CosyVoice-300M-SFT')
    snapshot_download('iic/CosyVoice-300M-Instruct', local_dir='pretrained_models/CosyVoice-300M-Instruct')
    snapshot_download('iic/CosyVoice-ttsfrd', local_dir='pretrained_models/CosyVoice-ttsfrd')
    
  2. 激活虚拟环境,直接执行Python程序download_models.py
    python download_models.py
    
  3. 也可以从以下链接直接下载模型,解压至项目文件夹即可(2024/9/2)
    • 百度网盘下载:https://pan.baidu.com/s/1JDbj8JGKDACVXChe51PaoA?pwd=e8st 提取码: e8st
    • 夸克网盘下载:https://pan.quark.cn/s/fe824caf90a5 提取码:VM7V
  • 注意:如果出现模型下载失败问题,可以尝试更新modelscope==1.15.0包到1.17.0,更新脚本如下,进入虚拟环境后粘贴运行
    即可。
    pip install modelscope==1.17.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
    

四、运行模型

  1. 内置音色模型启动(命令行)
    conda activate cosyvoice
    python webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M-SFT
    start http://127.0.0.1:50000
    
  2. 内置音色模型启动(启动文件)
  • 新建bat文件,把以下命令粘贴进文件,运行即可。
    @echo off
    call conda activate cosyvoice
    start http://127.0.0.1:50000
    python webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M-SFT
    pause
    
  1. 克隆音色+跨语种克隆模型启动(命令行)
    conda activate cosyvoice
    python webui.py --port 50001 --model_dir pretrained_models/CosyVoice-300M
    start http://127.0.0.1:50001
    
  2. 克隆音色+跨语种克隆模型启动(启动文件)
  • 新建bat文件,把以下命令粘贴进文件,运行即可。
    @echo off
    call conda activate cosyvoice
    start http://127.0.0.1:50001
    python webui.py --port 50001 --model_dir pretrained_models/CosyVoice-300M
    pause
    
  1. 内置音色+语气微调模型启动(命令行)
    conda activate cosyvoice
    python webui.py --port 50002 --model_dir pretrained_models/CosyVoice-300M-Instruct
    start http://127.0.0.1:50002
    
  2. 内置音色+语气微调模型启动(启动文件)
  • 新建bat文件,把以下命令粘贴进文件,运行即可。
    @echo off
    call conda activate cosyvoice
    start http://127.0.0.1:50002
    python webui.py --port 50002 --model_dir pretrained_models/CosyVoice-300M-Instruct
    pause
    

五、总结

根据功能需求,点击对应的.bat文件启动程序。

  1. 内置音色生成;
  2. 克隆音色+跨语种克隆;
  3. 内置音色生成+语气微调;
  • 浏览器页面会同步打开,但是不显示内容。需等待命令行窗口加载完成后,刷新下网页即可显示程序界面。
  • 参考教程:https://note.youdao.com/s/Z83Sljd1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2100716.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

集成电路学习:什么是IP知识产权

一、IP:知识产权 IP是Intellectual Property的缩写,即知识产权。知识产权是一种无形的财产权,也称智力成果权,它指的是通过智力创造性劳动所获得的成果,并且是由智力劳动者对成果依法享有的专有权利。这种权利包括人身…

神仙公司名单(南京)

神仙公司(南京) 继续,神仙公司系列。 上一期我们介绍了 深圳的神仙公司,结果留言区的重点全都指向了 HW 和 BYD 🤣🤣 不愧是你们,但我们不是"那个"排行。 言归正传,这期给…

笔记:《利用Python进行数据分析》之透视表和交叉表

透视表和交叉表 透视表(pivot table)是各种电子表格程序和其他数据分析软件中一种常见的数据汇总工具。它根据一个或多个键对数据进行聚合,并根据行和列上的分组键将数据分配到各个矩形区域中。在Python和pandas中,可以通过本章所…

代码随想录算法训练营第十八天| 669. 修剪二叉搜索树、108. 将有序数组转换为二叉搜索树、538. 把二叉搜索树转换为累加树

今日内容 leetcode. 669 修剪二叉搜索树leetcode. 108 将有序数组转换为二叉搜索树leetcode. 538 把二叉搜索树转换为累加树 Leetcode. 669 修剪二叉搜索树 文章链接:代码随想录 (programmercarl.com) 题目链接:669. 修剪二叉搜索树 - 力扣&#xff08…

mathtype批量更改公式编号的格式

这是一个笔记 在使用的时候遇到的问题,经过研究发现mathtype生成的右编号公式可以批量更新 调整前 如图,如果调整前使用的是默认的编号格式,显示为 1.5 1.5 1.5: 这里面1和5的意义为: 1:节编号5:公式编号 如下:调整后 如果需要不按章节形式来分类,则可以通过以下…

大数据中心运营管理整体规划方案(32页PPT)

随着信息技术的飞速发展,大数据已成为推动产业升级、促进经济社会发展的重要力量。大数据中心作为数据存储、处理与分析的核心基础设施,其运营管理的规范化、高效化、智能化直接关系到数据价值的有效挖掘和企业的核心竞争力。大数据中心运营管理整体规划…

免费下载Win11 24H2专业版!附详细安装教程

今日,系统之家小编给大家带来2024年最新的Windows11 24H2专业版系统,更新后系统版本号将升至26100.1591。系统基于微软官方最新Windows 11 24H2专业版进行离线制作与优化,确保系统安全无毒,兼容性强,可完美支持新老机型…

构建可扩展的数据平台(数据平台设计中的数据网格趋势)

添加图片注释,不超过 140 字(可选) 欢迎来到雲闪世界。在本文中,我旨在深入研究各种类型的数据平台架构,更好地了解它们的演变、优势、劣势和实际应用。重点是数据网格架构、它在现代数据堆栈 (MDS) 中的作用以及当今…

Getting an error trying to import environment OpenAI Gym

题意:尝试导入 OpenAI Gym 环境时遇到错误 问题背景: I am trying to run an OpenAI Gym environment: 我正在尝试运行一个 OpenAI Gym 环境: env gym.make("ALE/Breakout-v5", render_mode"rgb_array")But I get th…

数据分析-MAC 编程环境安装教程

目标 在 Mac 电脑上,安装以下环境: 1. 安装 Anaconda:用于管理 Python 及其依赖库的分发,适用于数据科学和机器学习。 2. 安装 chromedriver:用于 Selenium 自动化测试,尤其是与 Google Chrome 浏览器的…

【爬虫软件】YouTube关键词搜索采集工具

我用Python开发的油管关键词搜索批量采集软件。 软件界面: 采集结果demo数据: 演示视频: https://www.bilibili.com/video/BV1uz421m7JA 完整讲解: https://www.bilibili.com/read/cv34407726

Redis高级-----持久化AOF、RDB原理

目前已更新系列: 当前:Redis高级-----持久化AOF、RDB原理 Redis高级---面试总结5种数据结构的底层实现 Redis高级----主从、哨兵、分片、脑裂原理-CSDN博客 Redis高级---面试总结内存过期策略及其淘汰策略 计算机网络--面试知识总结一 计算机网络-…

3.数据结构-c/c++实现栈(详解,栈容量可以动态增长)

一.栈的基本介绍 栈是一种只能够在一端进行插入和删除的顺序表。如下图 空栈:表示不含任何元素的栈 栈顶:表示允许进行插入和删除元素的一端 栈底:表示不允许进行插入和删除元素的一端 即栈是一种后进先出的线性表数据结构 二.栈的常见操…

尚硅谷Vue入门视频 笔记

尚硅谷视频:https://www.bilibili.com/video/BV1Zy4y1K7SH/?spm_id_from333.999.0.0&vd_sourcecec13bbe100bddfff8baf29d18ed8994 文章目录 模板语法data与el的2种写法MVVM模型事件事件修饰符事件的基本使用 计算属性简写形式 监视属性绑定样式条件渲染列表渲…

多线程篇(可见性 原子性 有序性(可见性))(持续更新迭代)

目录 一、volatile(关键字)(并发编程之美) 1. 前言 2. synchronized与volatile关键字对比 3. 什么时候使用volatile关键字 二、volatile(关键字)(深入理解JVM第三版) 1. 前言 …

儿童护眼灯哪个牌子好?家长必看这些眼科医生推荐的台灯

如今,学生们经常长时间使用平板电脑、手机和电脑等电子设备,这些设备的屏幕会产生频闪和蓝光辐射,进而影响视力健康。因此,护眼成为了家长们普遍关心的问题。视力疲劳和眼部疾病不仅会影响个人的生活质量,还可能引发长…

申请超长期IP地址SSL证书

随着互联网技术的不断发展,信息安全成为了企业和个人关注的核心议题之一。SSL证书不仅能够加密网站的通信数据,保护用户隐私,还能增强网站的可信度,提升搜索引擎排名等。通常情况下,SSL证书是绑定到域名上的&#xff0…

09--kubernetes持久化存储和StatefulSet控制器

前言:本章是k8s持久化存储的详细笔记,由持久化引申出来的statefulset控制器和无头svc都会在本章有详细记录。 1、K8s持久化存储PV和PVC 在前面文章已经使用卷挂载的方式将pod文件持久化保存在宿主机中,但实际工作中pod往往会以多副本形式存…

骨传导耳机哪个牌子最好?今天安利五款好口碑骨传导耳机!

基于对运动耳机多年的使用和深入研究,我想传达几个朴素却重要的观点:购买前请三思,避免盲目追求潮流。虽然网络上的热门款式引人瞩目,但它们的热度可能转瞬即逝;而高价位的知名品牌耳机,虽然品质有保证&…

SpringBoot整合Thymleaf实现页面静态化

1. 问题需求分析 在做乐优商城时,页面是通过Thymeleaf模板引擎渲染后返回到客户端。当商品详情页数据渲染时,在后台需要大量的数据查询,而后渲染得到HTML页面。在用户访问量大的情况下会对数据库造成压力,并且请求的响应时间过长…