chattts一步步的记录,先跑起来。

news2024/12/28 19:27:27

0.下载git工具

Git - Downloads (git-scm.com)icon-default.png?t=O83Ahttps://git-scm.com/downloads

Download – TortoiseGit – Windows Shell Interface to Giticon-default.png?t=O83Ahttps://tortoisegit.org/download/

1.安装 随意,可以安汉化,也可不安。无所谓

 2.建个目录,我的上I:chat_kimi,你随意

3.打开官方

https://github.com/2noise/ChatTTS

拉取链接 

https://github.com/2noise/ChatTTS.git

 

4.假设你已经安装了conda.

 conda create --name chat_kimi python=3.11
conda activate chat_kimi

如下即可:

或者通过界面方式创建也可。

 5安装所要的文件,仅参考

(base) PS C:\Users\dell> conda activate chat_kimi
(chat_kimi) PS C:\Users\dell> cd I:\chat_kimi
(chat_kimi) PS I:\chat_kimi> cd chattts

用国内的源: 

pip install -r requirements.txt -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

 

6.模型Hf国内源,有一个位置是修改这个自动下载地址,等我找到后再更新到这。

HF-Mirroricon-default.png?t=O83Ahttps://hf-mirror.com/结构如

新建一个文件夹 models.或者,直接放在 chattts目录下,如:第二图:第二图的好处是所有代码不用修改了,直接用。

 

将网站上的文件全部下载到对应的位置

下载后,注意个别文件的主文件名,给加上了路径名了,一定要改回去。

对应下载到相应的地方。大约20分钟左右。

7.修改模型路径位置。如果是第一图的话.

注意这个位置。 

7.运行一下。

(chat_kimi) PS I:\chat_kimi\ChatTTS> python examples\web\web.py
C:\Users\dell\.conda\envs\chat_kimi\python.exe: can't open file 'I:\\chat_kimi\\ChatTTS\\examples\\web\\web.py': [Errno 2] No such file or directory
(chat_kimi) PS I:\chat_kimi\ChatTTS> python examples\web\webui.py
[+0800 20241013 17:03:24] [WARN]  WebUI  | funcs | no ffmpeg installed, use wav file output
[+0800 20241013 17:03:24] [INFO]  WebUI  | webui | loading ChatTTS model...
[+0800 20241013 17:03:24] [INFO] ChatTTS | dl | checking assets...
[+0800 20241013 17:03:25] [INFO] ChatTTS | dl | all assets are already latest.
[+0800 20241013 17:03:25] [WARN] ChatTTS | gpu | no GPU found, use CPU instead
[+0800 20241013 17:03:25] [INFO] ChatTTS | core | use device cpu
[+0800 20241013 17:03:25] [INFO] ChatTTS | core | vocos loaded.
[+0800 20241013 17:03:25] [INFO] ChatTTS | core | dvae loaded.
[+0800 20241013 17:03:26] [INFO] ChatTTS | core | embed loaded.
[+0800 20241013 17:03:26] [INFO] ChatTTS | core | gpt loaded.
[+0800 20241013 17:03:26] [INFO] ChatTTS | core | speaker loaded.
[+0800 20241013 17:03:26] [INFO] ChatTTS | core | decoder loaded.
[+0800 20241013 17:03:26] [INFO] ChatTTS | core | tokenizer loaded.
[+0800 20241013 17:03:26] [WARN]  WebUI  | funcs | Package nemo_text_processing not found!
[+0800 20241013 17:03:26] [WARN]  WebUI  | funcs | Run: conda install -c conda-forge pynini=2.1.5 && pip install nemo_text_processing
[+0800 20241013 17:03:26] [WARN]  WebUI  | funcs | Package WeTextProcessing not found!
[+0800 20241013 17:03:26] [WARN]  WebUI  | funcs | Run: conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
[+0800 20241013 17:03:26] [INFO]  WebUI  | webui | Models loaded successfully.
* Running on local URL:  http://0.0.0.0:8080

To create a public link, set `share=True` in `launch()`.
text:   0%|▏                                                                            | 1/384(max) [00:00,  3.95it/s]We detected that you are passing `past_key_values` as a tuple of tuples. This is deprecated and will be removed in v4.47. Please convert your cache or use an appropriate `Cache` class (https://huggingface.co/docs/transformers/kv_cache#legacy-cache-format)
text:  17%|█████████████▎                                                              | 67/384(max) [00:05, 13.30it/s]
code:  24%|█████████████████▉                                                        | 495/2048(max) [00:31, 15.72it/s]

8.gpu竟然不干活。发生了什么?

 CUDA Toolkit Archive | NVIDIA Developericon-default.png?t=O83Ahttps://developer.nvidia.com/cuda-toolkit-archive

 CUDA安装教程(超详细)-CSDN博客icon-default.png?t=O83Ahttps://blog.csdn.net/m0_45447650/article/details/123704930?ops_request_misc=%257B%2522request%255Fid%2522%253A%252229DBE75F-820D-4C34-94EB-A83EC55EC789%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=29DBE75F-820D-4C34-94EB-A83EC55EC789&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-123704930-null-null.142%5Ev100%5Epc_search_result_base5&utm_term=cuda%E5%AE%89%E8%A3%85&spm=1018.2226.3001.4187

 

 

cuda安装
安装cuda时,第一次会让设置临时解压目录,第二次会让设置安装目录;

临时解压路径,建议默认即可,也可以自定义。安装结束后,临时解压文件夹会自动删除;

安装目录,建议默认即可;

注意:临时解压目录千万不要和cuda的安装路径设置成一样的,否则安装结束,会找不到安装目录的!!!

选择自定义安装

安装完成后,配置cuda的环境变量;

命令行中,测试是否安装成功;

双击“exe文件”,选择下载路径(推荐默认路径)

验证:

 cuDNN Archive | NVIDIA Developericon-default.png?t=O83Ahttps://developer.nvidia.com/rdp/cudnn-archive

 最详细!Windows下的CUDA与cuDNN详细安装教程_windows安装cuda和cudnn-CSDN博客icon-default.png?t=O83Ahttps://blog.csdn.net/weixin_52677672/article/details/135853106?ops_request_misc=%257B%2522request%255Fid%2522%253A%252229DBE75F-820D-4C34-94EB-A83EC55EC789%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=29DBE75F-820D-4C34-94EB-A83EC55EC789&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-2-135853106-null-null.142%5Ev100%5Epc_search_result_base5&utm_term=cuda%E5%AE%89%E8%A3%85&spm=1018.2226.3001.4187

 

Win10安装ChatTTS-2024-cuda10.1_window 10 chattts安装-CSDN博客icon-default.png?t=O83Ahttps://blog.csdn.net/counsellor/article/details/141437597?ops_request_misc=&request_id=&biz_id=102&utm_term=chattts%20pip%20cuda&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-2-141437597.142%5Ev100%5Epc_search_result_base5&spm=1018.2226.3001.4187

conda install pytorch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 pytorch-cuda=12.4 -c pytorch -c nvidia

 漫长的等待。注意硬盘的空间。

(chat_kimi) PS I:\chat_kimi\ChatTTS> conda install pytorch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 pytorch-cuda=12.4 -c pytorch -c nvidia
Channels:
 - pytorch
 - nvidia
 - defaults
Platform: win-64
Collecting package metadata (repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: C:\Users\dell\.conda\envs\chat_kimi

  added / updated specs:
    - pytorch-cuda=12.4
    - pytorch==2.4.0
    - torchaudio==2.4.0
    - torchvision==0.19.0


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    pytorch-2.4.0              |py3.11_cuda12.4_cudnn9_0        1.20 GB  pytorch
    ------------------------------------------------------------
                                           Total:        1.20 GB

The following NEW packages will be INSTALLED:

  blas               pkgs/main/win-64::blas-1.0-mkl
  brotli-python      pkgs/main/win-64::brotli-python-1.0.9-py311hd77b12b_8
  certifi            pkgs/main/win-64::certifi-2024.8.30-py311haa95532_0
  charset-normalizer pkgs/main/noarch::charset-normalizer-3.3.2-pyhd3eb1b0_0
  cuda-cccl          nvidia/win-64::cuda-cccl-12.6.77-0
  cuda-cccl_win-64   nvidia/noarch::cuda-cccl_win-64-12.6.77-0
  cuda-cudart        nvidia/win-64::cuda-cudart-12.4.127-0
  cuda-cudart-dev    nvidia/win-64::cuda-cudart-dev-12.4.127-0
  cuda-cupti         nvidia/win-64::cuda-cupti-12.4.127-0
  cuda-libraries     nvidia/win-64::cuda-libraries-12.4.0-0
  cuda-libraries-dev nvidia/win-64::cuda-libraries-dev-12.4.0-0
  cuda-nvrtc         nvidia/win-64::cuda-nvrtc-12.4.127-0
  cuda-nvrtc-dev     nvidia/win-64::cuda-nvrtc-dev-12.4.127-0
  cuda-nvtx          nvidia/win-64::cuda-nvtx-12.4.127-0
  cuda-opencl        nvidia/win-64::cuda-opencl-12.6.77-0
  cuda-opencl-dev    nvidia/win-64::cuda-opencl-dev-12.6.77-0
  cuda-profiler-api  nvidia/win-64::cuda-profiler-api-12.6.77-0
  cuda-runtime       nvidia/win-64::cuda-runtime-12.4.0-0
  cuda-version       nvidia/noarch::cuda-version-12.6-3
  filelock           pkgs/main/win-64::filelock-3.13.1-py311haa95532_0
  freetype           pkgs/main/win-64::freetype-2.12.1-ha860e81_0
  gmpy2              pkgs/main/win-64::gmpy2-2.1.2-py311h7f96b67_0
  idna               pkgs/main/win-64::idna-3.7-py311haa95532_0
  intel-openmp       pkgs/main/win-64::intel-openmp-2023.1.0-h59b6b97_46320
  jinja2             pkgs/main/win-64::jinja2-3.1.4-py311haa95532_0
  jpeg               pkgs/main/win-64::jpeg-9e-h827c3e9_3
  lcms2              pkgs/main/win-64::lcms2-2.12-h83e58a3_0
  lerc               pkgs/main/win-64::lerc-3.0-hd77b12b_0
  libcublas          nvidia/win-64::libcublas-12.4.2.65-0
  libcublas-dev      nvidia/win-64::libcublas-dev-12.4.2.65-0
  libcufft           nvidia/win-64::libcufft-11.2.0.44-0
  libcufft-dev       nvidia/win-64::libcufft-dev-11.2.0.44-0
  libcurand          nvidia/win-64::libcurand-10.3.7.77-0
  libcurand-dev      nvidia/win-64::libcurand-dev-10.3.7.77-0
  libcusolver        nvidia/win-64::libcusolver-11.6.0.99-0
  libcusolver-dev    nvidia/win-64::libcusolver-dev-11.6.0.99-0
  libcusparse        nvidia/win-64::libcusparse-12.3.0.142-0
  libcusparse-dev    nvidia/win-64::libcusparse-dev-12.3.0.142-0
  libdeflate         pkgs/main/win-64::libdeflate-1.17-h2bbff1b_1
  libjpeg-turbo      pkgs/main/win-64::libjpeg-turbo-2.0.0-h196d8e1_0
  libnpp             nvidia/win-64::libnpp-12.2.5.2-0
  libnpp-dev         nvidia/win-64::libnpp-dev-12.2.5.2-0
  libnvfatbin        nvidia/win-64::libnvfatbin-12.6.77-0
  libnvfatbin-dev    nvidia/win-64::libnvfatbin-dev-12.6.77-0
  libnvjitlink       nvidia/win-64::libnvjitlink-12.4.99-0
  libnvjitlink-dev   nvidia/win-64::libnvjitlink-dev-12.4.99-0
  libnvjpeg          nvidia/win-64::libnvjpeg-12.3.1.89-0
  libnvjpeg-dev      nvidia/win-64::libnvjpeg-dev-12.3.1.89-0
  libpng             pkgs/main/win-64::libpng-1.6.39-h8cc25b3_0
  libtiff            pkgs/main/win-64::libtiff-4.5.1-hd77b12b_0
  libuv              pkgs/main/win-64::libuv-1.48.0-h827c3e9_0
  libwebp-base       pkgs/main/win-64::libwebp-base-1.3.2-h2bbff1b_0
  lz4-c              pkgs/main/win-64::lz4-c-1.9.4-h2bbff1b_1
  markupsafe         pkgs/main/win-64::markupsafe-2.1.3-py311h2bbff1b_0
  mkl                pkgs/main/win-64::mkl-2023.1.0-h6b88ed4_46358
  mkl-service        pkgs/main/win-64::mkl-service-2.4.0-py311h2bbff1b_1
  mkl_fft            pkgs/main/win-64::mkl_fft-1.3.10-py311h827c3e9_0
  mkl_random         pkgs/main/win-64::mkl_random-1.2.7-py311hea22821_0
  mpc                pkgs/main/win-64::mpc-1.1.0-h7edee0f_1
  mpfr               pkgs/main/win-64::mpfr-4.0.2-h62dcd97_1
  mpir               pkgs/main/win-64::mpir-3.0.0-hec2e145_1
  mpmath             pkgs/main/win-64::mpmath-1.3.0-py311haa95532_0
done
(chat_kimi) PS I:\chat_kimi\ChatTTS> python examples\web\webui.py
[+0800 20241014 05:22:44] [WARN]  WebUI  | funcs | no ffmpeg installed, use wav file output
[+0800 20241014 05:22:44] [INFO]  WebUI  | webui | loading ChatTTS model...
[+0800 20241014 05:22:44] [INFO] ChatTTS | dl | checking assets...
[+0800 20241014 05:22:45] [INFO] ChatTTS | dl | all assets are already latest.
[+0800 20241014 05:22:45] [INFO] ChatTTS | core | use device cuda:0
[+0800 20241014 05:22:45] [INFO] ChatTTS | core | vocos loaded.
[+0800 20241014 05:22:45] [INFO] ChatTTS | core | dvae loaded.
[+0800 20241014 05:22:46] [INFO] ChatTTS | core | embed loaded.
[+0800 20241014 05:22:47] [INFO] ChatTTS | core | gpt loaded.
[+0800 20241014 05:22:47] [INFO] ChatTTS | core | speaker loaded.
[+0800 20241014 05:22:47] [INFO] ChatTTS | core | decoder loaded.
[+0800 20241014 05:22:47] [INFO] ChatTTS | core | tokenizer loaded.
[+0800 20241014 05:22:47] [WARN]  WebUI  | funcs | Package nemo_text_processing not found!
[+0800 20241014 05:22:47] [WARN]  WebUI  | funcs | Run: conda install -c conda-forge pynini=2.1.5 && pip install nemo_text_processing
[+0800 20241014 05:22:47] [WARN]  WebUI  | funcs | Package WeTextProcessing not found!
[+0800 20241014 05:22:47] [WARN]  WebUI  | funcs | Run: conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
[+0800 20241014 05:22:47] [INFO]  WebUI  | webui | Models loaded successfully.
* Running on local URL:  http://0.0.0.0:8080

To create a public link, set `share=True` in `launch()`.

这速度,倍之。

* Running on local URL:  http://0.0.0.0:8080

To create a public link, set `share=True` in `launch()`.
text:   0%|                                                                                 | 0/384(max) [00:00, ?it/s]C:\Users\dell\.conda\envs\chat_kimi\Lib\site-packages\transformers\models\llama\modeling_llama.py:655: UserWarning: 1Torch was not compiled with flash attention. (Triggered internally at C:\cb\pytorch_1000000000000\work\aten\src\ATen\native\transformers\cuda\sdp_utils.cpp:555.)
  attn_output = torch.nn.functional.scaled_dot_product_attention(
text:   0%|▏                                                                            | 1/384(max) [00:00,  3.58it/s]We detected that you are passing `past_key_values` as a tuple of tuples. This is deprecated and will be removed in v4.47. Please convert your cache or use an appropriate `Cache` class (https://huggingface.co/docs/transformers/kv_cache#legacy-cache-format)
text:  19%|██████████████▍                                                             | 73/384(max) [00:02, 32.76it/s]
code:  25%|██████████████████▋                                                       | 517/2048(max) [00:12, 42.36it/s]

看下时间,10秒音频,13秒完成。还可以。

下一节:从kimi中获取文本并,出声。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2212456.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Prometheus+Grafana 监控 K8S Ingress-Ningx Controller

文章目录 一、prometheus中添加ingress-nginx的服务发现配置二、ingress-nginx controller的service添加端口暴露监控指标三、grafana添加ingress-nginx controller的监控模版 ingress-nginx默认是没有开启监控指标的,需要我们在ingress-nginx controller的svc里面开…

K8S配置MySQL主从自动水平扩展

前提环境 操作系统Ubuntu 22.04 K8S 1.28.2集群(1个master2个node) MySQL 5.7.44部署在K8S的主从集群 metrics-server v0.6.4 概念简介 在K8s中扩缩容分为两种 ●Node层面:对K8s物理节点扩容和缩容,根据业务规模实现物理节点自动扩…

数字媒体技术基础:色度子采样(4:4:4、4:2:2 、4:2:0)

在数字视频处理中,色度子采样 Chroma Subsampling可以用于压缩视频文件的大小,同时在大多数情况下保持较高的视觉质量,它的原理基于人类视觉系统对亮度 Luminance比对色度 Chrominance更加敏感这一特点。 一、 采样格式的表示方法 色度子采样…

一个技巧实现在SharePoint中使用Copilot

前几天写了在onedrive中使用copilot对单个文件进行提问汇总分析与对多个文件进行比较汇总提问等: Copilot重磅更新!OneDrive全新功能炸裂 很多小伙伴表示特别受用。 于是他们在纷纷尝试了一段时间后,开始把目光转向SharePoint和teams文件&a…

tkinter库的应用小示例:文本编辑器

tkinter库的应用小示例:文本编辑器 要 求: 创建一个文本编辑器,功能包括,创建、打开、编辑、保存文件。一个Button小组件,命名为btn_open,用于打开要编辑的文件,一个Button小组件,命名为btn_s…

Dockerfile 详解

Dockerfile是自定义Docker镜像的一套规则,由多条指令构成,每条指令都会对应于Docker镜像中的每一层,因为Docker是分层存储的。以下是Dockerfile中各个参数的详解及演示解析: 1. FROM 功能:指定待扩展的父级镜像&#…

JavaScript 访问者模式:打造高扩展性的对象结构

一. 前言 在面向对象编程中,访问者模式(Visitor Pattern)是一种行为设计模式,它允许我们向现有的类结构添加新的操作,而无需修改这些类。这对于需要对类层次结构中的元素进行复杂算法处理的场景非常有用。 本文将详细…

【硬件模块】HC-08蓝牙模块

蓝牙模块型号 HC-08蓝牙模块实物图 HC-08蓝牙模块引脚介绍 STATE:状态输出引脚。未连接时,则为低电平。连接成功时,则为高电平。可以在程序中作指示引脚使用; RXD:串口接收引脚。接单片机的 TX 引脚(如…

多线程(三):线程等待获取线程引用线程休眠线程状态

目录 1、等待一个线程:join 1.1 join() 1.2 join(long millis)——"超时时间" 1.3 join(long millis,int nanos) 2、获取当前线程的引用:currentThread 3、休眠当前进程:sleep 3.1 实际休眠时间 3.2 sleep的特殊…

Canvas:AI协作的新维度

在人工智能的浪潮中,OpenAI的最新力作Canvas,不仅是一款新工具,它标志着人工智能协作方式的一次革命性飞跃。Canvas为写作和编程提供了一个全新的交互界面,让用户能够与ChatGPT进行更紧密、更直观的协作。 ​​​​​​​ Canvas的…

LeetCode 面试经典150题 Z字形变换

题目: 将一个给定字符串 s 根据给定的行数 numRows ,以从上往下、从左到右进行 Z 字形排列。 比如输入字符串为 "PAYPALISHIRING" 行数为 3 时,排列如下: P A H N A P L S I I G Y I R 之后,你…

无人机无线电侦测核心技术详解

无人机无线电侦测核心技术主要涉及频谱分析、信号处理、定位技术以及智能化识别等多个方面。以下是对这些核心技术的详细解析: 1. 频谱分析技术 频谱探测技术:通过分析信号在频域上的分布和特性,来识别、测量和定位无线电信号。在无人机侦测…

leetcode 491.非递减子序列

1.题目要求: 给你一个整数数组 nums ,找出并返回所有该数组中不同的递增子序列,递增子序列中 至少有两个元素 。你可以按 任意顺序 返回答案。 数组中可能含有重复元素,如出现两个整数相等,也可以视作递增序列的一种特殊情况。 …

Python | Leetcode Python题解之第477题汉明距离总和

题目: 题解: class Solution:def totalHammingDistance(self, nums: List[int]) -> int:n len(nums)ans 0for i in range(30):c sum(((val >> i) & 1) for val in nums)ans c * (n - c)return ans

BUUCTF-Business Planning Group1

下载是一张PNG图片, 使用010editor打开发现尾部有隐藏文件 把这段16进制字符串复制到新文件并改名为1.bpg 使用bpgviewer软件查看 Release Simple BPG Image viewer asimba/pybpgviewer GitHub Notes: large images will be scaled to fit screen areabasic s…

[单master节点k8s部署]40.安装harbor

harbor 是私有镜像仓库,用来存储和分发镜像的 。docker 还有一个官方的镜像仓库 docker hub,免费用户只能简单的使用,创建一个私有镜像仓库,存储镜像,付费用户才可以拥有更多权限,默认 docker pull 拉取镜像…

nginx搭建视频下载站

目录 1.前言与介绍 2.atuoindex模块介绍 3.主要的功能 4.下载站基本要求 5.具体配置 6.做完如上的配置重载服务 7.创建密码文件 8.在windows主机上做域名解析 9.查看统计结果 1.前言与介绍 前面的学习中根据nginx的简单的配置实现了根据 IP 端口 和 域名 实现虚…

MySQL-三范式 视图

文章目录 三范式三范式简介第一范式第二范式第三范式 表设计一对一一对多多对多最终的设计 视图 三范式 三范式简介 所谓三范式, 其实是表设计的三大原则, 目的都是为了节省空间, 但是三范式是必须要遵守的吗? 答案是否定的(但是第一范式必须遵守) 因为有时候严格遵守三范式…

AI开发-三方库-Hugging Face-Tokenizer

1 需求 需求1:from transformers import AutoTokenizer 需求2:from transformers import BertTokenizer 2 接口 关键参数 textpaddingtruncationreturn_tensors 3 示例 BertTokenizer.from_pretrained() PreTrainedTokenizer PreTrainedTokenizerBa…

医疗图像之基于Unet++的息肉分割

第一步:准备数据 息肉分割数据,总共有1000张 第二步:搭建模型 UNet,这是一种旨在克服以上限制的新型通用图像分割体系结构。如下图所示,UNet由不同深度的U-Net组成,其解码器通过重新设计的跳接以相同的分…