分享一个项目——Sambert UI 声音克隆

news2024/11/25 16:29:06

文章目录

  • 前言
  • 一、运行ipynb
  • 二、数据标注
  • 三、训练
  • 四、生成
  • 总结


前言

原教程视频

项目链接

运行一个ipynb,就可操作

总共四步
1)运行ipynb
2)数据标注
3)训练
4)生成


一、运行ipynb

在这里插入图片描述
在这里插入图片描述

等运行完毕后,获得该链接打开
在这里插入图片描述

二、数据标注

在这里插入图片描述
准备一段自己念书的音频【MP3格式】(最好不要是唱歌的,亲测生成效果会比较扭曲)

1)上传音频
2) 角色命名
3) 开始标注

三、训练

在这里插入图片描述

1)点击角色选择
2)设置训练步数 60 ~ 100即可
3)开始训练

四、生成

在这里插入图片描述

1)选择推理模型
2) 输入文本
3)开始语音合成


总结

一个能够简单克隆声音的小demo, 里面可能有个基座模型,应该是用台湾省同胞的声音练的,总体效果会有点台湾腔。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1325528.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mt5和mt4交易软件有什么区别?

MetaTrader 4(MT4)和MetaTrader 5(MT5)是两种广泛使用的外汇和金融市场交易平台,由MetaQuotes公司开发。尽管它们都是外汇交易的常见选择,但在功能和特性上存在一些区别。以下是MT4和MT5之间的主要区别&…

2023 英特尔On技术创新大会直播 |我感受到的“芯”魅力

文章目录 每日一句正能量前言AI时代,云与PC结合为用户带来更好体验全新处理器,首次引入针对人工智能加速的NPU大模型时代,软硬结合带来更好训练成果后记 每日一句正能量 成长是一条必走的路路上我们伤痛在所难免。 前言 在2023年的英特尔On技…

Go语言HTTP编程入门指南

如果你是一名开发者,那么你一定听说过Go语言。Go,也被称为Golang,是由Google开发的一种静态类型、编译型语言。它的设计理念是“简单、快速、高效”,这使得Go语言在许多方面都表现出色,尤其是在网络编程和并发编程方面…

fastGitHub工具推荐(如果打不开github或者使用很慢可以使用该工具)

目录 一,针对问题二,下载1,github里面下载FastGitHub2,博客上传了下载资源 三,安装使用点击执行文件即可 一,针对问题 当使用github很慢,或者根本打不开的时候,就可以使用该工具 …

HDFS NFS Gateway(环境配置,超级详细!!)

HDFS NFS Gateway简介: ​ HDFS NFS Gateway是Hadoop Distributed File System(HDFS)中的一个组件,它允许客户端通过NFS(Network File System,网络文件系统)与HDFS进行交互。具体来说,HDFS NFS…

搭建esp32-idf开发环境并烧入第一个程序

ESP32下载idf并烧入第一个程序 一.官网下载idf安装包二.安装idf三 .测试安装是否成功3.1进入idf控制台3.2 查看安装版本3.3 编译工程 四.下载程序4.1查看所在端口4.2下载程序4.3 监听串口 一.官网下载idf安装包 点击下载 如图: 我们选择离线下载,注意…

行业前景咋样?大厂找我用C++抓取化工产品数据并分析

最近又来活了,天天忙到半夜,但是想想收益还是再坚持坚持。是这么一回事,兄弟所在的化工公司最近想看看某些行业数据,看看市面的同类型产品销量收益等情况是否满足预期效果,也就找到我让我给用爬虫写一个采集并分析的报…

如何实现设备联网控制?

在工业自动化领域,设备联网控制已经成为一种趋势。通过设备联网,可以实现设备的远程监控和管理,提高设备的可用性和效率。本文将介绍如何实现设备联网控制。 设备如何联网? 使用网关联网: HiWoo Box是一款功能强大的…

Sectigo的ov多域名ssl证书

OV多域名SSL证书和EV多域名SSL证书都只支持企事业单位申请,但是EV多域名SSL证书审核比较严格,价格也比较高,OV多域名SSL证书能加密网站传输数据,也能对服务器身份进行认证。对于大多数事业单位,OV多域名SSL证书就能满足…

外贸业务员该如何写好一份有质感的年终总结?内附外贸大神例文

庄子云:人生天地之间,若白驹之过隙,忽然而已... 2023年注定是不平凡的一年,临近年终,你可能听到最多的关键词就是外贸有点难做。不管是因为什么,客观来说2023年的外贸之路确实不太平坦,最近胡塞…

车辆违规开启远光灯检测系统:融合YOLO-MS改进YOLOv8

1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 研究背景与意义 随着社会的不断发展和交通工具的普及,车辆违规行为成为了一个严重的问题。其中,车辆违规开启远光灯是一种常见的违规行为,给其…

快速能访问服务器的文件

1、背景 访问ubuntu上的文件 2、方法 python3 -m http.server 8081 --directory /home/ NAS 共享访问协议 — NFS、SMB、FTP、WebDAV 各有何优势?http://1 Ubuntu 搭建文件服务器(Nginx)

【开源】USB转4路RS422+4路RS485电路板设计

简介 CH348Q是沁恒出品的一款USB转8路串口的芯片,USB为2.0接口,其中4路串口支持流控,另外4路不支持流控,之前介绍过一款开源USB转8路串口的板子,文章链接:https://mp.weixin.qq.com/s/KsrV3nwemQyq3tdv7Lk…

超分辨数据集:Set5 Set14 BSD100 Urban100 Manga109

DIV2K数据集官网上很好找到,但是网上流传的Set5 14 BSD100,Urban100 Manga109都是私人进行处理过的版本,各个处理方式都不同,为了统一方式写了这篇文章。 官方的DIV2K x2、x3、x4的LR图片使用下面matlab代码生成(已经经过测试最后…

精细经营:为 Web3 游戏长期卓越奠定基石

作者:lesleyfootprint.network 随着越来越多的人涌入 Web3 游戏世界,构建精细化运营体系成为保持项目长期发展的关键。充分利用数据分析对于明智的决策至关重要,它能揭示用户行为、交易模式和市场趋势的内在奥秘。 基于数据驱动的决策、风险…

汤晓鸥:以科技改变世界,以教育照亮未来

原创 | 文 BFT机器人 汤晓鸥是我国人工智能领域的杰出代表,也是商汤科技的创始人。他在AI领域有着深厚的研究背景和丰富的实践经验,其主要研究方向是计算机视觉(CV)、模式识别和视频处理。 汤晓鸥积极推动AI技术的发展&#xff0…

uniapp实现豆瓣电影微信小程序(附源码)

演示 运行 基于本地代理1 npm run dev:proxy1基于本地代理2 npm run dev:proxy2基于nginx 代理 npm run dev:nginx目录结构 |__ douban # 本地代理|__ app.js # 方式 1|__ proxy.js …

深度学习的十大核心算法

引言 深度学习是人工智能领域中最热门和最具影响力的分支之一。其核心在于通过构建复杂的神经网络模型,从大量的数据中自动学习并提取出有用的特征,从而实现各种高级的任务,如图像识别、自然语言处理等。本文将介绍深度学习中的十大核心算法…

Linux之进程(五)(进程控制)

目录 一、进程创建 1、fork函数创建进程 2、fork函数的返回值 3、fork常规用法 4、fork调用失败的原因 二、进程终止 1、进程终止的方式 2、进程退出码 3、进程的退出方法 三、进程等待 1、进程等待的必要性 2、wait函数 3、waitpid函数 四、进程程序替换 1、概念…

c++11特性:右值引用的作用以及使用

右值: C11 增加了一个新的类型,称为右值引用( R-value reference),标记为 &&。在介绍右值引用类型之前先要了解什么是左值和右值: 1. lvalue 是locator value的缩写,rvalue 是 read v…