音频合成之百度飞浆微调保姆级教程

音频合成之百度飞浆微调保姆级教程

news2026/2/16 9:10:24

🎯 这里我们使用，百度飞浆产品进行操作

至少需要提供一分钟的原声视频，越清晰越好，用于分析人物音色、声纹等特点。
预防针：这块稍微有点难度，涉及代码，不过不用担心，照着操作即可。
官网链接：飞桨AI Studio星河社区-人工智能学习与实训社区

3.2.1 选择项目并运行 GPU 环境

1、进入项目大厅，进入【有手就行】项目

2、点击运行，大家也可以看看项目说明，里面教程也很详细

3、进入环境时，一定要选择 32G或以上的GPU环境运行，CPU环境无法运行

等待启动

点击进入

3.2.2 开始微调【慢慢来】

🎯 注意：

这是一个 python 文件，前面买的 CPU 就是作微调用的。
大家需要挨个代码段点击▶️按钮运行程序，一定要按顺序运行，并且要保证前面的代码运行成功再运行后面的代码，运行前请看好如下说明。
如果跳着运行，会出错。

点击红框处的 ▶️ 按钮运行

运行完，重启一下内核（同一个文件，往下滑就看到了）

然后开始挨个运行下面的代码段（不需要重启内核了）

下载依赖，这步骤时间较长，耐心等待

中间几个同样操作，挨个运行，省略...

当运行到下图位置时，修改文件路径上传音频文件后，再运行

修改文件路径（同一个文件，往下滑就看到了）

将准备好的音频上传到刚刚的文件夹（音频切割工具可以使用 slicer-gui）

🎯 上传的音频数据说明：

对于语音合成任务，对数据是有一定要求的，尽可能上传干净的人声数据，比如像示例中的人声数据，在安静环境下录制，录制设备无论是手机，电脑，还是别的设备都可以，注意一定要控制噪音，或者提前使用音频剪辑软件进行降噪。

1. 音频不要太长，也不要太短，建议2s~10s之间
2. 音频尽量是干净人声，不要有BGM，不要有比较大的杂音，不要有一些奇奇怪怪的声效，比如回声等
3. 声音的情绪尽量稳定,以说话的语料为主，不要是『嗯』『啊』『哈』之类的语气词

关于录音工具

- 你可以使用一些在线运行的录音工具或者【Adobe Audition】，【Cool Edit Pro】, 【Audacity】等录音软件录制音频，保存为 24000采样率的 Wav 格式

这里方便大家联系，给大家提供一组音频如下👇
📎SpkA.zip

记得点击▶️按钮运行哦

微调参数调整

修改文本

全部运行完成后

下载音频：上面代码块运行后，按下面的方式下载音频

3.3.3 微调模型下载与使用

模型下载

上面微调训练结束后，会在【inference】目录下生成对应【exp_name】的模型文件夹，使用下面的代码块生成对应压缩文件，右键点击下载即可

3.2.4 停止服务

一般人不会告诉你这一步，服务记得停掉，因为前面的 GPU 是按小时收费的。

不过刚刚用的这会，不用担心，新人有免费额度。

查看自己剩余算力卡

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1953954.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

加载chatglm3模型时出现ValueError: too many values to unpack (expected 2)的解决方案

加载chatglm3模型时出现ValueError: too many values to unpack (expected 2)的解决方案

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

阅读更多...

MATLAB仿真：数字信号处理IIR数字滤波器设计

MATLAB仿真：数字信号处理IIR数字滤波器设计

目录 1．实验目的 2．实验原理 3．实验仪器及设备 4. 实验内容及步骤 5．信号产生函数mstg清单 6.实验程序及波形如下： 1．实验目的 （1）熟悉用双线性变换法设计IIR数字滤波器的原理…

阅读更多...

独立开发者系列（35）——python环境的理解

独立开发者系列（35）——python环境的理解

新手阶段，为了快速入门，基本都是直接开始写python代码实现自己想要的效果，类似搭建博客，写个web服务器，搭建简易聊天室，偶尔也写些爬虫，或者使用pygame写个简单小游戏，也有tk库做点简…

阅读更多...

Android AI应用开发：移动检测

Android AI应用开发：移动检测

基于Google ML模型的Android移动物体检测应用——检测、跟踪视频中的物体 A. 项目描述 ML Kit物体检测器可以对视频流进行操作，能够检测视频中的物体并在连续视频帧中跟踪该物体。相机捕捉视频时，检测到移动物体并为其生成一个边界框，并分…

阅读更多...

【算法/训练】：动态规划（线性DP）

【算法/训练】：动态规划（线性DP）

一、路径类 1. 字母收集思路： 1、预处理对输入的字符矩阵我们按照要求将其转换为数字分数，由于只能往下和往右走，因此走到（i，j）的位置要就是从（i - 1， j）往下走&#…

阅读更多...

2024第八届全国职工职业技能大赛“网络与信息安全管理员”赛项技术文件及任务书

2024第八届全国职工职业技能大赛“网络与信息安全管理员”赛项技术文件及任务书

2024第八届全国职工职业技能大赛“网络与信息安全管理员”赛项技术文件及任务书一、赛项概述：二、竞赛形式：三、竞赛规则四、竞赛样题4.1、第一场4.1.2、实操闯关赛4.2、第二场4.3、第三场需要培训可以私信博主欢迎交流学习！ [X] &#x1…

阅读更多...

Tuxera NTFS for Mac 2023安装教程+2024年软件Tuxera安装包下载

Tuxera NTFS for Mac 2023安装教程+2024年软件Tuxera安装包下载

‌在数字化时代，文件格式的兼容性问题一直是用户头疼的问题。尤其是在Mac和Windows两大操作系统之间，由于文件系统的不统一，使得文件在不同平台之间的传输和访问变得困难。然而，随着Tuxera NTFS for Mac 2023的出现，这…

阅读更多...

好书推荐 -- 《精通推荐算法》

新书发布，京东限时15天内5折优惠，半天即可送到。图书封底有读者微信群，作者也在群里，任何技术、offer选择和职业规划的问题，都可以咨询。《精通推荐算法》，限时半价，半日达https://u.jd.com…

阅读更多...

[CISCN2019 华东南赛区]Web11

[CISCN2019 华东南赛区]Web11

进来先做信息收集，右上角显示当前ip，然后有api的调用地址和请求包的格式以及最重要的是最下面的smarty模版，一看到这个就得想到smarty模版注入测试了一下两个api都无法访问直接切到数据包看看能不能通过XFF来修改右上角ip 成功修改&#x…

阅读更多...

Unity横版动作游戏 -瓦片地形和动画瓦片

Unity横版动作游戏 -瓦片地形和动画瓦片

(规则瓦片)瓦片地形和动画瓦片准备阶段在Tilemap中创建一个新的文件夹起名叫做Rule Tile，创建一个Rule Tile，用来设置瓦片地形，我们将用他来绘制地形图，类似于Godot中的瓦片地形。这里给他取名为了Ground 1，用于创…

阅读更多...

ARM32开发——PWM蜂鸣器案例

ARM32开发——PWM蜂鸣器案例

🎬 秋野酱：《个人主页》 🔥 个人专栏:《Java专栏》《Python专栏》 ⛺️心若有所向往,何惧道阻且长文章目录需求原来的驱动移植操作替换初始化更新Play函数完整代码需求通过控制PB9来播放音乐，PB9对应的定时器通道&#xff1…

阅读更多...

CTF之网站被黑

CTF之网站被黑

简单看一下网页和源码没发现什么明显漏洞那就扫描一下目录发现了/shell.php文件，访问一下，发现是一个后台管理登录页面别无他法只能爆破喽，爆破后发现密码是hack flag{25891d9e9d377f006eda3ca7d4c34c4d}

阅读更多...

2024第三届钉钉杯大学生大数据挑战赛【A题】完整分享

2024第三届钉钉杯大学生大数据挑战赛【A题】完整分享

2024第三届钉钉杯大学生大数据挑战赛已经开赛，小编给大家带来非常实用的助力【A题】完整，（看图片下方的说明），资料预览： 微信公众号

阅读更多...

【python】批量读取Word文档中的特定表格并保存为Excel文件

【python】批量读取Word文档中的特定表格并保存为Excel文件

批量读取Word文档中的特定表格并保存为Excel文件在工作中，我们常常需要从多个Word文档中提取数据，然后将这些数据汇总到一个Excel文件中进行分析。下面，我将分享一个Python脚本，它可以从多个Word文档中读取特定的表格数据&#…

阅读更多...

暑期c++ 命名空间

暑期c++ 命名空间

有任何不懂的问题可以评论区留言，能力范围内都会一一回答今天是暑期第一天开始写c笔记，新起点，新开始加油我们先来看两串代码这串代码编译没有问题 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> int rand 14; int main(…

阅读更多...

手机图片如何转化为word文档？分享3种好用的软件。

手机图片如何转化为word文档？分享3种好用的软件。

在数字化时代，手机已经成为我们生活中不可或缺的一部分。随着手机拍照功能的日益强大，我们常常用手机记录下重要的信息和瞬间。但你有没有遇到过这样的烦恼：如何将手机里的图片快速转化为可编辑的Word文档呢？今天，就为…

阅读更多...

从工艺到性能：模具3D打印材料不断革新

从工艺到性能：模具3D打印材料不断革新

在模具3D打印领域，材料性能的持续优化与创新是推动模具3D打印的关键因素，近年来，各种3D打印新材料不断涌现，模具3D打印材料也开始重工艺导向逐步向性能导向发展，如毅速公司推出的ESU-EM191/191S及ESU-EM201不锈钢粉末、…

阅读更多...

C语言 | Leetcode C语言题解之第299题猜数字游戏

C语言 | Leetcode C语言题解之第299题猜数字游戏

题目： 题解： #define MIN(a, b) ((a) < (b) ? (a) : (b))char * getHint(char * secret, char * guess){int A 0;int B 0;int dicS[10] {0};int dicG[10] {0};int i 0;while(secret[i]){if(secret[i] guess[i]){//同位置且相等（完…

阅读更多...

【React】useState：状态管理的基石

【React】useState：状态管理的基石

文章目录一、什么是 useState？二、useState 的基本用法三、useState 的工作原理四、高级用法五、最佳实践在现代前端开发中，React 是一个非常流行的库，而 useState 是 React 中最重要的 Hook 之一。useState 使得函数组件能够拥有自己的状态…

阅读更多...

RHEL 7.6 安装oracle database 19c Real Application Cluster Part5: RU配置

RHEL 7.6 安装oracle database 19c Real Application Cluster Part5: RU配置

RHEL 7.6 安装oracle database 19c Real Application Cluster Part1: 基础环境配置 RHEL 7.6 安装oracle database 19c Real Application Cluster Part2: Grid Infrastructure配置 RHEL 7.6 安装oracle database 19c Real Application Cluster Part3: ASM磁盘组配置 RHEL 7.…

阅读更多...

推荐文章

最新文章