AI用Alice_split_toolset切割音频的采样率

news2024/10/1 21:30:33

 AI用Alice_split_toolset切割音频的采样率

目录

 AI用Alice_split_toolset切割音频的采样率

一、Sample rate采样率的概念

二、Alice_split_toolset切割音频的参数

2.1、字符串参数--input_folder输入文件夹路径

2.2、字符串参数--output_folder输出文件夹路径

2.3、字符串参数--sample_rate声音的采样率

2.4、动作参数--mono转化为单声道

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

三、本期关联技术博文


一、Sample rate采样率的概念

声音的Sample rate(‌采样率)‌是指每秒从连续信号中提取并组成离散信号的采样个数,‌用赫兹(Hz)来表示。‌ 采样率是音频处理中的一个重要参数,‌它直接关系到音频的质量和数据量的大小。‌采样频率的高低决定了音频信号的还原程度,‌即音频的质量。‌采样频率越高,‌音频质量越高,‌但同时数据量也会增大。‌为了保证声音不失真,‌采样频率需要不低于音频信号最高频率的两倍。‌人耳能听到的频率范围大约在20Hz到20kHz之间,‌因此为了保证声音质量,‌采样频率通常在40kHz以上。‌常见的采样率包括11025Hz、‌22050Hz、‌24000Hz、‌44100Hz和48000Hz等。‌其中,‌44100Hz是理论上的CD音质界限,‌而48000Hz则更加精确一些。

二、Alice_split_toolset切割音频的参数

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description="Split WAVs based on SRT timings in a folder")
    parser.add_argument("--input_folder", type=str, default="input", help="Path to the input folder containing SRT and WAV files")
    parser.add_argument("--output_folder", type=str, default="output", help="Output folder path")
    parser.add_argument("--sample_rate", type=int, default=44100, help="Sample rate for output WAVs")
    parser.add_argument("--mono", action="store_true", help="Convert to mono")
    parser.add_argument("--use_subtitle_as_name", action="store_true", help="Use subtitle as filename")

2.1、字符串参数--input_folder输入文件夹路径

--input_folder input

请不要带中文,原始.wav文件及其字幕文件.srt所在的目录。

2.2、字符串参数--output_folder输出文件夹路径

--output_folder output

请不要带中文,切割后的.wav文件及其.list列表文件所在的目录。

2.3、字符串参数--sample_rate声音的采样率

--sample_rate 48000

44100Hz是理论上的CD音质界限,也是默认值。

而48000Hz则更加精确,通常被更多的音频输出设备软件,标识为DVD音质界限。会将原始录制的人声中,人的“嗓音”也识别和还原出来。

输出设备: 

输入设备: 

2.4、动作参数--mono转化为单声道

--mono

默认值。不要混响和声音通道的,纯粹的人声。

2.5、动作参数--use_subtitle_as_name使用字幕所在的.wav文件名作为文件名

--use_subtitle_as_name

默认值。

三、本期关联技术博文

《comfyUI-MuseTalk的参数设置》

《ComfyUI-MuseTalk部署依赖mmcv》
《Win10环境将Docker部署到非系统盘》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1979491.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第一次作业,sql注入总结

sqli-labs靶场中演示: less1: 注入点为: $sql"SELECT * FROM users WHERE id$id LIMIT 0,1"; get输入一个id,可以逃逸出单引号来实现sql注入。 正常的输入为,输出数据库中查询的内容。 http://127.0.0…

如何将PyCharm 中使用 PDM 管理的 Django 项目迁移到 VS Code 并确保一切正常工作?

嗨,我是兰若姐姐,相信很多小伙伴都遇到过这种情况,使用pycharm用习惯了,想换个编辑器,比如换成vscode,今天就告诉大家,如果轻松切换到vscode 步骤 1:在 VS Code 中打开项目 打开 V…

并行状态的广播事件

平行状态的广播事件 此示例显示了并行状态下事件广播操作的行为。 最初,图表处于休眠状态。并行子状态A.A1.A1a和A.A2.A2a处于活动状态。事件E_one发生并唤醒图表,图表从根向下通过层次结构处理事件: 1 图表根会检查根级别是否存在E_one导致…

Docker简介 MacM1安装Docker

文章目录 1 Docker简介2 Docker VS 虚拟机1 Docker优势2 Docker用途 3 MacM1 下载安装Docker1 配置环境变量 4 配置Docker2 设置Docker资源3 设置Docker镜像 参考 1 Docker简介 Docker主要解决了软件开发和运行配置的问题,但是由于其功能的强大,也被应用…

跨境电商下载工具天猫主图sku图等图片信息

优美的图片是电商卖家吸引顾客、展示商品魅力的关键。高质量的图片能够提升产品吸引力,增强用户信任感,促进购买决策,从而直接影响销量和店铺形象。在视觉营销的时代,优秀的商品图片更是流量转化的利器。 使用图快下载器&#xf…

多租户系统数据隔离方案

目录 前言 数据行 数据表 基于业务场景 基于数据量 数据库 数据源表 动态数据源 前言 多租户系统是一种将多个客户的数据和应用程序分开的系统,每个客户被视为一个独立的租户,互不干扰。实现多租户系统的关键之一是确保数据的隔离。 数据隔离的…

Windows 添加自定义服务实现开机(用户登录之前)自动运行 Python 脚本

实现效果 使用 Python 编写的一个脚本, 希望在 Windows 系统启动时, 用户登录之前就自动运行. 准备工作 首先确保 Python 脚本可以手动正常运行, 演示起见, 编写下面的一个简单的脚本用于在 C 盘根目录中生成一个包含脚本运行时间戳的文本文件. Python 脚本存放在 C:\Python…

RISC-V (五)上下文切换和协作式多任务

任务(task) 所谓的任务就是寄存器的当前值。 -smp后面的数字指的是hart的个数,qemu模拟器最大可以有8个核,此文围绕一个核来讲。 QEMU qemu-system-riscv32 QFLAG -nographic -smp 1 -machine virt -bios none 协作式多任务 …

绘唐科技,绘唐3高级推理创作

绘唐科技,绘唐3高级推理创作绘唐3https://qvfbz6lhqnd.feishu.cn/wiki/D3YLwmIzmivZ7BkDij6coVcbn7W 《绘唐3:高级推理创作》 第一章:谋杀案的启示 在古代绘唐王朝的京都,发生了一起离奇的谋杀案。一位名叫李红的官员&#xff0c…

[Day 44] 區塊鏈與人工智能的聯動應用:理論、技術與實踐

生成对抗网络(Generative Adversarial Networks,GANs)是一种由Ian Goodfellow等人在2014年提出的深度学习模型,广泛用于图像生成、图像超分辨率、图像修复等领域。GAN由一个生成器(Generator)和一个判别器&…

状态同步帧同步

帧同步: 有明确的逻辑帧概念,按照固定的逻辑帧间隔同步帧数据 原理 锁帧:mmo那种游戏,服务器需要收到第k帧所有客户端的指令,就算没有操作也发个空指令上去(相对来说回合制卡牌这类就简单很多&#xff0…

keil编程时,出现”MULTIPLE PUBLIC DEFINITIONS“,extern声明时不能赋值

原因导致重复定义? 有可能是重复定义导致的,这就需要查看报错位置的变量或函数是不是被重复定义了。也可能是一些语法错误导致的错误 语法错误导致的错误原因 使用extern只是为了说明这个变量在别的地方已经定义过,但使用extern引用时&…

NSS [HNCTF 2022 WEEK3]ssssti

NSS [HNCTF 2022 WEEK3]ssssti SSTI类题目(flask)毋庸置疑。 有过滤,我们拿burp先fuzz一波。长度159的都是被过滤的。 过滤了下划线、引号、args、os。 我们利用request对象绕过对下划线和引号的过滤(题目不允许POST方法&#x…

【机器学习】过拟合和欠拟合、高偏差(High Bias)和高方差(High Variance)的区别、过拟合和欠拟合的示例以及图表表示

引言 在机器学习中,过拟合(Overfitting)是指模型在训练数据上学习得太好,以至于它捕捉到了数据中的噪声和随机波动,而不是潜在的真实关系,这导致模型在新的、未见过的数据上表现不佳;欠拟合&…

从零开始:MySQL安装与配置完全指南

前言 哇,终于进入到令人激动的MySQL环节了 它可以说是你编程生涯中的最佳朋友,因为它总是能存储你的数据,从不说:“我忘记了你的信 息”。而且,它是免费的,不像一些昂贵的数据库,它从不让你的…

部署k8s+conatinerd环境

1、准备系统环境 禁用默认休眠(可选) 禁用:systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target启用:sudo systemctl unmask sleep.target suspend.target hibernate.target hybrid-sleep.target …

随机对照临床试验(RCT)与历史对照临床试验(HCT)

临床试验是评估新药、新疗法或新技术有效性和安全性的关键手段。在临床试验中,如何选择对照组是影响试验结果准确性和可信度的重要因素。随机对照临床试验(Randomized Controlled Trial, RCT)和历史对照临床试验(Historical Contr…

苹果电脑玩的游戏有哪些 Mac电脑怎么玩Windows游戏 苹果电脑可以装模拟器玩游戏吗

苹果电脑虽然在游戏生态上可能不及Windows平台那么广泛,但其强大的硬件和macOS系统的优化,足以支持一系列高质量游戏的流畅运行。从策略游戏《文明VI》到动作冒险游戏《黑暗之魂III》,再到解谜游戏《传送门2》和角色扮演游戏《神界&#xff1…

世界顶尖哲学家排行榜前十名,全球公认十大最厉害的思想家之一

标题:智慧与爱心:塑造命运的双翼 正能量因有爱心, 负能量期待智慧…(升命学说) 在这个纷纭复杂的世界中,我们每个人都是自己命运的舵手。正如升命学说所揭示,正能量的培养离不开爱心的滋养&…

Springboot+Vue在线考试系统(优质版)-附项目源码与配套论文

1.1 开发背景 在线考试系统的设计与实现,首先需要对系统进行需求分析,明确系统的功能和性能要求。系统需要具备考试管理、题库管理、在线考试、自动阅卷等功能,同时还需要保证系统的安全性、稳定性和可扩展性。 在系统的架构设计方面&#…