Python 音频处理以及可视化 Amplitude,MFCC,Mel Spectrogram, librosa 库

news2024/9/24 13:25:28

利用python库 librosa库对于音频文件进行预处理,以及可视化操作。

1. Load Audio Data 导入音频

将音频文件(这里使用苹果录音文件 .m4a 格式)导入librosa,音频格式可以为其它(甚至视频文件mp4也是可以的)

import librosa

audio_data = 'Audio/1.m4a'
y, sr = librosa.load(audio_data)

print('y:', y, '\n')
print('y shape:', np.shape(y), '\n')
print('Sample Rate (Hz):', sr, '\n')
print('Check Len of Audio:', np.shape(y)[0]/sr)

返回值有两个 y 和 sr。
y 是音频时间序列并支持多声道,
sr 是采样率 (注意:librosa默认load使用的是22050hz的采样率)
如果想要用固定采样率,则可以使用y, sr = librosa.load(audio_data,sr=None)表示保持原音频的采样率。或者可以规定采样率sr:y, sr = librosa.load(audio_data,sr=44100)

想要获取音频的基本信息可以输入:

print('y:', y, '\n')
print('y shape:', np.shape(y), '\n')
print('Sample Rate (Hz):', sr, '\n')
print('Check Len of Audio:', np.shape(y)[0]/sr)

2. Audio Visualization 音频可视化

a) Amplitude

音频可视化,y轴 为 Amplitude (振幅)随时间变化曲线。
import matplotlib.pyplot as plt
import librosa.display
 
plt.figure(figsize=(20, 5))
librosa.display.waveplot(y, sr=sr)
plt.xlabel('Time (samples)')
plt.ylabel('Amplitude')
plt.show()

在这里插入图片描述

b) Amplitude to DB

X = librosa.stft(y)
Xdb = librosa.amplitude_to_db(abs(X))
plt.figure(figsize=(20, 5))
librosa.display.specshow(Xdb, sr=sr, x_axis='time', y_axis='hz')
plt.colorbar()
plt.show()

在这里插入图片描述

c) MFCC 梅尔频率倒谱系数

mfccs = librosa.feature.mfcc(y=y, sr=sr)
librosa.display.specshow(mfccs, sr=sr, x_axis='time')

在这里插入图片描述

d) Mel Spectrogram 梅尔频谱图

mel = librosa.feature.melspectrogram(y=y, sr=sr)
librosa.display.specshow(mel, sr=sr, x_axis='time')

在这里插入图片描述
以上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/56952.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Docker】Dockerfile:常见保留字、使用案例

Dockerfile是用来构建Docker镜像的文本文件,是由一条条构建镜像所需的指令和参数构成的脚本。 官网:链接 构建三步骤 编写Dockerfile文件构建镜像:docker build用镜像运行容器实例:docker run 一、常用的保留字 二、使用案例 要…

Spring MVC统一异常处理的3种方式(附带实例)

在 Spring MVC 应用的开发中,不管是对底层数据库操作,还是业务层或控制层操作,都会不可避免地遇到各种可预知的、不可预知的异常需要处理。 如果每个过程都单独处理异常,那么系统的代码耦合度高,工作量大且不好统一&a…

html5期末大作业:基于html+css+javascript+jquery+bootstarp响应式图书电商HTML模板网上书店(25页)

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

STC 51单片机51——直流电机PWM

//开发板按钮K3和K4用于调速,直流电机接部件电机模块Vcc和O1 #include"reg52.h" #define u8 unsigned char #define u16 unsigned int sbit O1P1^0;//ULN2003 sbit K3P3^2; //减速 sbit K4P3^3; //加速 u8 Flag; u16 T, PWM, Temp;//T为控制周期…

Java项目:ssm赛事打分系统

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 赛事评分系统,SSM框架。该项目分管理员、裁判、选手三个用户角色。 管理员主要功能: 首页、选手管理、裁判管理、赛事管…

【2022世界杯开源项目实战】使用docker部署world-cup-2022-cli-dashboard数据看板工具

【2022世界杯开源项目实战】使用docker部署world-cup-2022-cli-dashboard数据看板工具一、world-cup-2022-cli-dashboard介绍1.工具介绍2.数据看板的内容二、检查本地docker环境1.检查docker版本2.检查docker状态三、构建world-cup-2022-cli-dashboard的镜像1.下载world-cup-20…

如何用蓝牙实现无线定位(四)--远程定位显示

1. 待救援定位设备 按照下面的针脚使用杜邦线将待救援定位设备的主蓝牙、从蓝牙连接到主控板上,和本地显示时的连接针脚是一样的,但是由于不需要连接OLED,因此不需要堆叠Bigfish。 参考视频 烧录程序如下(human.ino)&a…

善网ESG周报(第三期)

ESG报告: 陆金所控股发布2021年ESG报告 以可持续商业模式创造社会价值 从11月28日发布的报告来看,其公司2021年累计帮助超310万小微企业主并开展170场环保公益活动和超610场金融科普活动。 金融界联合济安金信发布首份《京津冀ESG绿色标杆企业报告》&a…

Keras深度学习高级(四)

本篇涉及的内容 如何将模型的结构由层升级成图如何使用 Keras 的回调函数在训练过程中监控模型,并根据模型状态采取行动使用TensorBoard将模型可视化什么是批标准化、深度可分离卷积和残差连接为什么应该使用超参数优化和模型集成 第一部分 Keras的函数式API 一、…

Nexus私服 (一)

(一) Nexus-OSS私服介绍 平时用maven构建项目,pom会默认去maven仓库下载包,网速都比较慢。此时可以选择国内的镜像(ex:阿里云仓库)如果想要自己管理项目的包,亦或者你的开源项目有多个人维护的时候,就需要考…

Allegro如何添加泪滴操作指导

Allegro如何添加泪滴操作指导 Allegro支持添加泪滴操作,保证焊接的可靠性,还可以调整泪滴的大小和形状,类似下图 具体操作如下 以给下图的pin和孔加泪滴为例 首先设置参数,route-Gloss-Parameters 点击Fillet and Taper Trace前面的方框 勾选下方的参数,Max size的值…

自己编写程序publish出kitti数据集,可视化kitti数据集

目的:不使用kitti2bag,因为kitti2bag的格式都是固定的,如果将来自己要添加什么东西,这个就会变得非常麻烦,自己编写程序就会右很多的变化。 开始之前仍然要下载kitti数据集,下载方式参考Ubuntu1804里进行KITTI数据集可视化操作_FYY2LHH的博客-CSDN博客 1、先执行roscor…

一款.Net7前后端分离、跨平台的通用权限管理框架

今天给大家推荐一个开源项目,基于.NetCore开发的、多租户的、前后端分离的企业开发框架。 项目简介 这是一个前后端分离、跨平台的、基于RBAC的通用框架;支持多租户、任务调度、缓存、国际化,前端支持Vue2/3,支持分表分库。 框…

【图像分类损失】SimLoss:一个适合于年龄估计的分类损失

Roses are red, violets are blue, both are somehow similar, but the classifier has no clue. 论文题目:《SimLoss: Class Similarities in Cross Entropy》(2020年) 论文地址:https://arxiv.org/pdf/2003.03182v1.pdf 1.背景…

Hbuilder打包成APP流程,以及遇到的坑

1.打包项目 期间遇到的坑,提前说下,避免重复工作。 【因为很多网友说自己打包的APP是白屏,这是需要实名认证才能使用的工具,灰灰产还是用其他的工具吧】 我打包的安卓APP给大家欣赏一下: https://wwttl.lanzout.co…

Spring MVC使用SessionLocaleResolver实现用户自定义切换语言实例

在许多成熟的商业软件系统中可以让用户自由切换语言,而不是修改浏览器的语言设置。一旦用户选择了自己需要使用的语言环境,整个系统的语言环境将一直是这种语言环境。 Spring MVC 也可以允许用户自行选择程序语言。本章通过 Web 应用 springMVCDemo09 演…

Linux安装使用Minio

目录简介安装方式1(推荐)安装方式2使用简介 需要一个靠谱的文件管理系统,所以想到了minio。在此记录过程。使用树莓派搭建。Linux下载不同的包即可。 官网地址:https://www.minio.org.cn/ 官方下载地址:https://dl.min.io/server/minio/rele…

FFmpeg二次开发

本文主要讲解 FFmpeg 的二次开发,ffmpeg.exe 的命令行功能特别强大,很多需求都能直接用命令行实现,但是总有一些需求用 命令行实现不太好做。 而你实现那些特殊需求,通常需要把 ffmpeg.exe 里面的某部分代码抄过来,本…

Android databinding之RecycleView使用与讲解(二)

一 、介绍 通过上一篇databinding接入,我们已大概了解到databinding接入的流程和数据的简单绑定。 如果你刚看这边,并不了解databinding的使用,可以查看:Android databinding的接入使用与详解(一) Activity和fragment的数据绑定…

Pr:导出设置之字幕

如果序列中包含字幕轨道,则导出设置中的字幕 CAPTIONS模块将提供用于处理字幕信息的选项。如果源序列不包含任何字幕轨道,此模块将被禁用。导出选项Export Options选择导出活动字幕轨道的方式。--无None若选择此项,则不以任何形式导出字幕。-…