不同音频振幅dBFS计算方法

news2025/1/14 0:08:24

1. 振幅的基本概念

振幅是描述音频信号强度的一个重要参数。它通常表示为信号的幅度值,幅度越大,声音听起来就越响。为了更好地理解和处理音频信号,通常会将振幅转换为分贝(dB)单位。分贝是一个对数单位,能够更好地反映人耳对声音强度变化的感知。

2. 振幅计算方法

2.1 总 RMS(Total RMS)

总 RMS 是一种常用的振幅计算方法,表示整个音频信号的平均能量。其计算公式为:
RMS = 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i 2 + 1.0 × 1 0 − 9 ) \text{RMS} = 20 \cdot \log_{10}(\sqrt{\frac{1}{N} \sum_{i=1}^{N} x_i^2} + 1.0 \times 10^{-9}) RMS=20log10(N1i=1Nxi2 +1.0×109)

其中, x i x_i xi是音频信号的样本值, N N N 是样本总数。总 RMS 提供了音频信号的整体响度感知。

2.2 最大 RMS(Max RMS)

最大 RMS 是通过将音频信号分成多个窗口,计算每个窗口的 RMS 值,并返回这些值中的最大值。其计算公式为:
Max RMS = max ⁡ ( 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i 2 + 1.0 × 1 0 − 9 ) ) \text{Max RMS} = \max \left( 20 \cdot \log_{10} \left( \sqrt{\frac{1}{N} \sum_{i=1}^{N} x_i^2} + 1.0 \times 10^{-9} \right) \right) Max RMS=max 20log10 N1i=1Nxi2 +1.0×109

其中:

  • x i x_i xi 是窗口内的音频样本值。
  • N N N是窗口内样本的总数。

2.3 最小 RMS(Min RMS)

最小 RMS 与最大 RMS 类似,但它返回的是每个窗口中计算出的最小 RMS 值。其计算公式为:
Min RMS = min ⁡ ( 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i 2 + 1.0 × 1 0 − 9 ) ) \text{Min RMS} = \min \left( 20 \cdot \log_{10} \left( \sqrt{\frac{1}{N} \sum_{i=1}^{N} x_i^2} + 1.0 \times 10^{-9} \right) \right) Min RMS=min 20log10 N1i=1Nxi2 +1.0×109

其中:

  • x i x_i xi 是窗口内的音频样本值。
  • N N N 是窗口内样本的总数。

2.4 平均 RMS(Avg RMS)

平均 RMS 是所有窗口 RMS 值的平均值,提供了音频信号的整体响度水平。其计算公式为:
Avg RMS = 1 M ∑ j = 1 M ( 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i j 2 + 1.0 × 1 0 − 9 ) ) \text{Avg RMS} = \frac{1}{M} \sum_{j=1}^{M} \left( 20 \cdot \log_{10} \left( \sqrt{\frac{1}{N} \sum_{i=1}^{N} x_{ij}^2} + 1.0 \times 10^{-9} \right) \right) Avg RMS=M1j=1M 20log10 N1i=1Nxij2 +1.0×109

其中:

  • x i j x_{ij} xij 是第 j j j 个窗口内的音频样本值。
  • N N N 是每个窗口内样本的总数。
  • M M M 是窗口的总数。

2.5 峰值幅度(Peak Amplitude)

峰值幅度是音频信号中最大绝对值的幅度,通常用于表示信号的瞬时强度。其计算公式为:
Peak = 20 ⋅ log ⁡ 10 ( max ⁡ ( ∣ x ∣ ) + 1.0 × 1 0 − 9 ) \text{Peak} = 20 \cdot \log_{10}(\max(|x|) + 1.0 \times 10^{-9}) Peak=20log10(max(x)+1.0×109)

峰值幅度能够快速反映音频信号的瞬时响度,但不一定能准确表示人耳的感知。

3. 听觉结果的一致性

人耳对声音的感知是非线性的,通常对响度变化的感知与实际的物理振幅变化不成正比。使用 RMS 和分贝单位进行计算,可以更好地模拟人耳的感知特性。以下是不同计算方法与听觉结果的一致性分析:

  • 总 RMS:提供了整体响度的良好估计,通常与听觉感知一致。
  • 最大 RMS:能够捕捉到音频信号中的最强响度部分,适合用于动态范围分析。
  • 最小 RMS:有助于识别音频信号中的弱响度部分,适合用于音频修复和增强。
  • 平均 RMS:提供了稳定的响度水平,适合用于音频混音和母带处理。
  • 峰值幅度:虽然能够快速反映瞬时响度,但由于其瞬时特性,可能与人耳的感知不完全一致。

4. 程序实现

import os
import numpy as np
import librosa
def calculate_total_rms_dbfs(audio_data):
    rms_level = 20 * np.log10(np.sqrt(np.mean(audio_data ** 2)) + 1.0e-9)  # 计算总 RMS 并转换为 dBFS
    return rms_level
def calculate_max_rms_dbfs(audio_data, window_size):
    rms_values = []
    for start in range(0, len(audio_data), window_size):
        end = min(start + window_size, len(audio_data))
        window = audio_data[start:end]
        if len(window) > 0:
            rms = 20 * np.log10(np.sqrt(np.mean(window ** 2)) + 1.0e-9)
            rms_values.append(rms)
    return np.max(rms_values) if rms_values else -np.inf  # 返回 -inf 如果没有 RMS 值
def calculate_min_rms_dbfs(audio_data, window_size):
    rms_values = []
    for start in range(0, len(audio_data), window_size):
        end = min(start + window_size, len(audio_data))
        window = audio_data[start:end]
        if len(window) > 0:
            rms = 20 * np.log10(np.sqrt(np.mean(window ** 2)) + 1.0e-9)
            rms_values.append(rms)
    return np.min(rms_values) if rms_values else -np.inf  # 返回 -inf 如果没有 RMS 值
def calculate_avg_rms_dbfs(audio_data, window_size):
    rms_values = []
    for start in range(0, len(audio_data), window_size):
        end = min(start + window_size, len(audio_data))
        window = audio_data[start:end]
        if len(window) > 0:
            rms = 20 * np.log10(np.sqrt(np.mean(window ** 2)) + 1.0e-9)
            rms_values.append(rms)
    return np.mean(rms_values) if rms_values else -np.inf  # 返回 -inf 如果没有 RMS 值
def calculate_peak_amplitude(audio_data):
    return 20 * np.log10(np.max(np.abs(audio_data)) + 1.0e-9)
def analyze_audio_file(audio_path, window_duration=0.05):
    audio_data, sr = librosa.load(audio_path, sr=None)
    window_size = int(window_duration * sr)
    total_rms_dbfs = calculate_total_rms_dbfs(audio_data)
    max_rms_dbfs = calculate_max_rms_dbfs(audio_data, window_size)
    min_rms_dbfs = calculate_min_rms_dbfs(audio_data, window_size)
    avg_rms_dbfs = calculate_avg_rms_dbfs(audio_data, window_size)
    peak_amplitude = calculate_peak_amplitude(audio_data)
    print(f"File: {audio_path}")
    print(f"Total RMS (dBFS): {total_rms_dbfs:.2f}")
    print(f"Max RMS (dBFS): {max_rms_dbfs:.2f}")
    print(f"Min RMS (dBFS): {min_rms_dbfs:.2f}")
    print(f"Avg RMS (dBFS): {avg_rms_dbfs:.2f}")
    print(f"Peak Amplitude(dBFS): {peak_amplitude:.2f}")
if __name__ == "__main__":
    audio_path = '/Volumes/T9/DATA/构建数据集/SELE/real_echo/0011217_echo.wav'
    analyze_audio_file(audio_path)

在这里插入图片描述

在这里插入图片描述计算结果与Audition一致。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2276211.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Nginx反向代理请求头有下划线_导致丢失问题处理

后端发来消息说前端已经发了但是后端没收到请求。 发现是下划线的都没收到,搜索之后发现nginx默认request的header中包含’_’时,会自动忽略掉。 解决方法是:在nginx里的nginx.conf配置文件中的http部分中添加如下配置: unders…

C语言程序环境和预处理详解

本章重点: 程序的翻译环境 程序的执行环境 详解:C语言程序的编译链接 预定义符号介绍 预处理指令 #define 宏和函数的对比 预处理操作符#和##的介绍 命令定义 预处理指令 #include 预处理指令 #undef 条件编译 程序的翻译环境和执行环…

计算机组成原理(1)

系统概述 计算机硬件基本组成早期冯诺依曼机现代计算机 计算机各部分工作原理主存储器运算器控制器计算机工作过程 此文章的图片资源获取来自于王道考研 计算机硬件基本组成 早期冯诺依曼机 存储程序是指将指令以二进制的形式事先输入到计算机的主存储器,然后按照…

基于element UI el-dropdown打造表格操作列的“更多⌵”上下文关联菜单

<template><div :class"$options.name"><el-table :data"tableData"><el-table-column type"index" label"序号" width"60" /><!-- 主要列 BEGIN---------------------------------------- --&g…

Oracle 表分区简介

目录 一. 前置知识1.1 什么是表分区1.2 表分区的优势1.3 表分区的使用条件 二. 表分区的方法2.1 范围分区&#xff08;Range Partitioning&#xff09;2.2 列表分区&#xff08;List Partitioning&#xff09;2.3 哈希分区&#xff08;Hash Partitioning&#xff09;2.4 复合分…

罗永浩再创业,这次盯上了 AI?

罗永浩&#xff0c;1972年7月9日生于中国延边朝鲜族自治州的一个军人家庭&#xff0c;是一名朝鲜族人&#xff1b;早年在新东方授课&#xff0c;2004年当选 “网络十大红人” &#xff1b;2006年8月1日&#xff0c;罗永浩创办牛博网&#xff1b;2008年5月&#xff0c;罗永浩注册…

自然语言处理基础:全面概述

自然语言处理基础&#xff1a;全面概述 什么是NLP及其重要性、NLP的核心组件、NLU与NLG、NLU与NLG的集成、NLP的挑战以及NLP的未来 自然语言处理&#xff08;NLP&#xff09;是人工智能&#xff08;AI&#xff09;中最引人入胜且具有影响力的领域之一。它驱动着我们日常使用的…

WPF系列八:图形控件Path

简介 Path控件支持一种称为路径迷你语言&#xff08;Path Mini-Language&#xff09;的紧凑字符串格式&#xff0c;用于描述复杂的几何图形。这种语言通过一系列命令字母和坐标来定义路径上的点和线段&#xff0c;最终绘制出想要的图形。 绘制任意形状&#xff1a;可以用来绘…

计算机图形学【绘制立方体和正六边形】

工具介绍 OpenGL&#xff1a;一个跨语言的图形API&#xff0c;用于渲染2D和3D图形。它提供了绘制图形所需的底层功能。 GLUT&#xff1a;OpenGL的一个工具库&#xff0c;简化了窗口创建、输入处理和其他与图形环境相关的任务。 使用的函数 1. glClear(GL_COLOR_BUFFER_BIT |…

有限元分析学习——Anasys Workbanch第一阶段笔记(10)桌子载荷案例分析_实际载荷与均布载荷的对比

目录 0 序言 1 桌子案例 2 模型简化 3 方案A 前处理 1&#xff09;分析类型选择 2&#xff09;材料加载 3&#xff09;约束、载荷及接触 4&#xff09;控制网格(网格大小需要根据结果不断调整) 初始计算结果 加密后计算结果 4 方案B、C 前处理 1&#xff09;分析…

Docker compose 使用 --force-recreate --no-recreate 控制重启容器时的行为【后续】

前情&#xff1a;上一篇实际是让AI工具帮我总结了一下讨论的内容&#xff0c;这里把讨论的过程贴出来&#xff0c;这个讨论是为解决实际问题 前文https://blog.csdn.net/wgdzg/article/details/145039446 问题说明&#xff1a; 我使用 docker compose 管理我的容器&#xff0…

Mysql--基础篇--多表查询(JOIN,笛卡尔积)

在MySQL中&#xff0c;多表查询&#xff08;也称为联表查询或JOIN操作&#xff09;是数据库操作中非常常见的需求。通过多表查询&#xff0c;你可以从多个表中获取相关数据&#xff0c;并根据一定的条件将它们组合在一起。MySQL支持多种类型的JOIN操作&#xff0c;每种JOIN都有…

postgresql|数据库|利用sqlparse和psycopg2库批量按顺序执行SQL语句(psyconpg2新优化版本)

一、 旧版批量执行SQL脚本的python文件缺点&#xff0c;优点&#xff0c;以及更新内容 书接上回&#xff0c;postgresql|数据库开发|python的psycopg2库按指定顺序批量执行SQL文件(可离线化部署)_python sql psycopg2-CSDN博客 这个python脚本写了很久了&#xff0c;最近开始…

5个不同类型的数据库安装

各种社区版本下载官方地址&#xff1a;MySQL :: MySQL Community Downloads 一、在线YUM仓库&#xff08;Linux&#xff09; 选择 MySQL Yum Repository 选择对应版本下载仓库安装包&#xff08;No thanks, just start my download.&#xff09; 下载方法1&#xff1a;下载到本…

shell基础使用及vim的常用快捷键

一、shell简介 参考博文1 参考博文2——shell语法及应用 参考博文3——vi的使用 在linux中有很多类型的shell&#xff0c;不同的shell具备不同的功能&#xff0c;shell还决定了脚本中函数的语法&#xff0c;Linux中默认的shell是 / b in/ b a s h &#xff0c;流行的shell…

Spring Data Elasticsearch简介

一、Spring Data Elasticsearch简介 1 SpringData ElasticSearch简介 Elasticsearch是一个实时的分布式搜索和分析引擎。它底层封装了Lucene框架,可以提供分布式多用户的全文搜索服务。 Spring Data ElasticSearch是SpringData技术对ElasticSearch原生API封装之后的产物,它通…

【巨实用】Git客户端基本操作

本文主要分享Git的一些基本常规操作&#xff0c;手把手教你如何配置~ ● 一个文件夹中初始化Git git init ● 为了方便以后提交代码需要对git进行配置&#xff08;第一次使用或者需求变更的时候&#xff09;&#xff0c;告诉git未来是谁在提交代码 git config --global user.na…

有收到腾讯委托律师事务所向AppStore投诉带有【水印相机】主标题名称App的开发者吗

近期&#xff0c;有多名开发者反馈&#xff0c;收到来自腾讯科技 (深圳) 有限公司委托北京的一家**诚律师事务所卞&#xff0c;写给AppStore的投诉邮件。 邮件内容主要说的是&#xff0c;腾讯注册了【水印相机】这四个字的商标&#xff0c;所以你们这些在AppStore上的app&…

导出文件,能够导出但是文件打不开

背景&#xff1a; 在项目开发中&#xff0c;对于列表的查询&#xff0c;而后会有导出功能&#xff0c;这里导出的是一个excell表格。实现了两种&#xff0c;1.导出的文件&#xff0c;命名是前端传输过去的&#xff1b;2.导出的文件&#xff0c;命名是根据后端返回的文件名获取的…

Redis 源码分析-内部数据结构 dict

Redis 源码分析-内部数据结构 dict 在上一篇 Redis 数据库源码分析 提到了 Redis 其实用了全局的 hash 表来存储所有的键值对&#xff0c;即下方图示的 dict&#xff0c;dict 中有两个数组&#xff0c;其中 ht[1] 只在 rehash 时候才真正用到&#xff0c;平时都是指向 null&am…