优化回声消除过程:舒适噪声生成算法的应用与原理

news2025/1/17 3:01:30

在回声消除中,舒适噪声生成(Comfort Noise Generator,CNG)算法是一种常用的技术,它被用来减轻回声消除过程中产生的不适感和声音失真。舒适噪声生成算法通过添加特定的噪声信号来模拟人耳的听觉特性,以改善声音的自然度和舒适度。舒适噪声生成算法的基本原理是通过将噪声信号与回声消除处理后的信号进行混合,使得混合信号在听觉上更加自然和舒适。舒适噪声生成一般需要以下几个步骤,首先是进行背景噪声估计,根据估计的背景噪声功率生成随机噪声,最后对生成的噪声进行加权。我们以WebRTC中的回声消除算法为例,解析舒适噪声算法和其应用。对WebRTC回声消除算法不熟悉的朋友可以参考WebRTC AEC 流程解析。

WebRTC回声消除的整体流程如下所示,近端信号再经过线性NLMS和非线性的NLP处理之后会送给CNG来产生舒适噪声。值得一提的是,有的音频处理流程会把NR放在NLP之后CNG之前。

I. 背景噪声估计

WebRTC回声消除中背景噪声估计在函数ProcessBlock中,首先定义了一些噪声估计常数,如下所示。

  const float gPow[2] = {0.9f, 0.1f};

  // Noise estimate constants.
  const int noiseInitBlocks = 500 * aec->mult;
  const float step = 0.1f;
  const float ramp = 1.0002f;
  const float gInitNoise[2] = {0.999f, 0.001f};

其中aec->mult是一个与采样率相关的因子,计算方式如下,我们目前测试音频采样率是16000,那么aec->mult值为2,这也意味着噪声初始化的block数目为1000。

  // Sampling frequency multiplier SWB is processed as 160 frame size
  if (aec->sampFreq == 32000) {
    aec->mult = (short)aec->sampFreq / 16000;
  } else {
    aec->mult = (short)aec->sampFreq / 8000;
  }

噪声估计算法如果对降噪比较熟悉的朋友应该知道WebRTC的ANR采用的是分位数噪声估计算法而不是一般常用的MCRA系列的噪声估计算法。在WebRTC AEC中的噪声估计算法类似于后者,是一种递归的噪声最小估计方法。首先在WebRtcAec_InitAec中对噪声功率谱进行初始化

  memset(aec->dInitMinPow, 0, sizeof(aec->dInitMinPow));
  aec->noisePow = aec->dInitMinPow;
  aec->noiseEstCtr = 0;

  // Initial comfort noise power
  for (i = 0; i < PART_LEN1; i++) {
    aec->dMinPow[i] = 1.0e6f;
  }

接着在ProcessBlock中计算远端和近端平滑后的功率谱

   for (i = 0; i < PART_LEN1; i++) {
    far_spectrum = (xf_ptr[i] * xf_ptr[i]) +
                   (xf_ptr[PART_LEN1 + i] * xf_ptr[PART_LEN1 + i]);
    aec->xPow[i] =
        gPow[0] * aec->xPow[i] + gPow[1] * aec->num_partitions * far_spectrum;
    // Calculate absolute spectra
    abs_far_spectrum[i] = sqrtf(far_spectrum);

    near_spectrum = df[0][i] * df[0][i] + df[1][i] * df[1][i];
    aec->dPow[i] = gPow[0] * aec->dPow[i] + gPow[1] * near_spectrum;
    // Calculate absolute spectra
    abs_near_spectrum[i] = sqrtf(near_spectrum);
  }

当aec->noiseEstCtr大于50的时候我们才开始进行最小值跟踪来估计近端信号的功率谱

  if (aec->noiseEstCtr > 50) {
    for (i = 0; i < PART_LEN1; i++) {
      if (aec->dPow[i] < aec->dMinPow[i]) {
        aec->dMinPow[i] =
            (aec->dPow[i] + step * (aec->dMinPow[i] - aec->dPow[i])) * ramp;
      } else {
        aec->dMinPow[i] *= ramp;
      }
    }
  }

当aec->noiseEstCtr小于设定的noiseInitBlocks,我们从零开始平滑增加噪声功率,这是为了避免一个突然的噪声出现。

  if (aec->noiseEstCtr < noiseInitBlocks) {
    aec->noiseEstCtr++;
    for (i = 0; i < PART_LEN1; i++) {
      if (aec->dMinPow[i] > aec->dInitMinPow[i]) {
        aec->dInitMinPow[i] = gInitNoise[0] * aec->dInitMinPow[i] +
                              gInitNoise[1] * aec->dMinPow[i];
      } else {
        aec->dInitMinPow[i] = aec->dMinPow[i];
      }
    }
    aec->noisePow = aec->dInitMinPow;
  } else {
    aec->noisePow = aec->dMinPow;
  }

以上就是WebRTC回声消除的噪声估计部分,采用了有别于WebRTC ANR的噪声估计算法,并且在计算过程中引入大量的平滑操作使得估计出来的噪声尽可能的“舒适”。

II. 随机数生成

WebRTC回声消除采用的随机数生成算法是线性加乘同余法。线性加乘同余法的基本原理是利用线性同余方程来生成随机数。具体而言,它使用以下公式生成随机数序列:X(n+1) = (a * X(n) + c) mod m,其中,X(n) 是当前的随机数,X(n+1) 是下一个随机数,a、c 和 m 是预先定义的参数。在WebRTC回声消除中实现线性加乘同余法的函数如下:

  • WebRtcSpl_IncreaseSeed,增加随机种子,并返回新值
  • WebRtcSpl_RandU,在int16_t 范围内产生一个均匀分布的值
  • WebRtcSpl_RandUArray,在 int16_t 范围内生成均匀分布的向量
static uint32_t IncreaseSeed(uint32_t* seed)  {
  seed[0] = (seed[0] * ((int32_t)69069) + 1) & (kMaxSeedUsed - 1);
   return seed[0];
 }
 
int16_t WebRtcSpl_RandU(uint32_t* seed) {
  return (int16_t)(IncreaseSeed(seed) >> 16);
}

int16_t WebRtcSpl_RandUArray(int16_t* vector,
                             int16_t vector_length,
                             uint32_t* seed) {
    int i;
    for (i = 0; i < vector_length; i++) {
      vector[i] = WebRtcSpl_RandU(seed);
    }
    return vector_length;
  }

III. 舒适噪声生成

最后就到了舒适噪声生成的函数ComfortNoise,我们看下重要的函数参数

  • efw,这是经过NLMS和NLP之后的输出信号
  • noisePow,估计的噪声功率谱
  • lambda,非线性抑制系数
static void ComfortNoise(AecCore* aec,
                         float efw[2][PART_LEN1],
                         complex_t* comfortNoiseHband,
                         const float* noisePow,
                         const float* lambda)

首先生成[0,1]直接均匀分布的向量。

  WebRtcSpl_RandUArray(randW16, PART_LEN, &aec->seed);
  for (i = 0; i < PART_LEN; i++) {
    rand[i] = ((float)randW16[i]) / 32768;
  

接着抑制低频噪声,去除直流分量,即将u[0]之后的都赋值为0,并产生时域的随机噪声信号,可以分为三步

Step 1: 根据随机数组计算随机角频率

Step 2: 根据功率谱开平方得到幅度谱

Step 3: 使用欧拉公式对频域信号进行加噪

  u[0][0] = 0;
  u[0][1] = 0;
  for (i = 1; i < PART_LEN1; i++) {
    tmp = pi2 * rand[i - 1];

    noise = sqrtf(noisePow[i]);
    u[i][0] = noise * cosf(tmp);
    u[i][1] = -noise * sinf(tmp);
  }
  u[PART_LEN][1] = 0

最后我们根据传入参数lambda数组选取合适的权重,用于非线性的调整噪声幅值u,基本准则是对应频段非线性抑制越厉害生成的舒适噪声越大,反之越小。

  for (i = 0; i < PART_LEN1; i++) {
    tmp = sqrtf(WEBRTC_SPL_MAX(1 - lambda[i] * lambda[i], 0));
    efw[0][i] += tmp * u[i][0];
    efw[1][i] += tmp * u[i][1];
  }

IV. 效果

我们最后比较下开启与不开启舒适噪声后的AEC处理效果,如下所示(上图为不开启舒适噪声,下图为开启舒适噪声)。可以明显看到,当不开始舒适噪声时由于远端声音被消除而留下了大片的空白,而开始舒适噪声后,生成的噪声填补了这些空白使得音频听感更连续。

参考文献:

[1]. https://blog.csdn.net/weixin_44856859/article/details/124117845

[2]. https://blog.csdn.net/shichaog/article/details/80210194

[3]. 实时语音处理实践指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/666588.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Cpp面试题:main函数执行以前,还会执行什么代码?

Cpp面试题:main函数执行以前&#xff0c;还会执行什么代码&#xff1f; 在 main() 函数执行之前和之后&#xff0c;C 程序可能会执行以下代码&#xff1a; 静态对象的构造函数&#xff1a;如果程序中有静态对象&#xff08;全局变量或静态成员变量&#xff09;&#xff0c;它们…

深入了解 vcruntime140 文件,从多方面解析vcruntime140

vcruntime140 是一个重要的文件&#xff0c;它在 Windows 系统中扮演着重要的角色。如果不小心缺失了&#xff0c;那么你的电脑就会出现问题&#xff0c;今天我们就来探讨一下vcruntime140这个文件&#xff0c;分别从背景和预防丢失&#xff0c;到如何修复丢失vcruntime140来给…

Elasticsearch(十)搜索---搜索匹配功能①--查询所有文档和term级别查询

一、前言 之前的学习我们已经了解了搜索的辅助功能&#xff0c;从这一章开始就是ES真正核心的功能&#xff0c;搜索。针对不同的数据类型&#xff0c;ES提供了很多搜索匹配功能&#xff1a;既有进行完全匹配的term搜索&#xff0c;也有按照范围匹配的range搜索&#xff1b;既有…

一文让你学会接口自动化测试框架!

目录 前言&#xff1a; 自动化测试 接口自动化测试的价值 接口自动化测试如何开展 接口自动化测试框架 前言&#xff1a; 接口自动化测试是指利用程序自动化地执行API接口测试&#xff0c;可以提高测试效率和准确性。 自动化测试 自动化测试&#xff0c;这几年行业内的…

一个悄然崛起的AI开源项目!

众所周知&#xff0c;最近这半年AI相关的话题实在是火到出圈。尤其是生成式AI的流行&#xff0c;让我们普通人也可以近距离地接触和应用AI。这其中最典型的就是ChatGPT。 那除了ChatGPT&#xff0c;还有一个非常实用的领域&#xff0c;也是我们今天要讨论的话题&#xff0c;那…

​低代码让传统软件开发土掉渣了

正所谓“让机器去做无聊的事情&#xff0c;让人类去创造美好的事物”。 在当今数码化时代&#xff0c;企业如何更快捷、高效的开发应用是众所周知的难题。传统开发方式需要多名开发人员耗费大量时间精力开发&#xff0c;期间还需要经历漫长的测试和上线过程。 要在这个竞争激烈…

AI绘图软件分享:Midjourney 基础教程(二)

大家好&#xff0c;我是权知星球&#xff0c;今天继续给大家介绍AI绘图软件分享&#xff1a;Midjourney 基础教程&#xff08;二&#xff09; ⼀、Midjourney 服务器介绍 1.Discord 软件介绍 Midjourney AI 绘画服务基于 Discord 软件的&#xff0c;它的绘画功能&#xff0c;…

【AUTOSAR】UDS协议的代码分析与解读(十一)----UDS例程控制31h请求下载 34h

8.15 例程控制 RoutineControl (31h) 此服务用于启动程序 、停止程序和请求程 序执行结果。例程由 两字节的例程标识符 (RoutineIdentifier)来确定。 8.15.1 报文格式 表 71 例程控制服务的请求报文 Byte Name Cvt Value (Hex) #1 RequestServiceIdentifier M 31 #2 …

部署运行jar包方法全解docker镜像打包部署等

基本方法 java -jar 对应的jar包名字 永久后台方法 有一种叫做“nohup”的命令&#xff0c;该命令可以让您的应用程序在后台运行&#xff0c;即使您已经断开了与终端的连接也能保持运行状态。 nohup 命令的语法为&#xff1a; nohup command arg1 arg2 ... argN &其中…

金三银四互联网大厂秋招精选 1160 道 Java 面试题答案整理(2023 最新版)

今年的大环境而言&#xff0c;面试成功的难度比往年高了很多&#xff0c;很明显的感受就是&#xff1a;对于今年的 java 开发朋友面试&#xff0c;无论一面还是二面&#xff0c;都开始考验一个 Java 程序员的技术功底和基础。Java 基础掌握不牢&#xff0c;对于一个开发人员来说…

北斗高精度定位赋能智慧港口,千寻位置解决方案落地应用

港口是交通运输的重要节点&#xff0c;也是国家经济发展的重要支撑&#xff0c;其作业效率直接影响着运营效益。随着全球数字化技术的不断革新&#xff0c;我国港口逐渐从传统模式向智能化、数字化的“智慧模式”转变。在这一转型过程中&#xff0c;高精度技术应用的作用愈发重…

伊朗上下5000年简史

提起伊朗&#xff0c;你脑海中首先浮现的是什么&#xff1f; 混乱、保守、战争&#xff1f;穆斯林&#xff1f;抑或是石油&#xff0c;核武器&#xff1f; 这些附着在伊朗头上的标签&#xff0c;使很多人忽略了&#xff0c;它是一个拥有着5000年历史的文明古国&#xff1b;在…

保护视力的软件:定时提醒你休息的桌面工具EyeLeo

文章目录 保护视力的软件&#xff1a;定时提醒你休息的桌面工具EyeLeo什么是EyeLeo为什么要使用&#xff1f;它为什么如此重要&#xff1f;EyeLeo特征 使用说明 保护视力的软件&#xff1a;定时提醒你休息的桌面工具EyeLeo 什么是EyeLeo 官网&#xff1a;http://www.eyeleo.c…

django新手教程

Django简介 Django是开源的、大而且全的Web应用框架。 它独具特色&#xff0c;采用了MTV设计模式。 它也是一款用来构建服务器的框架。这一概念如何理解呢&#xff1f; 应用程序有两种模式&#xff1a;C/S、B/S。 C/S是客户端与服务器端&#xff0c;这类程序一般能独立运行…

【Python】高级语法:推导式、迭代器、生成器、装饰器

原文作者&#xff1a;我辈李想 版权声明&#xff1a;文章原创&#xff0c;转载时请务必加上原文超链接、作者信息和本声明。 文章目录 一、推导式1.列表推导式2.集合推导式3.字典推导式 二、迭代器三、生成器1.yield 生成器2.元组生成器3.生成器中重要方法 四、装饰器1.函数装饰…

谈谈电商API!

近年来&#xff0c;随着互联网和移动互联网技术的不断发展&#xff0c;电商行业成为了一种新兴的商业模式。电商平台实现了互联网和商品销售的深度融合&#xff0c;成为经济社会发展的重要组成部分。而电商API&#xff08;Application Programming Interface, 应用程序接口&…

RobotFrameWork Web自动化测试之测试环境搭建

前言 Robot Framework是一款python编写的功能自动化测试框架。具备良好的可扩展性&#xff0c;支持关键字驱动&#xff0c;可以同时测试多种类型的客户端或者接口&#xff0c;可以进行分布式测试执行。主要用于轮次很多的验收测试和验收测试驱动开发&#xff08;ATDD&#xff…

自然语言处理实战项目11-阅读理解项目的数据处理与训练详细讲解,实验结果与分析

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下自然语言处理实战项目11-阅读理解项目的数据处理与训练详细讲解&#xff0c;阅读理解任务目标是让计算机从给定的文章中理解并回答问题。为了完成这个任务&#xff0c;我们需要对给定的数据进行处理和训练。该任务是…

项目调研丨多区块并行处理公链 Transformers 研究报告

目录 一、项目简介 二、项目愿景 三、特色和优势 &#xff08;1&#xff09;速度 &#xff08;2&#xff09;安全 &#xff08;3&#xff09;可扩展性 &#xff08;4&#xff09;高度定制 &#xff08;5&#xff09;不可篡改 &#xff08;6&#xff09;所有数据公开透…

怎么防止数据重放攻击——CBC模式【密码学】(7)

目录 一、什么是CBC模式 二、初始化向量 三、异或运算 四、密钥少一位会有影响吗 一、什么是CBC模式 CBC模式中&#xff0c;明文分组在加密前&#xff0c;要与前一组的密文分组进行异或运算&#xff0c;异或运算的结果参与加密函数的运算。 每一个密文分组&#xff0c;都…