1.降噪处理
我们在录制音频数据的同时,大量噪声都会掺杂进来,不同环境和情境下产生的噪声也不尽相同,噪声信号中的无规则波纹信息影响了声学信号所固有的声学特性,使得待分析的声音信号质量下降,并且噪声对声音识别系统的识别结果会产生重要影响。所以说,我们在对声音信号分析和处理之前,是一定要进行降噪处理的。
下面我们来看几个降噪的常用方法:
①小波变换降噪法
小波变换降噪法简称小波降噪,一般在声音降噪中使用最多的是小波阈值降噪法,它主要是说在带噪声音信号中,有效声音信号与噪声在不同频率上有着不同的小波系数,其中有效信号能量谱表现会比较集中,在能量谱集中的区域小波系数的绝对值会比较大;而噪声的能量谱比较分散,所以其系数的绝对值比较小。接下来,根据此特点,利用小波变换法将带噪声音信号分解到不同频率上,然后设置阈值进行差分调整,保留有效声音信号的小波系数,最后根据小波重构算法还原带噪信号中的有效信号,从而可以达到降噪的效果。
这是其基本原理,其中阈值的设定也可以分为硬阈值和软阈值法。
②谱减法
谱减法又称频谱减法降噪,是根据噪声的可加性、局部平稳性以及噪声和有效声音信号不相关性的一种声音信号降噪方法。这种降噪方法不会涉及到参考信号,其 主要思想 就是带噪声音信号是有效信号与噪声的叠加,那么带噪信号的功率也是相当于有效声音信号的功率和噪声功率的叠加,利用计算得到“静音”片段(信号中不含有有效信号,只含有系统噪声或者环境噪声)中噪声的频谱估计值来等值替换有效声音信号存在期间所含噪声的频谱,最后带噪声音信号的频谱与噪声的频谱估计值相减,就可以得到有效声音信号频谱的估计值。
③自适应噪声抵消法
自适应噪声抵消法的核心组成部分是自适应算法和自适应滤波器。自适应算法可以自动调节输入滤波器的加权系数使滤波器达到最优滤波效果,所以自适应噪声抵消法的关键是在于找到某种算法,可以实现自动调节加权系数。
自适应噪声抵消法的主要思想是:除了带噪声音信号x(t)=s(t)+n(t),假设还可以得到另外一个参考信号 r(t),而这个参考信号与噪声 n(t) 相关,但是与有效声音信号s(t)不相关,那么就可以根据Widrow算法(一种近似最速下降的神经网络算法)抵消带噪声信号中的噪声,从而达到降噪的效果。
④声音滤波器
数字滤波器作为数字信号处理中的重要组成部分,可以通过数值之间的运算来实现滤波的效果,去除噪声成分。数字滤波器有很多种类,根据冲激响应函数的时域特性数字滤波器可分为两种,即无限冲激响应(Infinite Impulse Response,IIR)滤波器和有限冲激响应(Finite Impulse Response,FIR)滤波器。这两种滤波器可分别实现低通、高通、带通和带阻 4 种功能。
2.预加重
预加重是语音信号处理的前提,主要目的是提升语音信号中的高频分量。
在语音信号中,提升高频分量的目的主要是因为高频分量(即辅音)包含了更多的信息,而元音的频率普遍较低。功率谱随频率的增加而减小,其大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容忍的程度。
总之,预加重保持信号的低频部分不变,提升信号的高频部分;而去加重衰减信号的低频部分,保持高频部分。预加重/去加重的目的都是提升信号中高频部分的能量,以补偿信道对高频部分衰减过大。预加重一般采用的是一阶高通滤波器:
3.分帧加窗
“分帧”是把一段声音信号分成一些时间长度相等的音频信号。它可以在预加重后的声音信号上平滑地移动规定长度的窗函数得到,窗函数的窗口大小由声音信号的采样频率来确定。采用可以随着时间移动的窗函数对猪声音信号进行“交叠分帧”,可以防止在分帧时出现遗漏有效的声音信号,也可以保证每段声音信号在滑动时保持平稳性和连续性。
常用的几种窗函数:幂窗、矩形窗、三角窗、汉宁窗、汉明窗、高斯窗。
4.端点检测
端点检测是指确定一段声音信号中有效信号的起始点和终止点。采集到的声音信号中含有无效的声音片段,进行端点检测确定出猪声音信号的起始点与终止点,可以排除大量的干扰信号,剪除静音片段,为后续的特征参数提取减小了运算量,缩短了提取时间。
常用方法:
短时过零率 是指每帧声音信号通过零点的次数,其算法就是计算每帧声音信号幅值符号改变的总次数,如果相邻采样点的幅值符号是相同的,则没有发生过零点的情况,相反,如果相邻采样点幅值的符号发生了改变,那么表示声音信号发生了过零的情况。
短时能量 一定程度上反应了声音信号的幅度变化,应用在区分声音信号中的清音和浊音,因为声音信号中清音的能量比浊音的能量小很多;区分无声片段和有声片段,因为无声片段的短时能量基本等于零,而有声片段是有能量存在的。
双门限端点检测法 是常用的端点检测方法之一,其通过声音信号的短时能量和短时平均过零率确定声音信号的端点位置,短时过零率检测到声音信号的起始点和终止点可能过于宽泛,这样就降低了声音信号处理系统的速度;而短时能量检测到声音信号的起始点和终止点可能包含噪声信号,这样会导致提取的声音信号不太准确。所以将二者 结合 起来来检测猪声音信号的起始点和终止点,即双门限检测法提取声音信号的端点。