线性预测是几乎所有现代语音编码算法的基础
– 手机
– 网络电话 (VOIP)
– 军事通讯
线性预测假设语音信号的每个样本都可以从 P 个先前样本的加权和中预测出来,利用平稳性假设产生的冗余,线性预测允许数百个样本的语音帧仅由 10-15 个“预测系数”(a1 … aP) 表示。
对于一般的数字滤波器例如FIR滤波器
• 只有前向路径
• 固有稳定
• z 平面中没有极点(只有零点)
线性预测分析:
特定样本 e[k] 的预测误差为
对两边进行 Z 变换,能得到
因此,预测误差滤波器传递函数是,同时也被称为全零点过滤器
计算预测系数
计算线性预测系数以最小化语音数据帧上的平方和“预测误差”(“残差信号”),均方误差 (MSE) 。这具有“白化”误差信号的效果(即展平其频谱,
通过找到解决方案来最小化 Ep,也就是最小均方误差 (MMSE),这能得到一组 p 个联立方程,也称为正规方程 normal equations
不同范围的求和会产生
–自相关法(Durban’s algorithm)autocorrelation method
–协方差法 covariance method
自相关法 | 协方差法 | |
---|---|---|
过滤顺序 | 10-15 | 10-15 |
Windowing | 有 | 无 |
稳定性 | 有 | 无 |
窗口大小 | 25 msec | 5-10 msec |
预算 | + | +++ |
反射系数 | 有 | 无 |
线性预测
从信号到预测误差序列的滤波器传递函数是全零点滤波器
从预测误差序列到信号的滤波器传递函数是全极点滤波器
线性预测合成
线性预测滤波器可以配置为全极点数字滤波器,以误差信号作为输入
LP 滤波器可用于分析和合成
– 分析
• 输入 = 信号
• 输出 1 = 预测系数
• 输出 2 = “残留”误差
– 合成
• 输入 1 = 预测系数
• 输入 2 = “残留”误差
• 输出 = 重构信号
残差+预测系数的数据率可以远低于信号的数据率,这使得线性预测特别适用于对语音信号进行编码
在语音分析-再合成中
– LP 滤波器对声道引起的频谱整形进行建模
– 误差序列对源激励进行建模
– 分析模型假设脉冲/白噪声激励(因此 LP 滤波器也捕获由声门源引起的频谱整形)
– 合成模型(全极点模型)忽略任何零点(例如鼻侧支和声门下的路径)
所以,线性预测的应用
• 音调提取
• 共振峰分析
• 语音合成
• 自动语音识别
• 线性预测编码 (LPC)
全球移动通信系统(GSM)Global System for Mobile communications 的基本操作原理:
– CELP( Code-Excited LPC)
– 8 kHz 采样率
– 20 毫秒帧
– 每帧 8 个短期预测系数
– 然后每个帧进一步分为四个 5 毫秒子帧
– 对于编码器为编解码器的长期预测器找到延迟和增益的每个子帧——短期和长期滤波后的残余信号为每个子帧量化