一个有趣的现象:倒谱上的第一个峰,恰好对应回声相比原声的延时。
回声 y y y 是原始声音 x x x 延迟 t 0 t_0 t0 秒后的、带有衰减 α α α 的副本
y = α x ( t − t 0 ) y = αx (t - t_0) y=αx(t−t0)
方便起见,这里取 α = 1 α = 1 α=1
原始声音
x
x
x 可以理解成一堆不同频率的正弦波的和:
x
=
a
1
s
i
n
(
f
1
)
+
a
2
s
i
n
(
f
2
)
+
.
.
.
x = a_1sin (f_1) + a_2sin (f_2) + ...
x=a1sin(f1)+a2sin(f2)+...回声
y
y
y 等价于把上面各个正弦波向后推移
t
0
t_0
t0,表示成附加一个相位
φ
φ
φ:
y
=
a
1
s
i
n
(
f
1
+
φ
1
)
+
a
2
s
i
n
(
f
2
+
φ
2
)
+
.
.
.
y = a_1sin (f_1+φ_1) + a_2sin (f_2+φ_2) + ...
y=a1sin(f1+φ1)+a2sin(f2+φ2)+...
最终麦克风接收到的信号记为
z
=
x
+
y
z=x+y
z=x+y
考察 z z z 的任何一个频率成分
f n : a n s i n ( f n ) + a n s i n ( f n + φ n ) f_n: a_nsin (f_n) + a_nsin (f_n+φ_n) fn:ansin(fn)+ansin(fn+φn)
可以看到,向后推移 t 0 t_0 t0 对任何频率成分的幅度影响是不同的。
这个影响将以周期为 1 / t 0 1/t_0 1/t0 的正弦扰动的形式,在幅度谱上被观察到。
举例而言,取 t 0 = 0.01 t_0 = 0.01 t0=0.01 s s s
则 z z z 中 100 H z 100Hz 100Hz 频率成分的幅度刚好翻倍, 50 H z 50Hz 50Hz 刚好抵消,
因为:
原来的 100 H z 100Hz 100Hz 正弦波加上延时 10 10 10 m s ms ms 后的 100 H z 100Hz 100Hz,刚好峰-峰对齐
原来的 50 H z 50Hz 50Hz 正弦波加上延时 10 10 10 m s ms ms 后的 50 H z 50Hz 50Hz,刚好峰-谷对齐
以此推类,相比 x x x 的幅度谱, z z z 的幅度谱上
200 H z / 300 H z / 400 H z . . . 200Hz / 300Hz /400 Hz... 200Hz/300Hz/400Hz... 都会翻倍
50 H z / 150 H z / 250 H z . . . 50Hz / 150Hz / 250Hz ... 50Hz/150Hz/250Hz... 都会相消
相当于回声给 x x x 的幅度谱上附加一个周期为 100 H z 100Hz 100Hz 的正弦扰动成分
由上面的讨论可知,迟滞 t 0 t_0 t0 的回声的存在
会使得 z z z 的幅度谱上多出了一个周期为 1 / t 0 1/t_0 1/t0 、频率为 t 0 t_0 t0 的正弦扰动。
那么如何表示这个幅度谱上频率为 t 0 t_0 t0 的正弦波?
可以把幅度谱当作一个信号,对其进行傅里叶变换,观察能量最高的成分。
这样得到的便是倒谱,谱上频率为 t 0 t_0 t0 的高峰,将恰好代表幅度谱上的扰动。