语音文件格式的重要参数
语音波形,它的这个文件,主要的格式就是采样率,那么电话或者嵌入式设备,采样率一般是8000Hz,就一秒钟8000个点,如果是PC机麦克风,那是16K,就一秒钟是16000个点,像这个CD是高保真的,音乐唱片的是用这个44.1K。
量化位数,又叫采样精度,刚才讲的就是每次采取样,它是通过二进制编码。
它也还原了它的这个信息量,一般用16比特就两个字节,那保存量化值,这个比特率是采样率和量化位数的相乘;比如说我们这个8K跟16比特,那就是128,就一秒钟有128位;
因为圆通道数,一个是单声道,还有双声道,双声道就是我们这个立体声,如果我们照语音识别,那这个双声道要把它转成单声道好。
WAV文件
语音的文件分析,wav文件是以RIFF格式去存储的,包含了一个头部,还有具体的数据,那