车载音频开发（一）：从看懂wav开始

news2025/12/23 15:39:41

背景介绍：随着电车的发展势头迅猛，国内车载音频也成为电车火热宣称的势头，要想深入了解车载音频，那首先还是得从最为普通的音频文件WAV开始。

我们都知道，计算机只能存储数字，声音确实靠不同频率的波组成，那么这些波的数据是如何存储在wav文件中的呢

首先我们用notepad++打开一首简单的wav文件一堆看不懂的乱码

然后借助插件看起hex格式

这些一个个数字和字母就是该文件的全部内容了，当然，这么看还是很迷，那么我们就用专门的音频软件audition来解析这些数据，看看wav到底长什么样

用audition打开可以看到该wav有两个声道，每个声道对应着一段波形图

我们放大了看，每个波箱图上有非常多的小点，这些点就被称为采样点，只要采样点足够密，那么将这些点按先后顺序连起来，那就成了波形数据

当然，实际的wav文件的内容远不止这些，要像真正读懂wav还要接着往下看

我们先来百度一下有关wav的词条

词条上显示有三个关键词：采样频率，采样位数，声道数

采样频率：简单理解就是一秒钟有多少个小点

采样位数：简单理解就是每个小点在计算机上由多少个 0/1 来记录

声道数：就是这个这个wav有多少个声道（除了我们大多熟悉的立体音，还有5.1，7.1.4，等其他各种各样的声道数的音源，当我们了解了wav的格式后，想要多少个声道就能有多少个声道）

接下来，我们应该知道的是采样频率，采样位数，声道数这些信息我们要如何知道，到底又怎么用，那我们就要去在百度再搜一搜wav文件头

知乎上说的很明白，以下就是文件头的内容

那么知道了这些，作为一个程序员就可以开始展现我们自己的专业啦

先建一个头文件的结构体

    struct WavHeader {
        char chunkId[4];			//"RIFF"
        uint32_t chunkSize;			//totalsize - 8
        char format[4];				//"WAVE"
        char subchunk1Id[4];		//"fmt"
        uint32_t subchunk1Size;		//16:Normal; 18:Non_PCM; 40:Extensible;
        uint16_t audioFormat; 		//wav 格式 1；int型  3：float型  65534：未知
        uint16_t numChannels; 		//声道数 
        uint32_t sampleRate;		//采样率
        uint32_t byteRate;			//比特率：采样率 * 采样位宽
        uint16_t blockAlign;		//采样深度：
        uint16_t bitsPerSample;		//采样位宽：采样深度 * 8
        char subchunk2Id[4];		//"data"
        uint32_t subchunk2Size;		//datasize
    };

通过IO读取文件的数据可得到如下内容

读出了头文件的信息后，剩下的便是读取其所有数据

根据头文件信息我们知道该文件有两声道，采样率是48000，采样位数是16

那接下来我们每16 位也就是每两个字节读一次数据

数据量太大，我们就截取看一部分

这里有正有负，

对应上这里纵坐标为dB 值，那么我把把这些数据转化一下，算出每个数据对应的dB值

memcpy(&WavDate16, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);
printf(" %10d , %.2f db ,",  WavDate16, 20 * log10f(abs((float)WavDate16) / 32768));

得到以下结果

接下来我们就还可以完全用代码把所有wav的数据读出来了

以下是优化好的c++代码

#include <iostream>
#include <fstream>
#include <vector>
#include <cstring>
#include <cmath>

    using namespace std;

    struct WavHeader {
        char chunkId[4];			//"RIFF"
        uint32_t chunkSize;			//totalsize - 8
        char format[4];				//"WAVE"
        char subchunk1Id[4];		//"fmt"
        uint32_t subchunk1Size;		//16:Normal; 18:Non_PCM; 40:Extensible;
    };

    struct type40_header {
        uint16_t audioFormat; 		//wav 格式 1；int型  3：float型  65534：未知
        uint16_t numChannels; 		//声道数 
        uint32_t sampleRate;		//采样率
        uint32_t byteRate;			//比特率：采样率 * 采样位宽
        uint16_t blockAlign;		//采样深度：
        uint16_t bitsPerSample;		//采样位宽：采样深度 * 8
        uint16_t cbSize;
        uint16_t wValidBitsPerSample;
        uint32_t dwChannelMask;
        char SubFormat[4];
        char ckID[4];
        uint32_t cksize;
        uint32_t dwSampleLength;
    };

    struct data_header {
        char subchunk2Id[4];		//"data"
        uint32_t subchunk2Size;		//datasize
    };

    //查看头部数据
    int header_check(const char* filename)
    {
        WavHeader header = {};
        type40_header headera = {};
        data_header headerb = {};

        ifstream inputFile(filename, ios::binary);
        if (!inputFile.is_open()) {
            cerr << "无法打开文件" << endl;
            return -1;
        }

        inputFile.read(reinterpret_cast<char*>(&header), sizeof(header));
        inputFile.read(reinterpret_cast<char*>(&headera), header.subchunk1Size);
        inputFile.read(reinterpret_cast<char*>(&headerb), sizeof(headerb));


        //printf("\ntotalsize : \t%u \n", header.chunkSize + 8);
         printf("chunkId       : ,%c%c%c%c\n", header.chunkId[0], header.chunkId[1], header.chunkId[2], header.chunkId[3]);
        cout << "chunkSize     : ," << header.chunkSize << endl;
         printf("format        : ,%c%c%c%c\n", header.format[0], header.format[1], header.format[2], header.format[3]);
         printf("subchunk1Id   : ,%c%c%c%c\n", header.subchunk1Id[0], header.subchunk1Id[1], header.subchunk1Id[2], header.subchunk1Id[3]);
        cout << "subchunk1Size : ," << header.subchunk1Size << endl;
        cout << "audioFormat   : ," << headera.audioFormat << endl;
        cout << "numChannels   : ," << headera.numChannels << endl;
        cout << "sampleRate    : ," << headera.sampleRate << endl;
        cout << "byteRate      : ," << headera.byteRate << endl;
        cout << "blockAlign    : ," << headera.blockAlign << endl;
        cout << "bitsPerSample : ," << headera.bitsPerSample << endl;


         printf("subchunk2Id   : ,%c%c%c%c\n", headerb.subchunk2Id[0], headerb.subchunk2Id[1], headerb.subchunk2Id[2], headerb.subchunk2Id[3]);
        cout << "subchunk2Size : ," << headerb.subchunk2Size << endl;


        inputFile.close();
        return 0;
    }

    int data_check(const char* filename)
    {
        WavHeader header = {};
        type40_header headera = {};
        data_header headerb = {};

        ifstream inputFile(filename, ios::binary);
        if (!inputFile.is_open()) {
            cerr << "无法打开文件" << endl;
            return -1;
        }

        inputFile.read(reinterpret_cast<char*>(&header), sizeof(header));
        inputFile.read(reinterpret_cast<char*>(&headera), header.subchunk1Size);
        inputFile.read(reinterpret_cast<char*>(&headerb), sizeof(headerb));

        const size_t dataSize = headerb.subchunk2Size;
        vector<char> buffer(dataSize);

        inputFile.read(buffer.data(), dataSize);
        uint16_t perdatasize = headera.bitsPerSample / 8;
        float wavdate;
        int32_t WavDate = 0;
        int16_t WavDate16 = 0;
        printf(",");
        for (int j = 0; j < headera.numChannels; j++) {
            printf("channel[%d] , ,", j + 1);
        }
        printf("\n");
        printf("data,");
        for (int j = 0; j < headera.numChannels; j++) {
            printf("Frequency , Response ,");
        }
        printf("\n");
        for (size_t i = 0; i < dataSize / perdatasize/ headera.numChannels; i++) {
            //for (size_t i = 0; i < 100; i++) {
                printf("data[%8d] : ,",(unsigned int)i);
                for (size_t j = 0; j < headera.numChannels; j++) {

                        if (16 == headera.bitsPerSample)
                        {
                            memcpy(&WavDate16, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);
                            printf(" %10d , %.2f db ,",  WavDate16, 20 * log10f(abs((float)WavDate16) / 32768));
                        }
                        else if (24 == headera.bitsPerSample)
                        {
                            memcpy(&WavDate, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);
                            printf(" %10d , %.2f db ,", (WavDate << 8) / 256, 20 * log10f(abs((float)(WavDate << 8)) / 256 / 8388608));
                        }
                        else if (32 == headera.bitsPerSample)
                        {
                            if (1 != headera.audioFormat) {
                                memcpy(&wavdate, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);
                                printf(" %.6f , %.2f db ,", wavdate, 20 * log10f(abs(wavdate)));
                            }
                            else {
                                memcpy(&WavDate, buffer.data() + i * headera.numChannels * perdatasize + j * perdatasize, perdatasize);
                                printf(" %16d , %.2f db ,", WavDate, 20 * log10f(abs((float)WavDate) / 2147483648));
                            }

                        }
                    
                }
                cout << endl;
            }
        buffer.clear();

        inputFile.close();
        return 0;
    }



    int main(int argc, const char* argv[]) {

        int wavnum = argc - 1;

        if (1 == wavnum) {

            header_check(argv[1]);
            printf("\n");
            data_check(argv[1]);
        }

        return 0;
    }

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1975359.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！