AAC ADTS格式分析与提取aac音频文件实战

1.AAC⾳频格式简介

AAC⾳频格式：Advanced Audio Coding(⾼级⾳频解码)，是⼀种由MPEG-4 标准定义的有损⾳频压缩格式，由Fraunhofer发展，Dolby, Sony和AT&T是主要的贡献者。

AAC 包含两种格式：ADIF和ADTS

2.ADIF和ADTS简介

ADIF：Audio Data Interchange Format ⾳频数据交换格式。这种格式的特征是可以确定的找到这个⾳频数据的开始，不需进⾏在⾳频数据流中间开始的解码，即它的解码必须在明确定义的开始处进⾏。故这种格式常⽤在磁盘⽂件中。
ADTS的全称是Audio Data Transport Stream。是AAC⾳频的传输流格式。AAC⾳频格式在MPEG-2（ISO-13318-7 2003）中有定义。AAC后来⼜被采⽤到MPEG-4标准中。这种格式的特征是它是⼀个有同步字的⽐特流，解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。

简单说，ADTS可以在任意帧解码，也就是说它每⼀帧都有头信息。ADIF只有⼀个统⼀的头，所以必须得到所有的数据后解码。

且这两种的header的格式也是不同的，⽬前⼀般编码后的和抽取出的都是 ADTS格式的⾳频流。

AAC的ADIF格式：

在这里插入图片描述

AAC的ADTS的⼀般格式（空⽩处表示前后帧）：
在这里插入图片描述

有的时候当你编码AAC裸流的时候，会遇到写出来的AAC⽂件并不能在PC和⼿机上播放，很⼤的可能就是AAC⽂件的每⼀帧⾥缺少了ADTS头信息⽂件的包装拼接。

只需要加⼊头⽂件ADTS即可，⼀个AAC原始数据块⻓度是可变的，对原始帧加上ADTS头进⾏ADTS的封装，就形成了ADTS帧。

3.ADTS解析

AAC⾳频⽂件的每⼀帧由ADTS Header和AAC Audio Data组成，结构体如下：

在这里插入图片描述

注意：ADTS Header的长度可能为7个字节或者9个字节，protection_absent=0时，9个字节，protection_absent=1,7个字节。

每⼀帧的ADTS的头⽂件都包含了⾳频的采样率，声道，帧⻓度等信息，这样解码器才能解析读取，⼀般情况下ADTS的头信息都是7个字节，分为2部分：

adts_fixed_header
adts_variable_header

其⼀为固定头信息，紧接着是可变头信息。固定头信息中的数据每⼀帧都相同，⽽可变头信息则在帧与帧之间可变。

	/* adts_fixed_header */
    put_bits(&pb, 12, 0xfff);   /* syncword */
    put_bits(&pb, 1, 0);        /* ID */
    put_bits(&pb, 2, 0);        /* layer */
    put_bits(&pb, 1, 1);        /* protection_absent */
    put_bits(&pb, 2, ctx->objecttype); /* profile_objecttype */
    put_bits(&pb, 4, ctx->sample_rate_index);
    put_bits(&pb, 1, 0);        /* private_bit */
    put_bits(&pb, 3, ctx->channel_conf); /* channel_configuration */
    put_bits(&pb, 1, 0);        /* original_copy */
    put_bits(&pb, 1, 0);        /* home */

syncword ：同步头总是0xFFF, all bits must be 1，代表着⼀个ADTS帧的开始

ID：MPEG标识符，0标识MPEG-4，1标识MPEG-2

Layer：always: ‘00’

protection_absent：表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC

profile：表示使⽤哪个级别的AAC，如01 Low Complexity(LC)— AAC

LC。有些芯⽚只⽀持AAC LC 。

   /* adts_variable_header */
    put_bits(&pb, 1, 0);        /* copyright_identification_bit */
    put_bits(&pb, 1, 0);        /* copyright_identification_start */
    put_bits(&pb, 13, full_frame_size); /* aac_frame_length */
    put_bits(&pb, 11, 0x7ff);   /* adts_buffer_fullness */
    put_bits(&pb, 2, 0);        /* number_of_raw_data_blocks_in_frame */

frame_length : ⼀个ADTS帧的⻓度包括ADTS头和AAC原始流. frame length, this value must include 7 or 9 bytes of header length:

aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)

protection_absent=0时, header length=9bytes

protection_absent=1时, header length=7bytes

adts_buffer_fullness：0x7FF 说明是码率可变的码流。

number_of_raw_data_blocks_in_frame：表示ADTS帧中有

number_of_raw_data_blocks_in_frame + 1个AAC原始帧。

所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有⼀个 AAC数据块。

ADTS MediaInfo解析：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Hm3G5qY2-1672847932496)(C:\Users\56930\Pictures\ADTS.png)]

二进制文件：

在这里插入图片描述

ADTS头7个字节：0xFF、0xF1、0x4C、0x80、0x2B、0x9F、0xFC

0xFF---->11111111

0xF1------>11110001

0x4C------>1001100

0x80-------->10000000

0x2B------->101011

0x9F--------->10011111

0xFC--------> 11111100

4.从视频文件中提取aac音频文件实战

4.1定义采样率数组

const int sampling_frequencies[]={
    96000,  // 0x0
    88200,  // 0x1
    64000,  // 0x2
    48000,  // 0x3
    44100,  // 0x4
    32000,  // 0x5
    24000,  // 0x6
    22050,  // 0x7
    16000,  // 0x8
    12000,  // 0x9
    11025,  // 0xa
    8000   // 0xb
    // 0xc d e f是保留的
};

4.2添加ADTS文件头信息

int adts_header(char* const p_adts_header,const int data_length,const int profile,
                const int samplerate,const int channels){
    int sampling_frequency_index=3; //默认使用48000采样率
    int adtsLen=data_length+7;
    int frequencies_size=sizeof (sampling_frequencies)/sizeof (sampling_frequencies[0]);
    int i=0;
    for(i=0;i<frequencies_size;i++){
        if(sampling_frequencies[i]==samplerate){
            sampling_frequency_index=i;
            break;
        }
    }

    //采样率不支持
    if(i>=frequencies_size){
        printf("unsupport samplerate:%d\n", samplerate);
        return -1;
    }


    p_adts_header[0] = 0xff;         //syncword:0xfff                          高8bits
    p_adts_header[1] = 0xf0;         //syncword:0xfff                          低4bits
    p_adts_header[1] |= (0 << 3);    //MPEG Version:0 for MPEG-4,1 for MPEG-2  1bit
    p_adts_header[1] |= (0 << 1);    //Layer:0                                 2bits
    p_adts_header[1] |= 1;           //protection absent:1                     1bit

    p_adts_header[2] = (profile)<<6;            //profile:profile               2bits
    p_adts_header[2] |= (sampling_frequency_index & 0x0f)<<2; //sampling frequency index:sampling_frequency_index  4bits
    p_adts_header[2] |= (0 << 1);             //private bit:0                   1bit
    p_adts_header[2] |= (channels & 0x04)>>2; //channel configuration:channels  高1bit

    p_adts_header[3] = (channels & 0x03)<<6; //channel configuration:channels 低2bits
    p_adts_header[3] |= (0 << 5);               //original：0                1bit
    p_adts_header[3] |= (0 << 4);               //home：0                    1bit
    p_adts_header[3] |= (0 << 3);               //copyright id bit：0        1bit
    p_adts_header[3] |= (0 << 2);               //copyright id start：0      1bit
    p_adts_header[3] |= ((adtsLen & 0x1800) >> 11);           //frame length：value   高2bits

    p_adts_header[4] = (uint8_t)((adtsLen & 0x7f8) >> 3);     //frame length:value    中间8bits
    p_adts_header[5] = (uint8_t)((adtsLen & 0x7) << 5);       //frame length:value    低3bits
    p_adts_header[5] |= 0x1f;                                 //buffer fullness:0x7ff 高5bits
    p_adts_header[6] = 0xfc;      //‭11111100‬       //buffer fullness:0x7ff 低6bits
    // number_of_raw_data_blocks_in_frame：
    //    表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。

    return 0;
}

4.3提取aac音频文件

 int ret=-1;
    char errors[1024];

    char* filename=NULL;
    char* aac_filename=NULL;

    int audio_index=-1;
    int len=0;

    FILE *aac_fd=NULL;

    AVFormatContext* av_format_context=NULL;
    AVPacket pkt;

    av_log_set_level(AV_LOG_DEBUG);

    if(argc<3){
        av_log(NULL, LOG_LEVEL, "the count of parameters should be more than three!\n");
        return -1;
    }

    filename=argv[1];  //输入文件名称
    aac_filename=argv[2]; //输出aac文件名

    if(filename == NULL||aac_filename==NULL){
        av_log(NULL,LOG_LEVEL,"输入文件或者输出文件名为null，请检查");
        return -1;
    }

    aac_fd=fopen(aac_filename,"wb");
    if(!aac_fd){
        av_log(NULL,LOG_LEVEL,"aac_file open fieled");
        return -1;
    }

    if(ret = avformat_open_input(&av_format_context,filename,NULL,NULL)<0){
        av_strerror(ret,errors,1024);
        av_log(NULL,LOG_LEVEL,"avformat_open_input failed :%s,%d(%s)\n",
               filename,
               ret,
               errors);
    }
    // 获取解码器信息
    if(ret=avformat_find_stream_info(av_format_context,NULL)<0){
        av_strerror(ret,errors,1024);
        av_log(NULL,LOG_LEVEL,"avformat_find_stream_info failed :%s,%d(%s)\n",
               filename,
               ret,
               errors);
    }

    av_dump_format(av_format_context,0,filename,0);

    av_init_packet(&pkt);

    audio_index= av_find_best_stream(av_format_context,AVMEDIA_TYPE_AUDIO,-1,-1,NULL,0);
    if(audio_index<0){
        av_log(NULL,LOG_LEVEL,"没找到%s 流信息 从%s视频文件中\n",
               av_get_media_type_string(AVMEDIA_TYPE_AUDIO),
               filename);
        return AVERROR(EINVAL);
    }

    //打印aac的级别
    printf("audio profile :%d , FF_PROFILE_AAC_LOW:%d\n",
           av_format_context->streams[audio_index]->codecpar->level,
           FF_PROFILE_AAC_LOW);

    if(av_format_context->streams[audio_index]->codecpar->codec_id != AV_CODEC_ID_AAC)
    {
        printf("the media file no contain AAC stream, it's codec_id is %d\n",
               av_format_context->streams[audio_index]->codecpar->codec_id);
        goto failed;
    }

    //读取媒体文件并把aac数据贞写法如到本地文件
    while(av_read_frame(av_format_context,&pkt)>=0){
        if(pkt.stream_index==audio_index){
            char adts_header_buf[7]={0};
            adts_header(adts_header_buf,pkt.size,
                        av_format_context->streams[audio_index]->codecpar->profile,
                        av_format_context->streams[audio_index]->codecpar->sample_rate,
                        av_format_context->streams[audio_index]->codecpar->channels);
            // 写adts header , ts流不适用，ts流分离出来的packet带了adts header
            //第二个参数：这是要被写入的每个元素的大小，以字节为单位  char 占一个字节所以写1
            fwrite(adts_header_buf,1,7,aac_fd);
            len=fwrite(pkt.data,1,pkt.size,aac_fd); //写adts data
            if(len!=pkt.size){
                av_log(NULL, AV_LOG_DEBUG, "warning, length of writed data isn't equal pkt.size(%d, %d)\n",
                       len,
                       pkt.size);
            }
        }
        av_packet_unref(&pkt);
    }

 failed:
     if(av_format_context){
         avformat_close_input(&av_format_context);
     }

     if(aac_fd){
         fclose(aac_fd);
     }