1.AAC⾳频格式简介
AAC⾳频格式:Advanced Audio Coding(⾼级⾳频解码),是⼀种由MPEG-4 标准定义的有损⾳频压缩格式,由Fraunhofer发展,Dolby, Sony和AT&T是主 要的贡献者。
AAC 包含两种格式:ADIF和ADTS
2.ADIF和ADTS简介
- ADIF:Audio Data Interchange Format ⾳频数据交换格式。这种格式的特 征是可以确定的找到这个⾳频数据的开始,不需进⾏在⾳频数据流中间开始 的解码,即它的解码必须在明确定义的开始处进⾏。故这种格式常⽤在磁盘 ⽂件中。
- ADTS的全称是Audio Data Transport Stream。是AAC⾳频的传输流格 式。AAC⾳频格式在MPEG-2(ISO-13318-7 2003)中有定义。AAC后来 ⼜被采⽤到MPEG-4标准中。这种格式的特征是它是⼀个有同步字的⽐特 流,解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。
简单说,ADTS可以在任意帧解码,也就是说它每⼀帧都有头信息。ADIF只有⼀ 个统⼀的头,所以必须得到所有的数据后解码。
且这两种的header的格式也是不同的,⽬前⼀般编码后的和抽取出的都是 ADTS格式的⾳频流。
AAC的ADIF格式:
AAC的ADTS的⼀般格式(空⽩处表示前后帧):
有的时候当你编码AAC裸流的时候,会遇到写出来的AAC⽂件并不能在PC和⼿ 机上播放,很⼤的可能就是AAC⽂件的每⼀帧⾥缺少了ADTS头信息⽂件的包装拼接。
只需要加⼊头⽂件ADTS即可,⼀个AAC原始数据块⻓度是可变的,对原始帧加 上ADTS头进⾏ADTS的封装,就形成了ADTS帧。
3.ADTS解析
AAC⾳频⽂件的每⼀帧由ADTS Header和AAC Audio Data组成,结构体如下:
注意:ADTS Header的长度可能为7个字节或者9个字节,protection_absent=0时,9个字节,protection_absent=1,7个字节。
每⼀帧的ADTS的头⽂件都包含了⾳频的采样率,声道,帧⻓度等信息,这样解码器才能解析读取,⼀般情况下ADTS的头信息都是7个字节,分为2部分:
-
adts_fixed_header
-
adts_variable_header
其⼀为固定头信息,紧接着是可变头信息。固定头信息中的数据每⼀帧都相 同,⽽可变头信息则在帧与帧之间可变。
/* adts_fixed_header */
put_bits(&pb, 12, 0xfff); /* syncword */
put_bits(&pb, 1, 0); /* ID */
put_bits(&pb, 2, 0); /* layer */
put_bits(&pb, 1, 1); /* protection_absent */
put_bits(&pb, 2, ctx->objecttype); /* profile_objecttype */
put_bits(&pb, 4, ctx->sample_rate_index);
put_bits(&pb, 1, 0); /* private_bit */
put_bits(&pb, 3, ctx->channel_conf); /* channel_configuration */
put_bits(&pb, 1, 0); /* original_copy */
put_bits(&pb, 1, 0); /* home */
syncword :同步头 总是0xFFF, all bits must be 1,代表着⼀个ADTS帧的开 始
ID:MPEG标识符,0标识MPEG-4,1标识MPEG-2
Layer:always: ‘00’
protection_absent:表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC
profile:表示使⽤哪个级别的AAC,如01 Low Complexity(LC)— AAC
LC。有些芯⽚只⽀持AAC LC 。
/* adts_variable_header */
put_bits(&pb, 1, 0); /* copyright_identification_bit */
put_bits(&pb, 1, 0); /* copyright_identification_start */
put_bits(&pb, 13, full_frame_size); /* aac_frame_length */
put_bits(&pb, 11, 0x7ff); /* adts_buffer_fullness */
put_bits(&pb, 2, 0); /* number_of_raw_data_blocks_in_frame */
frame_length : ⼀个ADTS帧的⻓度包括ADTS头和AAC原始流. frame length, this value must include 7 or 9 bytes of header length:
aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)
protection_absent=0时, header length=9bytes
protection_absent=1时, header length=7bytes
adts_buffer_fullness:0x7FF 说明是码率可变的码流。
number_of_raw_data_blocks_in_frame:表示ADTS帧中有
number_of_raw_data_blocks_in_frame + 1个AAC原始帧。
所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有⼀个 AAC数据块。
ADTS MediaInfo解析:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Hm3G5qY2-1672847932496)(C:\Users\56930\Pictures\ADTS.png)]
二进制文件:
ADTS头7个字节:0xFF、0xF1、0x4C、0x80、0x2B、0x9F、0xFC
0xFF---->11111111
0xF1------>11110001
0x4C------>1001100
0x80-------->10000000
0x2B------->101011
0x9F--------->10011111
0xFC--------> 11111100
4.从视频文件中提取aac音频文件实战
4.1定义采样率数组
const int sampling_frequencies[]={
96000, // 0x0
88200, // 0x1
64000, // 0x2
48000, // 0x3
44100, // 0x4
32000, // 0x5
24000, // 0x6
22050, // 0x7
16000, // 0x8
12000, // 0x9
11025, // 0xa
8000 // 0xb
// 0xc d e f是保留的
};
4.2添加ADTS文件头信息
int adts_header(char* const p_adts_header,const int data_length,const int profile,
const int samplerate,const int channels){
int sampling_frequency_index=3; //默认使用48000采样率
int adtsLen=data_length+7;
int frequencies_size=sizeof (sampling_frequencies)/sizeof (sampling_frequencies[0]);
int i=0;
for(i=0;i<frequencies_size;i++){
if(sampling_frequencies[i]==samplerate){
sampling_frequency_index=i;
break;
}
}
//采样率不支持
if(i>=frequencies_size){
printf("unsupport samplerate:%d\n", samplerate);
return -1;
}
p_adts_header[0] = 0xff; //syncword:0xfff 高8bits
p_adts_header[1] = 0xf0; //syncword:0xfff 低4bits
p_adts_header[1] |= (0 << 3); //MPEG Version:0 for MPEG-4,1 for MPEG-2 1bit
p_adts_header[1] |= (0 << 1); //Layer:0 2bits
p_adts_header[1] |= 1; //protection absent:1 1bit
p_adts_header[2] = (profile)<<6; //profile:profile 2bits
p_adts_header[2] |= (sampling_frequency_index & 0x0f)<<2; //sampling frequency index:sampling_frequency_index 4bits
p_adts_header[2] |= (0 << 1); //private bit:0 1bit
p_adts_header[2] |= (channels & 0x04)>>2; //channel configuration:channels 高1bit
p_adts_header[3] = (channels & 0x03)<<6; //channel configuration:channels 低2bits
p_adts_header[3] |= (0 << 5); //original:0 1bit
p_adts_header[3] |= (0 << 4); //home:0 1bit
p_adts_header[3] |= (0 << 3); //copyright id bit:0 1bit
p_adts_header[3] |= (0 << 2); //copyright id start:0 1bit
p_adts_header[3] |= ((adtsLen & 0x1800) >> 11); //frame length:value 高2bits
p_adts_header[4] = (uint8_t)((adtsLen & 0x7f8) >> 3); //frame length:value 中间8bits
p_adts_header[5] = (uint8_t)((adtsLen & 0x7) << 5); //frame length:value 低3bits
p_adts_header[5] |= 0x1f; //buffer fullness:0x7ff 高5bits
p_adts_header[6] = 0xfc; //11111100 //buffer fullness:0x7ff 低6bits
// number_of_raw_data_blocks_in_frame:
// 表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。
return 0;
}
4.3提取aac音频文件
int ret=-1;
char errors[1024];
char* filename=NULL;
char* aac_filename=NULL;
int audio_index=-1;
int len=0;
FILE *aac_fd=NULL;
AVFormatContext* av_format_context=NULL;
AVPacket pkt;
av_log_set_level(AV_LOG_DEBUG);
if(argc<3){
av_log(NULL, LOG_LEVEL, "the count of parameters should be more than three!\n");
return -1;
}
filename=argv[1]; //输入文件名称
aac_filename=argv[2]; //输出aac文件名
if(filename == NULL||aac_filename==NULL){
av_log(NULL,LOG_LEVEL,"输入文件或者输出文件名为null,请检查");
return -1;
}
aac_fd=fopen(aac_filename,"wb");
if(!aac_fd){
av_log(NULL,LOG_LEVEL,"aac_file open fieled");
return -1;
}
if(ret = avformat_open_input(&av_format_context,filename,NULL,NULL)<0){
av_strerror(ret,errors,1024);
av_log(NULL,LOG_LEVEL,"avformat_open_input failed :%s,%d(%s)\n",
filename,
ret,
errors);
}
// 获取解码器信息
if(ret=avformat_find_stream_info(av_format_context,NULL)<0){
av_strerror(ret,errors,1024);
av_log(NULL,LOG_LEVEL,"avformat_find_stream_info failed :%s,%d(%s)\n",
filename,
ret,
errors);
}
av_dump_format(av_format_context,0,filename,0);
av_init_packet(&pkt);
audio_index= av_find_best_stream(av_format_context,AVMEDIA_TYPE_AUDIO,-1,-1,NULL,0);
if(audio_index<0){
av_log(NULL,LOG_LEVEL,"没找到%s 流信息 从%s视频文件中\n",
av_get_media_type_string(AVMEDIA_TYPE_AUDIO),
filename);
return AVERROR(EINVAL);
}
//打印aac的级别
printf("audio profile :%d , FF_PROFILE_AAC_LOW:%d\n",
av_format_context->streams[audio_index]->codecpar->level,
FF_PROFILE_AAC_LOW);
if(av_format_context->streams[audio_index]->codecpar->codec_id != AV_CODEC_ID_AAC)
{
printf("the media file no contain AAC stream, it's codec_id is %d\n",
av_format_context->streams[audio_index]->codecpar->codec_id);
goto failed;
}
//读取媒体文件并把aac数据贞写法如到本地文件
while(av_read_frame(av_format_context,&pkt)>=0){
if(pkt.stream_index==audio_index){
char adts_header_buf[7]={0};
adts_header(adts_header_buf,pkt.size,
av_format_context->streams[audio_index]->codecpar->profile,
av_format_context->streams[audio_index]->codecpar->sample_rate,
av_format_context->streams[audio_index]->codecpar->channels);
// 写adts header , ts流不适用,ts流分离出来的packet带了adts header
//第二个参数:这是要被写入的每个元素的大小,以字节为单位 char 占一个字节所以写1
fwrite(adts_header_buf,1,7,aac_fd);
len=fwrite(pkt.data,1,pkt.size,aac_fd); //写adts data
if(len!=pkt.size){
av_log(NULL, AV_LOG_DEBUG, "warning, length of writed data isn't equal pkt.size(%d, %d)\n",
len,
pkt.size);
}
}
av_packet_unref(&pkt);
}
failed:
if(av_format_context){
avformat_close_input(&av_format_context);
}
if(aac_fd){
fclose(aac_fd);
}