使用FFMPEG库将PCM编码为AAC

news2024/9/20 5:30:50

准备

ffmpeg 版本4.4

准备一段48000Hz 2 channel f32le 格式的PCM原始数据

这里我们直接使用ffmpeg命令行提取

ffmpeg -i beautlWorld.mp4 -ar 48000 -ac 2 -f f32le 48000_2_f32le.pcm

-ac 采样率

-ac 音频通道

-f f32le 音频样本数据存储格式(f32 ---- float  32位   le ----小端)

使用下面命令进行播放:

ffplay -ar 48000 -ac 2 -f f32le 48000_2_f32le.pcm

编码流程

基本上面的流程已经很清晰了,按照步骤编写代码即可,下面贴出源码

#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>

extern "C" {
    #include <libavcodec/avcodec.h>

    #include <libavutil/channel_layout.h>
    #include <libavutil/common.h>
    #include <libavutil/frame.h>
    #include <libavutil/samplefmt.h>
    #include <libavutil/opt.h>
}

/* 检测该编码器是否支持该采样格式 */
static int check_sample_fmt(const AVCodec* codec, enum AVSampleFormat sample_fmt)
{
    const enum  AVSampleFormat* p = codec->sample_fmts;

    while (*p != AV_SAMPLE_FMT_NONE) { // 通过AV_SAMPLE_FMT_NONE作为结束符

        if (*p == sample_fmt)
            return 1;
        p++;
    }
    return 0;
}

/* 检测该编码器是否支持该采样率 */
static int check_sample_rate(const AVCodec* codec, const int sample_rate)
{
    const int* p = codec->supported_samplerates;
    while (*p != 0) {// 0作为退出条件,比如libfdk-aacenc.c的aac_sample_rates
        printf("%s support %dhz\n", codec->name, *p);
        if (*p == sample_rate)
            return 1;
        p++;
    }
    return 0;
}

/* 检测该编码器是否支持该采样率, 该函数只是作参考 */
static int check_channel_layout(const AVCodec* codec, const uint64_t channel_layout)
{
    // 不是每个codec都给出支持的channel_layout
    const uint64_t* p = codec->channel_layouts;
    if (!p) {
        printf("the codec %s no set channel_layouts\n", codec->name);
        return 1;
    }
    while (*p != 0) { // 0作为退出条件,比如libfdk-aacenc.c的aac_channel_layout
        printf("%s support channel_layout %d\n", codec->name, *p);
        if (*p == channel_layout)
            return 1;
        p++;
    }
    return 0;
}

static int check_codec(AVCodec* codec, AVCodecContext* codec_ctx)
{

    if (!check_sample_fmt(codec, codec_ctx->sample_fmt)) {
        fprintf(stderr, "Encoder does not support sample format %s",
            av_get_sample_fmt_name(codec_ctx->sample_fmt));
        return 0;
    }
    if (!check_sample_rate(codec, codec_ctx->sample_rate)) {
        fprintf(stderr, "Encoder does not support sample rate %d", codec_ctx->sample_rate);
        return 0;
    }
    if (!check_channel_layout(codec, codec_ctx->channel_layout)) {
        fprintf(stderr, "Encoder does not support channel layout %lu", codec_ctx->channel_layout);
        return 0;
    }

    printf("\n\nAudio encode config\n");
    printf("bit_rate:%ldkbps\n", codec_ctx->bit_rate / 1024);
    printf("sample_rate:%d\n", codec_ctx->sample_rate);
    printf("sample_fmt:%s\n", av_get_sample_fmt_name(codec_ctx->sample_fmt));
    printf("channels:%d\n", codec_ctx->channels);
    // frame_size是在avcodec_open2后进行关联
    printf("1 frame_size:%d\n", codec_ctx->frame_size);

    return 1;
}

//写入ADTS头
static void get_adts_header(AVCodecContext* ctx, uint8_t* adts_header, int aac_length)
{
    uint8_t freq_idx = 0;    //0: 96000 Hz  3: 48000 Hz 4: 44100 Hz
    switch (ctx->sample_rate) {
    case 96000: freq_idx = 0; break;
    case 88200: freq_idx = 1; break;
    case 64000: freq_idx = 2; break;
    case 48000: freq_idx = 3; break;
    case 44100: freq_idx = 4; break;
    case 32000: freq_idx = 5; break;
    case 24000: freq_idx = 6; break;
    case 22050: freq_idx = 7; break;
    case 16000: freq_idx = 8; break;
    case 12000: freq_idx = 9; break;
    case 11025: freq_idx = 10; break;
    case 8000: freq_idx = 11; break;
    case 7350: freq_idx = 12; break;
    default: freq_idx = 4; break;
    }
    uint8_t chanCfg = ctx->channels;
    uint32_t frame_length = aac_length + 7;
    adts_header[0] = 0xFF;
    adts_header[1] = 0xF1;
    adts_header[2] = ((ctx->profile) << 6) + (freq_idx << 2) + (chanCfg >> 2);
    adts_header[3] = (((chanCfg & 3) << 6) + (frame_length >> 11));
    adts_header[4] = ((frame_length & 0x7FF) >> 3);
    adts_header[5] = (((frame_length & 7) << 5) + 0x1F);
    adts_header[6] = 0xFC;
}


//编码
static int encode(AVCodecContext* ctx, AVFrame* frame, AVPacket* pkt, FILE* output)
{
    int ret;

    /* send the frame for encoding */
    ret = avcodec_send_frame(ctx, frame);
    if (ret < 0) {
        fprintf(stderr, "Error sending the frame to the encoder\n");
        return -1;
    }

    /* read all the available output packets (in general there may be any number of them */
    // 编码和解码都是一样的,都是send 1次,然后receive多次, 直到AVERROR(EAGAIN)或者AVERROR_EOF
    while (ret >= 0) {
        ret = avcodec_receive_packet(ctx, pkt);
        if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF) {
            return 0;
        }
        else if (ret < 0) {
            fprintf(stderr, "Error encoding audio frame\n");
            return -1;
        }
        uint8_t aac_header[7];
        get_adts_header(ctx, aac_header, pkt->size);

        size_t len = 0;
        len = fwrite(aac_header, 1, 7, output);
        if (len != 7) {
            fprintf(stderr, "fwrite aac_header failed\n");
            return -1;
        }
        len = fwrite(pkt->data, 1, pkt->size, output);
        if (len != pkt->size) {
            fprintf(stderr, "fwrite aac data failed\n");
            return -1;
        }
        
        av_packet_unref(pkt);
    }
    return -1;
}

/*
 * 这里只支持2通道的转换
*/
void f32le_convert_to_fltp(float* f32le, float* fltp, int nb_samples) {
    float* fltp_l = fltp;   // 左通道
    float* fltp_r = fltp + nb_samples;   // 右通道
    for (int i = 0; i < nb_samples; i++) {
        fltp_l[i] = f32le[i * 2];     // 0 1   - 2 3
        fltp_r[i] = f32le[i * 2 + 1];   // 可以尝试注释左声道或者右声道听听声音
    }
}


int main(int argc, char** argv)
{
    const char* in_pcm_file = "D:/测试工程/sound/48000_2_f32le.pcm";      // 输入PCM文件
    const char* out_aac_file = "D:/测试工程/sound/8k_32kbps_decode_2channel.aac";     // 输出的AAC文件
    AVCodecID codec_id = AV_CODEC_ID_AAC;
    // 1.查找编码器
    AVCodec* codec = (AVCodec *)avcodec_find_encoder(codec_id); // 按ID查找则缺省的aac encode为aacenc.c
    if (!codec) {
        fprintf(stderr, "Codec not found\n");
        exit(1);
    }

    // 2.分配内存
    AVCodecContext* codec_ctx = avcodec_alloc_context3(codec);
    if (!codec_ctx) {
        fprintf(stderr, "Could not allocate audio codec context\n");
        exit(1);
    }
    codec_ctx->codec_id = codec_id;
    codec_ctx->codec_type = AVMEDIA_TYPE_AUDIO;
    codec_ctx->bit_rate = 32 * 1024;
    codec_ctx->channel_layout = AV_CH_LAYOUT_STEREO;
    codec_ctx->sample_rate = 48000;
    codec_ctx->channels = av_get_channel_layout_nb_channels(codec_ctx->channel_layout);
    codec_ctx->profile = FF_PROFILE_AAC_LOW;    //
    codec_ctx->sample_fmt = AV_SAMPLE_FMT_FLTP;
    


    // 3.检测支持采样格式支持情况
    if (!check_codec(codec, codec_ctx)) {
        exit(1);
    }

    // 4.将编码器上下文和编码器进行关联
    if (avcodec_open2(codec_ctx, codec, NULL) < 0) {
        fprintf(stderr, "Could not open codec\n");
        exit(1);
    }
    printf("2 frame_size:%d\n\n", codec_ctx->frame_size); // 决定每次到底送多少个采样点

    // 5.打开输入和输出文件
    FILE* infile = fopen(in_pcm_file, "rb");
    if (!infile) {
        fprintf(stderr, "Could not open %s\n", in_pcm_file);
        exit(1);
    }
    FILE* outfile = fopen(out_aac_file, "wb");
    if (!outfile) {
        fprintf(stderr, "Could not open %s\n", out_aac_file);
        exit(1);
    }

    // 6.分配packet
    AVPacket* pkt = av_packet_alloc();
    if (!pkt) {
        fprintf(stderr, "could not allocate the packet\n");
        exit(1);
    }

    // 7.分配frame
    AVFrame* frame = av_frame_alloc();
    if (!frame) {
        fprintf(stderr, "Could not allocate audio frame\n");
        exit(1);
    }
    /* 每次送多少数据给编码器由:
     *  (1)frame_size(每帧单个通道的采样点数);
     *  (2)sample_fmt(采样点格式);
     *  (3)channel_layout(通道布局情况);
     * 3要素决定
     */
    frame->nb_samples = codec_ctx->frame_size;
    frame->format = codec_ctx->sample_fmt;
    frame->channel_layout = codec_ctx->channel_layout;
    frame->channels = av_get_channel_layout_nb_channels(frame->channel_layout);
    printf("frame nb_samples:%d\n", frame->nb_samples);
    printf("frame sample_fmt:%d\n", frame->format);
    printf("frame channel_layout:%lu\n", frame->channel_layout);
    printf("frame channels_num:%lu\n\n", frame->channels);
    // 8.为frame分配buffer
    int ret = av_frame_get_buffer(frame, 0);
    if (ret < 0) {
        fprintf(stderr, "Could not allocate audio data buffers\n");
        exit(1);
    }

    // 9.循环读取数据
    // 计算出每一帧的数据 单个采样点的字节 * 通道数目 * 每帧采样点数量
    int frame_bytes = av_get_bytes_per_sample((AVSampleFormat)frame->format) \
        * frame->channels \
        * frame->nb_samples;
    //int frame_bytes = 1 * frame->channels * frame->nb_samples;

    printf("frame_bytes %d\n", frame_bytes);

    uint8_t* pcm_buf = (uint8_t*)malloc(frame_bytes);
    if (!pcm_buf) {
        printf("pcm_buf malloc failed\n");
        return 1;
    }
    uint8_t* pcm_temp_buf = (uint8_t*)malloc(frame_bytes);
    if (!pcm_temp_buf) {
        printf("pcm_temp_buf malloc failed\n");
        return 1;
    }

    //每个通道占的字节数
    int data_size = av_get_bytes_per_sample((AVSampleFormat)frame->format);

    int64_t pts = 0;
    printf("start enode\n");
    while (!feof(infile))
     {

        // 10.确保该frame可写, 如果编码器内部保持了内存参考计数,则需要重新拷贝一个备份 目的是新写入的数据和编码器保存的数据不能产生冲突
        ret = av_frame_make_writable(frame);
        if (ret != 0)
            printf("av_frame_make_writable failed, ret = %d\n", ret);

        //读取packed模式数据用planar模式存储 aac只支持fltp模式
        for (int i = 0; i < frame->nb_samples; i++)
            for (int j = 0; j < frame->channels; j++)
            {
                fread(frame->data[j] + data_size * i, 1, data_size, infile);
                
            }


        //声道控制
        //memset(frame->data[1], 0, frame->nb_samples * data_size);
        

        pts += frame->nb_samples;
        frame->pts = pts;       // 使用采样率作为pts的单位,具体换算成秒 pts*1/采样率
        ret = encode(codec_ctx, frame, pkt, outfile);
        if (ret < 0) {
            printf("encode failed\n");
            break;
        }
    }

    // 13.冲刷编码器
    encode(codec_ctx, NULL, pkt, outfile);

    // 14.关闭文件
    fclose(infile);
    fclose(outfile);

    // 15.释放内存
    if (pcm_buf) {
        free(pcm_buf);
    }
    if (pcm_temp_buf) {
        free(pcm_temp_buf);
    }
    av_frame_free(&frame);
    av_packet_free(&pkt);
    avcodec_free_context(&codec_ctx);
    printf("main finish, please enter Enter and exit\n");
    getchar();
    return 0;
}

 小记

在编码测试过程中,有几点心得记录下:

1.关于采样率,采样率的大小表示的PCM原始数据格式每秒传递给播放器的样本数,比如48000Hz,那么播放器1s就会收到48000 * 2个样本数据(双通道)。如果采样率设置为原来的两倍,则播放速度也就是原来的两倍,相应播放时间也会减半,同时在比特率不变的情况下,文件大小也会缩小一半左右。

2.关于比特率,比特率影响的是播放时编码后的数据每秒传递给解码器的数据量,比如比特率128kb/s,那么每秒就会给解码器发送128000 / 8 = 1600个字节的数据,注意这1600个数据是压缩数据,分为很多个未解码的包(avpacket), 那么这1600个数据最终会被解码成48000 * 2个字节的数据(双通道)。那么比特率的设置有什么用呢?经过测试,可以知道设置比特率会再次影响压缩率,按照我的理解,比特率的设置就是告诉编码器要丢弃多少数据。

我们可以设置几个很大的比特率,进行编码,结果生成的文件大小一样。同时我们播放时发现,过大的比特率编码器并未采用,说明当比特率大于某一个值时,编码器不会丢弃数据,此时将压缩后的数据直接生成文件,而后比特率值有编码器计算后设置。

 3. PCM 文件大小计算

采样率(Hz) x 通道数 x 样本字节数(Bit) x 时间(s)  / 1024 = pcm文件大小(KB)

我们以48000HZ 2 channel  float 32位深度(一个样本4字节)为例进行计算

48000 x 2 x 4 x 59.46 = 22,832,640 

 可以看下面的图PCM文件的大小为22835656个字节,与我们计算的相差无几!其实这个误差是由于时间精确度导致的。

4.acc文件的大小计算

比特率(kb / s)  x 时长(s)  / 8  / 1024 = aac文件大小(KB)

比特率以实际播放的为主

 

参考:FFmpeg简单使用:音频编码 ---- pcm转aac - Vzf - 博客园 (cnblogs.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/441309.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【OJ比赛日历】快周末了,不来一场比赛吗? #04.22-04.28 #11场

CompHub 实时聚合多平台的数据类(Kaggle、天池…)和OJ类(Leetcode、牛客…&#xff09;比赛。本账号同时会推送最新的比赛消息&#xff0c;欢迎关注&#xff01; 更多比赛信息见 CompHub主页 或 点击文末阅读原文 以下信息仅供参考&#xff0c;以比赛官网为准 目录 2023-04-22&…

程序员最新赚钱指南!

程序员们的主要收入来源 1️⃣首先&#xff0c;我们要明白程序员无论编程开发多么努力&#xff0c;随着时间推移&#xff0c;受年龄、生活、健康等因素&#xff0c;程序员们都会面临职业天花板&#xff0c;这是大多数人不可规避的一个事实。 2️⃣其次&#xff0c;这几年因为…

【Python】【进阶篇】二十三、Python爬虫的Selenium库

目录 二十三、Python爬虫的Selenium库23.1 Selenium下载安装23.2 安装浏览器驱动23.3 自动访问百度 二十三、Python爬虫的Selenium库 Selenium 是一个用于测试 Web 应用程序的自动化测试工具&#xff0c;它直接运行在浏览器中&#xff0c;实现了对浏览器的自动化&#xff0c;它…

集群和分布式

本文以即时通讯软件&#xff08;IM&#xff09;为例&#xff0c;介绍单机、集群、分布式的区别&#xff0c;以及它们各自的优缺点。 假设现在开发一款IM&#xff0c;刚开始业务比较简单&#xff0c;用户量也较少&#xff0c;我们将服务部署在一台单机服务器上足矣。软件开发过程…

【从零开始学Skynet】实战篇《球球大作战》(十):agent代码设计

现在开发登录流程涉及的最后一个服务agent&#xff0c;完成后就可以真正地把框架运行起来了。还会演示agent的单机功能&#xff0c;做个“打工”小游戏。 1、消息分发 玩家登录后&#xff0c;gateway会将客户端协议转发给agent&#xff08;流程图的阶段⑨&#xff09;。 新建se…

第五章-数字水印-1-位平面

数字水印概念 数字水印是一种将特定数字信息嵌入到数字作品中从而实现信息隐藏、版权认证、完整性认证、数字签名等功能的技术。 以图片水印为例: 水印嵌入过程:版权信息水印A嵌入到图像B中,得到含有水印的图像C,图像C与图像B在外观上基本一致&#xff0c;肉眼无法区分差异。…

OpenHarmony的线程间通信EventHandler

一、初识EventHandler ​ 在OpenHarmony的开发过程中&#xff0c;如果遇到处理下载、运算等较为耗时的操作时&#xff0c;会阻塞当前线程&#xff0c;但是实际操作中又不希望当前线程受到阻塞。比如&#xff1a;我们的app在界面上有一个下载文件的处理按钮&#xff0c;如果在按…

计算机网络基础 第三章练习题

计算机网络基础 第三章练习题 现在大量的计算机是通过诸如以太网这样的局域网连入广域网的&#xff0c;而局域网与广城网的互联是通过( A)实现的。 A. 路由器B. 资源子网C. 桥接器D. 中继器 下列不属于数据链路层功能的是(B )。 A. 帧定界功能B. 电路管理功能C. 差错控制功能D…

HCIP——交换

交换 园区网架构 交换机实现了一下功能 无限的传输距离——识别&#xff0c;重写电信号&#xff08;帧&#xff09;保证信息完整彻底解决了冲突二层单播——MAC地址表提高端口密度 MAC 单播地址&#xff1a;MAC地址第一个字节第8位为0 组播地址&#xff1a;MAC地址第一个字…

Camera | 8.让rk3568支持前后置摄像头

一、目标 本文主要目标是&#xff0c;支持前置摄像头0v5648、后置摄像头ov13850&#xff0c;以及移植过程遇到的一些小问题的解决。 1. 摄像头连接图 参考上图&#xff0c;摄像头详细信息如下&#xff1a; 2个摄像头均连接在I2C通道42个摄像头共用同一个MIPI数据通道2个摄像…

C++——探究引用

文章目录 概述引用的概念引用特性引用的作用**引用做参数****引用作为函数返回值** 常引用引用的底层实现总结一下引用和指针的不同点 概述 本篇博客将讲述c相对于c新增的一个重要的内容——引用&#xff0c;深入研究其语法细节以及其需要注意的一些要点。 引用的概念 竟然要学…

Baumer工业相机堡盟工业相机如何联合BGAPISDK和佳能EF变焦镜头实现相机的自动变焦(C++)

Baumer工业相机堡盟工业相机如何联合BGAPISDK和佳能EF变焦镜头实现相机的自动变焦&#xff08;C&#xff09; Baumer工业相机Baumer工业相机BGAPISDK中控制变焦镜头的技术背景代码案例分享第一步&#xff1a;开启相机自动调焦功能模块第二步&#xff1a;控制自动变焦镜头电机的…

Java+SSM+Mysql在线图书超市

课题背景及意义 随着现代网络技术发展&#xff0c;对于在线图书超市的设计现在正处于发展的阶段&#xff0c;所以对的要求也是比较严格的&#xff0c;要从系统的功能和用户实际需求来进行对系统制定开发的发展方式&#xff0c;依靠网络技术的的快速发展和现代通讯技术的结合为…

C++11: lambda、包装器、模板参数包和线程库

lambda C98中的一个例子 在C98中&#xff0c;如果想要对一个数据集合中的元素进行排序&#xff0c;可以使用std::sort方法。 int main() {int array[] { 4,1,8,5,3,7,0,9,2,6 };// 默认按照小于比较&#xff0c;排出来结果是升序std::sort(array, array sizeof(array) / s…

socket.io 解决浏览器兼容性(WebSocket)

在上一篇讲了 npm 上最流行的 WebSocket 库之一的 ws 库&#xff0c;那么本篇就来讲另外一个&#xff0c;就是 socket.io 库&#xff0c;socket.io 其实是一个兼容方案&#xff0c;当浏览器不支持 H5 的情况下就不能够使用上一篇内容讲的 WebSocket &#xff0c;只能采用其他的…

【数据统计】— 极大似然估计 MLE、最大后验估计 MAP、贝叶斯估计

【数据统计】— 极大似然估计 MLE、最大后验估计 MAP、贝叶斯估计 极大似然估计、最大后验概率估计(MAP)&#xff0c;贝叶斯估计极大似然估计(Maximum Likelihood Estimate&#xff0c;MLE)MLE目标例子: 扔硬币极大似然估计—高斯分布的参数 矩估计 vs LSE vs MLE贝叶斯公式&am…

JavaScript函数基础

●我们代码里面所说的函数和我们上学的时候学习的什么三角函数、二次函数之类的不是一个东西 函数的概念 ●对于 js 来说&#xff0c;函数就是把任意一段代码放在一个 盒子 里面 ●在我想要让这段代码执行的时候&#xff0c;直接执行这个 盒子 里面的代码就行 ●先看一段代码 …

[golang gin框架] 25.Gin 商城项目-配置清除缓存以及前台列表页面数据渲染公共数据

配置清除缓存 当进入前台首页时,会缓存对应的商品相关数据,这时,如果后台修改了商品的相关数据,缓存中的对应数据并没有随之发生改变,这时就需要需改对应的缓存数据,这里有两种方法: 方法一 在管理后台操作直接清除缓存中的所有数据,当再次访问前台首页时,就会先从数据库中获取…

巧用千寻位置GNSS软件|直线放样有技巧

日常测量作业中&#xff0c;直线放样是对设计好的直线进行放样&#xff0c;其中包括直线的里程&#xff0c;左右偏距及设计直线范围内的高程控制。本文将介绍如何运用千寻位置GNSS软件完成日常的直线放样。 点击【测量】->【直线放样】->【直线库】&#xff0c;选择一条直…