faad2交叉编译——aac解码为pcm,解决faad单通道转双通道问题

news2025/1/17 1:47:14

FAAD是比较成熟高效的开源AAC解码库,这里用于解码AAC生成PCM数据,用于音频播放。这里因为faad库,会将单通道转化为双通道踩了些坑,所以记录一下。
我使用的是2.11.0版本,貌似往前的版本没有使用CMake,需要configure配置编译

1.源码编译

使用git拉取

git clone https://github.com/knik0/faad2.git

因为是交叉编译,所以创建了一个cfg_file_path,其中设置一些参数,cfg_file_path内容如下:

##################################
# 配置 交叉编译
#################################

set(CMAKE_SYSTEM_NAME Linux)    #设置目标系统名字
set(CMAKE_SYSTEM_PROCESSOR aarch64) #设置目标处理器架构
set(CMAKE_C_COMPILER aarch64-ca53-linux-gnu-gcc-10.4.0)#设置交叉编译器
add_compile_definitions(DISABLE_SBR) #禁止SBR和DECODER
add_compile_definitions(LC_ONLY_DECODER)

指定cfg_file_path进行编译,编译产物输出到output目录

mkdir output
/usr/bin/cmake  -DCMAKE_TOOLCHAIN_FILE=cfg_file_path -Boutput/
cd output
make
sudo make install

这样编译完成后在output下就会有libfaad.so,libfaad.so.2,libfaad.so.2.11.1,可以拷贝到开发板即可
image.png

2.测试代码

/** 
 * faaddec.c 
 * use faad library to decode AAC, only can decode frame with ADTS head  
 */  
#include <stdio.h>  
#include <memory.h>  
#include "faad.h"  
  
#define FRAME_MAX_LEN 1024*5   
#define BUFFER_MAX_LEN 1024*1024  
  
void show_usage()  
{  
    printf("usage\nfaaddec src_file dst_file");  
}  
  
/** 
 * fetch one ADTS frame 
 */  
int get_one_ADTS_frame(unsigned char* buffer, size_t buf_size, unsigned char* data ,size_t* data_size)  
{  
    size_t size = 0;  
  
    if(!buffer || !data || !data_size )  
    {  
        return -1;  
    }  
  
    while(1)  
    {  
        if(buf_size  < 7 )  
        {  
            return -1;  
        }  
  
        if((buffer[0] == 0xff) && ((buffer[1] & 0xf0) == 0xf0) )  
        {  
            size |= ((buffer[3] & 0x03) <<11);     //high 2 bit  
            size |= buffer[4]<<3;                //middle 8 bit  
            size |= ((buffer[5] & 0xe0)>>5);        //low 3bit  
            break;  
        }  
        --buf_size;  
        ++buffer;  
    }  
  
    if(buf_size < size)  
    {  
        return -1;  
    }  
  
    memcpy(data, buffer, size);  
    *data_size = size;  
      
    return 0;  
}  
  
int main(int argc, char* argv[])  
{  
    static unsigned char frame[FRAME_MAX_LEN];  
    static unsigned char buffer[BUFFER_MAX_LEN] = {0};  
  
    char src_file[128] = {0};  
    char dst_file[128] = {0};  
    FILE* ifile = NULL;  
    FILE* ofile = NULL;  
  
    unsigned long samplerate;  
    unsigned char channels;  
    NeAACDecHandle decoder = 0;  
  
    size_t data_size = 0;  
    size_t size = 0;  
  
    NeAACDecFrameInfo frame_info;  
    unsigned char* input_data = buffer;  
    unsigned char* pcm_data = NULL;  
  
    //analyse parameter  
    if(argc < 3)  
    {  
        show_usage();  
        return -1;  
    }  
    sscanf(argv[1], "%s", src_file);  
    sscanf(argv[2], "%s", dst_file);  
  
  
    ifile = fopen(src_file, "rb");  
    ofile = fopen(dst_file, "wb");  
    if(!ifile || !ofile)  
    {  
        printf("source or destination file");  
        return -1;  
    }  
  
     data_size = fread(buffer, 1, BUFFER_MAX_LEN, ifile);  
  
     //open decoder  
    decoder = NeAACDecOpen();      
    if(get_one_ADTS_frame(buffer, data_size, frame, &size) < 0)  
    {  
        return -1;  
    }  


    NeAACDecConfigurationPtr config = NeAACDecGetCurrentConfiguration(decoder);
    config->defObjectType = LC;
    config->defSampleRate = 8000;
    // config->defObjectType = HE_AAC;
    config->outputFormat = FAAD_FMT_16BIT;  //位深度设置成16bit
    config->downMatrix = 0;
//    源码部分如下:
//    if (*samplerate <= 24000 && (hDecoder->config.dontUpSampleImplicitSBR == 0))
//    {
//        *samplerate *= 2;
//        hDecoder->forceUpSampling = 1;
//    } else if (*samplerate > 24000 && (hDecoder->config.dontUpSampleImplicitSBR == 0)) {
//        hDecoder->downSampledSBR = 1;
//    }
//    dontUpSampleImplicitSBR 设置成1,可以禁止NeAACDecInit时,采样率(小于等于24000时)翻倍的问题
    config->dontUpSampleImplicitSBR = 1;
    NeAACDecSetConfiguration(decoder, config);
  
    //initialize decoder  
    NeAACDecInit(decoder, frame, size, &samplerate, &channels);  
    printf("samplerate %d, channels %d\n", samplerate, channels);  
      
    while(get_one_ADTS_frame(input_data, data_size, frame, &size) == 0)  
    {  
       // printf("frame size %d\n", size);  
  
        //decode ADTS frame  
        pcm_data = (unsigned char*)NeAACDecDecode(decoder, &frame_info, frame, size);   
          
        if(frame_info.error > 0)  
        {  
            printf("%s\n",NeAACDecGetErrorMessage(frame_info.error));              
  
        }  
        else if(pcm_data && frame_info.samples > 0)  
        {  
            printf("frame info: bytesconsumed %d, channels %d, header_type %d\  
                object_type %d, samples %d, samplerate %d\n",   
                frame_info.bytesconsumed,   
                frame_info.channels, frame_info.header_type,   
                frame_info.object_type, frame_info.samples,   
                frame_info.samplerate);  
  
            fwrite(pcm_data, 1, frame_info.samples * frame_info.channels * 2, ofile);      //2个通道  
            fflush(ofile);  
        }          
        data_size -= size;  
        input_data += size;  
    }      
  
    NeAACDecClose(decoder);  
  
    fclose(ifile);  
    fclose(ofile);  
  
    return 0;  
}  

注意这里很多博客给的都是错的,frame_info.samples * frame_info.channels * 2,这里需要乘以2,因为位宽是16bit,而一个字节是8bit。在使用单通道的情况下,这里如果不乘以2,会导致音频加速等问题

3.程序运行

使用下面的编译指令编译,拷贝可执行文件和动态库到板子里。

aarch64-ca53-linux-gnu-gcc-10.4.0 main.c -o main -lfaad -L/usr/local/lib/
./main_aarch high_temperature_shut_down.aac test.pcm

动态库拷贝到板子的/usr/lib下后,在板子上运行可执行文件。

4.关于单/双通道

faad这个在内部因为一些音频算法,开启一些编译选项之后,会将通道数乘以2,导致输出的音频通道数总是2,达不到预期效果,要解决这个问题,需要做以下两点
1)参考第二点测试代码,需要乘以2,否则音频加速
2)参考第一点中的编译配置选项,取消一些编译配置选项,防止通道乘以2
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1653611.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何在电脑中使用微信?pc版微信和手机版有什么区别

微信简介 微信是一个社交和商业强国&#xff0c;自成立以来一直在持续增长。该应用程序在2023年拥有13亿月活跃用户&#xff0c;尽管在某些国家对其使用存在一些阻力。 使用微信网页版可以获得的好处 尽管微信为iOS和Android智能手机提供了出色的应用程序&#xff0c;但仍有时…

面向初学者:什么是图数据库

当数据成为关键生产要素&#xff0c;许多企业开始面临利用海量数据辅助企业复杂决策的现实难题。而在数据爆发式增长&#xff0c;关联复杂度激增的趋势下&#xff0c;图数据库成为企业加工关联数据、挖掘隐藏价值、智能决策升级的关键技术之一&#xff0c;在全球范围内开始被使…

sql优化思路

sql的优化经验 这里解释一下SQL语句的优化的原理 1.指明字段名称&#xff0c;可以尽量使用覆盖索引&#xff0c;避免回表查询&#xff0c;因此可以提高效率 2.字面意思&#xff0c;无需过多赘述。索引就是为了提高查询效率的。 3.图中两条sql直接可以使用union all 或者 uni…

一文盘点 Partisia Blockchain 生态 4 月市场进展

Partisia Blockchain 是一个以高迸发、隐私、高度可互操作性、可拓展为特性的 Layer1 网络。通过将 MPC 技术方案引入到区块链系统中&#xff0c;以零知识证明&#xff08;ZK&#xff09;技术和多方计算&#xff08;MPC&#xff09;为基础&#xff0c;共同保障在不影响网络完整…

万字长文详解Typora+PicGo+Github/Gitee的配置教程

文章目录 1.前言1.1 Typora简介1.2 引入1.2.1 移动本地图片位置导致图片加载失败问题解决方案反思&#xff1a; 1.2.2 CSDN导入图片转存失败1.2.3 思考 1.3 图床工具1.4 使用原因1.5 总结 2.安装教程2.1 Typora安装教程2.1.1 下载安装包方式1&#xff1a;百度网盘方式2&#xf…

【Python爬虫】使用request和xpath爬取高清美女图片

&#x1f4dd;个人主页&#xff1a;哈__ 期待您的关注 目录 &#x1f388; urlib.request &#x1f525;具体的方法 ✈ lxml &#x1f525;xpath的基本语法 1. 基本路径 2. 选择节点 3. 谓语&#xff08;Predicates&#xff09; 4. 通配符 5. 选择多个路径 6. 函数 …

鸿蒙内核源码分析(工作模式篇) | CPU的七种工作模式

本篇说清楚CPU的工作模式 工作模式(Working mode) 也叫操作模式&#xff08;Operating mode&#xff09;又叫处理器模式&#xff08;Processor mode&#xff09;&#xff0c;是 CPU 运行的重要参数&#xff0c;决定着处理器的工作方式&#xff0c;比如如何裁决特权级别和报告异…

文献速递:深度学习医学影像心脏疾病检测与诊断--基于深度学习的低剂量SPECT心肌灌注图像去噪:定量评估与临床表现

Title 题目 Deep learning–based denoising of low‑dose SPECT myocardialperfusion images: quantitative assessment and clinical performance 基于深度学习的低剂量SPECT心肌灌注图像去噪&#xff1a;定量评估与临床表现 01 文献速递介绍 单光子发射计算机断层扫描&a…

Options API:选项式 API改成Composition API:组合式 API的留言板

让我欢喜让我忧 改成Composition API:组合式 API的代码&#xff0c; <template><!-- start --><span class"span_checkbox">操作<input type"checkbox" v-model"showInput" value"操作" /></span><…

Learning Continuous Image Representation with Local Implicit Image Function

CVPR2021https://github.com/yinboc/liif 问题引入 图像普遍都是使用像素来表示的&#xff0c;而现实世界是连续的&#xff0c;所以本文借鉴3D中neural implicit representation的思想&#xff0c;以连续的方式表示图像&#xff1b;模型输入坐标值和坐标附近的特征&#xff0…

区块链 | NFT 水印:Review on Watermarking Techniques(二)

&#x1f34d;原文&#xff1a;Review on Watermarking Techniques Aiming Authentication of Digital Image Artistic Works Minted as NFTs into Blockchains 1 半脆弱和可逆水印 鲁棒性好的水印技术通常会产生非常低透明度。正如前面所述&#xff0c;由于透明度在处理数字…

OpenGL 入门(四)—— 贴纸与美颜滤镜

本篇我们来介绍贴纸效果与美颜滤镜的实现。 1、贴纸效果 贴纸实际上是一个图片&#xff0c;用 Bitmap 加载图片后用 OpenGL 渲染到指定的位置上。我们举例添加一个耳朵贴纸&#xff1a; 1.1 获取人脸位置 上一篇我们在讲大眼滤镜时&#xff0c;在 Native 层除了获取到人脸 5…

【数据库表的约束(下)】

文章目录 一、自增长主键二、唯一键约束三、外键约束总结 一、自增长主键 这个约束的功能是&#xff1a; 你不用管我&#xff0c;也不需要插入我这一列的数据&#xff0c;我会保证自己与其他数据不冲突&#xff0c;并且是连续的。 创建一个表&#xff0c;表格内容如下&#x…

Tkinter组件:Checkbutton

Tkinter组件&#xff1a;Checkbutton Checkbutton&#xff08;多选按钮&#xff09;组件用于实现确定是否选择的按钮。Checkbutton 组件可以包含文本或图像&#xff0c;你可以将一个 Python 的函数或方法与之相关联&#xff0c;当按钮被按下时&#xff0c;对应的函数或方法将被…

保护公司机密:避免员工带着数据说拜拜

公司的核心资产之一就是数据。无论是客户信息、研发代码、内部决议、财务报告、商业合同、设计图纸等都是公司的重要资产。如果这些数据在员工离职时被带走&#xff0c;或在员工在职期间不当行为导致数据泄露&#xff0c;将给公司带来重大损失。 然而&#xff0c;保护这些数据…

大模型微调之 在亚马逊AWS上实战LlaMA案例(四)

大模型微调之 在亚马逊AWS上实战LlaMA案例&#xff08;四&#xff09; 在 Amazon SageMaker JumpStart 上微调 Llama 2 以生成文本 Meta 能够使用Amazon SageMaker JumpStart微调 Llama 2 模型。 Llama 2 系列大型语言模型 (LLM) 是预先训练和微调的生成文本模型的集合&#x…

漏洞伴随App无时不在,该怎么办?

漏洞攻击、加密被破坏以及数据泄露是App面临的三大重要安全风险&#xff0c;无论开发者如何防范&#xff0c;攻击者往往会找到新的方法&#xff0c;并依靠最新的工具来破坏App安全性。 统计数据表明&#xff0c;大约82&#xff05;的漏洞是在App程序代码中发现的。如果尽快发现…

百度百科怎么修改词条

百度百科是一个由网民编辑内容的网络百科全书&#xff0c;支持用户添加或修改词条。以下是关于如何修改百度百科词条的详细步骤和注意事项。 1. 登录百度百科账户 首先&#xff0c;你需要登录到百度百科账户。如果你还没有百度账号&#xff0c;你需要先注册一个。注册完成后&a…

【vue+el-upload】当action=“#“,代表不使用默认上传,使用自定义上传,http-request获取文件流

el-upload有多种上传行为&#xff1a; 1、立即上传&#xff1a; 当 action 属性被赋予一个有效的 URL 时&#xff0c;一旦用户选择了文件&#xff0c;el-upload 组件会立即自动将文件上传到指定的服务器地址。 2、不立即上传&#xff08;自定义触发&#xff09;&#xff1a; 如…

2024-5-3学习笔记 虚拟继承原理

目录 原理 总结 前面提到过&#xff0c;解决菱形继承产生的数据二义性问题和数据冗余&#xff0c;就需要用到虚拟继承&#xff0c;关于它是如何解决的&#xff0c;我们来一起研究。 class Person { public :string _name ; // 姓名 }; class Student : virtual public Perso…