音视频 五 看书的笔记 MediaCodec

news2025/4/15 23:21:43

MediaCodec

用于访问底层媒体编解码器框架,编解码组件。通常与MediaExtractor(解封装,例如Mp4文件分解成 video和audio)、MediaSync、MediaMuxer(封装 例如音视频合成Mp4文件)、MediaCrypto、Image(cameraX 回调的ImageReader对象可以获取到Image帧图像,可转换成YUV420数组,传递给编码器编码),Surface(camera的预览回调)、Audio一起使用。
在这里插入图片描述

创建MediaCodec

    public static MediaCodec createEncoderByType(@NonNull String type)  //创建编码器
    
   public static MediaCodec createDecoderByType(@NonNull String type) //创建解码器
  

一般type是:

  • h264 MediaFormat.MIMETYPE_VIDEO_AVC(video/avc)
  • h265 MediaFormat.MIMETYPE_VIDEO_HEVC(video/hevc)
   public static MediaCodec createByCodecName(@NonNull String name) //通过名称创建

一般name是:

  • OMX.google.h264.encoder 软编码
  • OMX.google.h264.decoder 软解码
  • OMX.MTK.VIDEO.DECODER.AVC 硬解码

  • 以下代码可以检测是否支持某编解码
MediaCodecList codecList = new MediaCodecList(MediaCodecList.ALL_CODECS);
for (MediaCodecInfo codecInfo : codecList.getCodecInfos()) {
    if (codecInfo.isEncoder()) {
        continue; // 只检查解码器
    }
    String[] types = codecInfo.getSupportedTypes();
    for (String type : types) {
        if (type.equalsIgnoreCase("video/hevc")) {
            Log.d("MediaCodec", "Device supports H265 decoding");
            return; // 找到支持的解码器,可以退出
        }
    }
}
Log.d("MediaCodec", "Device does not support H265 decoding");

工作方式

以以下代码为例

// 假设你已经有了ByteBuffer data和BufferInfo info
codec.queueInputBuffer(inputBufferIndex, 0, data.limit(), presentationTimeUs, 0);
MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo();
int outputBufferIndex = codec.dequeueOutputBuffer(bufferInfo, 10000);
while (outputBufferIndex >= 0) {
    // 处理输出帧,例如绘制到Surface或保存到文件等
    codec.releaseOutputBuffer(outputBufferIndex, true); // true表示将输出帧渲染到Surface中(如果有的话)
    outputBufferIndex = codec.dequeueOutputBuffer(bufferInfo, 0); // 再次尝试获取下一个输出帧
}
  • queueInputBuffer 处理输入数据(如:camera/cameraX回调的视频帧数据)
  • dequeueOutputBuffer 输出数据 编码后的数据(如:使用H264编码则 可直接将数据保存为H264文件)
    分析:
  • MediaCodeC使用一组输入和输出Buffer队列。
  • 数据填入设定的空输入缓冲区 ( inputBuffers = mediaCodec.getInputBuffers();),填满数据后传递给MediaCodec进行编解码
  • 编解码后数据填充到一个输出Buffer中。

状态

  • MediaCodec 有三种状态 Stopped Executing Released
    – Stopped 包括 三种状态 Uninitialized Configured Error
    – Executing 包括三种状态 Flushed Running End-of-Stream

状态

  • 通过以上create工厂方法创建一个MediaCodec ,MediaCodec 处于未初始化状态
  • 需要通过MediaCodec对象的configure方法配置,配置后 处于配置状态
String mimeType = "video/hevc"; // H265 MIME类型
MediaCodec codec = MediaCodec.createDecoderByType(mimeType);
MediaFormat format = MediaFormat.createVideoFormat(mimeType, width, height);
format.setInteger(MediaFormat.KEY_COLOR_FORMAT, MediaCodecInfo.CodecCapabilities.COLOR_FormatSurface); // 使用Surface作为输出类型,如果是预览或显示使用
format.setInteger(MediaFormat.KEY_BIT_RATE, bitRate); // 设置比特率,如果需要的话
format.setInteger(MediaFormat.KEY_FRAME_RATE, frameRate); // 设置帧率,如果需要的话
format.setInteger(MediaFormat.KEY_I_FRAME_INTERVAL, 1); // 设置I帧间隔,通常设置为1或2
 
codec.configure(format, null, null, 0); // 使用null作为输出Surface,因为我们不直接处理输出数据
codec.start();
  • 调用start之后 处于 Executing状态
  • 调用start后,MediaCodec 会立刻刷新子状态(Flushed ) 并拥有所有的Buffer
  • 第一个输入Buffer从队列中移除 MediaCodec 会花较长时间转换为 正在运行的子状态 (Running )
  • 当队列输入Buffer携带End-of-Stream标记 则转换为 End-of-Stream子状态 这种状态MediaCodec不再接收输入Buffer,但是仍然会产生输出Buffer
  • Executing状态下,调用flush函数可以回到 Flushed子状态
  • 调用stop,MediaCodec 处于Uninitialized 状态 等待再次配置和使用
  • 再次创建MediaCodec 时,上个MediaCodec 对象必须调用release函数
  • 极少数情况会出现Error状态,此时需要调用reset函数让MediaCodec 再次可用

MediaCodec 从创建到start的过程

  • 需要经历JNI
  • 与MediaPlayer有很多相似的地方
  • 我帮大家看了 想看的花去点这里

就是MediaCodec 会对应到 c++层的JMediaCodec方法
release -> native_release
reset -> native_reset
setup -> native_setup
finalize -> native_finalize
config -> native_configure

  • setup -> 调用 JMediaCodec 构造方法创建JMediaCodec
  • JMediaCodec的构造方法 -> createByType/CreateByComponentName 创建JMediaCodec
  • 接着java 调用config -> native_configure
  • native_configure -> 获取前边创建的JMediaCodec 对象 调用其configure方法 构建编解码器
  • java 层调用 start -> 最终使用的还是JMediaCodec 对象 的 start方法 会直行ACodec.cpp 的start 函数

MediaCodec 到OMX过程

OpenMAX Integration Layer(OMX IL,集成层)是由Khronos Group开发的一套低层级标准接口,旨在为编解码器提供一定程度的抽象,使得嵌入式或移动设备能够统一调用音频、视频和图像编解码器,从而实现编解码器实现代码和调用代码的跨平台性。
OMX IL API由两大主要部分组成,分别是Core API和Component API。
OMX IL Component:在OMX IL中组件表示独立的功能模块,组件可能是source(源)、sinks(接收器)、codecs(编解码器)、filters(过滤器)或任何其他数据处理模块,组件需要依据Component API来实现。与组件之间的数据通信是通过称为端口的接口进行的,用户可以通过输入端口向组件发送数据,也可以通过输出端口接收数据。
OMX IL Core:Core API主要用于动态加载卸载组件,调用组件方法;
将OMX IL API封装并向上层提供高层级接口的部分被称为IL Client(客户端),IL Client使用OMX Core来加载组件,卸载组件,调用组件的方法。

  • MediaCodec::init 函数
    – 创建Acodec Acodec继承AHander(消息机制有了)
    – 初始化ALooper AMessage
    – 发送kWhatInit消息
    – ACodec收到消息 调用initiateAllocateComponent(format)函数
    – 发送kWhatAllocateComponent消息
  • 消息中心收到消息 调用onAllocateComponent回调函数
    – 通过ACodec::AllocateComponent函数判断OMXClient和Server是否正常建立连接
    – 通过IOMX进行IPC通信
    – 调用omx->allocateNode分配Node节点
  • onConfigureComponent 函数
    – 调用ACodec的configCodec函数 构建编解码器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2334739.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ubuntu 系统安装Mysql

安装 mysql sudo apt update sudo apt install mysql-server 启动服务 sudo systemctl start mysql 设置为开机自启 sudo systemctl enable mysql 查看服务状态 (看到类似“active (running)”的状态信息代表成功) sudo systemctl status mysql …

selenium快速入门

一、操作浏览器 from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By# 设置选项 q1 Options() q1.add_argument("--no-sandbo…

Redis:线程模型

单线程模型 Redis 自诞生以来,一直以高性能著称。很多人好奇,Redis 为什么早期采用单线程模型,它真的比多线程还快吗? 其实,Redis 的“快”并不在于并发线程,而在于其整体架构设计极致简单高效,…

Transformer模型解析与实例:搭建一个自己的预测语言模型

目录 1. 前言 2. Transformer 的核心结构 2.1 编码器(Encoder) 2.2 解码器(Decoder) 2.3 位置编码(Positional Encoding) 3. 使用 PyTorch 构建 Transformer 3.1 导入所需的模块: 3.2 定…

springboot框架集成websocket依赖实现物联网设备、前端网页实时通信!

需求: 最近在对接一个物联网里设备,他的通信方式是 websocket 。所以我需要在 springboot框架中集成websocket 依赖,从而实现与设备实时通信! 框架:springboot2.7 java版本:java8 好了,还是直接…

ES6学习03-字符串扩展(unicode、for...of、字符串模板)和新方法()

一、字符串扩展 1. eg: 2.for...of eg: 3. eg: 二。字符串新增方法 1. 2. 3. 4. 5.

目前状况下,计算机和人工智能是什么关系?

目录 一、计算机和人工智能的关系 (一)从学科发展角度看 计算机是基础 人工智能是计算机的延伸和拓展 (二)从技术应用角度看 二、计算机系学生对人工智能的了解程度 (一)基础层面的了解 必备知识 …

Flutter 2025 Roadmap

2025 这个路线图是有抱负的。它主要代表了我们这些在谷歌工作的人收集的内容。到目前为止,非Google贡献者的数量超过了谷歌雇佣的贡献者,所以这并不是一个详尽的列表,列出了我们希望今年Flutter能够出现的所有令人兴奋的新事物!在…

[数据结构]排序 --2

目录 8、快速排序 8.1、Hoare版 8.2、挖坑法 8.3、前后指针法 9、快速排序优化 9.1、三数取中法 9.2、采用插入排序 10、快速排序非递归 11、归并排序 12、归并排序非递归 13、排序类算法总结 14、计数排序 15、其他排序 15.1、基数排序 15.2、桶排序 8、快速排…

第16届蓝桥杯c++省赛c组个人题解

偷偷吐槽: c组没人写题解吗,找不到题解啊 P12162 [蓝桥杯 2025 省 C/研究生组] 数位倍数 题目背景 本站蓝桥杯 2025 省赛测试数据均为洛谷自造,与官方数据可能存在差异,仅供学习参考。 题目描述 请问在 1 至 202504&#xff…

记一次InternVL3- 2B 8B的部署测验日志

1、模型下载魔搭社区 2、运行环境: 1、硬件 RTX 3090*1 云主机[普通性能] 8核15G 200G 免费 32 Mbps付费68Mbps ubuntu22.04 cuda12.4 2、软件: flash_attn(好像不用装 忘记了) numpy Pillow10.3.0 Requests2.31.0 transfo…

使用SSH解决在IDEA中Push出现403的问题

错误截图: 控制台日志: 12:15:34.649: [xxx] git -c core.quotepathfalse -c log.showSignaturefalse push --progress --porcelain master refs/heads/master:master fatal: unable to access https://github.com/xxx.git/: The requested URL return…

Tauri 2.3.1+Leptos 0.7.8开发桌面应用--Sqlite数据库的写入、展示和选择删除

在前期工作的基础上(Tauri2Leptos开发桌面应用--Sqlite数据库操作_tauri sqlite-CSDN博客),尝试制作产品化学成分录入界面,并展示数据库内容,删除选中的数据。具体效果如下: 一、前端Leptos程序 前端程序主…

《车辆人机工程-》实验报告

汽车驾驶操纵实验 汽车操纵装置有哪几种,各有什么特点 汽车操纵装置是驾驶员直接控制车辆行驶状态的关键部件,主要包括以下几种,其特点如下: 一、方向盘(转向操纵装置) 作用:控制车辆行驶方向…

使用多进程和 Socket 接收解析数据并推送到 Kafka 的高性能架构

使用多进程和 Socket 接收解析数据并推送到 Kafka 的高性能架构 在现代应用程序中,实时数据处理和高并发性能是至关重要的。本文将介绍如何使用 Python 的多进程和 Socket 技术来接收和解析数据,并将处理后的数据推送到 Kafka,从而实现高效的…

Redis 哨兵模式 搭建

1 . 哨兵模式拓扑 与 简介 本文介绍如何搭建 单主双从 多哨兵模式的搭建 哨兵有12个作用 。通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。 当哨兵监测到master宕机,会自动将slave切换成master,然后通过…

【网络安全 | 项目开发】Web 安全响应头扫描器(提升网站安全性)

原创项目,未经许可,不得转载。 文章目录 项目简介工作流程示例输出技术栈项目代码使用说明项目简介 安全响应头是防止常见 Web 攻击(如点击劫持、跨站脚本攻击等)的有效防线,因此合理的配置这些头部信息对任何网站的安全至关重要。 Web 安全响应头扫描器(Security Head…

基于PySide6与pycatia的CATIA绘图比例智能调节工具开发全解析

引言:工程图纸自动化处理的技术革新 在机械设计领域,CATIA图纸的比例调整是高频且重复性极强的操作。传统手动调整方式效率低下且易出错。本文基于PySide6+pycatia技术栈,提出一种支持智能比例匹配、实时视图控制、异常自处理的图纸批处理方案,其核心突破体现在: ​操作效…

STM32硬件IIC+DMA驱动OLED显示——释放CPU资源,提升实时性

目录 前言 一、软件IIC与硬件IIC 1、软件IIC 2、硬件IIC 二、STM32CubeMX配置KEIL配置 三、OLED驱动示例 1、0.96寸OLED 2、OLED驱动程序 3、运用示例 4、效果展示 总结 前言 0.96寸OLED屏是一个很常见的显示模块,其驱动方式在用采IIC通讯时,常用软件IIC…

泛型的二三事

泛型(Generics)是Java语言的一个重要特性,它允许在定义类、接口和方法时使用类型参数(Type Parameters),从而实现类型安全的代码重用。泛型在Java 5中被引入,极大地增强了代码的灵活性和安全性。…