关于Ultra HDR Image的那些事

news2024/11/18 10:21:53

一、什么是Ultra HDR Image

2023年10月初,google正式发布了Android 14。该版本中引入了一个新的功能Ultra HDR Image,被誉为”图像技术的未来”。之前Android版本各手机厂商或许有自己的HDR图片技术,本文这里重点分析下Android14上google的实现方案。

7db5ea733aebf8f2aee6f37aa83db1d5.png

让我们先来看一组图片。上图中左边的图片为SDR(标准动态范围),右边的图片为HDR(高动态范围)。显而易见HDR图片更加的生动鲜艳,画面层次感表现的更为突出。Ultra HDR Image功能就是为用户提供了拍摄、查看HDR照片的功能。

8f7efb52277a5607f88b557b0f4dee31.png

Google Ultra HDR Image实际是使用两个8-bit位深的JPEG来还原真实拍摄场景的高动态范围。本文将此文件格式称为JPEG-R,该格式向后兼容JPEG。

二、Ultra HDR Image文件结构

Ultra HDR Image文件是基于传统JPEG文件格式,通过附加的metadata 信息及Gainmap图,最大程度上保留了拍摄场景的动态范围。

8716b920031ab7601d3e26b7da292e9c.png

图2.1 - Ultra HDR Image 文件结构

前面讲到Ultra HDR Image是由两个JPEG文件组成。其中第一个JPEG称为Primary image(主图),是一张普通的8bit SDR图片,存储着SDR图像数据。第二个JPEG称为Gainmap(增益图),Gainmap图存储着足以恢复原始高动态亮度的数据,可以简单理解为每个像素点处的亮度差。支持该格式的设备会将主图和增益图结合起来,在兼容的显示器上渲染出高动态范围的图像。

图2.1中绿色部分为Google GContainer,遵循XMP规范,并嵌入到主图文件中,其格式为RDF/XML。

f0594d7870af36b9d2209a1406ebdfa4.png

图2.2- Google GContainer

如图2.2所示,主图像在XMP中包含了Container:Directory元素,定义文件容器中后续媒体文件的顺序和属性。容器中每个文件在Container:Directory中都有一个相应的媒体项,媒体项描述文件容器中的位置及每个串联文件的基本属性。

933822a63754f73b3a7271efc24c81ff.png

图2.2 GContainer说明该图片有1个Primary图和1个Gainmap图,两个文件均为“image/jpeg”格式,Gainmap图文件长度为66171字节。

图2.1中红色部分为HDR Gain map metadata. 这部分数据说明了如何使用Gainmap图将主图像渲染到高动态范围。

5a571034a0ac4925aa13e7aa79d8cc22.png

图2.3- HDR Gain map metadata

2b8676f6e98c3a773e521f63c9c77454.png

上表中GainMapMin和GainMapMax是图像内容上像素值的增益范围,取决于图像内容。而HDRCapacityMin和HDRCapacityMax是显示时提升的增益范围,取决于显示设备和其他因素。XMP中存储的这几个值都是经过对数转换的。可能有人会问:为什么需要对数转换,这样有什么好处呢?这里就不得不提一个概念:”压缩范围”。在摄影中,现实世界场景的动态范围通常比 SDR 显示器所能呈现的动态范围更大。需要诸如范围压缩(也称为局部色调映射)之类的操作来减少图像的动态范围。减小图像中最大亮度边缘的大小,同时尽可能保留小亮度边缘(细节)的大小。如图2.4,对数曲线在像素值较低的区域斜率大,在像素值较高的区域斜率小。所以对数变换可以将图像低亮部分进行扩展,保留更多的细节;高亮部分压缩,减少高亮部分的细节。

1b52c9757daf15891df0b78883e1082f.png

图2.4- 对数曲线

图2.1中紫色部分为MPF数据,储存在主图像中App2字段,主要包含了文件容器中Primary图和Gainmap图的偏移及文件长度。

6b69bc3faad6c8c2b7cd0fa5b9e35dfe.png

图2.5- MPF

三、Ultra HDR Image编码

Android14上针对不同的场景,共提供了5个编码接口用来生成Ultra HDR Image。

4e24626152d805d970c16ea6ce25218a.png

图3.1- API-0

097f4cd84e9301670c1a9f66feabf521.png

图3.2- API-1

ca10f4b06b5b0abc3dc6652cf20aa46b.png

图3.3- API-2

dbcfa3b81442ad72814c1861c70ebd34.png

图3.4- API-3

410d90b8420d68b78fe25586ab5791f9.png

图3.5- API-4

调用方根据需要选择其中一个即可。在这里我们以API-0为例,详细剖析下编码流程。

ba42577614d58c2cad73c2acbcadb101.png

图3.6- API-0编码流程

JPEG-R编码主要有以下5个步骤:

a.相机Hal采集到HDR数据(P010)通过tonemap函数生成SDR数据(YUV420)

b. 通过HDR数据和SDR数据生成未压缩的gain map(亮度差)数据

c. gain map数据压缩成单通道JPEG文件(灰度图)

d. SDR数据压缩成Primary JPEG图

e.生成metadata信息,并将gainmap灰度图添加到Primary JPEG后面

上面5步中,c、d均为普通jpeg编码,e为文件流输出,这里就不在赘述。我们重点结合代码分析下前两步:

a.HDR->SDR:

从下图代码中可以看出tonemap操作实际是将每个像素点处的P010数据通过右移2位的操作,从10-bit映射到了8-bit范围,生成新的SDR数据(YUV420)。

08c863d26a07aac377e540d3be326505.png

图3.7- P010数据tonemap到YUV420代码

b. Gain map亮度差数据生成:

4b45423c3573ce51a1e5b64090633872.png

图3.8- gainmap 亮度差生成代码

sampleYuv420()函数是获取(x,y)坐标处归一化后的yuv数据。

e8b8a8f6d8827cf16c344ebe79e297d8.png

图3.9- sample420函数

srgbYuvToRgbFn()是通过公式将归一化得yuv数据转成rgb数据,需要注意得是这里的rgb数据是经过gamma编码的非线性数据。这里以P3色域的图片为例:

a5013ec0c07188486c09405a35e3111b.png

图3.10- srgbYuvToRgbFn函数

srgbInvOetfLUT()是通过光电转换函数将非线性的rgb数据转换成线性rgb数据。

4f3a3ccaf1ef09c39ca4384b5224e80b.png

图3.11- srgbInvOetfLUT函数

luminanceFn()是将归一化的线性rgb数据转换成对应的亮度值,在0.0到1.0的范围内。该值乘以kSdrWhiteNits表示的是(x,y)坐标处标准动态范围主图像的线性亮度,这里暂时用Ysdr(x,y)表示。

e5597d10eedaf45715eeb44b83330c9c.png

图3.12- luminanceFn函数

同理根据P010数据可以计算出(x,y)处高动态范围图像的线性亮度用Yhdr(x,y)表示。

根据(x,y)处的标准动态范围主图像线性亮度Ysdr(x,y)和高动态范围图像的线性亮度Yhdr(x,y),通过encodeGain函数生成(x,y)处的亮度差,并恢复到0~255范围。

9dff6730db5d23890fe8d2b30f7ef815.png

图3.13- encodeGain函数

所有像素点处的亮度差获取到后,编码成单通道的JPEG灰度图存储在primary JPEG文件后面。以上就是Native层Ultra HDR Image生成的全部过程。

下面通过一个简单的例子告诉你上层应用如何编码JPEG-R格式。

07e05061fed167981a4ba8a091cff003.png

图3.14- 上层应用编码实例

四、Ultra HDR Image解码

JPEG-R解码流程如下图所示:

39ff39757c1ded248951319d706052d7.png

图4.1- JPEG-R解码流程

JPEG-R格式图片解码时,首先解码primary JPEG(主图),然后判断该图片是否遵循JPEG-R格式标准包含Gainmap图。如果有,则解码Gainmap图并将gainmap存入主图Bitmap结构体中。代码如下:

0436273d1945558a49d90625cb27140b.png

图4.2- JPEG-R解码流程

图4.2中getAndroidGainmap()函数解析图片是否符合JPEG-R格式标准。如果是JPEG-R,继续解析获取XMP文件中gainmap图的metadata信息,保存在gainmapInfo中。同时保存出gainmap数据流。decodeGainmap()函数负责解码上一步获取到的gainmap数据流,并将解码后的数据保存在gainmap参数中。最后通过setGainmap()函数将gainmap数据保存到主图bitmap结构体中。Primary JPEG和Gainmap图的解码都是基本的jpeg解码流程,这里就不在赘述了。

以上就是Native层Ultra HDR Image的解码过程。下面一个例子告诉你上层应用该如何获取Gainmap数据:

380ec941092063f9f3f897202ce24ce8.png

五、Ultra HDR Image渲染

JPEG-R渲染时,每个坐标点的像素通过HDR/SDR ratio(亮度差)数据, 将标准动态范围数据还原到高动态范围。

d72134463dcee820ec2a700b650e3eba.png

这里的f可以认为是一个用于计算HDR数据的插值转换函数。相关代码如下:

2ce93ebc442f96f5fc800c470a03ac9d.png

图4.3- HDR数据还原

图4.3中trfn_apply_gain()函数使用对应坐标处的HDR/SDR ratio,计算出该坐标处的HDR数据,之后按正常流程渲染即可。

六、总结

Android14之前各厂商HDR技术、效果各不相同,因此社交平台很难适配各家的HDR图片。Ultra HDR Image的出现或许能改变这一困局,统一的HDR流程和效果对于三方应用的适配提供了便利。或许不久的将来,HDR图片效果就能出现在朋友圈、微博等社交平台。你别说,“图像技术的未来”还真有那味了。

Ultra HDR Image整个拍摄到显示的链路很长,它不是一篇文章能完整描述清楚的。本文侧重点主要在编解码模块。因为该技术较新,本人拙见,如有不当处,还望读者朋友海涵。

参考文献:

[1].https://developer.android.com/guide/topics/media/platform/hdr-image-format

[2].http://aospxref.com/android-14.0.0_r2/

超详细!Linux内核内存规整详解

Android logd日志简介及典型案例分析

OPPO在CLK大会上公布可编程内核技术,引领安卓流畅体验升级

f87ebd946efabfe9dcc54ba1de8e94e9.gif

长按关注内核工匠微信

Linux内核黑科技| 技术文章| 精选教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1222141.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaScript 浮点数运算的精度问题及解决

JavaScript 浮点数运算的精度问题及解决 在 JavaScript 中整数和浮点数都属于 Number 数据类型,当浮点数做数学运算的时候,你经常会发现一些问题,举几个例子: 0.1 0.2 0.30000000000000004 console.log(0.1 0.2) 0.3000000…

springcloud新闻发布系统源码

开发技术: jdk1.8,mysql5.7,nodejs,idea,vscode springcloud springboot mybatis vue elementui 功能介绍: 用户端: 登录注册 首页显示搜索新闻,新闻分类,新闻列表…

VS+Qt+C++ Yolov8物体识别窗体程序onnx模型

程序示例精选 VSQtC Yolov8物体识别窗体程序onnx模型 如需安装运行环境或远程调试,见文章底部个人QQ名片,由专业技术人员远程协助! 前言 这篇博客针对《VSQtC Yolov8物体识别窗体程序onnx模型》编写代码,代码整洁,规…

【Hello Go】Go语言工程管理

工程管理 工作区工作区介绍GOPATH设置 包自定义包main包main函数和init函数导入包点操作别名操作_操作 测试案例GOPATH配置go install使用 在我们实际的工作中 直接运用到编译器进行编译链接的场景少之又少 这是因为 在工程中不会只有一个源文件 并且源文件之间也有着相互依赖…

java学习part05

43-流程控制-使用Scanner类从键盘获取数据_哔哩哔哩_bilibili 1.接收输入 步骤 例子 2.生成随机数 3.switch-case 4.for 5.while

IDEA插件下载到本地

IDEA插件下载到本地 官网下载【点击跳转】

基于DE10-Standard Cyclone V SoC FPGA学习---开发板简介

基于DE10-Standard Cyclone V SoC FPGA学习---开发板简介 简介产品规格基于 ARM 的 HPS配置与调试存储器件通讯连接头显示器音频视频输入模数转换器开关、按钮、指示器传感器电源 DE10-Standard 开发板系统框图Connect HTG 组件配置设计资源其他资源 简介 开发板资料 见 DE10-…

rv1126-rv1109-openssh

这是一个工具,可以通过ssh远程登录来操作,非常逆天! 于是rv1109代码自身自带有openssh 所以只需要打开config即可 diff --git a/buildroot/configs/rockchip_rv1126_rv1109_spi_nand_defconfig b/buildroot/configs/rockchip_rv1126_rv1109…

Pytorch plt.scatter()函数用法

一.scatter()函数的定义 matplotlib.pyplot.scatter(x, y, sNone, cNone, markerNone, cmapNone, normNone, vminNone, vmaxNone, alphaNone, linewidthsNone, vertsNone, edgecolorsNone, *, dataNone, **kwargs) 特征值作用x,y绘制散点图…

MAC电脑连接外接显示屏,颜色显示有问题,又粉、紫色蒙版,问题处理(1)

问题描述 买了一个显示器,想给mac做分屏使用,结果连上之后发现,整个屏幕像是被蒙上了一层紫色的蒙版。 就像下面展示的一样: 解决 将显示器颜色空间改为RGB颜色空间即可。 打开显示器菜单,找到颜色空间选项&#…

(六)什么是Vite——热更新时vite、webpack做了什么

vite分享ppt,感兴趣的可以下载: ​​​​​​​Vite分享、原理介绍ppt 什么是vite系列目录: (一)什么是Vite——vite介绍与使用-CSDN博客 (二)什么是Vite——Vite 和 Webpack 区别&#xff0…

2023数维杯数学建模C题完整版本

已经完成全部版本,获取请查看文末下方名片 摘要 随着人工智能在多个领域的快速发展,其在文本生成上的应用引起了广泛关注。本研究聚焦于辨识人工智能(AI)生成文本的基本规则,并探究AI文本的检测及其与人类文本的区分…

Boolean源码解剖学

原创/朱季谦 有天突发其想,想看一下Boolean底层都做了些什么,故而去看了一番Boolean的源码,基于一些思考的基础上,输出了这篇文章。 一.类继承 Boolean的源码类定义部分如下: 1 public final class Boolean implemen…

Cascade-MVSNet论文笔记

Cascade-MVSNet论文笔记 摘要1 立体匹配(Stereo Matching)2 多视图立体视觉(Multi-View Stereo)3 立体视觉和立体视觉的高分辨率输出4 代价体表达方式(Cost volume Formulation)4.1 多视图立体视觉的3D代价…

农户建档管理系统的设计与实现-计算机毕业设计源码20835

摘 要 随着互联网趋势的到来,各行各业都在考虑利用互联网将自己推广出去,最好方式就是建立自己的互联网系统,并对其进行维护和管理。在现实运用中,应用软件的工作规则和开发步骤,采用Java技术建设农户建档管理系统。 本…

keepalived离线安装

上传离线安装包 将离线安装包拖动到服务器上 进入到离线安装包路径,执行下面脚本进行安装 rpm -Uvh --force --nodeps *.rpm

免费!IDEA插件推荐:Apipost-Helper

今天给大家推荐一款IDEA插件:Apipost-Helper-2.0,写完代码IDEA内一键生成API文档,无需安装、打开任何其他软件;写完代码IDEA内一键调试,无需安装、打开任何其他软件;生成API目录树,双击即可快速…

pythom导出mysql指定binlog文件

要求 要求本地有py环境和全局环境变量 先测试直接执行binlog命令执行命令 Windows 本地直接执行命令 # E:\output>E:\phpstudy_pro\Extensions\MySQL5.7.26\bin\mysqlbinlog binglog文件地址 # --no-defaults 不限制编码 # -h mysql链接地址 # -u mysql 链接名称 # -p m…

数据库学习 02-01 关系数据模型详细学习(数据库模式中的一种)

关系型数据模型的相关概念介绍: 01.关系(Relation) 一个关系对应通常说的一张表 02.元组(Tuple) 表中的一行即为一个元组,也就是一个对象 03.属性(Attribute) 表中的一列即为一个属性…

C语言日记——调试篇

一、调试调试的基本步骤 发现程序错误的存在 以隔离、消除等方式对错误进行定位 确定错误产生的原因 提出纠正错误的解决办法 对程序错误予以改正,重新测试 二、Debug和Release Debug通常称为调试版本,它包含调试信息,并且不作任何优化…