Android---字节码层面分析Class类文件

news2025/1/22 18:00:10

Java 提供了一种可以在所有平台上都能使用的一种中间代码---字节码文件(.class文件)。有了字节码,无论是那个平台只要安装了虚拟机都可以直接运行字节码文件。有了虚拟机,解除了 java 虚拟机与 java 代码之间的耦合。

Java 虚拟机当初被设计出来时就不单单只运行 java 这一种语言,目前 java 虚拟机已经可以支持很多除 java 语言以外的其它语言了,比如 Groovy, JRuby, json, skilla等。之所以可以支持其它语言,是因为这些语言经过编译之后,也可以生成能够被 JVM 解析并执行的字节码文件。而虚拟机并不关心字节码是由哪一种语言编译而来,如下图所示:

class 文件

从纵观的角度看,class 文件里只有两种数据结构:无符号数

\bullet 无符号数:属于基本的数据类型。以 u1,u2,u4,u8来分别代表 1 个字节、2个字节、4个字节和8个字节的无符号数。无符号数可以用来描述数字、索引引用,数量值或者字符串(UTF-8编码)。

\bullet 表:表由多个无符号数或者其它表作为数据项构成的复合数据类型。class 文件中所有的表都以“_info”结尾。整个 class 文件本质上就是一张表。

表和无符号数之间的关心

class 文件结构

无符号数和表组成了 class 中的各个结构,这些结构按照预先规定好的顺序紧密的从前向后排列,相邻的项之间没有任何间隙。当 JVM 加载某个 class 文件时,JVM 就是根据上图中的结构去解析 class 文件。加载 class 文件到内存中,并在内存中分配相应的内存空间,具体某种结构需要占用多大的空间,可以参考如下图:

实例解析:

把 test.java 编译成 test.class 文件。用十六进制编辑器打开 .class 文件(可以用在线的编辑器 HexD.it)。

package software_test;

import java.io.Serializable;

public class test implements Serializable, Cloneable {

	private int num = 1;
	
	public int add(int i) {
		int j = 10;
		num = num + i + j;
		return num;
	}
	
}

打开 test.class 文件的内容

1. 魔数(magic number)

在 class 文件开头的四个字节是 class 文件的魔数,它是一个固定的值--0XCAFEBABE。魔数是 class 文件的标志,它是判断一个文件是不是 class 格式文件的标准。

2. 版本号

前两个字节 0000代表次版本号(minor_version),后两个字节 0034 是主版本号(major_version),对应的十进制值为52,当前 class 文件的主版本号为52,次版本号为0,所以综合版本号是52.0,也就是 jdk1.8.0。

3. 常量池

紧跟在版本号之后的是一个叫做常量池的表(cp_info)。在常量池中保存了类的各种相关信息,比如类的名称父类的名称类中的方法名参数名称参数类型等。

常量池中的每一项都是一个表,其项目类型共有14种。常量池中的每一项都会有一个 u1 大小的 tag 值,是表的标识。

JVM 解析 class 文件时,通过 tag 值来判断当前数据结构是哪一个表。例如,CONSTANT_Class_info 表:

tag:占用一个字节大小,值为为7,说明是 CONSTANT_Class_info 类型表。

name_index:是一个索引值,可以将它理解为一个指针,指向常量池中索引为 name_index 的常量表。比如 name_index = 7,则它指向常量池中第7个常量表(表与表之间是有关联的)。

再例如 CONSTANT_Utf8_info 表:

tag:值为1,表示是 CONSTANT_Utf8_info类型表。

length:表示 u1[]的长度,比如length = 5,则表示接下来的数据是 5 个连续的u1类型数据。

bytes: u1 类型数组,长度为上面第2个参数 length 的值。

面试题:Java 源文件中 String 字符串的长度 有限制吗?

有(字符串存储在Class文件的常量池中)。在 Java 代码中声明的 String 字符串最终在 class 文件中的存储格式是 CONSTANT_utf8_info因此一个字符串最大长度也就是 u2 所能代表的最大值 65536(2^16) 个,但是需要使用2个来保存null值,因此一个字符串的最大长度为 65536 - 2 = 65534。

class 文件在常量池的前面使用2个字节的容量计数器,用来代表当前类中常量池的大小。

001D 转化为十进制为29,即常量计数器的值为29。其中下标为0的常量被 JVM 留作其他特殊用途,因此 Test.class 中时间的常量池大小为这个计数器的值减1,也就是28个。

第一个常量:

0A 转化为十进制为10,通过查看常量池14种表格图,可以查到 tag=10的表类型为 CONSTANT_Methodref_info,因此常量池中的第一个常量类型为类的方法引用表。其结构如下:

也就是说,0A之后的两个直接是指向该方法所属类,再紧跟的两个字节指向此方法的名称和类型。

0006:十进制为6,表示指向常量池中的第6个常量;

000F:十进制为15,表示指向常量池中的第 15 个常量。

至此,第一个常量解读完毕!

第二个常量:

09转化为十进制为9,即tag = 9,表示是字段引用表 CONSTANT_Fieldref_info,其结构如下:

同理,

0010:指向常量池中第 16 个常量,0011指向常量池中第17个常量。

至此,我们已经解析了常量池中的2个常量,剩下的26个常量也是如此。

4. 访问标志

紧跟在常量池之后的常量是访问标志,占用两个字节。访问标志代表类或者接口的访问信息。比如:该 class 文件是类还是接口,是否被定义成 public,是否是 abstract,如果是类,是否被声明成 final 等。各种访问标志如下图所示:

我们定义的 test.java 是一个普通 Java 类,不是接口、枚举或注解,并且被 public 修饰但没有被声明为 final 和 abstract,因此它所对应的 access_flags 为 0021(0X0001 和 0X0020相结合)。

5. 类索引、父类索引和接口索引计时器

访问标志后的2个字节就是类索引,类索引后的2个字节就是父类索引,父类索引后的2个字节则是接口索引计数器。如下图所示:

 综上所述,我们可以得出当前类为 Test继承自 Object 类,并实现了 “Serializable”和“Cloneable”这两个接口。 

6. 字段表

紧跟在接口索引集合后面的就是字段表,字段表的主要功能是用来描述类或者接口中声明的变量。这里的字段包含了类级别变量以及实例变量,但不包含方法中的局部变量。其具体结构如下:

字段访问标志

其中,第7和8个常量就 num 和 i。因此可以得出,类中有一个为num,类型为 int  的变量。

7. 方法表

字段之后跟着的就是方法表常量,方法表常量应该也是以一个计数器开始的,因为一个类中的方法数量是不固定的。

上图表示 test.class中有两个方法,但是我们只在 test.java 中声明了一个 add 方法,因为默认构造器方法也被包含在方法表常量中。方法表结构如下:

访问标志

8. 属性表

在之前解析字段和方法的时候,在它们的具体结构中,都能看到有一个叫做 attributes_info 的表,这就是属性表。属性表没有一个固定结构,各种不同的属性只要满足以下结构即可:

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1063364.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【设计模式】访问者模式

文章目录 1.访问者模式定义2.访问者模式的角色3.访问者模式实战案例3.1.场景说明3.2.UML类图3.3.代码实现 4.访问者模式优缺点5.访问者模式适用场景6.访问者模式总结 主页传送门:💁 传送 1.访问者模式定义 访问者模式(Visitor Pattern&#x…

【MATLAB源码-第43期】基于matlab的turbo码误码率仿真比较不同迭代次数,采用logmap/sova算法。

操作环境: MATLAB 2022a 1、算法描述 Turbo码是一种前向纠错码 (Forward Error Correction, FEC),在 1993 年由法国的两位研究员 Claude Berrou 和 Alain Glavieux 提出。这种编码技术以其接近 Shannon 极限的高性能而受到广泛关注。以下是关于 Turbo…

黑马JVM总结(二十六)

(1)异常-catch 下面看一下字节码里面怎么做异常的处理 (2)异常-多个catch astore_2:就是把异常对象的地址存到局部变量表2号曹位上 (3)异常-multicatch (4)异常-finally &#xff0…

uniapp 实现地图头像上的水波纹效果

最近实现了uniapp 地图头像水波纹的效果,话不多说,先来看看视频效果吧:链接 在这里具体的代码就不放出来了,还是利用了uniapp的 uni.createAnimation 方法,因为cover-view 不支持一些css 的动画效果,所以这…

探秘布隆过滤器:高效数据查找与去重利器

探秘布隆过滤器:高效数据查找与去重利器 引言 在现代计算机科学中,数据的查找与去重是一个至关重要的问题。本文将介绍一种高效的数据结构——布隆过滤器,它能够在海量数据中快速判断某个元素是否存在,同时具有出色的空间效率。…

动态调整系统主题色(4): CssVar 与 Variant 方案的探索

动态调整系统主题色(4): CssVar 与 Variant 方案的探索 动态调整系统主题色(4): CssVar 与 Variant 方案的探索 前言方案的介绍与比较 CssVar (CSS 变量方案)CSS 变量方案与 tailwindcss 的结合Variant 方案 2种方案在小程序上的示例之前的几篇 前言 这篇已经是动态调整系统…

深度学习模型部署与优化:策略与实践;L40S与A100、H100的对比分析

★深度学习、机器学习、生成式AI、深度神经网络、抽象学习、Seq2Seq、VAE、GAN、GPT、BERT、预训练语言模型、Transformer、ChatGPT、GenAI、多模态大模型、视觉大模型、TensorFlow、PyTorch、Batchnorm、Scale、Crop算子、L40S、A100、H100、A800、H800 随着生成式AI应用的迅猛…

python打开浏览器并模拟搜索

打开已存在的浏览器 打开已存在的浏览器有个很重要的作用就是,可以对于一些登录场景,提前登录好,不需要模拟登录了。 在命令行中执行打开chrome的命令,在图标上找到chrome的安装位置 在cmd命令行下执行命令 C:\Program Files\…

工厂管理软件中的计划排产是什么

一、计划排产的定义: 计划排产是指根据工厂的生产能力、订单需求和资源限制等因素,合理安排生产任务和时间,以实现高效的生产计划。它涉及到生产订单的分配、生产线的调度和资源的优化利用,旨在提高生产效率、缩短交货时间和降低…

高速公路堵车动力学

S/t trace 图可以分析牛顿力学时间序列的一切。 下例分析了当车距太小时,一个轻微的刹车扰动如何触发大堵车的: 堵车由以下因素促成: 刹车反应时间,刹车反应很快,看见灯即可,即使这样越往后刹车必须越狠&…

对于对象初始化的加深理解

一道有一定难度和挑战性的注重细节的有趣的面试题 目录 案例需求不同写法与角度下写法一写法二写法三写法四A类B类测试类 注参考视频 案例需求 不同写法与角度下 写法一 注:方法的修饰符为private package com.xie.interview;/*** 对象属性初始化相关的面试笔试题*…

Stable diffusion的架构解读(本博客还是以unet架构为主)

博客只是简单的记录一下自己学的,基于自己的一些情况,所以简单了一些只是将来忘记,用来回顾用。 论文的大体框架 unet结构位于 unet会接受prompt特征、latent特征、和t时间步特征,最后生成新一轮的特征 可以参考知乎大佬htt…

re学习(37)DASCTF 2023 0X401七月暑期挑战赛 controflow

程序通过改变栈里面的返回地址来控制程序的控制流 从而达到混淆的效果 左侧有许多被hook的函数 在每个函数开头设置断点 然后观察程序的运行流程 会发现输入的数据会进行 异或 相加 异或 相减 相乘 异或等操作 要注意部分运算的索引是 从[10]开始的 具体思路参考&#xf…

三十、【进阶】B-Trees的演变过程

1、索引结构 (1)二叉树 (2)B-Tree树 B-Tree树最大度数为5,代表每一个节点最多存储4个key(每个节点最多存储4个数据),5个指针(可以指向5个子节点)。 2、演变过程(最大度数为5) &…

gorm 自定义时间、字符串数组类型

文章目录 自定义时间类型自定义字符串数组测试与完整代码测试代码测试结果 GORM 是GO语言中一款强大友好的ORM框架,但在使用过程中内置的数据类型不能满足以下两个需求,如下: time.Time类型返回的是 2023-10-03T09:12:08.5352808:00这种字符串…

基于Java的家政公司服务平台设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

在windows 10 里安装并设置了gvim 9.0

在windows 10 里安装并设置了gvim 9.0 。由于电脑里有联想软件商店,搜索vim,找到gvim 9.0 ,顺利安装了该软件。安装好以后,打开该软件,界面背景是白色,字体小。因此在网上搜索:设置gvim背景&…

Docker 的数据管理与Docker 镜像的创建

------------------Docker 的数据管理--------------------- 管理 Docker 容器中数据主要有两种方式:数据卷(Data Volumes)和数据卷容器(DataVolumes Containers)。 1.数据卷 数据卷是一个供容器使用的特殊…

FM5888协议系列-USB充电控制器 移动电源应用

产品描述: FM5888是一款USB快速充电控制IC,符合USB电池充电规范1.2版本,允许充电装置吸取的电流类似于使用原装充电器。FM5888可自动识别充电设备类型,支持多种智能手机,并通过对应的USB充电协议与设备握手&#xff0c…

Video Caption / 视频字幕:数据集总结

目录 一、背景 二、介绍 2.1 MSR-VTT 2.2 MSVD 2.3 VATEX 三、参考文献 一、背景 Video Caption / 视频字幕:常用指标(BELU-4,ROUGE-L,METEOR,CIDEr,SPICE)和数据集总结-CSDN博客Video C…