字节码插桩:从分析class文件结构开始

news2024/9/24 19:15:56

作者:小马快跑

Class字节码

Java 能做到 一次编译,到处运行,主要就是靠 class字节码 文件,也就是 java 文件经过编译之后 .java -> .class,然后再被 JVM 虚拟机加载。其实,不仅是 java 语言,只要是符合规则的 class 字节码文件,都可以被 JVM 加载,如 Grooy、Kolin 语言:

有了 class 字节码,也就解除了 VM虚拟机编程语言之间的耦合性。不管什么语言,只要是能编译成符合规则的字节码文件,就可以被 VM虚拟机 识别并加载到内存中

class字节码构成

class字节码 中由无符号数两种数据结构组成。如:

  • 无符号数:基本数据类型,u1、u2、u4、u8分别表示1、2、4、8个字节的无符号数,无符号数可以用来表示数字、索引引用、数量只或者字符串(UTF-8编码)。
  • 表:由多个无符号数或者其他表作为数据项构成的复合数据类型,class文件中所有的表都以“_info”结尾。所以,整个 Class 文件可以认为就是一张表。

示例:

package org.ninetripods.lib_bytecode.asm.coreApi;

public class Test {
    private int num = 0;

    public void addNum() {
        num++;
        System.out.println("num:" + num);
    }

    public static int staticAdd(int a, int b) {
        return a + b;
    }
}

经过javac 编译之后,会生成Test.class字节码文件,用010 Editor打开这个文件:

上述的字节码看上去有点乱,但其实是按顺序排列的,整理信息如下:

如我们常见的字节码文件都是以CAFEBABE开头,表示VM虚拟机要加载的是class字节码;紧跟着的0000表示的主副版本,再往后面的0037,用十进制表示为55,对应JDK 11等等。

继续使用 javap -c xxx.class命令可以 输出分解后的 java字节码

上述文件中描述了Test.class加载到内存时的执行顺序,包括各种描述符及操作码,接下面就来看一看它们。

类型描述符

基本类型描述符

每个基本类型都对应一个字母,如下:

基本类型描述符
byteB
shortS
intI
longJ
floatF
doubleD
charC
booleanZ
voidV

非数组的引用类型

使用L + 全限定名表示,示例:String -> Ljava/lang/String;

注:全限定名用于描述class类的名称,实际上就是把平时Java类名称中的"."换成了"/",如Java的祖先类java.lang.Object全限定名是:java/lang/Object

数组引用类型

使用[ + 数组内类型的描述符表示,示例:

int[] -> [I
String[][] -> [[Ljava/lang/String;

方法描述符

方法描述符用于class字节码文件中保存参数类型列表和返回值的方式。 方法描述符规则:

  • (参数列表)+ 返回值
  • 参数类型都为类型描述符
  • 参数列表中如果有多个参数,直接排列即可,不需要用逗号隔开

示例:

void test() -> ()V
void test(int i) -> (I)V
void test(String s, int i) -> (Ljava/lang/StringI)V

int[] test(double[], boolean) -> ([DZ)[I复制代码

OpCode操作码指令

OpCode用于VM虚拟机解释运行Java程序,每个操作码都可以用来表示一个指令。如0x62是一个十六进制数,表示两个float类型的数相加。在ASMorg.objectweb.asm.OpCodes类中可以找到: int FADD = 98ASM中是用十进制表示的,除此之外,其他操作码指令都可以在这个类中找到。

类操作码

  • new 创建对象时使用,如new String()对应 mv.visitTypeInsn(NEW, "java/lang/String") ,返回一个指定类型的对象。
  • instanceof 表示是否为指定类的对象,如 obj instanceof String 对应 mv.visitTypeInsn(INSTANCEOF, "java/lang/String"),返回一个布尔值结果。
  • checkcast ,用于检查对象的类型,如 (String) obji 对应 mv.visitTypeInsn(CHECKCAST, "java/lang/String"),返回类型检查后的对象。

注:上述的mv指的是MethodVisitorASM Core Api中的类,后面的文章会详细介绍),主要用于操作遍历、修改方法时使用。

字段操作码

  • getfield 用于获取非静态字段的值,对应ASM中的GETFIELD,如mv.visitFieldInsn(GETFIELD, xxxx)
  • putfield 用于修改非静态字段的值,对应ASM中的PUTFIELD,如mv.visitFieldInsn(PUTFIELD, xxxx)
  • getstatic 用于获取静态字段的值,对应ASM中的GETSTATIC,如mv.visitFieldInsn(GETSTATIC, xxxx)
  • putstatic 用于修改静态字段的值,对应ASM中的PUTSTATIC,如mv.visitFieldInsn(PUTSTATIC, xxxx)

方法操作码

  • invokevirtual 用于调用非静态方法,它是一种动态分派的调用指令,即引用类型并不能决定方法属于哪个类型。一般可以被重写的方法就用invokevirtual
  • invokespecial 用于调用非静态方法,主要用于<init>方法、私有方法、super.method()。因为这三类方法的调用对象在编译时就可以确定。调用方式如mv.visitMethodInsn(INVOKESPECIAL, "java/lang/Object", "equals", "(Ljava/lang/Object;)Z", false);
  • invokestatic 用于调用 static 静态方法。
  • invokeinterface 用于调用接口实例方法,如mv.visitMethodInsn(INVOKEINTERFACE, "java/util/List", "size", "()I", true);
  • invokedynamic 用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。

加载、存储等操作

虚拟机栈: 虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。 每一个栈帧中又包含了以下信息:

  • 局部变量表:表长度在编译阶段确定。调用方法时传递的参数,以及在方法内部创建的局部变量都保存在局部变量表中。
  • 操作数栈:也称为操作栈,是一个后入先出栈(LIFO),操作数栈的深度也是在编译阶段确定。当一个方法刚开始执行时,这个方法的操作数栈是空的,在方法执行过程中,会有各种字节码指令被压入和弹出操作数栈。
  • 动态链接:主要是为了支持方法调用过程中的动态连接。比如在一个方法中去调用其他方法。
  • 返回地址:用来帮助当前方法恢复它的上层方法执行状态。

下面的加载、存储相关操作都与操作数栈、局部变量表有关。通常程序需要将局部变量表的数据加载到操作数栈中,计算结束后再将结果存入局部变量表中

  • xload & xload_n (x = a/i/l/f/d, n表示加载对象的位置)

a 表示对象,I表示int, l表示long, f表示float, d表示double, b表示byte, c表示char, s表示short。 加载字节码,如aload_0,对应ASM中的mv.visitVarInsn(ALOAD, 0);

  • xstore & xstore_n (x = a/i/l/f/d,n表示加载对象的位置)

a 表示对象,I表示int, l表示long, f表示float, d表示double, b表示byte, c表示char, s表示short。 存储对象,如astore_1,对应ASM中的mv.visitVarInsn(ISTORE, 1);

  • xreturn (x = a/i/l/f/d) 返回操作码 返回操作码会将栈顶元素返回(返回某一对象或基本数据类型),并清空操作数栈。如:

mv.visitInsn(ARETURN); //对应某一对象(非基本类型) mv.visitInsn(RETURN); //无返回,对应void方法

  • dup 复制栈顶数据的操作码 用于复制栈顶元素并插入到栈中的操作码,可以节省xloadxstore的使用量。对应ASM中的DUPmv.visitInsn(DUP);DUP后紧接着的数字代表了复制数量,Xn代表插入到栈顶下第几层。如:
1、 DUP
输入:d3 d2 d1
输出:d3 d2 d1 d1

2、DUP2_X1
输入:d3 d2 d1
输出:d3 d2 d2 d1 d1
  • pop pop2 弹出栈顶操作码 用于栈操作的,比如调用了一个有返回值的方法,但是该返回值并不需要,可以使用POP。如:mv.visitInsn(POP)
  • swap 交换操作码 可以操作交换栈顶的两个操作数。
  • ldc & ldc_w & ldc2_w 读取常量池常量的操作码
  • bipush & sipush 整数常量操作码

bipush,属于byte范围(-128127) sipush,属于short范围(-3276832767) 对应ASM中: mv.visitIntInsn(BIPUSH, 100); mv.visitIntInsn(SIPUSH, 1000);

计算相关操作码

  • xneg、xadd、xsub、xmul 、xdiv、xrem、iinc(iinc_w) 分别为取反、加法、减法、乘法、除法、取余、自增操作法。
  • xand、xor、xxor、xshl、xshr、xushr 按位且、按位或、按位异或、按位左移、按位右移、按位无符号右移操作符。
  • x2f(x=i/l/d)、x2d(x=i/l/f)、x2i(x=d/l/f)、x2l (x=i/d/f)、i2x(x=b/c/s) 分别为转化为float、转换为double、转换为int、转换为longint转换为(b/c/s)的操作码。其中b/c/s的取值范围:byte(-128 ~ 127)、short(-32768 ~ 32767)和char(0 ~ 65535)

其他

  • monitorenter/monitorexit 尝试加锁的操作码,两个必须成对使用,作用与引用类型对象上。如mv.visitInsn(MONITORENTER); mv.visitInsn(MONITOREXIT); 注:如果使用的是ACC_SYNCHRONIZED尝试加锁,则不再需要手动对自身对象或类加锁,会自动加锁及释放锁。
  • athrow 用于将一个Throwable异常对象抛出,如mv.visitInsn(ATHROW);

示例

  • new String(“Hello”)
 methodVisitor.visitTypeInsn(NEW, "java/lang/String");
 methodVisitor.visitInsn(DUP);
 methodVisitor.visitLdcInsn("Hello"); //将入参Hello放到操作数栈中,下面调用构造方法时传入
 methodVisitor.visitMethodInsn(INVOKESPECIAL, "java/lang/String", "<init>", "(Ljava/lang/String;)V", false);

注意,NEW操作码指令只会创建对象,不会调用构造函数;如果想调用构造函数进行初始化,须用上面INVOKESPECIAL指令。


为了帮助到大家更好的了解Android Framework框架中的知识点,这边查阅大量的素材,整理了一下的 Android Framework 核心知识点手册,里面记录了:有Handler、Binder、AMS、WMS、PMS、事件分发机制、UI绘制……等等,几乎把更Framework相关的知识点全都记录在册了

《Framework 核心知识点汇总手册》:https://qr18.cn/AQpN4J

Handler 机制实现原理部分:
1.宏观理论分析与Message源码分析
2.MessageQueue的源码分析
3.Looper的源码分析
4.handler的源码分析
5.总结

Binder 原理:
1.学习Binder前必须要了解的知识点
2.ServiceManager中的Binder机制
3.系统服务的注册过程
4.ServiceManager的启动过程
5.系统服务的获取过程
6.Java Binder的初始化
7.Java Binder中系统服务的注册过程

Zygote :

  1. Android系统的启动过程及Zygote的启动过程
  2. 应用进程的启动过程

AMS源码分析 :

  1. Activity生命周期管理
  2. onActivityResult执行过程
  3. AMS中Activity栈管理详解

深入PMS源码:

1.PMS的启动过程和执行流程
2.APK的安装和卸载源码分析
3.PMS中intent-filter的匹配架构

WMS:
1.WMS的诞生
2.WMS的重要成员和Window的添加过程
3.Window的删除过程

《Android Framework学习手册》:https://qr18.cn/AQpN4J

  1. 开机Init 进程
  2. 开机启动 Zygote 进程
  3. 开机启动 SystemServer 进程
  4. Binder 驱动
  5. AMS 的启动过程
  6. PMS 的启动过程
  7. Launcher 的启动过程
  8. Android 四大组件
  9. Android 系统服务 - Input 事件的分发过程
  10. Android 底层渲染 - 屏幕刷新机制源码分析
  11. Android 源码分析实战

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/439656.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每日做题总结——day02

目录 字符串处理函数&#xff0c;strcpy&#xff0c;strcat 数组指针 函数缺省值 初始化列表​编辑 友元函数 new与delete 静态成员变量 new与构造函数 delete与析构函数 拷贝构造函数的特点 常成员函数 初始化列表 编程题 字符串中找出连续最长的数字串 数组中超过…

字节的面试,你能扛住几道?

C &#xff0c; Python 哪一个更快&#xff1f; 读者答&#xff1a;这个我不知道从哪方面说&#xff0c;就是 C 的话&#xff0c;它其实能够提供开发者非常多的权限&#xff0c;就是说它能涉及到一些操作系统级别的一些操作&#xff0c;速度应该挺快。然后 Python 实现功能还…

从数据到应用 Web3不再纸上谈兵

继宣布拨款5000万港元加速推动Web3生态圈发展后&#xff0c;香港再次明确对Web3产业创新的支持。近日&#xff0c;香港Web3协会正式成立&#xff0c;创立Web3Hub基金&#xff0c;“东方之珠”正在大力推进第三代互联网的生态建设。 不仅仅是政策红利&#xff0c;ChatGPT等人工…

Web服务器配置(Tomcat)【Centos】

Tomcat 是一个轻量化服务器&#xff0c;理论上支持 20,000 个用户 LNMP&#xff1a;Linux Nginx MySQL LTMP&#xff1a;Linux Tomcat MySQL 1.Apache Tomcat 从版本7开始&#xff0c;若仅仅只需要部署HTML静态页面&#xff0c;Apache就可以完全够用 查看Apache是否安装 rpm -…

Ajax的特性以及用法

一、什么是Ajax 1、jQuery的Ajax ①&#xff1a;get方法​编辑 ②&#xff1a;post方法 ③&#xff1a;Ajax&#xff08;这个重要&#xff0c;jQuery的ajax最常用&#xff09; PS&#xff1a;一定要注意&#xff0c;数据类型是 json &#xff01;&#xff01;&#xff01; …

google breakpad中minidump_stackwalk的编译(Windows)

接上一篇的内容&#xff1a; breakpad编译指南&#xff08;Windows&#xff09;_我的胖是因为太膨胀的博客-CSDN博客 1、获取 googletest 放进 breakpad/src 目录下&#xff0c;并把目录名重命名为testing git clone https://github.com/google/googletest.git 如下图 2、把…

ROS2安装教程(virtualbox7.0.6+ROS2)

整个过程分两步&#xff1a;先安装Virtualbox&#xff0c;再安装ROS2 一、安装virtualbox7.0.6 网址&#xff1a;https://www.virtualbox.org/wiki/Downloads 问题1 安装时报错&#xff1a;缺少python core 、win32api依赖&#xff08;下图网上拷贝的图&#xff0c;版本忽略…

这份完整WhatsApp营销方案请收好!

WhatsApp是什么&#xff1f; WhatsApp是一种跨平台的即时通讯应用程序&#xff0c;可以在手机、平板电脑和电脑上使用。它允许用户发送文字消息、语音消息、图片、视频和文件等内容&#xff0c;同时还可以进行语音通话和视频通话。 WhatsApp拥有多种功能&#xff0c;包括但不…

Windows下通过CMake编译hiredis及应用

1、 在下载的redis-6.2.12.tar.gz的压缩包中&#xff0c;解压后有个deps文件夹&#xff0c;里面有个hiredis文件夹&#xff0c;是我们访问redis的C接口&#xff0c;需要我们手动编译后才能使用。&#xff08;redis: https://redis.io/download/&#xff09; 2、打开CMake软件&…

日本PSE认证日本的電気用品安全法METI备案

日本的電気用品安全法&#xff08;PSE认证&#xff09;法规要求日本的采购商在购进商品后一个月内必须向日本METI注册申报&#xff0c;并必须将采购商名称或ID标在产品上&#xff0c;以便在今后产品销售过程中进行监督管理&#xff0c;完成后将获得電気用品製造事業届出書&…

全球化背景下,如何利用内容营销促进跨境电商业务增长

随着全球跨境电商市场的迅速发展&#xff0c;越来越多的企业开始将注意力转向跨境电商。然而&#xff0c;随着竞争的激烈化&#xff0c;企业不再能够仅仅依靠产品本身来吸引消费者的注意。因此&#xff0c;内容营销成为了跨境电商企业在吸引、留住消费者方面的关键。在这篇文章…

【Spring】— Spring AOP

目录 一、Spring AOP简介1.什么是AOP2.AOP术语 二、AspectJ开发1.基于XML的声明式AspectJ1.1 配置切面1.2 配置切入点1.3 配置通知 2.基于注解的声明式AspectJ 一、Spring AOP简介 1.什么是AOP AOP的全称是Aspect-Oriented Programming&#xff0c;即面向切面编程&#xff08;…

芴甲氧羰酰基-氨基-聚乙二醇-巯基吡啶Fmoc-NH-PEG-OPSS

修饰性PEG芴甲氧羰基-氨基-聚乙二醇-巯基吡啶Fmoc-NH-PEG-OPSS是保护氨基的PEG衍生物之一 结构式&#xff1a; 芴甲氧羰酰基-氨基-聚乙二醇-巯基吡啶Fmoc-NH-PEG-OPSS聚乙二醇化可以提高聚乙二醇分子的稳定性&#xff0c;降低其免疫原性&#xff0c;仅用于科研实验。 FMOC-NH…

骨传导风靡蓝牙耳机市场 AI赋能有望打破行业技术桎梏

一、骨传导耳机行业概述 骨传导耳机是运用骨传导技术应用制造的耳机&#xff0c;听到的大部分声音都是声波经过空气到达骨膜振动进而将声音传入内耳&#xff0c;另一种方式是声波通过骨震动可以直接传至内耳。骨传导耳机可分为骨传导扬声器技术应用耳机、骨传导麦克风技术应用…

关于比较中设置极大值,常设置的0x3f3f3f3f

无穷大常量 int型变量的取值范围&#xff1a;[-2^31, 2^31 - 1] -> [-2147483648, 2147483647] 0x7fffffff 2147483647 (2^31 - 1) (1 << 31) - 1 0x3fffffff 1073741823 (2^30 - 1) (1 << 30) - 1 0x3f3f…

产品经理必读 | 俞军产品经理十二条军规

最近在学习《俞军产品方法论》&#xff0c;觉得俞军总结的十二条产品经理原则非常受用&#xff0c;分享给大家。 01. 产品经理首先是产品的深度用户 自己设计的产品都没使用过的产品经理&#xff0c;如何明白用户使用的问题&#xff0c;如何解决问题&#xff0c;所以产品经理肯…

java版工程项目管理系统源代码-功能清单 图文解析

Java版工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离 功能清单如下&#xff1a; 首页 工作台&#xff1a;待办工作、消息通知、预警信息&#xff0c;点击可进入相应的列表 项目进度图表&#xff1a;选择&#xff08;总体或单个&#xff09;项目显示…

工信部第369批新品公示冷藏车占比显著提升,新能源“卡位战”已悄然打响

一、冷藏车行业概述 随着货物储运的种类不断增多&#xff0c;有些货物在储运过程中易受到外界温度、湿度等条件影响而发生腐烂变质。为了保持易腐货物的本来品质和使用价值&#xff0c;在运输途中不发生腐烂变质和数量上的短缺&#xff0c;提高货物运输的安全性&#xff0c;减…

​windows通过修改路由表,通过特定的网卡访问特定IP​

windows通过修改路由表&#xff0c;通过特定的网卡访问特定IP 方式&#xff1a;修改路由表&#xff0c;指定的IP网段走指定的无线网卡。 步骤1&#xff1a;查看无线网卡的网关信息。终端里输入ipconfig&#xff0c;找到无线网卡对应的网关信息&#xff1b;这里是192.168.44.1…

深度学习训练营Resnet之鸟类识别

深度学习训练营之鸟类识别 原文链接理论知识储备为什么会提出ResNetResNet 环境介绍前置工作设置GPU导入数据并进行查找 数据处理可视化数据配置数据集 残差网络的介绍构建残差网络模型训练开始编译 结果可视化训练样本和测试样本预测 原文链接 &#x1f368; 本文为&#x1f5…