一、字节码与指令概述
package ch13_bytecode;
public class HelloWorld {
public static void main(String[] args) {
System.out.println("hello world");
}
}
生成字节码:
cafe babe 0000 0031 0022 0a00 0600 1409
0015 0016 0800 170a 0018 0019 0700 1a07
001b 0100 063c 696e 6974 3e01 0003 2829
5601 0004 436f 6465 0100 0f4c 696e 654e
756d 6265 7254 6162 6c65 0100 124c 6f63
616c 5661 7269 6162 6c65 5461 626c 6501
0004 7468 6973 0100 1a4c 6368 3133 5f62
7974 6563 6f64 652f 4865 6c6c 6f57 6f72
6c64 3b01 0004 6d61 696e 0100 1628 5b4c
6a61 7661 2f6c 616e 672f 5374 7269 6e67
3b29 5601 0004 6172 6773 0100 135b 4c6a
6176 612f 6c61 6e67 2f53 7472 696e 673b
0100 0a53 6f75 7263 6546 696c 6501 000f
4865 6c6c 6f57 6f72 6c64 2e6a 6176 610c
0007 0008 0700 1c0c 001d 001e 0100 0b68
656c 6c6f 2077 6f72 6c64 0700 1f0c 0020
0021 0100 1863 6831 335f 6279 7465 636f
6465 2f48 656c 6c6f 576f 726c 6401 0010
6a61 7661 2f6c 616e 672f 4f62 6a65 6374
0100 106a 6176 612f 6c61 6e67 2f53 7973
7465 6d01 0003 6f75 7401 0015 4c6a 6176
612f 696f 2f50 7269 6e74 5374 7265 616d
3b01 0013 6a61 7661 2f69 6f2f 5072 696e
7453 7472 6561 6d01 0007 7072 696e 746c
6e01 0015 284c 6a61 7661 2f6c 616e 672f
5374 7269 6e67 3b29 5600 2100 0500 0600
0000 0000 0200 0100 0700 0800 0100 0900
0000 2f00 0100 0100 0000 052a b700 01b1
0000 0002 000a 0000 0006 0001 0000 0003
000b 0000 000c 0001 0000 0005 000c 000d
0000 0009 000e 000f 0001 0009 0000 0037
0002 0001 0000 0009 b200 0212 03b6 0004
b100 0000 0200 0a00 0000 0a00 0200 0000
0500 0800 0600 0b00 0000 0c00 0100 0000
0900 1000 1100 0000 0100 1200 0000 0200
13
解释:
cafe babe - 魔数
0000 0031 - 版本号,前面大版本,后面小版本
0022 - 常量池大小
二、JVM编译基本原理
示例:
package main.java.ch13_bytecode;
import com.sun.tools.javac.parser.Scanner;
import com.sun.tools.javac.parser.ScannerFactory;
import com.sun.tools.javac.util.Context;
//词法分析案例
public class LexicalAnalyzeTest {
public static void main(String[] args) {
ScannerFactory factory = ScannerFactory.instance(new Context());
Scanner scanner = factory.newScanner("int m=i+j;", false);
scanner.nextToken();
System.out.println(scanner.token().kind);
scanner.nextToken();
System.out.println(scanner.token().name());
scanner.nextToken();
System.out.println(scanner.token().kind);
scanner.nextToken();
System.out.println(scanner.token().name());
scanner.nextToken();
System.out.println(scanner.token().kind);
scanner.nextToken();
System.out.println(scanner.token().name());
System.out.println(scanner.token().kind);
scanner.nextToken();
}
}
大白话:
符号解析: int x = 5 -> int 类型的字段 x值为5 以及作用域
大白话:
处理注解以及引入(@autowired)等
大白话:
类层面的语义合法性检查。
大白话:
针对方法内部语法语义合法性检查。
大白话:
第六步,去掉高级用法(比如lambda、switch-case等高级特性),转为最基本用法。
三、字节码解析上-魔数、版本和常量池解析原理
package ch13_bytecode;
public class HelloWorld {
public static void main(String[] args) {
System.out.println("hello world");
}
}
cafe babe 0000 0031 0022 0a00 0600 1409
0015 0016 0800 170a 0018 0019 0700 1a07
001b 0100 063c 696e 6974 3e01 0003 2829
5601 0004 436f 6465 0100 0f4c 696e 654e
756d 6265 7254 6162 6c65 0100 124c 6f63
616c 5661 7269 6162 6c65 5461 626c 6501
0004 7468 6973 0100 1a4c 6368 3133 5f62
7974 6563 6f64 652f 4865 6c6c 6f57 6f72
6c64 3b01 0004 6d61 696e 0100 1628 5b4c
6a61 7661 2f6c 616e 672f 5374 7269 6e67
3b29 5601 0004 6172 6773 0100 135b 4c6a
6176 612f 6c61 6e67 2f53 7472 696e 673b
0100 0a53 6f75 7263 6546 696c 6501 000f
4865 6c6c 6f57 6f72 6c64 2e6a 6176 610c
0007 0008 0700 1c0c 001d 001e 0100 0b68
656c 6c6f 2077 6f72 6c64 0700 1f0c 0020
0021 0100 1863 6831 335f 6279 7465 636f
6465 2f48 656c 6c6f 576f 726c 6401 0010
6a61 7661 2f6c 616e 672f 4f62 6a65 6374
0100 106a 6176 612f 6c61 6e67 2f53 7973
7465 6d01 0003 6f75 7401 0015 4c6a 6176
612f 696f 2f50 7269 6e74 5374 7265 616d
3b01 0013 6a61 7661 2f69 6f2f 5072 696e
7453 7472 6561 6d01 0007 7072 696e 746c
6e01 0015 284c 6a61 7661 2f6c 616e 672f
5374 7269 6e67 3b29 5600 2100 0500 0600
0000 0000 0200 0100 0700 0800 0100 0900
0000 2f00 0100 0100 0000 052a b700 01b1
0000 0002 000a 0000 0006 0001 0000 0003
000b 0000 000c 0001 0000 0005 000c 000d
0000 0009 000e 000f 0001 0009 0000 0037
0002 0001 0000 0009 b200 0212 03b6 0004
b100 0000 0200 0a00 0000 0a00 0200 0000
0500 0800 0600 0b00 0000 0c00 0100 0000
0900 1000 1100 0000 0100 1200 0000 0200
13
大白话:
cafe babe - 魔数,即文件开始标志符;
0000 0031 - Java版本号,这里的31是16进制大版本号,转换后十进制49,前面4个字节 是小版本,后面是大版本。
大白话:
u4 magic - 魔数 4个字节
u2 minor_version - 小版本,2个字节
u2 major_version - 大版本, 2个字节
u2 constant_pool_count - 常量池大小,2个字节
cp_info constant_pool - 常量池,长度为常量池大小-1
tag - 类型对应下图
如上图,tag是1个字节,值为0a, 转为十进制,值为10,对应CONSTANT_Methodref
通过代码看到,常量池第一个常量确实是Methodref,这是个初始化方法,一般情况下绝大部分常量池第一个都是这个
具体看tag的特征(属性),比如看Float
将Java代码修改如下,看能否在字节码中找到对应的值
解释:
CONSTANT_Utf8_Info - 真正的字符串
CONSTANT_String_info - 索引, 指向CONSTANT_Utf8_Info
补充:
其实上图的class类名,也是一个字符串,跟其他字符串保存方式相同,也是通过索引引用,具体见后面第四组。
四、字节码解析下-访问标记、字段、方法和属性解析原理
继续接上一节
u2 access_flags - public?private?...
比如:ACC_ENUM
ACC_ENUM - 对应0x4000, 数字4000的每个数字分别对应下图
其中在3的这4个位,对应4,4转为二进制是0100,1对应ACC_ENUM。
u2 this_class - 当前类
super_class指向CONSTANT_Class_info,指向常量池的索引,它提供了类的全限定名,如org/jamesdbloom/foo/Bar 作者:空气带糖 https://www.bilibili.com/read/cv14055954/ 出处:bilibili
u2 super_class - 父类
super_class同样指向CONSTANT_Class_info
u2 interface_count - 实现接口数量
u2 interfaces[interfaces_count] - 接口具体信息
u2 field_count - 字段或属性数量
field_info - 字段或属性具体信息
u2 methods_count - 方法数量
method_info methods[methods_count] - 对应具体方法具体信息
指向常量池存的接口的名字,接口信息
u2 attributes_count - 属性数量
attribute_info attributes[attributes_count] - 对应具体属性信息
https://www.cnblogs.com/yuluoxingkong/p/15394825.html
五、字节码指令初步以及加载存储指令
解释:
之所以对不同的值采用不用的指令,是为了让字节码更加紧凑。
iconst_n - 只占一个字节
bipush_n - 占两个字节
sipush_n - 占三个字节
六、控制转移指令
解释:
tableswitch、lookupswitch区别:
case的值相对有序的话,虚拟机会采用tableswitch,查找效率会更高一些,如果是无序的case的值差异比较大,虚拟机会老老实实使用lookupswith。
三目运算符
七、对象创建指令
解释:
Java代码里边的new - 告诉JVM我要创建一个对象了;
字节码中的new - 创建指令,dup指令(复制栈顶数值并将复制值压入栈顶),后面调用invokespecial指令,调用父方法、实例初始化方法、私有方法。
指令参考:https://www.cnblogs.com/yuluoxingkong/p/15394825.html
八、方法调用与lambda表达式基本原理screenflow
大白话:
调用静态方法 - invokestatic指令
调用私有方法、构造方法、super调用的父类方法 - invokespecial指令
调用普通方法 - invokevirtual指令
调用接口方法 - invokeinterface指令
调用动态方法(如lamdba、动态语音编译的字节码)- invokedynamic指令
大白话:
调用动态方法(如lamdba、动态语音编译的字节码),会有至少两步,第一步,先将语法糖还原成invokedynamic指令,第二步再根据具体方法类型,调用具体指令。
九、synchronized指令
大白话:
每个线程在执行的时候,先看能不能抢到锁,不能抢到锁等到,抢到锁,执行monitorenter指令,代码执行完后,再执行monitorexit指令退出,其他线程继续抢锁,抢到后继续执行这2个指令,如此往复。
这里严格来说,应该通过多线程来演示,这里简单写一下,
使用synchronized关键字,表示方式有两种:
如果synchronized加在方法上,flags会多个ACC_SYNCHRONIZED;
如果synchronized加在代码段上,