文章目录
- 3. 方法调用
- 3.1 解析
- 3.2 分派
接着深入理解java虚拟机:虚拟机字节码执行引擎(1),我们继续往下看:
3. 方法调用
方法调用并不等同于方法执行,方法调用阶段唯一的任务就是确定被调用方法的版本(即调用哪一个方法),暂时还不涉及方法内部的具体运行流程。在程序运行时,进行方法调用是最普遍、最频繁的操作,但前面已经讲过,Class文件的编译过程中 不包含传统编译中的连接步骤,一切方法调用在Class文件里面存储的都只是 符号引用,而不是方法在实际运行时内存布局中的 入口地址(相当于之前所说的直接引用)。这个特性给Java带来了更强大的动态扩展能力,但也使得Java方法的调用过程变得相对复杂起来,需要在类加载期间甚至到运行期间才能确定目标方法的直接引用。
3.1 解析
所有方法调用中的目标方法在Class文件里面都是一个 常量池中的符号引用,在类加载的解析阶段,会将其中的一部分符号引用转化为直接引用,这种解析能成立的前提是:方法在程序真正运行之前就有一个可确定的 调用版本,并且这个方法的调用版本在运行期是不可改变的。换句话说,调用目标在程序代码写好、编译器进行编译时就必须确定下来。这类方法的调用称为 解析(Resolution)。
在Java语言中,符合“编译期可知,运行期不可变”这个要求的方法主要有 静态方法 和 私有方法 两大类,前者与类型直接关联,后者在外部不可被访问,这两种方法都不能通过继承或者别的方式重写出其他版本,因此它们都适合在类加载阶段进行解析。
与之对应,在Java虚拟机里面提供了4条方法调用字节码指令,分别是
invokestatic
:调用静态方法invokespecial
:调用实例构造器<init>方法
、私有方法和父类方法invokevirtual
:调用所有虚方法invokeinterface
:调用接口方法,会在运行时再确定一个实现此接口的对象
只要能被invokestatic
和invokespecial
指令调用的方法,都可以在解析阶段 确定唯一的调用版本,符合这个条件的有 静态方法、私有方法、实例构造器 和 父类方法 四类,它们在类加载的时候就会把符号引用解析为该方法的直接引用。这些方法可以称为 非虚方法,与之相反,其他方法就称为虚方法(除去final方法,后文会提到)。下面验收一个最常见的解析调用例子,此样例中,静态方法sayHello()
只可能属于类型StaticResolution
,没有任何手段可以覆盖或隐藏这个方法。
/*
* 方法静态解析演示
*/
public class Test {
public static void sayHello(){
System.out.println("hello world");
}
public static void main(String[] args) {
Test.sayHello();
}
}
/*
javap -verbose Test
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: (0x0009) ACC_PUBLIC, ACC_STATIC
Code:
stack=0, locals=1, args_size=1
0: invokestatic #5 // Method sayHello:()V
3: return
LineNumberTable:
line 7: 0
line 8: 3
*/
使用javap
命令查看这段程序的字节码,会发现的确是通过invokestatic
命令来调用 sayHello() 方法的
Java中的非虚方法除了使用invokestatic
和invokespecial
调用的方法之外还有一种,就是被 final
修饰的方法。虽然final
方法是使用invokevirtual
指令来调用的,但是 由于它无法被覆盖,没有其他版本,所以也无须对方法接收者进行多态选择,又或者说多态选择的结果肯定是唯一的。在Java语言规范中明确说明了**final方法
是一种非虚方法**。
解析调用一定是个静态的过程,在编译期间就完全确定,在类装载的解析阶段就会把涉及的符号引用全部转变为可确定的直接引用,不会延迟到运行期再去完成。而分派(Dispatch)调用则可能是静态的也可能是动态的,根据分派依据的宗量数可分为单分派和多分派。这两类分派方式两两组合就构成了静态单分派、静态多分派、动态单分派、动态多分派四种分派情况,下面我们看看虚拟机中的方法分派是如何进行的。
3.2 分派
众所周知,Java是一门面向对象的程序设计语言,因为Java具备面向对象的三个基本特征:继承、封装和多态。本节讲解的分派调用过程将会揭示多态性特征的一些最基本的体现(如“重载”和“重写”),在Java中是如何实现的,这里的实现当然不是语法上该如何写,我们关心的依然是虚拟机如何确定正确的目标方法。
1. 静态分派
我们从一个例子出发:
public class StaticDispatch {
static abstract class Human{}
static class Man extends Human{}
static class Women extends Human{}
public void sayHello(Human guy){
System.out.println("hello guy");
}
public void sayHello(Man guy){
System.out.println("hello, gentleman");
}
public void sayHello(Women guy){
System.out.println("hello, lady");
}
public static void main(String[] args) {
Human man = new Man();
Human women = new Women();
StaticDispatch sd = new StaticDispatch();
sd.sayHello(man);
sd.sayHello(women);
}
}
/**
hello guy
hello guy
*/
首先解释一下什么叫 重载,或者说方法的重载,指的是一个类下面的 同名不同参 的一系列函数。上面代码为什么会选择执行参数类型为 Human 的重载呢?我们先按如下代码定义两个重要的概念:
Human man = new Man();
我们把上面代码中的“Human”称为变量的 静态类型(Static Type) 或者 外观类型(Apparent Type),后面的“Man”则称为变量的 实际类型(Actual Type),静态类型和实际类型在程序中都可以发生一些变化,区别是静态类型的变化仅仅在使用时发生,变量本身的静态类型不会被改变,并且最终的静态类型是在编译期可知的;而实际类型变化的结果在运行期才可确定,编译器在编译程序的时候并不知道一个对象的实际类型是什么。如下面的代码:
// 实际类型变化
Human man = new Man();
man = new Women();
// 静态类型变化
sd.sayHello((Man)man);
sd.sayHello((Women)man);
解释了这两个概念,再回到代码的样例代码中。main()
里面的两次sayHello()
方法调用,在方法接收者已经确定是对象“sd”的前提下,使用哪个重载版本,就完全取决于传入参数的数量和数据类型。代码中刻意地定义了两个静态类型相同、实际类型不同的变量,但虚拟机(准确地说是编译器)在重载时是通过参数的静态类型而不是实际类型作为判定依据的。并且 静态类型是编译期可知的,所以在编译阶段,Javac编译器就根据参数的静态类型决定使用哪个重载版本,所以选择了sayHello(Human)
作为调用目标,并把这个方法的符号引用写到main()
方法里的两条invokevirtual
指令的参数中。
所有依赖静态类型来定位方法执行版本的分派动作,都称为静态分派。静态分派的最典型应用就是 方法重载。静态分派发生在编译阶段,因此确定静态分派的动作实际上不是由虚拟机来执行的。另外,编译器虽然能确定出方法的重载版本,但在很多情况下这个重载版本并不是“唯一的”,往往只能确定一个“更加合适的”版本。
public class Test {
public static void sayHello(Object arg) {
System.out.println("hello object");
}
public static void sayHello(int arg) {
System.out.println("hello int");
}
public static void sayHello(long arg) {
System.out.println("hello long");
}
public static void sayHello(Character arg) {
System.out.println("hello Character");
}
public static void sayHello(char arg) {
System.out.println("hello char");
}
public static void sayHello(char... arg) {
System.out.println("hello char...");
}
public static void sayHello(Serializable arg) {
System.out.println("hello Serializable");
}
public static void main(String[] args) {
sayHello('a');
}
}
/*
hello char
*/
如果分别注释掉最近一次的输出方法,那么轮番输出是以下列形式呈现
/*
hello int
hello long
hello Character
hello Serializable
hello Object
hello char...
*/
按照上面的轮番注释,发现可见变长参数的重载优先级是最低的,这时候‘a'
被当做一个数组元素。当然还可以选择int类型、Character类型、Object类型等的变长参数重载来把上面的过程重新演示一遍。但是要注意的是,有一些在单个参数中能成立的自动转型,如char转型为int,在变长参数中是不成立的。
另外还有一点可能比较容易混淆:这里讲述的解析与分派这两者之间的关系并不是二选一的排他关系,它们是在不同层次上去筛选和确定目标方法的过程。例如,前面说过静态方法会在类加载期就进行解析,而静态方法显然也是可以拥有重载版本的,选择重载版本的过程是通过静态分派完成的。
2. 动态分派
了解了静态分派,我们接下来看一下动态分派的过程,它和多态性的另外一个重要体现 一 重写(Override) 有着很密切的关联,我们看下示例代码
/*
方法动态分派演示
*/
public class Test {
static abstract class Human{
protected abstract void sayHello();
}
static class Man extends Human{
@Override
protected void sayHello() {
System.out.println("man say hello");
}
}
static class Women extends Human{
@Override
protected void sayHello() {
System.out.println("women say hello");
}
}
public static void main(String[] args) {
Human man = new Man();
Human women = new Women();
man.sayHello();
women.sayHello();
man = new Women();
man.sayHello();
}
}
/*
man say hello
women say hello
women say hello
*/
通过结果我们可以看出来,这里不可能根据静态类型来决定,这里试通过实际类型来区分的,我们通过javap
来查看下字节码
javap -verbose Test
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: (0x0009) ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=3, args_size=1
0: new #2 // class Test$Man
3: dup
4: invokespecial #3 // Method Test$Man."<init>":()V
7: astore_1
8: new #4 // class Test$Women
11: dup
12: invokespecial #5 // Method Test$Women."<init>":()V
15: astore_2
16: aload_1
17: invokevirtual #6 // Method Test$Human.sayHello:()V
20: aload_2
21: invokevirtual #6 // Method Test$Human.sayHello:()V
24: new #4 // class Test$Women
27: dup
28: invokespecial #5 // Method Test$Women."<init>":()V
31: astore_1
32: aload_1
33: invokevirtual #6 // Method Test$Human.sayHello:()V
36: return
0~15行的字节码是准备动作,作用是建立man和women的内存空间、调用Man和Womn类型的实例构造器,将这两个实例的引用存放在第1和第2个局部变量表Slot之中,这个动作对应了代码中的这两句:
Human man = new Man();
Human women = new Women();
接下来的第16~21行是关键部分,第16和第20两行分别把刚刚创建的两个 对象的引用压到栈顶,这两个对象是将要执行的sayHello方法的所有者,称为 接收者(Receiver);第17和第21两行是方法调用指令,单从字节码的角度来看,这两条调用指令无论是指令(都是invokevirtual)还是参数(都是常量池中第22项的常量,注释显示了这个常量是Human.sayHello的符号引用)都完全一样,但是这两条指令最终执行的目标方法并不相同,其原因需要从invokevirtual
指令的多态查找过程开始说起,invokevirtual
指令的运行时解析过程大致分为以下步骤:
- 找到操作数栈顶的第一个元素所指向的对象的实际类型,记作C。
- 如果在类型C中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束:不通过则返回
java.lang.IllegalAccessError
异常。 - 否则,按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程。
- 如果始终没有找到合适的方法,则抛出
java.lang.AbstractMethodError
异常。
3. 单分派与多分派
方法的接收者与方法的参数统称为 方法的宗量,这个定义最早应该来源于《Java与模式》一书的译文。根据分派基于多少种宗量,可以将分派划分为单分派和多分派两种。单分派是根据一个宗量对目标方法进行选择,多分派则是根据多于一个的宗量对目标方法进行选择。
字面看起来不太直观,我们可以通过代码演示 “一个艰难的决定“ 来看这两个定义
/*
单分派,多分派的演示
*/
public class Test {
static class QQ{}
static class _360{}
public static class Father{
public void hardChoice(QQ arg){
System.out.println("father choose qq");
}
public void hardChoice(_360 arg){
System.out.println("father choose 360");
}
}
public static class Son extends Father{
public void hardChoice(QQ arg){
System.out.println("son choose qq");
}
public void hardChoice(_360 arg){
System.out.println("son choose 360");
}
}
public static void main(String[] args) {
Father father = new Father();
Father son = new Son();
father.hardChoice(new _360());
son.hardChoice(new QQ());
}
}
/**
father choose 360
son choose qq
*/
来看看编译阶段编译器的选择过程,即静态分派的过程。这时候选择目标方法的依据有两点:一是静态类型是Father还是Son,二是方法参数是QQ还是360。这次选择结果的最终产物是产生了两条invokevirtual
指令,两条指令的参数分别为常量池中指向Father.hardChoice(360)
及Father.hardChoice(QQ)
方法的符号引用。因为是 根据两个宗量进行选择,所以Java语言的静态分派属于多分派类型。
再看看运行阶段虚拟机的选择,即动态分派的过程。在执行son.hardChoice(newQQO)
这句代码时,更准确地说,在执行这句代码所对应的invokevirtual
指令时,由于编译期已经决定目标方法的签名必须为hardChoice(QQ),虚拟机此时不会关心传递过来的参数“QQ”到底是“腾讯QQ”还是“奇瑞QQ”,因为这时候参数的静态类型、实际类型都不会对方法的选择构成任何影响,唯一可以影响虚拟机选择的因素只有此方法的接收者的实际类型是Father还是Son。因为只有一个宗量作为选择依据,所以Java语言的动态分派属于单分派类型。
4. 虚拟机动态分派的实现
由于 动态分派是非常频繁的动作,而且动态分派的方法版本选择过程需要运行时在类的方法元数据中搜索合适的目标方法,因此在虚拟机的实际实现中基于性能的考虑,大部分实现都不会真的进行如此频繁的搜索。面对这种情况,最常用的“稳定优化”手段就是为类在方法区中建立一个 虚方法表(Virtual Method Table,也称为vtable,与此对应,在invokeinterface执行时也会用到接口方法表一Interface Method Table,简称itable),使用虚方法表索引来代替元数据查找以提高性能。我们先看看前面代码所对应的虚方法表结构示例: