JVM总体一张图:
整体上来看:类文件从类加载子系统,加载完成之后,主要存放在方法区(JRockit和H9没有方法区,这里指的是HotSpot)。运行时的数据主要是存放在运行时数据区,代码的解释编译优化以及垃圾收集,都是在执行引擎中。本地方法是指Native方法,也就是C/C++编写的方法。
类加载子系统
类文件首先需要经过类加载子系统,进行加载,进类信息等加载到运行时数据区。
在类加载子系统中有以下三个阶段操作:
-
加载
-
链接
-
初始化
其中加载的时候,有三种类加载器:
-
Bootstrap ClassLoader:引导类加载器,主要加载JDK里面的核心类
-
Extension ClassLoader:拓展类加载器
-
Application ClassLoader:应用加载器
而链接也分为3个阶段,主要是:
-
验证
-
链接
-
解析
运行时数据区
经过类加载子系统加载之后,进入运行时数据区,运行时区域主要分为:
-
线程私有:
-
程序计数器:
Program Count Register
,线程私有,没有垃圾回收 -
虚拟机栈:
VM Stack
,线程私有,没有垃圾回收 -
本地方法栈:
Native Method Stack
,线程私有,没有垃圾回收
-
-
线程共享:
-
方法区:
Method Area
,以HotSpot
为例,JDK1.8
后元空间取代方法区,有垃圾回收。 -
堆:
Heap
,垃圾回收最重要的地方。
-
虚拟机栈,每一个线程有一份,每一个线程的虚拟机栈里面,存放的是一个个栈帧,每一个栈帧表示一个方法调用。
PC寄存器,同样是每一个线程有一份,不同线程之间执行到何处,互不干扰。
执行引擎
执行引擎里面可以逐行解释执行,也可以编译成机器指令直接执行,主要包括:
-
解释器
-
即时编译器:即时编译器中包括了中间代码生成器,代码优化器,目标代码生成器等。
-
垃圾收集器
解释器,需要逐行解释执行,效率低下。譬如:如果循环两千次,循环体很大,每次执行都需要解释执行。
JIT
编译器,除了可以直接全部即时编译,还可以统计出那些代码执行频率比较高,这部分代码就是热点代码,这种技术叫做热点代码探测技术,JIT
编译器会将热点代码,提前编译成为机器指令,放在方法区缓存起来,下次执行到的时候,不需要解释执行,而是直接运行机器指令。
即时编译器的执行效率很高,为什么不将它全部提前编译好缓存起来呢?
-
全部提前编译,首次启动响应速度慢,会有卡顿的感觉,因为编译需要大量时间。(主要原因)
-
缓存代码,需要放在方法区,占用内存空间,容易溢出。
-
翻译成为机器指令,则这部分缓存的
CodeCache
是不能够直接跨平台,因为不同环境的机器指令是不大一样的,只能每次运行前就全部编译。
如果需要写一个虚拟机,那么需要考虑的重要两部分是:类加载子系统和执行引擎。
类加载子系统负责将类信息按照规定,加载到运行时数据区,而执行引擎主要负责对代码解释执行或者编译成二进制缓存起来,进行执行。