第二章 Java内存区域与内存溢出异常
2.1 概述
JVM是自动内存管理
2.2 运行时数据区
所谓运行时数据区是JVM在运行Java程序的时候将所管理的内存划分为几块不同的数据区域,分为:程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区,如下图:
2.2.1 程序计数器(Program Counter Register)
- 程序计数器可以看作是当前线程所执行字节码指令的行号指示器
- 线程私有,每个线程都有一个程序计数器,相互独立,互不干扰。
- 如果当前线程正在执行的是一个Java方法,则程序计数器则记录的是字节码指令。如果当前线程正在执行的是Native方法,则程序计数器记录的是空(Undefined)。
- 该区域是唯一个一块儿在Java虚拟机规范当中没有规定任何OOM情况的区域
- 使用场景
- 解释执行的时候,要通过程序计数器来获取下一个要执行的字节码指令。
- Java多线程是通过线程轮流切换并分配处理器执行时间来实现的,当线程切换回来的继续执行的时候,需要恢复到正确的执行位置上。
2.2.2 Java虚拟机栈(Java Virtual Machine Stacks)
- 线程私有
- 方法在执行的时候会创建一个对应的“栈帧”,用来存放局部变量表、操作数栈、动态链接、方法出口等信息。方法的调用到结束,就是栈帧在Java虚拟机栈中的进栈出栈的过程。
- 栈帧中的局部变量表
- 用来存放编译期可知的基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,指向对象的指针或句柄)、returnAddress(一个字节码指令的地址)。
- 在基本数据类型中的64位长度long和double,需要占用2个局部空间变量(Slot),其他需要占用1个Solt。
- 局部变量表在编译期间就完成了内存的分配,内存的大小都已确定,运行期也不会有改变。
- 通常所说的堆内存(Heap),栈内存(Stack)中的栈内存(Stack),指的就是Java虚拟机栈,或者说Java虚拟机栈中的局部变量表部分。
- Java虚拟机规范中对该区域规定了2种异常情况
- 当线程请求的栈深度超过了虚拟机允许的最大深度,则会抛出StackOverflowError异常。
- 如果虚拟机动态支持扩展,当扩展的时候无法申请到足够的内存,则会抛出OutOfMemoryError异常。
2.2.3 本地方法栈(Native Method Stack)
- 如果说Java虚拟机栈是为Java方法服务的,那本地方法栈就是为了Native方法服务的。
- Java虚拟机规范并没有对本地方法栈如何实现进行规范,各个虚拟机都会有自己具体的实现。例如:HotSpot VM是将本地方法去和Java虚拟机栈合二为一了。
- Java虚拟机规范对该区域规定了2种异常情况(与Java虚拟机栈一致)。
2.2.4 Java堆(Java Heap)
- JVM所管理内存中最大的一块。
- 线程共享,所有线程共享这块区域。
- Java堆是在JVM启动的时候创建的。
- Java堆是用来存放对象实例的,几乎所有对象的内存都是在这里分配的。之所以说几乎,是因为随着JIT的发展和逃逸分析算法的完善,出现了栈上分配、标量替换等优化手段使这个情况发生了一些改变。
- Java堆是垃圾收集器所管理的主要区域,因此Java堆又称GC堆。
- 基于垃圾收集器的分代收集算法,我们又Java堆分为2部分:新生代和老年代,新生代又分为3部分:Eden、From Survivor、To Survivor。
- 在线程共享的Java堆中,也会为一些线程分配一块儿线程私有的本地线程分配缓冲区(Thread Local Allocation Buffer,TLAB)
- Java虚拟机规范中规定,Java堆可以存在于不连续的物理内存空间上,只要是逻辑上连续就可以。
- Java虚拟机规范规定,当此区域无足够的空间来完成实例分配且无法扩展,则抛出OutOfMemoryError异常。
2.2.5 方法区(Method Area)
- 该区域线程共享。
- 用于存放加载后的类、常量、静态变量、编译后的代码。
- 在Java虚拟机规范中方法区是Java堆的一个逻辑部分,为了与堆区分开,方法区也可叫做非堆(Non-Heap)
- 因为方法区是Java堆的一个逻辑部分,则方法区也就和Java堆一样,都是可以存放在物理上不连续的内存空间上,只要逻辑上连续即可。
- 垃圾收集器对这个区域主要回收的目标是:卸载的类和对常量池的回收。
- Java虚拟机规范中规定,当方法区无法满足内存分配的需求时,则出现OutOfMemoryError异常。
- 很多人将“方法区”也称为“永久代”,实际这两者并不等价。只是HotSpot团队将GC分代收集延展到了方法区,或者说用永久代来实现了方法区。这样做的好处是,直接可以复用GC的内存管理,不用再另起炉灶了。其他厂商的虚拟机,例如:JRockit、J9,都没有永久代这个概念。有好处也有不足,带来的问题就是HotSopt相较于其他厂商的虚拟机,更容易出现内存溢出的问题,因为永久代的大小有-XX:MaxPermSize的限制,其他产商的虚拟机是没有这个限制的(只要没有碰触到进程可用内存的上限,就不会出现内存溢出的问题)。在未来的规划当中,HotSpot也是计划要采用Native Memory来实现方法区。
2.2.4 运行时常量池(Runtime Constant Pool)
- 作为方法区的一部分。
- Class文件中有一部分叫做常量池(Constant Pool Table),用来存放编译后产生的各种字面量和符号引用,当类加载完成后,会将这部分信息存放到运行时常量池中。
- 比起Class中的常量池,运行时常量池是动态的,即运行期也会产生的一些常量并将这些常量也都存放到运行时常量池中,例如:String的intern()方法。
- 作为方法区的一部分,和方法区一样,当无法满足内存分配需求的时候,则出现OutOfMemoryError异常。
2.2.5 直接内存(Direct Memory)
- 不属于运行时数据区,也不属于Java虚拟机规范当中规定的内存区域。
- NIO(New Input/Output)类,通过该类我们可以使用Native方法直接对堆外内存进行分配,并在堆中生成一个DirectByteBuffer对象作为该内存的引用。
- 在设置虚拟机-Xmx参数的时候,如果忽略了直接内存,使得各个内存区域的总和大于了物理内存限制,从而导致动态扩展的时候出现OutOfMemoryError异常。
2.3 HotSpot虚拟机对象探秘
2.3.1 对象的创建
这里以用new命令来创建一个对象为例,说下整个创建过程:
-
当碰到new指令的时候,首先检查new指令的参数是否在常量池中有对应的符号引用,如果有的话则检查该符号引用的类是否已经加载、解析、初始化过了。如果没有则先完成类的加载。
-
类加载完成后,就要为对象分配内存了,需要多大内存空间在类加载完成后就已经确定了。内存分配的方式有两种:指针碰撞和空闲列表。
-
指针碰撞:
如果Java堆是规整的,即已用的内存在一边,空闲的内存在另外一边,两只之间分界点以指针作为指示器。分配内存的时候将指针向空闲空间移动与对象内存大小相等的距离即可。 -
空闲列表
如果Java堆不是规整的,那就需要一个列表用来记录空闲的内存空间,分配内存的时候从空闲列表中找到足够大的内存空间分配给对象,并更新空闲列表中的记录。
使用哪种内存分配方式是由Java堆是否规整来决定的,而Java堆是否规整则是由垃圾收集器是否具备压缩整理功能来决定的。
创建对象是非常频繁的,我们要考虑并发情况下如何保证分配内存空间线程安全,这里有两个方案:
- 同步分配内存空间的操作(实际上虚拟机采用的是CAS + 失败重试来实现同步的)
- 为每个线程在Java堆中分配一块属于该线程的空间,即本地线程分配缓冲区(Thread Local Allocation Buffer,TLAB),线程中的对象将在TLAB上进行分配,如果TLAB不够用了,需要分配新的TLAB的时候,此时才需要同步锁定。
-
-
内存空间分配好后要对内存空间初始化零值。如果使用了TLAB,则该过程提前至TLAB分配的时候进行。
-
对对象进行一些必要的设置,例如:它属于哪个类、类的元数据从哪里能找到、对象的Hashcode、对象的GC年龄,这些信息会保存在对象头(Object Head)中,根据当前虚拟机的状态,是否开启偏向锁,对象头会有不同的设置方式。
-
以上4步执行完成后,对于虚拟机来说一个对象就算创建完成了,但是对于程序员来说,对象的创建才真正开始(因为init<>方法还没有执行,所有字段都还是零值)。所以,new执行完接着会执行init<>方法,根据程序员的意愿去初始化,至此一个对象才真正的创建完成。
基于以上5个步骤,整理了一个大体的流程图,如下:
2.3.2 对象的布局
这里所讲的对象内存布局,是基于HotSpotVM来讲的。对象在内存中的布局分为3个部分:对象头,实例数据,对齐填充。
-
对象头(Object Head)
对象头包含两部分信息:一部分对象自身的运行时数据,一部分是对象的类型指针。- 对象自身的运行时数据
这部分数据包括,对象的哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分数据的长度分别在32位和64位的虚拟机当中为32bit(4字节)和64bit(8字节),官方将这部分数据称为“Mark Word”。 - 对象的类型指针
即指向对象的类元数据的指针,虚拟机可以通过这个指针知道这个对象是属于哪个类的实例。 - 如果对象是数组的话,对象头还需要有一块用来记录数组的长度,因为虚拟机可以通过普通对象的元数据来确定对象的大小,但是无法通过数组的元数据来确定数组的大小。
- 对象自身的运行时数据
-
实例数据(Instance Data)
对象真正存储的有效数据,即那些在程序代码中定义的各种类型的字段,无论是从父类继承下来的,还是子类自己定义的。 -
对齐填充(Padding)
HotSpot VM的自动内存管理系统要求对象的大小必须是8字节的整数倍。对象头正好是8字节的倍数(1倍或者2倍),如果实例数据不是8字节的整数倍,就需要对齐填充来进行补全。
2.3.3 对象的访问定位
Java虚拟机规范当中没有对如何对对象进行访问定位有明确的规定,所以要看具体的虚拟机是如何实现的了,主流方式有两种:句柄和指针。
- 使用句柄访问
首先要在Java堆中划出一块区域作为句柄池,虚拟机栈中的reference数据存储的句柄的地址,句柄中会存放对象实例数据的地址和对象类型数据的地址,如下图:
采用句柄的好处是:当对象实例数据的地址发生变化的时候,虚拟机占中的reference数据不需要做任何改变。 - 使用指针访问
虚拟机栈中的reference数据存储的是对象的指针,在对象的对象头中存放该对象的类型数据指针,如下图:
比起使用句柄访问对象,采用指针访问对象的好处是:减少了一次查询的开销,也避免了句柄池占用Java堆的空间。
上一篇:《深入理解JAVA虚拟机(第2版)》- 第1章 - 学习笔记
下一篇:《深入理解JAVA虚拟机(第2版)》- 第3章 - 学习笔记