目录
运行时数据区域
程序计数器
Java虚拟机栈
本地方法栈
Java堆
方法区
运行时常量池
直接内存
虚拟机对象探秘
对象的创建
对象的内存布局
运行时数据区域
程序计数器
程序计数器是一块较小的内存空间,存储当前线程所执行的字节码指令的地址。在java虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
处理器的一个逻辑核同一时间只会执行一个线程的字节码指令,而java虚拟机的多线程是通过线程轮流切换、分配处理器的执行时间来实现。为了多线程切换后能够恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各个线程之间计数器互不影响,独立存储,属于线程私有的内存。
如果线程正在执行的是一个java方法,计数器记录的是正在执行的字节码指令的地址;如果执行的是native方法,这个计数器的值为空,此内存是唯一一个没有OOM的区域
Java虚拟机栈
线程私有的,生命周期和线程相同。虚拟机栈描述的是Java方法执行的线程内存模型:每个方法被执行都会创建一个栈帧用于存储局部变量表、操作数栈、动态连接、方法出口等信息。每一个方法被调用直至执行完毕的过程,都对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
- 局部变量表
局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用和returnAddress类型(指向了一条字节码指令的地址)
这些数据类型在局部变量表中的存储空间以局部变量槽(Slot)为单位的数组来表示,long和double的数据会占用两个变量槽,其余的数据类型只占用一个。局部变量表所需要的内存空间在编译期完成分配,当进入一个方法时,这个方法需要在栈帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小(大小指的是变量槽的数量,一个变量槽32个比特、64个比特或者更多完全由具体的虚拟机实现)。
线程请求的栈深度大于虚拟机允许的深度,抛出StackOverflowError;如果虚拟机栈容量可以动态扩展,当扩展时无法申请到足够的内存抛出OOM
- 操作数栈
与局部变量表一样,均以Slot为单位的数组。不过局部变量表用的是索引,操作数栈是弹栈/压栈来访问。操作数栈可理解为java虚拟机栈中的一个用于计算的临时数据存储区。
存储的数据与局部变量表一致int、long、float、double、reference、returnType,操作数栈中byte、short、char压栈前(bipush)会被转为int。数据运算的地方,大多数指令都在操作数栈弹栈运算,然后结果压栈。
java虚拟机栈是方法调用和执行的空间,每个方法会封装成一个栈帧压入栈中。其中里面的操作数栈用于进行运算,当前线程只有当前执行的方法才会在栈帧的操作数栈中调用指令(可见java虚拟机栈的指令主要取于操作数栈)
下面一段字节码表述了局部变量表和操作数栈的关系:
本地方法栈
和java虚拟机栈类似也是线程私有的,区别就是虚拟机栈是为虚拟机执行java方法(字节码)服务,而本地方法栈是为虚拟机使用本地方法(native)服务
Java堆
gc回收的主要区域,所有线程共享。从内存分配的角度,可以划分出多个线程私有的分配缓冲区(TLAB),以提升对象分配时的效率。-Xmx和-Xms指定堆的大小。内存不足分配实例时OOM
方法区
线程共享的内存区域。用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码缓存等数据。方法区无法满足新的内存分配需求时,OOM
运行时常量池
方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池表,用于存放编译期生成的各种字面量与符号引用,这部分内容将在类加载后放到方法区的运行时常量池中。
运行时常量池的一个重要特性是具备动态性,运行期间也可以将新的常量放入池中,用的比较多的就是String.intern()方法。
当常量无法在申请时OOM
直接内存
NIO类引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,可以使用native函数直接分配堆外内存,然后通过一个存储在Java堆里面的DirectByteBuffer对象引用这块内存进行操作。能在一些场景中显著提升性能,避免了在Java堆和Native堆中来回复制数据。
受到本机总内存的限制,内存不足OOM
虚拟机对象探秘
对象的创建
new关键字 -> 检查指令的参数在常量池中定位到一个类的符号引用 -> 类是否被加载、解析、初始化 -> 为对象分配内存(对象所需内存在类加载完成后可完全确定)-> 将分配的内存空间(不包括对象头)初始化为零值(保证了java代码中可以不赋值直接使用)-> 设置对象头(类的元数据信息、对象哈希码、gc分代年龄等)-> 执行构造函数init<>()方法
分配内存方式有指针碰撞、空闲列表,serial、ParNew等待压缩整理过程的收集器,使用指针碰撞,CMS这种基于标记清楚的使用空闲列表。同时多线程创建对象为了保证线程安全:CAS配上失败重试的方式保证更新操作的原子性;为每个线程预分配一小块内存TLAB,当线程的TLAB使用完了,分配新的缓存区才需要同步锁定。
对象的内存布局
对象头
- Mark Word
比如 hash码,对象所属的年代,对象锁,锁状态标志,偏向锁(线程)ID,偏向时间,数组长度(数组对象)等。Java对象头一般占有2个机器码(64位虚拟机中,1个机器码是8个字节,也就是64bit),但是 如果对象是数组类型,则需要3个机器码,因为JVM虚拟机可以通过Java对象的元数据信息确定Java对象的大小,但是无法从数组的元数据来确认数组的大小,所以用一块来记录数组长度
- 指向类的指针
大小也通常为32bit,它主要指向类的数据,也就是指向方法区中的位置。
- 数组长度
只有数组对象才有,在32位或者64位JVM中,长度都是32bit
实例数据
对象真正存储的有效信息,我们在程序代码里定义的各种类型的字段内容,无论是从父类中继承下来的,还是在子类中定义的字段都必须记录起来。
对齐填充
由于虚拟机要求 对象起始地址必须是8字节的整数倍。填充数据不是必须存在的,仅仅是为了字节对齐。原因是为了寻址最优,64位机器正好8个字节;