JVM
JVM 是 java 虚拟机,简单来说就是能执行标准 java 字节码的虚拟计算机
JVM 是如何工作的
首先程序在执行之前先要把 Java 代码(.java)转换成字节码(.class),JVM 通过类加载器(ClassLoader)把字节码加载到内存中,但字节码文件是 JVM 的一套指令集规范,并不能直接交给底层操作系统去执行,因此需要特定的命令解析器执行引擎(Execution Engine)将字节码翻译成底层机器码,再交由 CPU 去执行,CPU 执行的过程中需要调用本地库接口(Native Interface)来完成整个程序的运行。
jvm 的组件以及功能
- 类加载器(Class Loader):加载类文件到方法区。
- 执行引擎(Execution Engine):也叫解释器,负责解释命令,交由操作系统执行。
- 本地库接口(Native Interface):本地接口的作用是融合不同的语言为 java 所用
- 运行时数据区(Runtime Data Area):
1)堆。堆是 java 对象的存储区域,任何用 new 字段分配的 java 对象实例和数组,都被分配在堆
上
2)方法区:用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等
数据。
3)虚拟机栈:虚拟机栈中执行每个方法的时候,都会创建一个栈桢用于存储局部变量表,操作
数栈,动态链接,方法出口等信息。
4)本地方法区:用来调用非 Java 语言实现的方法
5)程序计数器。指示 Java 虚拟机下一条需要执行的字节码指令。
请谈一下方法区,永久代,元空间
很多人把方法区称作“永久代”(Permanent Generation),本质上两者并不等价,只是 HotSpot 虚
拟机垃圾回收器团队把 GC 分代收集扩展到了方法区,或者说是用来永久代来实现方法区而已,
这样能省去专门为方法区编写内存管理的代码,但是在 Jdk8 也移除了“永久代”,使用 Native
Memory 来实现方法区。
元空间是 Hotspot 在 JDK8 中新加的内容,其本质和永久代类似,都是对 JVM 规范中方法区的实
现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。
会发生内存溢出的区域?
首先程序计数器不会发生内存溢出(因为 java 虚拟机规范了程序计数器是没有内存溢出的区域)
内存溢出分为两者情况一种是 OutOfMemoryError
- 堆内存耗尽,对象越来越多又一直使用不能被垃圾回收
- 方法区内存耗尽 - 加载的类越来越多
- 虚拟机栈累计 - 每个线程都会占用 1M 的内存,线程越来越多还不销毁
另一种是 StackOverflowError
JVM 虚拟机栈原因有递归调用未正常结束或者反序列化 json 循环引用
什么是内存泄漏?内存泄漏与内存溢出的区别?
在 java 中一般是指无用的对象因为错误的引用关系不能被 GC 回收处理
如果存在严重的内存泄漏问题,随着时间推移必会引发内存溢出。内存泄漏一般是指资源管理问
题和程序 BUG,内存溢出一般是指内存空间不足和内存泄漏的最终结果
请谈一下什么是垃圾回收?
GC 前要做的三件事
- 哪些内存需要回收?
- 什么时候回收?
- 怎么回收?
如何确定垃圾?
引用计数法:
只要一个对象被其他变量所引用,就让这个对象的计数 +1,如果某一个变量不在被引用,让
他的计数-1,当这个对象引用计数 =0 的时候,代表这个对象没有再被引用了,就可以作为一个
垃圾被回收掉。引用计数法有一个弊端,在循环引用的场合,如果两个对象被循环无限引用,虽
然都不在使用了,但是两个对象的计数都不为 0,导致不能被回收。
可达性分析:
确定一系列根对象,垃圾回收前先把堆中的对象进行一次扫描,判断每一个对象是不是被根
对象所直接或者间接引用,如果是,那么这个对象就不能被回收。反正如果这个对象没有被根对
象直接或者间接所引用,那么这个对象就可以作为垃圾被回收。
如何确定 GC Roots 对象?
虚拟机栈中引用的对象
方法区中的类静态属性引用的对象
方法区中常量引用的对象
本地方法栈中 JNI 引用的对象
对象的引用关系都有哪些?
不管是引用计数法还是可达性分析算法都与对象的“引用”有关,这说明对象的引用决定了
对象的生死,对象的引用关系如下。
强引用:在代码中普遍存在的,类似 Object obj = new Object() 这类引用,只要强引用还
在,垃圾收集器永远不会回收掉被引用的对象。
软引用: 是一种相对强引用弱化一些的引用,可以让对象豁免一些垃圾收集,只有当 JVM
认为内存不足时,才会去试图回收软引用指向的对象,JVM 会确保在抛出 OutOfMemoryError
之前,清理软引用指向的对象。
弱引用: 非必需对象,但它的强度比软引用更弱,被弱引用关联的对象只能生存到下一
次垃圾收集发生之前。
虚引用: 也称为幽灵引用或幻影引用,是最弱的一种引用关系,无法通过虚引用来获取
一个对象实例,为对象设置虚引用的目的只有一个,就是当着个对象被收集器回收时收到一
条系统通知。
垃圾回收算法有哪些?
-
标记清除算法
标记阶段:沿着 GC Root 对象的引用链找,直接或间接引用到的对象加上标记
清除阶段:释放未加标记的对象占用的内存 -
标记整理法
前面的标记阶段、清理阶段与标记清除法类似 多了一步整理的动作,将存活对象向一端移动,可以避免内存碎片产生 -
标记复制法
将整个内存分成两个大小相等的区域,from 和 to,其中 to 总是处于空闲,from 存储新创建的
对象,标记阶段与前面的算法类似,在找出存活对象后,会将它们从 from 复制到 to 区域,复制的过程中自然完成了碎片整理,复制完成后,交换 from 和 to 的位置即可。 -
分代收集算法
当前主流 JVM 垃圾回收基本都采用分代收集算法,这种算法会根据对象存活周期的不同将内存
分为几块,比如 JVM 中的年轻代、老年代、永久代。这样就可以根据各年代特点分别采用最适
当的 GC 算法。
垃圾收集按照回收区域分类:默认情况下新生代和老生代的内存比例是 1:2。
部分收集(Partial GC)
年轻代收集(Minor GC),只是年轻代(Eden,From,To)的垃圾收集。
老年代收集(Major GC),只是老年代的垃圾收集。整堆收集(Full GC)
收集整个 Java 堆和方法区的垃圾,暂停时间长,应尽力避免混合收集(Mixed GC)
收集整个新生代以及部分老年代的垃圾收集,目前只有 G1 收集器会有这种行为。
Minor GC 年轻代垃圾回收触发机制
新生代垃圾回收采用的是复制算法,每次垃圾收集都能发现大批对象已经死亡,只有少量存
活,因此选择复制算法,年轻代又被分为 Eden 区,From 区和 To 区。
新对象产生的时候都会被放入年轻代的 Eden 区(如果是个大对象会直接进入老年代,判断
大对虾通过 Pretenure SIze Threshold 参数设置,默认 3M),当 eden 内存不足,标记 eden 和 from
的存活对象,清理不可达对象,将 Eden 区和 From 区没有被清理的对象使用复制算法复制到年
轻代的幸存区 To 区,并且将 To 区幸存的对象年龄 +1,在交换幸存区 To 区和幸存区 From 区的
位置。minor GC 会引发一次 stop the world,暂停其他用户的线程,等到垃圾会输结束,用户线程
才恢复运行。当寿命达到 15 次左右,作为一个老不死对象,会被移交至老年代。
Major GC(老年代垃圾回收)
Major GC 指发生在老年代的 GC,MajorGC 采用标记—清除算法。
Major GC 触发条件: 老年代空间不足时,会先尝试触发 Minor GC。Minor GC 之后空间还
不足,则会触发 Major GC。
Full-GC触发条件:
Full-GC是针对整个新生代,老年代和元空间的全局范围内的GC。Full-GC不等于Major GC也不等于Minor GC+Major 发生Full-GC具体看使用了什么垃圾回收器,才能解释是什么样的垃圾回收。当⽼年代的空间使⽤率超过某阈值时,会触发Full GC;当元空间不⾜时(JDK1.7永久代不足),也会触发Full GC;当调⽤System.gc()也会安排⼀次Full GC。
JVM 中为什么新生代中要有两个 Survivor 区?
- 如果 Survivor 是 0 的话,也就是说新生代只有一个 Eden 分区,每次垃圾回收之后,存活的对
象都会进入老生代,这样老生代的内存空间很快就被占满了,从而触发最耗时的 Full GC ,显然 这样的收集器的效率是我们完全不能接受的。 - Survivor 中分为两个区一个 FromService 一个 ToService 区,首先如果只有一个区的话,当新 生代的 Gc 开始工作的时候先把 Eden 区的垃圾回收了,根据其标志-复制算法,我们需要保留的 对象会被移动到 FromService 区中,当FromService 中的内存容量达到了一个阈值,需要我们堆 FromService区进行收集的时候,会导致大量的内存碎片残存其中,以至于后来无法在存入大对象 了;两个区的好处在于,当 FromService区的不需要用到对象也需要被清理的时候,Minor GC 再 次被触发的时候,我们需要保留的对象送到了 ToService 区,然后将ToService 区域和 FromService 区域互换身份,这样我们避免了碎片化的存在,而且永远都有一个干净的内存区域可以使用,是内存区域非常的整洁。
常见的垃圾回收器有哪些??
新生代回收器:Serial、ParNew、Parallel Scavenge
老年代回收器:Serial Old、Parallel Old、CMS
整堆回收器:G1
Serial 垃圾收集器(单线程、复制算法):
Serial 垃圾收集器是最基本的垃圾收集器,它使用的是复制算法,Serial 是一个单线程收集
器,它只会使用一个 CPU 或一条线程去完成垃圾收集,在进行垃圾收集的同时必须暂停其他所
有的工作线程直到垃圾收集结束。简单、高效。对于单个 CPU 环境来说没有线程交互的开销,可
以获得最高的单线程回收效率。但一般限定单核 CPU 才可以使用。
ParNew 垃圾收集器(Serial+ 多线程):
ParNew 垃圾收集器是 Serial 收集器的多线程版本,使用的也是复制算法,除了使用多线程
进行垃圾回收,其余的行为全都和 Serial 一样,ParNew 垃圾收集器在垃圾收集过程中也会产生
STW。ParNew 会默认开启和 CPU 数目相同的线程数,可以通过-XX:ParallelGCThreads 参数来
限制垃圾收集器的线程数。
CMS 垃圾回收器 (多线程标记清除算法):
是一款里程碑式的垃圾收集器,为什么这么说呢?因为在它之前,GC 线程和用户线程是无
法同时工作的,即使是 Parallel Scavenge,也不过是 GC 时开启多个线程并行回收而已,GC 的整
个过程依然要暂停用户线程,即 Stop The World。这带来的后果就是 Java 程序运行一段时间就会
卡顿一会,降低应用的响应速度,这对于运行在服务端的程序是不能被接收的。
G1 收集器
Garbage first 垃圾收集器相比 CMS 收集器有以下两个改进:
基于标记-整理算法,不产生内存碎片。可以非常精确控制停顿时间,在不牺牲吞吐量前提
下,实现低停顿垃圾回收。
G1 收集器避免全区域垃圾收集,他把堆内存划分为几个固定大小的独立区域(上面提到的
分区收集算法),并且跟踪这些区域的垃圾收集进度,同时在后台维护一个优先级列表。每次根
据所允许的收集时间,优先回收垃圾最多的区域。区域划分和优先级回收机制确保 G1 收集器可
以在有限时间获取最高的垃圾收集效率。