jvm的作用是解释执行java字节码.java的跨平台就是靠jvm实现的.下面看看一个java程序的执行流程.
1. jvm中的内存区域划分
jvm也是一个进程,进程在运行过程中,要行操作系统申请一些资源.这些内存空间就支撑了后续java程序的执行.
jvm从系统申请了一大块内存,这块内存在java程序使用的时候又会根据实际用途来划分成不同的空间,这就是区域划分.
主要划分下面几个区域
- 堆区
代码中new出来的对象就是在堆区,对象中持有的非静态变量也在堆区,整个进程只有一份.- 栈区
- 本地方法栈 : jvm内部通过c++代码实现的
- 虚拟机栈 : 记录了Java代码的调用关系,java代码中的局部变量在栈区
- 程序计数器
这个区域空间较小,专门用来存储下一条要执行的Java指令的地址.整个进程只有一份.- 元数据区(方法区)
往往是一些辅助性质的,描述性质的属性,比如存放了类的信息,方法的信息文件的大小,文件的位置等信息.
理解
public class Test {
private int n;
private static int m;
public static void main(String[] args) {
Test test = new Test();
}
}
问题: 上面代码中,n , m test都存放在那个位置
- test是一个引用类型的局部变量,存放在栈上.
- n是Test的成员变量,存放在推上
- m是static修饰的变量,称为"类属性",就是在类对象中,也就存放在元数据区.
类对象中包含的信息包括且不限于类的名称,继承那个类,实现哪些接口,有什么属性,有什么方法等等.
- static修饰的变量称为"类属性, 修饰的方法称为"类方法""
- 非static修饰的变量称为"实例属性", 修饰的方法称为"实例方法"
2. jvm中的类加载机制
类加载指的是java程序运行的时候,需要把.class文件,读取到内存中,并进行一系列解析校验的过程. 类加载大致分为5个步骤
- 加载 ; 把硬盘上的.class文件找到并打开,读取到文件中的内容(二进制数据)
- 验证 : 需要确保当前读取的文件的内容是合法的.class文件(字节码文件)的格式
- 准备 : 给类对象申请内存空间(默认是全0的)
- 解析 : 针对字符串常量进行解析,解析阶段就是java虚拟机将常量池中的符号引用替换为直接引用的过程,也就是初始化常量的过程.
把文件从硬盘读取到内存的过程.,引用偏移量来暂时代替这个字符串的地址,当,class文件加载到内存中这个字符串就有了地址,此时存放的地址就是真实地市,也叫做直接引用.- 初始化 : 针对类对象完成后续的初始化.
双亲委派模型
双亲委派模型的作用是描述了如何查找.class文件的策略.
jvm进行类加载的操作,由 “类加载器” 这个模块专门负责,类加载器的作用是给定一个全限定类名(带有包的类名),找到对应的.class文件.
jvm中的类加载器默认是有三个的
- BootstrapClassLoader : 负责查找标准库中的目录
- ExtensionClassLoader : 负责查找扩展库中的目录(实现jvm的厂商也会在标准库的基础上扩展一些额外的功能)
- ApplicationClassLoader : 负责查找当前项目的目录以及第三方库中的目录.
这三个类加载器按上面顺序存在 “父子关系”, 类似与二叉树,有一个引用parent, 指向自己的父类加载器.
双亲委派模型描述了上述类加载器之间是如何工作的
- 从ApplicationClassLoader作为入口, 先开始工作
- ApplicationClassLoader不会立即搜索自己负责的目录,会把自己的任务交给自己的父亲ExtensionClassLoader.
- 代码进入到ExtensionClassLoader也不会立刻执行,会把自己的任务交给父亲BootatrapClassLoader.
- BootstrapClassLoader也不会立刻执行,也交给自己的父亲.发现自己没有父亲,才会开始搜索自己负责的目录.通过全限定类名,尝试在标准库目录中找到符合条件的.class文件.
- 如果找到了就直接进入到打开文件/读取文件的流程中,如果没有找到,回到孩子的类加载器中继续找.
- ExtensionClassLoader收到父亲交给他的任务,自己进行查找,找到了就进入下一个流程,没找到交给自己的孩子
- ApplicationClassLoader收到父亲交给的任务,开始搜索当前项目的目录和第三方库宏中的目录,找到了进入下一个流程,没找到就会抛出ClassNotFoundEXception异常.
3.垃圾回收机制
在C语言中,通过malloc申请内存,通过free回收内存,但在实际开发中很容易出现内存申请了但没有回收的情况,就会使内存空间变小,后续就没法继续申请内存了.在jvm中就引入了垃圾回收机制,由程序手动释放内存.
垃圾回收是回收内存
- 在程序计数器和元数据区一般不需要回收内存
- 栈中主要存放的是局部变量,局部变量在代码块执行结束就自动销毁.
- 主要回收的区域是堆区
如何进行垃圾回收
垃圾回收说是回收内存,实际上是回收对象,每次回收垃圾的时候,就会释放若干个对象.
识别垃圾
- 判定那个对象后续不在进行使用,就进行回收.通过下面的伪代码来分析
func() {
{
test t = new Test();
t.start();
}
//当代码执行到这里时,局部变量t就被销毁了,
//此时new Tset()对象就没有引用在指向他了,
//此时这个代码无法使用这个对象,就被回收了
}
上面这种情况是比较简单的,但当有多个引用指向同一个new Test对象,此时需要确保所有的引用都销毁了,才能把Test对象作为垃圾.
1. 引用计数
给每个对象安排一个额外的空间,空间里保存当前这个对象有几个引用.
//伪代码
{
Test t1 = new Test();
//当代码执行到这里,t1指向new Test这个对象,引用空间计数为1 ,代表有1个引用指向这个对象
Test t2 = t1;
//当代码执行到这里,t2指向new Test这个对象,引用空间计数加1 ,代表有2个引用指向这个对象
t1 = null;
// 此时t1这个引用指向空,此时引用空间减1,此时有一个引用指向这个对象.
t2 = null;
//此时t2这个引用为空,此时引用空间减1,此时没有引用指向这个对象
//引用空间为0 ,此时可以回收这个对象.
}
1. 引用计数机制会消耗额外的空间.
要给每个对象安排一个一个计数器,如果这个程序对象数目很多,也会产生很多额外的空间.
2. 引用计数可能产生 “循环引用的问题”
此时,引用计数就无法继续工作了.
class Test {
Test t;
public static void main(String[] args) {
Test a = new Test();
Test b = new Test();
a.t = b;
//此时a指向的这个对象的引用空间计数为2
b.t = a;
//此时b指向的这个对象的引用空间计数为2
a = null;
//a指向的这个对象引用空间减1,但a这个引用都指向空了
//此时引用数不为0 ,不能被回收掉,但这个对象有无法再使用了
b = null;
//b指向的这个对象引用空间减1,但b这个引用都指向空了
//此时引用数不为0 ,不能被回收掉,但这个对象有无法再使用了
}
}
2. 可达性分析
在写代码的过程中,会定义很多变量,比如,栈上的局部变量/方法区中静态类型的变量.常量池中引用的对象…可以从这些变量作为起点出发,尝试去遍历,所谓遍历就是沿着这些变量中持有的引用类型的成员,在进一步进行往下访问.
用上面这颗二叉树进行举例
如果执行代码root.right.left = null;此时从root出发进行遍历就无法访问到f对象,此时f这个节点就是 " 不可达".
如果执行代码root.right = null ; 此时c就不可达,也导致f不可达,此时c和f都是垃圾.
可达性分析本质上是用 “时间” 换"空间", 相比于引用计数,需要消耗额外更多额外的时间,但总体来说是可控的,不会出现类似于"循环引用"
等问题.
4. 如何清除标记为垃圾的对象
1.标记清除法
把标记为垃圾的对象,直接释放掉.
内存碎片问题
内存申请每次都会申请一块连续的内存空间 . 采用标记清除法把垃圾对象释放掉,可能会产生很多很小的,离散的内存空间,导致后续内存申请失败.
2. 复制算法
复制算法的核心是把内存分为两部分, 把不是垃圾的对象复制到另一半里,接下来把左边整体空间都释放掉
复制算法规避了内存碎片问题,单也产生了新的问题
- 总的内存空间变少了
- 如果每次要复制的对象比较多,此时复制的开销也变大了
3.标记整理法
类似与顺序表的删除顺序表中全部的某个元素,但此时解决了内存碎片问题,也解决了复制过多复制开销大的问题,但此时搬运的开销又变大了.
4. 分代回收
在分代回收中引用的对象的年龄这个概念,JVM中有专门负责周期性扫描/释放的线程,当一个对象每次被线程扫描一次,可达了,年龄就加1.JVM就会根据对象的年龄把内存划分为两个区域.
回收方法
- 当代码中new 出一个对象,就会被创建在伊甸区,伊甸区中就有很多对象,但伊甸区中的对象大对数生命周期都比较短,大多数都活不过第一轮GC.
- 第一轮GC扫描完成后,少数伊甸区中的对象仍存活,就会通过复制算法复制到生存区中,后续GC扫描就会扫描伊甸区和生存区,生存区中的对象也会被扫描标记为垃圾,少量存活的,复制到生存区中的另外一部分.只要这个对象存活,就会被复制算法继续复制到另一半生存区中.
- 若果这个对象在生存区中经过若干轮GC仍存活,JVM就会认为这个对象生命周期大概率很长,就把这个对象从生存区中拷贝到老年代.
- 老年代的对象,也会被GC扫描,但扫描的频率会大大降低
- 对象在老年代标记为垃圾后,JVM就会按照标记整理的方式, 释放内存