深入JVM:详解JIT即时编译器

news2024/10/5 22:23:51

文章目录

  • 深入JVM:详解JIT即时编译器
    • 一、序言
    • 二、基础概念
      • 1、何为JIT即时编译
      • 2、热点代码
    • 三、HotSpot内置的即时编译器
      • 1、C1编译器
      • 2、C2编译器
      • 3、分层编译
        • 3.1 协作流程
    • 四、常见JIT优化技术
      • 1、方法内联
      • 2、逃逸分析
        • (1)同步锁消除
        • (2)栈上分配
        • (3)标量替换
    • 五、后记


深入JVM:详解JIT即时编译器

一、序言

对于Java工程师而言,深入理解JVM(Java虚拟机)不仅是掌握Java程序运行机制的基础,也是提升系统性能、优化应用和解决复杂问题能力的重要一步,更是Java进阶之路的重中之重。

本文小豪将带大家认识JIT即时编译器,介绍主流HotSpot虚拟机内置的几款即时编译器,同时结合代码实例,着重讲解JIT优化手段,话不多说,我们直接进入正题。

二、基础概念

在之前,网上可能经常说Java语言的运行速度不如C或C++,Java运行速度慢主要是因为它是解释执行的,而C或C++是编译执行的,解释执行需要通过JVM虚拟机将字节码实时翻译成机器码(边翻译边执行),才能运行在操作系统上,这个过程会比编译执行慢。

但现在再说这个结论就不太对了,随着JIT即时编译技术的发展,性能差距正在逐步缩小,甚至在某些情况下,执行速度是优于C或C++的。

1、何为JIT即时编译

在Java程序执行过程中,主要依靠字节码指令来进行。这些字节码指令按照顺序逐行被实时翻译成机器码,以便于在操作系统上运行。当某些方法或代码块(它们都对应特定的字节码)被频繁调用时,这部分代码就被视为热点代码

JVM虚拟机会针对性的对这部分热点代码进行优化编译,将它们从字节码转换为本地机器码,然后将优化后的本地机器码缓存起来,后续再执行时可以直接从缓存中获取并运行,无需再次编译。

完成这个过程的编译器,就称为JIT即时编译器(Just In Time Compiler)。JIT即时编译器显著提升了Java的性能,缩小了与其它编译型语言运行速度的差距。

在这里插入图片描述

2、热点代码

热点代码是指在运行过程中被频繁执行的代码,被即时编译的热点代码有两种,分别是:

  • 被多次调用的方法
  • 被多次执行的循环体

而热点代码由热点探测进行发现,热点探测基于计数器,JVM虚拟机会为每个方法建立对应的计数器,统计方法的执行次数、方法内的循环次数等,如果计数器超过指定阈值,则标识其为热点代码。

方法调用计数器:统计方法被调用的次数

回边计数器:统计方法内循环体代码执行的次数

三、HotSpot内置的即时编译器

主流的HotSpot虚拟机内置了两个JIT编译器:C1(Client Compiler)编译器C2(Server Compiler)编译器,在常用的JDK 8版本中,C1和C2是相互协同工作的。

1、C1编译器

C1编译器注重启动时间和编译时间,编译速度较快,但优化程度相对较低。

C1的优化策略相对简单,也比较轻量级,比如方法内联、公共子表达式消除,C1编译器编译的代码的执行速度通常比C2编译器慢。

2、C2编译器

C2编译器侧重于深度优化,与C1正好相反,C2编译器的编译时间较长,但优化的程度较高。

C2的优化策略比较深度,会进行更高级的优化,比如逃逸分析等,C2编译器编译的代码的执行速度通常比C1编译器快。

C2编译器由于深度优化代码过于复杂,已经很难维护了,从JDK 10开始,Graal编译器已经代替了C2编译器,与C1编译器协同工作

3、分层编译

由于C1和C2编译器在优化方面有不同的侧重点:C1侧重编译速度,C2侧重深度优化。

从JDK 7开始,采用分层编译的方式,C1和C2相互协同,共同发挥作用,HotSpot虚拟机根据代码的运行性能动态的选择具体采用哪个编译器完成优化。

在分层编译中,整个优化过程分为五个层次,对应着不同的优化策略:

  • 第0层:解释器执行,开启Profiling性能监控功能
  • 第1层:C1编译器执行,不开启Profiling,执行不带Profiling功能的C1编译代码
  • 第2层:C1编译器执行,开启Profiling,仅执行带部分Profiling功能的C1编译代码(方法调用次数和循环次数)
  • 第3层:C1编译器执行,开启Profiling,执行带全部Profiling功能的C1编译代码
  • 第4层:C2编译器执行,执行C2编译代码

Profiling性能监控是指在程序执行过程中,收集程序执行的各项数据,包括方法调用次数、循环次数、类型转换等等,收集的数据越多,额外的性能开销越大。

第1层到第3层都是由C1编译器执行的,显然,第1层由于不开启Profiling,执行性能会高于第2层,同时第2层只收集少量数据,第2层的执行性能也会高于第3层(总体性能:第4层 > 第1层 > 第2层 > 第3层 > 第0层)

3.1 协作流程

在分层编译中,C1和C2编译器是相互协作的,它们都由各自独立的线程来处理编译任务,线程内部维护着任务队列,用来存放待编译的热点代码,具体协作流程如下:

  1. 默认情况下,热点方法首先会被第3层的C1编译器执行,当Profiling性能监控收集到的数值达到阈值,JVM会评估C1和C2的优化性能(字节码数较少等)
    • 若判定C1和C2的执行效率相当:交由第1层的C1编译器进行优化,停止Profiling监控,不再收集运行信息
    • 若判定C2执行效率相当优于C1:交由第4层的C2编译器进行深度优化
  2. C1线程忙碌时,会直接交由第4层的C2编译器进行深度优化
  3. C2线程忙碌时,会先交由第2层的C1编译器执行优化,进行信息的初步收集,待C2线程空闲时,再交由第3层的C1编译器执行

在这里插入图片描述

四、常见JIT优化技术

JIT即使编译器主要是通过方法内联逃逸分析两种技术来实现代码的优化。

1、方法内联

方法内联其实就是将被调用方法的字节码直接插入到调用该方法的地方,调用时减少了栈帧的创建销毁开销。

举个例子:

实际上JIT修改的是字节码指令,为便于理解,本文使用代码举例

// 方法内联
public double methodInlining() {
    double num1 = Math.random();
    double num2 = Math.random();
    // 等价于 -> double sum = num1 + num2
    double sum = add(num1, num2);
    return sum;
}

public double add(double num1, double num2) {
    return num1 + num1;
}

在代码中,方法内联会将其中的add(num1, num2)方法转换为实际的num1 + num1,直接进行计算操作,避免了方法调用。

这里我们简单测试一下:

public static void main(String[] args) {
    long startTime = System.currentTimeMillis();
    JitTest demo = new JitTest();
    for (int i = 0; i < 1000000; i++) {
        demo.methodInlining();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

测试代码也比较简单,循环调用百万次,统计总耗时。

首先我们测试不启用JIT优化下这段代码的执行耗时,禁用JIT优化只需要添加JVM参数-Xint即可,禁用后,控制台输出:

执行耗时:881

取消掉禁用参数-Xint,启用JIT优化,重新执行这段测试代码:

执行耗时:47

我们进一步验证一下add方法是否进行了方法内联优化,添加三个JVM参数-XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions -XX:+PrintInlining,打印JVM优化内容:

  • -XX:+PrintCompilation:输出被JIT编译的方法信息
  • -XX:+UnlockDiagnosticVMOptions:解锁用于诊断JVM的选项,默认关闭
  • -XX:+PrintInlining:打印内联方法

在这里插入图片描述

如图,大量方法都被内联,其中也包括我们自己写的methodInliningadd方法,并且同时打印出了方法对应的字节大小,我们发现这些被内联的方法字节数都比较小。

其实这是由于方法内联也有一点的限制,即字节数过大的方法体不会进行内联,具体限制如下:

  • 非热点代码:默认限制字节数小于35,可通过参数调整限制

    // 非热点代码的内联字节大小最大阈值
    -XX:MaxInlineSize=n
    
  • 热点代码:默认限制字节数小于325,可通过参数调整限制

    // 热点代码的内联字节大小最大阈值
    -XX:FreqInlineSize=n
    
  • 接口实现限制:若接口的实现方法数量超过3个,则不会被内联

2、逃逸分析

逃逸分析核心思想是判断方法内创建的对象是否会被外部所引用,当JIT编译器判断到对象在方法外部不会被引用,即该对象的生命周期被限定在当前方法执行期间,编译器就能采取多种优化措施,比如锁消除、标量替换和栈上分配。

(1)同步锁消除

同步锁消除旨在消除代码中的同步操作,若某个对象不会逃逸出当前方法,只在方法内部使用,则不存在线程安全问题,因为每个方法的栈都是私有的,JIT编译器就会消除该同步锁操作,提高程序的执行效率。

举个例子:

public void syncLockEliminate() {
    // 等价于 -> 不执行该同步锁
    synchronized (JitTest.class) {
        // 业务代码逻辑
    }
}

public static void main(String[] args) {
    long startTime = System.currentTimeMillis();
    JitTest demo = new JitTest();
    for (int i = 0; i < 1000000; i++) {
        demo.syncLockEliminate();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

这里启用和禁用JIT锁消除(禁用锁消除参数:-XX:-EliminateLocks)对应控制台输出的执行耗时分别为:

// 启用锁消除
执行耗时:143

// 禁用锁消除
执行耗时:203
(2)栈上分配

栈上分配是将被创建的对象内存分配在栈上,而不是堆上,降低GC垃圾回收的频率。

举个例子:

static class UserInfo {
    // 姓名
    private String name;
    // 年龄
    private int age;

    public UserInfo() {
    }

    public UserInfo(String name, int age) {
        this.name = name;
        this.age = age;
    }
}

// 栈上分配,不赋值对象属性
public static void createUser() {
    UserInfo user = new UserInfo();
}

public static void main(String[] args) throws Exception {
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 1000000; i++) {
        createUser();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

这里我们验证一下这个结论,我们在JVM参数上添加-XX:+PrintGC,输出GC日志信息,同时将堆内存空间设小一些:

-Xms10m -Xmn10m -XX:+PrintGC

首先默认启用JIT逃逸分析优化,控制台输出:

执行耗时:72

接着禁用逃逸分析优化,添加参数-XX:-DoEscapeAnalysis关闭逃逸分析,控制台输出:

[GC (Allocation Failure)  7679K->1041K(9216K), 0.0010975 secs]
[GC (Allocation Failure)  8721K->904K(9216K), 0.0006550 secs]
[GC (Allocation Failure)  8584K->840K(9216K), 0.0007822 secs]
执行耗时:103

关闭逃逸分析优化后,JVM执行了几次的GC垃圾回收。

(3)标量替换

标量替换是将需要被创建的对象拆解成独立的标量(对象内部的基本数据类型),方法执行时不创建该对象实例,而是直接创建它的成员变量代替它,这些成员变量作为该方法的局部变量被分配在栈上。

标量替换是针对栈上分配更进一步的优化技术,栈上分配只是将对象从堆上分配到栈上,而标量替换是将对象进行拆解,作为方法的局部变量被分配在栈上。

举个例子:

// 标量替换,赋值对象属性
public static void createUser() {
    // 等价于 -> String name = user.name = xiaohao;
    //          int age = user.name = 24
    UserInfo user = new UserInfo("xiaohao", 24);
    String userInfo = user.name + ":" + user.age;
}

public static void main(String[] args) throws Exception {
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 1000000; i++) {
        createUser();
    }
    long endTime = System.currentTimeMillis();
    System.out.println("执行耗时:" + (endTime - startTime));
}

若JIT判断到UserInfo对象不会逃逸出当前方法,则会将UserInfo对象的nameage属性替换为两个局部变量,不进行创建UserInfo对象,避免在堆上分配对象实例。

控制台输出的执行耗时分别为:

// 启用逃逸分析
执行耗时:162

// 禁用逃逸分析
执行耗时:203

五、后记

本文从JIT即时编译器基础概念开始介绍,着重讲解了常见的JIT优化技术,包括方法内联与逃逸分析,额外拓展了HotSpot虚拟机内置的C1、C2编译器及分层编译协作流程。

JIT即时编译器在运行时对Java字节码进行优化,极大地提升了Java程序的执行效率。不过也要求我们日常编写代码要注意一定的规范,让JIT发挥最大效果。比如控制方法的代码行数,避免写过长的代码方法,可以将复杂的逻辑拆分成多个小方法,提升方法内联的生效几率;另外也可以控制接口的实现数量,尽量不超过两个,降低方法内联的复杂度;以及注意在方法内创建对象时,尽量不让对象逃逸。

如果大家觉得内容有价值,不妨考虑点点赞,关注关注小豪,后续小豪将会继续更新其它Java相关文章,大家共同进步~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1861780.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高考填报志愿,找准自己的真兴趣来选择专业

又是一年一度的高考填报志愿的时间了&#xff0c;毕业生们要根据自己的分数&#xff0c;在很短的时间内确定自己的专业。专业千万条&#xff0c;兴趣第一条。专业的选择很大程度上决定着大学的学习生活是否顺利&#xff0c;甚至决定着以后的职业生涯。在纷繁复杂的专业中&#…

全球首个数字人开源了

DUIX&#xff08;Dialogue User Interface System&#xff09;是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源&#xff0c;开发者可自行接入多方大模型、语音识别&#xff08;ASR&#xff09;、语音合成&#xff08;TTS&#xff09;能力&#xff0c;实现数字…

【AI落地应用实战】如何高效检索与阅读论文——302.AI学术论文工具评测

一、引言 作为一名学术领域的探索者&#xff0c;我们都知道&#xff0c;检索和阅读论文是我们获取知识、启发思考、验证假设的基石&#xff0c;也是日常学习中必不可少的基本功之一。然而在浩瀚的学术海洋中&#xff0c;如何快速、准确地找到我们需要的论文&#xff0c;就像是…

git提交新仓库代码,提示无权限,但用户名已修改

目录 1 用户名无权限 2 删除用户凭据 2.1 打开控制面板 2.2 找到“凭据管理器” 2.3 删除git历史 3 npm工具库添加git仓库指引 1 用户名无权限 之前因为时间的原因&#xff0c;js-tool-big-box工具库没有提交到github上去&#xff0c;今天想着往上提交一下&#xff0c;但…

python03——文件操作(new)

“变量”open&#xff08;‘文件路径’&#xff0c;‘模式’&#xff09; //注意加引号 “变量”.write( ) //write函数是写的是字符串&#xff0c;如果你写的东西不是字符串&#xff0c;要写成write&#xff08;str&#xff08;。。&#xff09;&#xff09; “变量”.read…

【Containerd】Containerd接入Harbor仓库

说明 在日常使用容器时&#xff0c;安全方便起见一般都会使用到私有仓库&#xff0c;一般都是采用 harbor 作为私有仓库&#xff0c;docker 对接 harbor 仓库非常简单&#xff0c;那么 containerd 如何对接 harbor 呢&#xff1f; 在内网使用 harbor 根据个人习惯&#xff0c…

快速上手golang(持续更新)

由于项目需要&#xff0c;我不得不快速掌握go语言来帮助我进行项目的开发。时间紧迫到我来不及去了解语言的特性就直接项目上手了。我决定就先熟悉一个主流的go框架和go语言的一些日常用法&#xff0c;之后就得滑着这只破船摇摇晃晃上路了。 1 基础命令 就说几个用的多的&…

QT拖放事件之八:通过全局剪切板中的接口QClipboard::mimeData()来获取MIME类型数据

1、演示效果 首先向剪切板写入数据,然后点击paste按钮进行从全局剪切板中 获取 MIME数据。。。 2、核心代码 void Widget::on_pasteBtn_clicked() {const QClipboard* clipBoard = QGuiApplication::clipboard()

理解和处理不同类型的上下文的新型的语言模型ReALM

在人类的日常交流中&#xff0c;模糊的代词如“他们”或“那个”常常出现&#xff0c;它们的意义通常依赖于上下文才能明确。这种上下文的理解对于对话助手来说至关重要&#xff0c;因为它们旨在提供一种自然的交流体验。然而&#xff0c;现有的对话助手在处理这类模糊引用时往…

Java HashMap 简介

HashMap 简介 HashMap 主要用来存放键值对&#xff0c;它基于哈希表的 Map 接口实现&#xff0c;是常用的 Java 集合之一&#xff0c;是线程不安全的。 HashMap&#xff1b;可以存储 null 的 key 和 value &#xff0c;但 null 作为 key 只能有一个&#xff0c;null 作为值可以…

非强化学习的对齐方法

在文章《LLM对齐“3H原则”》和《深入理解RLHF技术》中&#xff0c;我们介绍了大语言模型与人类对齐的“3H原则”&#xff0c;以及基于人类反馈的强化学习方法&#xff08;RLHF&#xff09;&#xff0c;本文将继续介绍另外一种非强化学习的对齐方法&#xff1a;直接偏好优化&am…

深度学习语义分割算法之基础知识

文章目录 前言一、图像分割介绍1.语义分割2.实例分割3.全景分割 二、常见数据集格式1.PASCAL VOC2.MS COCO 三、语义分割结果四、语义分割常见评价指标1.Pixel Accuracy2.mean Accuracy3.mean IoU 五、语义分割标注工具结束语 &#x1f482; 个人主页:风间琉璃&#x1f91f; 版…

FireFox 编译指南2024 Windows10篇-环境准备(一)

1. 引言 在开源浏览器项目中&#xff0c;Firefox因其高性能和灵活性而备受开发者青睐。为了在本地环境中编译和定制Firefox&#xff0c;开发者需要做好充分的环境准备工作。这不仅是编译成功的基础&#xff0c;也是后续调试、优化和二次开发的关键步骤。 编译Firefox是一个复…

硬核实力再亮,玩出梦想科技发布全球首款安卓系统空间计算机

6月25日&#xff0c;玩出梦想科技在新加坡召开全球新品发布会&#xff0c;正式发布全球首款安卓系统空间计算机——玩出梦想MR&#xff0c;填补了空间计算机在安卓生态的空白。 作为品牌沉淀两年的破晓之作&#xff0c;玩出梦想MR以业内领先软硬件配置&#xff0c;强大自研算法…

kafka--发布-订阅消息系统

1. Kafka概述 1. kafka是什么 kafka是分布式的、高并发的、基于发布/订阅模式的消息队列软件系统。 kafka中的重要组件 Producer&#xff1a;消息生产者&#xff0c;发布消息到Kafka集群的终端或服务Consume&#xff1a;消费者&#xff0c;从Kafka集群中消费消息的终端或服…

CAN报文的发送类型-OnChange、OnWrite、IfActive、Repetition

CAN报文的发送类型分为基本发送类型和混合发送类型两大类 CAN基本发送类型包括Cyclic周期发送、OnChange变化时发送、OnWrite写入时发送和IfActive有效时发送。基本发送类型中的Cyclic称为周期型,而其他3个类型称为事件型(Event)。发送次数是通过定义Repetition重复次数来实…

AI 编程探索- iOS动态标签控件

需求分析&#xff1a; 标签根据文字长度&#xff0c;自适应标签居中显示扩展 超过内容显示范围&#xff0c;需要换行显示&#xff0c;且保持居中显示 AI实现过程 提问&#xff1a; 回答&#xff1a; import UIKit import SnapKitclass DynamicLabelsContainerView: UIView…

python基础篇(5):None类型

1 None类型 Python中有一个特殊的字面量&#xff1a;None&#xff0c;其类型是&#xff1a;<class NoneType> 无返回值的函数&#xff0c;实际上就是返回了&#xff1a;None这个字面量 None表示&#xff1a;空的、无实际意义的意思 函数返回的None&#xff0c;就表示…

[MYSQL] MYSQL库的操作

前言 本文主要介绍MYSQL里 库 的操作 请注意 : 在MYSQL中,命令行是不区分大小写的 1.创建库 create database [if not exists] database_name [charsetutf8 collateutf8_general_ci] ...] create database 是命名语法,不可省略[if not exists] 如果不存在创建,如果存在跳过…

基于CRITIC-TOPSIS法的各地区评价

1.CRITIC-TOPSIS法原理 1.1 基本理论 CRITIC-TOPSIS法是一种结合CRITIC&#xff08;Criteria Importance Through Intercriteria Correlation&#xff09;法和TOPSIS&#xff08;Technique for Order Preference by Similarity to Ideal Solution&#xff09;法的综合评价方法…