【JVM详解四】执行引擎

news2025/2/10 22:58:46

一、概述

Java程序运行时,JVM会加载.class字节码文件,但是字节码并不能直接运行在操作系统之上,而JVM中的执行引擎就是负责将字节码转化为对应平台的机器码让CPU运行的组件。

执行引擎是JVM核心的组成部分之一。可以把JVM架构分成三部分,如下图所示:

 执行引擎位于JVM的最下层(图中虚线框部分),可以粗略地看到执行引擎负责和运行时数据区交互。

二、计算机语言的发展史

在讲解执行引擎之前,需要知道什么是机器码、汇编语言、高级语言以及为什么会有Java字节码的出现。

2.1 机器码

各种用 0 和 1 组成的二进制编码方式表示的指令,叫作机器指令码,简称机器码。

计算机发展的初始阶段,人们就用机器码编写程序,我们也称为机器语言。机器语言虽然能够被计算机理解和接受,但由于可读性差不便于人类读写,并且用它编程容易出差错。使用机器码编写的程序一经输入计算机,CPU可以直接读取运行,因此和其他语言编的程序相比,执行速度最快。机器码与CPU紧密相关,所以不同种类的CPU所对应的机器码也就不同。

2.2 汇编语言

由于机器码是由0和1组成的二进制序列,可读性实在太差,于是人们发明了指令。

指令就是把机器码中特定的0和1序列,简化成对应的指令(一般为英文简写,如mov、inc等),可读性稍好,这就是我们常说的汇编语言。在汇编语言中,用助记符 (Mnemonics) 代替机器码的操作码,用地址符号 (Symbol) 或标号 (Label) 代替指令或操作数的地址。

不同的硬件平台,各自支持的指令是有差别的。因此每个平台所支持的指令,称为对应平台的指令集,如常见的x86指令集对应的是x86架构的平台,ARM指令集对应的是ARM架构的平台。不同平台之间指令不可以直接移植。

由于计算机只认识机器码,所以用汇编语言编写的程序还必须经过汇编器转换为机器语言,计算机才能识别和执行。

2.3 高级语言

为了使计算机用户编程序更容易些,后来就出现了各种高级计算机语言。比如C、C++等更容易让人识别的语言。

高级语言则相对汇编语言更易于编写,有更好的可读性,一般编译器会将高级语言转换成汇编语言,然后再由汇编器转换为机器指令由计算机执行。

2.4 字节码

字节码是一种中间状态(中间码)的二进制代码(文件),需要转译后才能成为机器码。Java 程序可以通过编译器将源码编译成 Java 字节码,特定平台上的虚拟机将字节码转译为可以直接执行的指令,也就实现了跨平台性。如下图所示:

三、执行引擎工作过程

  1. 执行引擎在执行过程中,需要执行什么样的字节码指令取决于PC寄存器(程序计数器);
  2. 每执行完一项指令操作之后,PC寄存器会更新下一条需要执行的指令地址;
  3. 方法执行过程中,执行引擎可能会通过局部变量表中的对象引用准确定位到 Java 堆中的对象实例信息,以及通过对象头中的元数据信息定位到目标对象的类型信息。
Java执行引擎包括以下组成部分:
  • 解释器
  • JIT编译器
  • 垃圾收集器

3.1 解释器

解释器就是一个运行时的“翻译者”,将字节码指令翻译为对应平台的本地机器指令由CPU执行,当一条指令执行完成后再根据PC寄存器中记录的下一条指令执行解释操作。

JVM设计者的初衷是为了满足Java程序实现跨平台特性,因此避免采用静态编译的方式直接生成机器码,从而诞生了实现解释器在运行时采用逐行解释字节码执行程序的想法。

3.2 JIT(Just-In-Time)编译器

当执行某些频繁被调用的代码(比如for循环中的代码)时,如果按照解释执行,效率非常低,这种被频繁调用的代码成为热点代码。为了提高热点代码的执行效率,在运行时,JIT编译器则会将这些代码编译成与本地平台有关的机器码,并进行各种层次的优化。

JIT的构成组件包括:

  • 中间代码生成器——生成中间代码
  • 代码优化器——优化中间代码
  • 目标代码生成器——生成机器码或本地代码
  • 分析器——负责查找热点代码

3.2.1 JIT编译器类型

在 Hotspot 虚拟机中内置了两种JIT编译器:

  • C1编译器:主要关注点在于局部性能优化,适用于执行时间短或对启动性能有要求的程序,如:GUI应用,C1编译器也被称为Client Compiler。
  • C2编译器:为长期运行的服务端应用程序做性能优化的编译器,适用于执行时间较长或对峰值性能有要求的程序,C2编译器也被称为Server Compiler。
Graal编译器:用Java实现的JIT编译器,JDK10中引入(具体信息参考: JEP 317: Experimental Java-Based JIT Compiler),JDK17中移除(移除原因参考: JEP 410: Remove the Experimental AOT and JIT Compiler)

3.2.2 分层编译

在 Java7 引入了分层编译,这种方式综合了 C1 的启动优势和 C2 的峰值性能优势。分层编译将 JVM 的执行状态分为5个层次:

  • 第0层:程序解释执行,默认开启性能监控(Profiling),如果不开启,可触发第二层编译
  • 第1层:C1编译,将字节码编译成本地代码,进行简单可靠的优化,不开启Profiling
  • 第2层:C1编译,开启Profiling,仅执行带方法调用次数和循环回边执行次数Profiling的C1编译
  • 第3层:C1编译,执行所有带Profiling的C1编译
  • 第4层:C2编译,将字节码编译为本地代码,但会启用一下编译耗时较长的优化,甚至会根据性能监控信息进行一些不可靠的激进优化。

Java8 中默认开启分层编译,-XX:-TieredCompilation 参数可关闭分层编译只使用C2编译,如果只使用C1编译可设置参数 -XX:TieredStopAtLevel=1。

-Xint参数可设置为强制解释器模式运行,-Xcomp可设置为强制运行JIT编译模式。

3.2.3 热点代码探测

Hotspot 虚拟机判定热点代码基于2种计数器进行,方法调用计数器和回边计数器,只有代码符合标准并达到设置的阈值才会进行JIT编译优化。

1)方法调用计数器

当某个方法调用次数达到阈值就会触发JIT编译优化。

jinfo -flag CompileThreshold 或者 java -XX:+PrintFlagsFinal -version 命令可查看方法调用次数阈值,客户端模式下默认值为1500,服务端模式下默认值为10000。

2)回边计数器

用于统计方法体中循环体代码执行次数,字节码中遇到控制流向后跳转的指令称为“回边”(Back Edge),用于计算是否为热点代码的阈值。

计算公式如下:

回边计数器阈值 = 方法调用计数器阈值(CompileThreshold)*(OSR比率(OnStackReplacePercentage)-解释器监控比例(InterpreterProfilePercentage))/ 100

java -XX:+PrintFlagsFinal -version 命令可查看相关参数

 根据图中显示的各参数的默认值可以计算出回边计数器阈值为:1000 * (140 - 33) = 10700

3.2.4 编译优化技术

1)方法内联

方法内联的优化行为是将目标方法的代码复制到发起调用的方法中,避免真实方法调用。

private int add(int a, int b, int c, int d) {
    return addInt1(a, b) + addInt2(c, d);
}
​
private int addInt1(int a, int b) {
    return a + b;
}
​
private int addInt2(int a, int b) {
    return a + b;
}

例如上面的代码如果被检测为热点代码,则会被优化为以下代码:

private int add(int a, int b, int c, int d) {
    return a + b + c + d;
}

热点方法不一定都会被内联优化,只有当方法体大小小于参数 -XX:FreqInlineSize 值(默认325字节)才会进行内联,非热点方法当方法体小于参数 -XX:MaxInlineSize 值(默认35字节)才会进行内联。

相关性能调优 :

  • 减小热点方法检测阈值,增加内联方法体阈值,缺点则是会增加内存占用
  • 尽量避免在一个方法体内写入大量代码,习惯使用小方法体
  • 尽量使用final private static 关键字修饰方法,代码优化时,因为继承需要额外的类型检查。

2)锁消除

当方法中的局部方法中创建的对象只能被当前线程访问时,不存在锁竞争,JIT编译会对这个对象的方法进行锁消除。

参数 -XX:+EliminateLocks 可以开启锁消除(默认开启),-XX:-EliminateLocks 则是关闭锁消除。

3)锁粗化

如果检测到同一个对象执行了连续的加锁和解锁操作,则会将这一系列操作合并成一个更大的锁,从而提升程序运行效率。

4)逃逸分析

JIT编译器会对热点代码中的对象进行逃逸分析,分析该对象动态作用域,当被传递到其他方法中称为方法逃逸,当能被外部方法所引用则为线程逃逸

不逃逸 到 方法逃逸 再到 线程逃逸,逃逸程度由低到高。

逃逸分析可以通过参数 -XX:+DoEscapeAnalysis开启(jdk1.8默认开启),或 -XX:-DoEscapeAnalysis 关闭。

关闭逃逸分析会导致对象分配到堆中,频繁触发垃圾回收导致代码运行慢。

5)标量替换

当确定对象不会逃逸出线程之外,该对象则会被分配到栈上,对象分配到栈需要进行成员变量拆分,这种优化技术叫做标量替换。标量替换需要开启逃逸分析。

标量替换可以通过参数 -XX:+EliminateAllocations开启(jdk1.8默认开启),或-XX:+EliminateAllocations关闭

3.3 垃圾收集器

Java的一个主要特点就是开发人员不需要过分关注对象的内存管理,无用对象的销毁和空间释放都交由JVM的垃圾收集器处理。这减轻了编程负担提高了编程效率,但垃圾回收也会影响程序的性能。

详细介绍见上章。

四、总结

JVM中的执行引擎是JVM的重要组成部分之一,主要负责将字节码指令翻译成机器码指令。

执行引擎包括解释器,JIT解释器和垃圾收集器。

解释器就是运行时的“翻译者”,将字节码解释为机器指令。

但是某些频繁执行的热点代码依然采用解释执行的话会导致程序执行很慢,JIT编译器则是负责将热点代码编译分层优化成本地机器码。

垃圾收集器则负责无用对象的销毁,释放内存空间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2296014.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

route 与 router 之间的差别

简述&#xff1a; router&#xff1a;主要用于处理一些动作&#xff0c; route&#xff1a;主要获得或处理一些数据&#xff0c;比如地址、参数等 例&#xff1a; videoInfo1.vue&#xff1a; <template><div class"video-info"><h3>二级组件…

SamWaf开源轻量级的网站应用防火墙(安装包),私有化部署,加密本地存储的数据,易于启动,并支持 Linux 和 Windows 64 位和 Arm64

一、SamWaf轻量级开源防火墙介绍 &#xff08;文末提供下载&#xff09; SamWaf网站防火墙是一款适用于小公司、工作室和个人网站的开源轻量级网站防火墙&#xff0c;完全私有化部署&#xff0c;数据加密且仅保存本地&#xff0c;一键启动&#xff0c;支持Linux&#xff0c;Wi…

极客说|利用 Azure AI Agent Service 创建自定义 VS Code Chat participant

作者&#xff1a;卢建晖 - 微软高级云技术布道师 「极客说」 是一档专注 AI 时代开发者分享的专栏&#xff0c;我们邀请来自微软以及技术社区专家&#xff0c;带来最前沿的技术干货与实践经验。在这里&#xff0c;您将看到深度教程、最佳实践和创新解决方案。关注「极客说」&a…

windows + visual studio 2019 使用cmake 编译构建静、动态库并调用详解

环境 windows visual studio 2019 visual studio 2019创建cmake工程 1. 静态库.lib 1.1 静态库编译生成 以下是我创建的cmake工程文件结构&#xff0c;只关注高亮文件夹部分 libout 存放编译生成的.lib文件libsrc 存放编译用的源代码和头文件CMakeLists.txt 此次编译CMak…

【kafka实战】05 Kafka消费者消费消息过程源码剖析

1. 概述 Kafka消费者&#xff08;Consumer&#xff09;是Kafka系统中负责从Kafka集群中拉取消息的客户端组件。消费者消费消息的过程涉及多个步骤&#xff0c;包括消费者组的协调、分区分配、消息拉取、消息处理等。本文将深入剖析Kafka消费者消费消息的源码&#xff0c;并结合…

[EAI-033] SFT 记忆,RL 泛化,LLM和VLM的消融研究

Paper Card 论文标题&#xff1a;SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training 论文作者&#xff1a;Tianzhe Chu, Yuexiang Zhai, Jihan Yang, Shengbang Tong, Saining Xie, Dale Schuurmans, Quoc V. Le, Sergey Levine, Yi Ma 论…

算法与数据结构(字符串相乘)

题目 思路 这道题我们可以使用竖式乘法&#xff0c;从右往左遍历每个乘数&#xff0c;将其相乘&#xff0c;并且把乘完的数记录在nums数组中&#xff0c;然后再进行进位运算&#xff0c;将同一列的数进行相加&#xff0c;进位。 解题过程 首先求出两个数组的长度&#xff0c;…

DeepSeek从入门到精通:全面掌握AI大模型的核心能力

文章目录 一、DeepSeek是什么&#xff1f;性能对齐OpenAI-o1正式版 二、Deepseek可以做什么&#xff1f;能力图谱文本生成自然语言理解与分析编程与代码相关常规绘图 三、如何使用DeepSeek&#xff1f;四、DeepSeek从入门到精通推理模型推理大模型非推理大模型 快思慢想&#x…

【异常解决】在idea中提示 hutool 提示 HttpResponse used withoud try-with-resources statement

博主介绍&#xff1a;✌全网粉丝22W&#xff0c;CSDN博客专家、Java领域优质创作者&#xff0c;掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌ 技术范围&#xff1a;SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物…

【Uniapp-Vue3】UniCloud云数据库获取指定字段的数据

使用where方法可以获取指定的字段&#xff1a; let db uniCloud.database(); db.collection("数据表").where({字段名1:数据, 字段名2:数据}).get({getOne:true}) 如果我们不在get中添加{getOne:true}&#xff0c;在只获取到一个数据res.result.data将会是一个数组&…

信息科技伦理与道德3-2:智能决策

2.2 智能推荐 推荐算法介绍 推荐系统&#xff1a;猜你喜欢 https://blog.csdn.net/search_129_hr/article/details/120468187 推荐系统–矩阵分解 https://blog.csdn.net/search_129_hr/article/details/121598087 案例一&#xff1a;YouTube推荐算法向儿童推荐不适宜视频 …

Visual Studio 2022 中使用 Google Test

要在 Visual Studio 2022 中使用 Google Test (gtest)&#xff0c;可以按照以下步骤进行&#xff1a; 安装 Google Test&#xff1a;确保你已经安装了 Google Test。如果没有安装&#xff0c;可以通过 Visual Studio Installer 安装。在安装程序中&#xff0c;找到并选择 Googl…

WGCLOUD监控系统部署教程

官网地址&#xff1a;下载WGCLOUD安装包 - WGCLOUD官网 第一步、环境配置 #安装jdk 1、安装 EPEL 仓库&#xff1a; sudo yum install -y epel-release 2、安装 OpenJDK 11&#xff1a; sudo yum install java-11-openjdk-devel 3、如果成功&#xff0c;你可以通过运行 java …

协议-WebRTC-HLS

是什么&#xff1f; WebRTC&#xff08;Web Real-Time Communication&#xff09; 实现 Web 浏览器和移动应用程序之间通过互联网直接进行实时通信。允许点对点音频、视频和数据共享&#xff0c;而无需任何插件或其他软件。WebRTC 广泛用于构建视频会议、语音通话、直播、在线游…

MySQL系列之数据类型(String)

导览 前言一、字符串类型知多少 1. 类型说明2. 字符和字节的转换 二、字符串类型的异同 1. CHAR & VARCHAR2. BINARY & VARBINARY3. BLOB & TEXT4. ENUM & SET 结语精彩回放 前言 MySQL数据类型第三弹闪亮登场&#xff0c;欢迎关注O。 本篇博主开始谈谈MySQ…

【C++高并发服务器WebServer】-15:poll、epoll详解及实现

本文目录 一、poll二、epoll2.1 相对poll和select的优点2.2 epoll的api2.3 epoll的demo实现2.5 epoll的工作模式 一、poll poll是对select的一个改进&#xff0c;我们先来看看select的缺点。 我们来看看poll的实现。 struct pollfd {int fd; /* 委托内核检测的文件描述符 */s…

git提交到GitHub问题汇总

1.main->master git默认主分支是maser&#xff0c;如果是按照这个分支名push&#xff0c;GitHub会出现两个branch&#xff0c;与预期不符 解决方案&#xff1a;更改原始主分支名为main git config --global init.defaultBranch main2.git&#xff1a;OpenSSL SSL_read: SS…

CNN-GRU卷积神经网络门控循环单元多变量多步预测,光伏功率预测(Matlab完整源码和数据)

代码地址&#xff1a;CNN-GRU卷积神经网络门控循环单元多变量多步预测&#xff0c;光伏功率预测&#xff08;Matlab完整源码和数据) CNN-GRU卷积神经网络门控循环单元多变量多步预测&#xff0c;光伏功率预测 一、引言 1.1、研究背景和意义 随着全球能源危机和环境问题的日…

编译原理面试问答

编译原理面试拷打 1.编译原理的基本概念 编译原理是研究如何将高级程序语言转换为计算机可执行代码的理论与技术&#xff0c;其核心目标是实现高效、正确的代码翻译。 **编译器&#xff1a;**将源代码转化为目标代码&#xff08;机器码、字节码等&#xff09;。一次翻译整个程…

LIMO:上海交大的工作 “少即是多” LLM 推理

25年2月来自上海交大、SII 和 GAIR 的论文“LIMO: Less is More for Reasoning”。 一个挑战是在大语言模型&#xff08;LLM&#xff09;中的复杂推理。虽然传统观点认为复杂的推理任务需要大量的训练数据&#xff08;通常超过 100,000 个示例&#xff09;&#xff0c;但本文展…