目录
一.Java编译与执行流程:
二.编译过程:
1.编译器(javac):
2.字节码文件(.class):
三.执行过程:
1.启动JVM(Java虚拟机):
2.类加载:
3.字节码执行:
4.JVM内存模型:
5.垃圾回收(GC):
6. Java运行时的执行引擎:
Java是将代码编译成一种“字节码”,它类似于抽象的CPU指令,然后针对不同平台编写虚拟机,不同平台的虚拟机负责加载字节码并执行,这样就实现了“一次编写,到处运行”的效果。当然,这是针对Java开发者而言。对于虚拟机,需要为每个平台分别开发。为了保证不同平台、不同公司开发的虚拟机都能正确执行Java字节码,SUN公司制定了一系列的Java虚拟机规范。从实践的角度看,JVM的兼容性做得非常好,低版本的Java字节码完全可以正常运行在高版本的JVM上。
Java源码本质上是一个文本文件,我们需要先用javac
把Hello.java
编译成字节码文件Hello.class
,然后,用java
命令执行这个字节码文件:
因此,可执行文件javac
是编译器,而可执行文件java
就是虚拟机。
Java程序的编译和运行涉及到多个阶段和不同的组件,最重要的是Java虚拟机(JVM)的角色,它在程序运行时负责执行字节码。理解Java程序的编译、运行流程及其如何与JVM交互是掌握Java开发的基础。
一.Java编译与执行流程:
- 由开发者编写.java源代码文件。
- Java编译器(javac)将.java源代码文件编译成字节码文件(.class),字节码文件包含平台无关的指令,JVM能够理解并执行这些指令。
- JVM通过类加载器(ClassLoader)加载
.class
文件。 - 字节码被JVM解释执行,或者通过JIT(即时编译器)转化为本地机器代码。(将字节码转换为机器码,从而提高程序的执行效率)
- JVM根据需求进行垃圾回收,自动管理内存以及回收不再使用的对象。
二.编译过程:
当我们编写Java程序并运行javac
命令时,Java编译器将源代码(.java文件)编译成字节码(.class文件)。字节码并不是针对某个特定机器的机器码,而是与平台无关的中间代码。这是Java的跨平台性("Write Once, Run Anywhere")的关键所在。字节码并没有直接针对硬件或操作系统进行优化,因此它不能直接被CPU执行。
Java程序首先由Java编译器(
javac
)编译成字节码(字节码文件(.class
文件)是与平台无关的指令,而JVM可以理解并执行)。这个过程包括:
- 语法分析(Parsing):将源代码(
.java
文件)转换为抽象语法树(AST)。- 符号解析(Symbol Resolution):通过符号表解析类、方法、变量的名称等。
- 字节码生成(Bytecode Generation):将抽象语法树转换为字节码指令,生成
.class
文件。javac HelloWorld.java
编译后会生成一个字节码文件
HelloWorld.class
。这个文件包含了Java源代码的字节码,JVM可以加载并执行它。
三.执行过程:
1.启动JVM(Java虚拟机):
JVM的执行由Java启动类(通常是java
命令)来启动。
java HelloWorld
java
命令启动JVM并传递应用程序的主类(HelloWorld
)给JVM。
2.类加载:
当我们运行Java程序时,JVM会使用类加载器(ClassLoader)加载.class
文件。JVM并不会直接执行.class
文件,而是解析并执行其字节码。JVM将字节码转化为机器码后执行。
JVM使用类加载器(ClassLoader)加载
.class
文件。加载过程包括以下几个步骤:
- 加载:从文件系统、网络、或者其他位置加载字节码文件。
- 链接:包括验证(确保字节码格式正确)、准备(为类变量分配内存)和解析(解析符号引用)。
- 初始化:执行类的静态初始化块(
static
块)和静态变量的初始化。
JVM有三种主要的类加载器:
- Bootstrap ClassLoader:负责加载核心类库,如
rt.jar
中的类。- Extension ClassLoader:加载Java扩展库(如
ext
目录中的库)。- Application ClassLoader:负责加载应用程序类路径下的类。
3.字节码执行:
一旦类被加载,JVM会执行字节码。
执行字节码方式:
解释执行:
- JVM中的解释器逐条解释字节码指令,并将其翻译成机器码执行。
- 这种方式灵活但较慢,因为每条指令都需要在每次执行时解释一次。
JIT编译(即时编译):
- JIT编译器会在程序运行时,动态地将热点代码(频繁执行的代码)编译成机器码。
- JIT优化性能,将程序中的热路径(经常执行的代码)编译为本地机器代码,以避免每次执行时都需要解释。(机器码是与硬件相关的,并且执行速度更快。)
- 即时编译器(JIT)是JVM的一部分,它在程序运行时将热点代码(频繁执行的部分)从字节码转换成机器码,并将这些机器码存储在内存中以便后续直接执行。JIT编译通常会选择一些最常调用的代码块进行编译,从而优化程序的执行速度。
- JIT能够根据程序的实际运行情况进行优化(如内联、死代码消除等),进一步提高性能。
.class
文件内容:
- 常量池(Constant Pool):存储了类、方法、字段等的引用。
- 字段表(Field Table):包含了类中所有字段的定义。
- 方法表(Method Table):包含了类中所有方法的定义。
- 字节码:具体的指令集,表示类中的方法的操作步骤。
JVM执行这些指令时会根据当前系统平台生成机器代码。字节码指令类似于汇编语言,但它们并非直接执行,而是由JVM的解释器或JIT(即时编译器)执行。
字节码与机器码的区别:
字节码:Java源代码通过
javac
编译器编译后生成的中间代码,平台无关,能够在任何安装了JVM的操作系统上运行。字节码是一种虚拟机指令,JVM根据这些指令执行程序的逻辑。机器码:是特定硬件平台能够直接理解和执行的指令集。每种硬件平台(如x86、ARM等)都有其专用的机器码格式。因此,机器码是与硬件相关的,并且执行速度更快。
字节码到机器码:
- 字节码是一种平台无关的中间代码,它不能直接由硬件执行。
- JIT编译是JVM将字节码转换为平台特定的机器码的过程。通过将热点代码编译为机器码,JIT提高了Java程序的执行性能。
- 解释执行和JIT编译是JVM在字节码执行中的两种主要方式,JIT会根据代码的执行频率将热点代码编译为机器码,避免了每次执行时都进行字节码解释。
- JIT优化(如方法内联、死代码消除、常量折叠等)可以进一步提升性能。
字节码转机器码的过程通过JIT技术优化了Java程序的性能,使得Java在保持平台无关性的同时,也能够接近本地代码的执行效率。
4.JVM内存模型:
JVM在程序运行时管理内存,包括以下几个主要区域:
堆(Heap):
- 存储所有对象实例和数组。
- 堆内存是JVM中最大的一块内存区域,由垃圾回收器(GC)负责管理内存回收。
方法区(Method Area):存储类的元数据(如类名、方法信息、字段信息等),以及静态变量。
栈(Stack):
- 每个线程在执行时都会有一个栈,用于存储局部变量、操作栈和方法调用的相关信息。
- 每个方法调用都会创建一个栈帧,其中存储方法的局部变量和返回地址。
程序计数器(PC Register):每个线程都有一个程序计数器,指示当前正在执行的字节码指令的地址。
本地方法栈(Native Method Stack):专门为本地方法(使用JNI调用的C、C++等语言编写的代码)提供的内存区域。
5.垃圾回收(GC):
Java的垃圾回收机制自动回收不再使用的对象,释放内存。JVM通过GC(垃圾回收)来管理堆内存,减少内存泄漏的风险。
GC的过程包括:
- 标记(Mark):标记所有被引用的对象。
- 清除(Sweep):删除所有没有被标记的对象。
- 压缩(Compact):整理内存,确保内存空间连续。
常见的垃圾回收算法包括标记-清除、标记-整理、复制算法等。
6. Java运行时的执行引擎:
JVM的执行引擎负责执行字节码指令,有两种主要的执行方式:
解释器(Interpreter):
- 解释器逐条解释并执行字节码。
- 每次执行时都要将字节码解释成机器码,因此效率较低。
JIT编译器(Just-In-Time Compiler):
- JIT编译器在程序运行时,检测到热点代码并将其编译为机器码。
- 热点代码会直接使用机器码执行,避免了每次解释执行。
- JIT编译器提高了程序的执行速度,尤其是在大量重复执行的代码路径上。