class 文件的定义
class 文件就是能够被 JVM 识别,加载并且执行的文件格式。从定义来看,class 文件没有想象中的那么神秘,和其他格式如 txt,mp4 一样,只是一种文件格式,它存储的是我们应用程序。
不止 Java 语言,很多其他语言,比如 Scala,Python,都可以生成 class 字节码文件,被 JVM 识别和执行。
Class字节码文件分析
文件结构:
Magic:
class文件的魔数,class文件的魔数是一个固定的值:0XCAFEBABE
minor_version major_version:
文件版本号,对应JDK版本。
constant_pool_count和constant_pool:
常量池数和常量,常量池中记录了java文件中的所有的常量类型包括字符串、类名、方法名等,除了JAVA源代码中定义的的常量,常量池中还包含下面几种类型:
- 类和接口的全限定名
- 字段的名称和描述符
- 方法的名称和描述符
除此之外常量池还描述了类的引用信息。
总共有如下12种类型:
每种常量类型结构表
Access_flags
它定义了java源文件中类或者接口的类型
this_class
对常量池的索引。在this_class位置的常量池入口必须为CONSTANT_Class表,该表索引指向一个CONSTANT_Utf8,该CONSTANT_Utf8存放该类的全限定名。
super_class
对常量池索引,在super_class位置的常量池入口是一个指向该类超类全限定名的CONSTANT_Class入口,如果该类直接继承自object类,那索引值为0.
interfaces_count和interfaces
由该类自己实现的或者该类继承后扩展的接口。
如何生成一个 class 文件
通常我们有两种方式来生成 class 文件。
第一种方式就是通过我们强大的 IDE 来生成 class 文件,无需我们操心步骤,像 eclipse 和 IDEA 或者是 Android 开发使用的 Android Studio 都是我们常用的可以自动生成 class 字节码文件的 IDE,同时,我们能通过 IDE 来帮助我们执行 class 文件,只需要简单的点击 IDE 中的 run 按钮,即可执行。
虽然强大的 IDE 简化了我们程序员很多操作,方便和提高了我们的开发工作,但同时会让我们难以理解生成 class 文件的真正流程,所以很多小伙伴在刚开始学习 Java 的时候,老师都会建议我们使用终端的 javac 命令去生成 class 文件,通过 java 命令来执行 class 文件。这就是我们的第二种方式。
例如现在控制台所在文件目录下有一个 Test.java 文件,我们通过 javac Test.java 来生成 Test.class 文件,通过 java Test 执行,控制台就能看到输出结果了。
javac 可以指定很多参数,如 -target 1.6 -source 1.6 ,可以指定 JDK 版本,通常我们指定一个比较低的 JDK,JDK版本是向下兼容的,这样我们使用高版本 JDK 时候,也是没有问题的。当然还有别的指令,这里就不再赘述了。
class 文件的作用
class 文件的作用是记录一个类文件的所有信息。这里我们要强调下这个所有信息,因为 class 文件所包含的类文件信息,是远远多余我们能看到的 java 源代码中的信息。
比如说 java 中我们能使用 this、super ,但我们并没有定义这些关键字,这是因为我们在生成 class 字节码的时候,虚拟机帮我们记录了当前类 this 和父类 super 的信息,所以说 class 字节码文件的信息量是远多于 java 源代码的。
class 文件格式详解
class 的文件结构有以下几个特点:
- class 文件是一种 8 位字节的二进制流文件。
- 各个数据是按顺序紧密排列的,没有任何间隙,这样可以减少我们 class 文件的体积,让 JVM 加载更加迅速。
- 每一个类、接口或者枚举等,都会单独占据一个 class 文件,这样的好处可以类和接口等可以独自管理自己的内容而无需相互交叉提升管理的复杂性。
下图是 class 文件的内部结构和所有的字段,我们将会具体解释下每个字段的内容。
- magic:无符号 4 字节类型,这个字段是 class 文件的加密端,用来检测这个 class 文件有没有篡改过,如果被篡改过了,JVM 将会有一系列的措施。有点类似于 MD5 加密。
- minor_version:最小 JDK 适配版本。
- major_version:当前适配的 JDK 版本。
- constant_pool_count:常量池数量,通常都是 1
- constant_pool:真正的常量池字段,结构体类型,是我们 class 文件中最核心和也是比较难懂的部分。
- access_flags:当前 class 文件作用域标志,如 public , private , protected,这个比较好理解。
- this_class:JVM 帮我们填充的当前类信息。
- super_class:JVM 帮我们填充的父类信息。
- interfaces_count:继承的接口数量,只记录直接继承的接口。
- interfaces:记载继承的接口,数量为 interfaces_count
- fields_count:标明 class 文件中的成员变量的数量
- fields:结构体类型,数量为 fields_count,包含成员变量的 Name,所属的类和类型。
- methods_count:方法数量
- methods:结构体类型,数量为 methods_count,记录了方法的 name , type , access_flag等信息。
- attribute_count:以上没有包含的信息的数量。
- attributes:结构体类型,数量为 attribute_count,比如包含了注解等信息。
class 文件的这种文件结构有点像 JSON,通过这样一层套一层的结构,我们想要查阅什么类信息,都可以查阅的到。我们来看下 access_flags 的取值范围,包括了我们平时使用到的所有类型,如下图所示,不再具体说明:
下面我们将具体的讲解下constant_pool字段。
constant_pool 中有一些比较简单的字段,比如 CONSTANT_Integer_info,CONSTANT_Long_info,CONSTANT_String_info等,这些字段存储了相对应类型的信息,当然还有像 Short,Double 这样的其他类型。
CONSTANT_Class_info 记录了类相关的信息,不仅记录了当前类的信息,如名字和 access_flags,还记录了引用到的类的信息。还有 CONSTANT_Fieldref_info 记录了成员变量的信息,CONSTANT_Methodref_info 则记录了类中方法的信息。这些存储的并不是真正的内容,而是索引,指向之前说的那些CONSTANT_Integer_info,CONSTANT_Long_info,CONSTANT_String_info,真正的内容实际上是存储于这些字段中的。
我们可以通过一个很棒的软件来查看这些二进制文件:010 Editor。 这款软件很强大,作用主要是来查看二进制文件,不仅可以看 class 文件,还能看 dex 文件,非常清晰的能看到这些文件的文件结构。
有关 class 的知识点就简单的介绍到这里,有关更多的Android开发基础或核心进阶技术,可参考《Android核心技术手册》里面记录了大大小小的基础知识和Android进阶的核心必备技术。
文末
Java 能够实现"一次编译,到处运行”,这其中 class 文件要占大部分功劳。为了让 Java 语言具有良好的跨平台能力,Java 独具匠心的提供了一种可以在所有平台上都能使用的一种中间代码——字节码类文件(.class文件)。有了字节码,无论是哪种平台(如:Mac、Windows、Linux 等),只要安装了虚拟机都可以直接运行字节码。