文章目录
  1. 1. 概述
  2. 2. 类加载的时机
  3. 3. 类加载的过程
    1. 3.1. 加载
    2. 3.2. 验证
    3. 3.3. 准备
    4. 3.4. 解析
    5. 3.5. 初始化
  4. 4. 类加载器

本文是对JVM的经典学籍《深入理解Java虚拟机》中知识学习的总结摘抄,原书内容写的很好,所特意从中摘取自己觉得比较重要的点,不求能够全部掌握所有内容,但至少保证能够在整体轮廓上有所斩获。
关于JVM的学习一共包含三篇文章,本文是第三篇:
深入学习JVM1:自动内存管理机制
深入学习JVM2:自动内存管理机制
深入学习JVM3:虚拟机类加载机制

本文的内容是关于JVM如何加载Class文件以及Class文件中的信息进入到虚拟机后会发生什么变化。本文内容主要包括一下这个部分:

  • 类加载的时机
  • 类加载的过程
  • 类加载器

概述


学计算机的都晓得一句话:“计算机只认识0和1,所以我们写的程序需要被编译器翻译成由0和1构成的二进制格式才能被计算机执行”。但由于虚拟机以及建立在虚拟机之上的大量程序语言如雨后春笋般出现并蓬勃发展,将我们编写的程序编译成二进制本地机器码已不再是唯一选择,越来越多的程序语言选择了与操作系统和机器指令集无关的、平台中立的格式作为程序编译后的存储格式。

实现语言无关性的基础是虚拟机和字节码存储格式,使用Java编译器可以把Java代码编译为存储字节码的Class文件,使用JRuby等其他语言编译器也可以把程序代码编译成Class文件,虚拟机并不关心Class的来源是什么语言,只要它符合Class文件应有的结构就可以在Java虚拟机中运行。
图1

解析Class文件的数据结构是很重要的内容,但本文关注的是另一个很重要的点:虚拟机的类加载机制。关于Class文件的数据结构大家可以看一下《深入理解Java虚拟机》的第六章内容。

虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。

类加载的时机


类从被加载到虚拟机内存中开始,到卸载出内存为止,整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载七个阶段。其中验证、准备和解析三个部分通称为连接。
图2

加载、验证、准备、初始化和卸载这5个阶段顺序是确定,加载过程必须按照这种顺序开始。但这些阶段通常都是互相交叉的混合式进行的,通常会在一个阶段执行的过程中调用或激活另一个阶段。解析阶段在某些情况下可以在初始化阶段之后再开始。

虚拟机规范没有强制约束什么时候开始类加载过程的第一个阶段,但对于初始化阶段,虚拟机严格规定有且只有四种情况必须立即对类进行“初始化”(加载、验证、准备自然需要在此之前开始):

  1. 遇到new、getstatic、putstatic或invokestatic这4条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。
  2. 使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。
  3. 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
  4. 当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先初始化这个类。

类加载的过程


加载

在加载阶段,虚拟机需要完成3件事情:

  1. 通过一个类的全限定名来获取定义此类的二进制字节流。
  2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
  3. 在Java堆中生成一个代表这个类的java.lang.Class对象,作为方法区这些数据的访问入口。

加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区。然后在Java堆中实例化一个java.lang.Class对象,这个对象将作为程序访问方法区中的这些类型数据的外部接口。

加载阶段与连接阶段的部分内容(如一部分字节码文件格式验证动作)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始,但这些夹在加载阶段之中进行的动作,仍然属于连接阶段的内容,这两个阶段的开始时间仍然保持固定的先后顺序。

验证

这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
不同的虚拟机对类验证的实现可能会有所不同,但大致上都会完成下面四个阶段的检验过程:

  1. 文件格式验证:该验证阶段的主要目的是保证输入的字节流能正确的解析并存储与方法区,格式上符合描述一个Java类型信息的要求。这阶段的验证是基于字节流进行的,经过了这个阶段的验证之后,字节流才会进入内存的方法区中进行存储,所以后面的三个验证阶段全部是基于方法区的存储结构进行的。
  2. 元数据验证:对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求。
  3. 字节码验证:主要工作是进行数据流和控制流分析。这阶段的任务是保证被校验类的方法在运行时不会做出危害虚拟机安全的行为。
  4. 符合引用验证:该校验发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在解析阶段发生。

验证阶段很重要,但非必须。如果所运行的全部代码都已经被反复使用和验证过,在实施阶段就可以考虑使用-Xverify:none参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。

准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中进行分配。需要注意两点:
1、这时候进行内存分配的仅包括类变量(被static修饰的变量),而不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在Java堆中。
2、初始值通常情况下是数据类型的零值,假设一个类变量的定义为:

1
public static int value = 123;

那么变量value在准备阶段过会的初始值为0而不是123,因为这时候尚未开始执行任何Java方法,而把value赋值为123的putstatic指令是程序编译后,存放于类构造器方法之中,所以value赋值为123是在初始化阶段才会被执行。当然,有一些特殊情况:如果类字段的字段属性表中存在ConstantValue属性,那么准备阶段变量value就会被初始化为ConstantValue属性所指定的值,例如:

1
public static final int value = 123;

解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,那么符号引用与直接引用有什么关联?

  1. 符号引用:以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。
  2. 直接引用:直接引用可以是直接指向目标的指针、相对偏移的量或者一个能间接定位到目标的句柄。直接引用是与虚拟机实现的内存布局相关的,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经在内存中存在了。

解析动作主要针对类或接口、字段、类方法、接口方法四类符号引用进行。

初始化

到了初始化阶段,才真正开始执行类中定义的Java程序代码。

在准备阶段,变量已经赋过一次系统要求的初始值,而在初始化阶段,则是根据程序员通过程序制定的主观计划去初始化类变量和其他资源,或者可以说:初始化阶段是执行类构造器()方法的过程。

  • ()方法是由编译器自动收集类中所有变量的赋值动作和静态语句块(static {}块)中的语句合并产生的,编译器收集(主要是收集)的顺序一定是先变量赋值,再静态语句块,因此在静态语句块中可以访问到类变量的初始值。
  • ()方法与类的构造函数不同,它不需要显式的调用父类构造器,虚拟机会保证在执行子类()方法之前,父类的()方法先执行完毕。
  • 由于父类()方法先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作。
  • ()方法不是必须的,如果一个类中没有静态语句块,也没有对变量的赋值操作,那么可以不产生()方法。
  • 虚拟机会保证一个类的()方法在多线程环境中被正确的加锁和同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行()方法,其他线程都需要阻塞等待。

类加载器


虚拟机设计团队把类加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流这个动作放到Java虚拟机外部去实现,实现这个动作的代码模块成为“类加载器”。

文章目录
  1. 1. 概述
  2. 2. 类加载的时机
  3. 3. 类加载的过程
    1. 3.1. 加载
    2. 3.2. 验证
    3. 3.3. 准备
    4. 3.4. 解析
    5. 3.5. 初始化
  4. 4. 类加载器