JVM 字节码与类的加载篇-3-类的加载过程
概述
Java数据类型分为基本数据类型和引用数据类型。基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载
从class文件到加载到内存中的类,到类卸载出内存为止,它的整个生命周期包括如下7个阶段:
从类的使用过程来看:
Loading
加载完成的操作
加载
所谓是将Java类的字节码文件加载到机器内存中,并在内存中构建出Java类的原型(类模板对象)。
类模板对象是Java类在JVM内存中的一个快照,JVM将从字节码文件中解析出的常量池、类字段、类方法等信息存储到类模板中,这样JVM在运行期便能通过类模板而获取Java类中的任意信息,能够对Java类的成员变量进行遍历,能进行Java方法的调用。
反射的机制即基于这一基础,如果JVM没有将Java类的声明信息存储起来,则JVM在运行期也无法反射。
加载完成的操作
- 通过类的全名,获取类的二进制数据流
- 解析类的二进制数据流为方法区内的数据结构(Java类模型)
- 创建java.lang.Class类的实例,表示该类型。作为方法区这个类的各种数据的访问入口
二进制流的获取方式
- 虚拟析可能通过文件系统读入
.class
文件 - 读入jar、zip等归档数据包,提取类文件
- 事先存放在数据库中的类的二进制数据
- 使用类似于HTTP之类的协议通过网络进行加载
- 在运行时生成一段class的二进制信息等
获取到类的二进制信息后JVM会处理这些数据,并最终转为java.lang.class`的实例。如果输入数据不是classFile的结构,则会抛出ClassFormatError。
类模型与Class实例的位置
类模型的位置
加载的类在JVM中创建相应的类结构,类结构会存储在方法区(JDK1.8前:永久代;JDK1.8及后:元空间)
Class实例的位置
类将.class
文件加载至元空间后会在堆中创建Java.lang.Class
对象,用来封装类位于方法区内的数据结构,该Class对象是在加载类的过程中创建的,每个类都对应有一个Class类型的对象。
- Class类的构造方法是私有的,只有VM能够创建。
java.lang.Class
实例是访问类型元数据的接口,它是实现反射的关键数据、入口- 通过Class类提供的接口,可以获得目标类所关联的
.class
文件中具体的数据结构:方法、字段等信息
数组类的加载
数组类本身并不是由类加载器负责创建,而是由JVM在运行时根据需要而直接创建的,但数组的元素类型仍然需要依靠类加载器去创建
创建数组类的过程:
- 如果数组的元素类型是引用类型,那么就遵循定义的加载过程递归加载和创建数组A的元素类型
- JVM使用指定的元素类型和数组维度来创建新的数组类
如果数组的元素类型是引用类型,数组类的可访问性就由元素类型的可访问性决定。否则数组类的可访问性将被缺省定义为public
Linking
Verification
- 当类加载到系统后就开始链接操作(验证是链接操作的第一步)
- 它的目的是保证加载的字节码是合法、合理并符合规范的
验证的内容则涵盖了类数据信息的格式验证、语义检查、字节码验证,以及符号引用验证等
- 其中格式验证会和加载阶段一起执行。验证通过后,类加载器才会成功将类的二进制数据信息加载到方法区
- 格式验证外的验证操作将会在万法区中进行
1.格式验证:
是否以魔数0xCAFEBABE
开头,主版本和副版本号是否在当前Java虚拟机的支持范围内,数据中每一个项是否都拥有正确的长度等
2.语义检查:
- 是否所有的类都有父类的存在
- 是否一些被定义为final的方法或者类被重写或继承
非抽象类是否实现所有抽象方法或者接口方法
是否存在不兼容的方法
3.字节码验证
- 在字节码的执行过程中是否会跳转到一条不存在的指令
- 函数的调用是否传递正确类型的参数
- 变量的赋值是不是给正确的数据类型等
栈映射帧(StackMapTable)就是在这个阶段,用于检测在特定的字节码处,其局部变量表和操作数栈是否有着正确的数据类型。该过程只是尽可能地检查出可以预知的明显的问题,如果在这个阶段无法通过检查,虚拟机也不会正确装载这个类。但是如果通过了该阶段的检查,也不能说明这个类是完全没有问题的。
4.符号引用验证
Class文件在其常量池会通过字符串记录自己将要使用的其他类或者方法。在验证阶段,虚拟机就会检查这些类或者方法是否存在,并且当前类有权限访问这些数据,如果一个需要使用类无法在系统中找到,则会抛出NoClassDefFoundError,如果一个方法无法被找到,则会抛出NoSuchMethodError。
Preparation
准备阶段为类的静态变量分配内存并将其初始化为默认值。
当一个类验证通过时虚拟机就会进入准备阶段。该阶段,虚拟机就会为这个类分配相应的内存空间,并设置默认初始值
表:Java虚拟机为各类型变量默认的初始值
- 这里不包含基本数据类型的字段用
static final
修饰的情况,因为final
在编译时就会分配,准备阶段会显式赋值 - 注意这里不会为实例变量分配初始化,类变量会分配在方法区中,实例变量是会随着对象一起分配到Java堆
- 在这个阶段并不会像初始化阶段中那样会有初始化或者代码被执行
注意:Java并不支持boolean类型,对于boolean类型,内部实现是int ,由于int的默认值是0,boolean的默认值是false。
拓展
- 对于基本数据类型,非
final
修饰的变量,在解析环节进行默认初始化赋值 对于基本数据类型,
final
修饰的变量,再解析环节直接进行显示赋值如果使用字面量方式定义字符串常量,爷爷是在解析环节直接进行显示赋值
Resolution
在准备阶段完成后,就进入解析阶段,该阶段将类、接口、字段和方法的符号引用转为直接引用
具体描述
符号引用字面量的引用,和虚拟机的内部数据结构和和内存布局无关。程序实际运行时,仅符号引用不够,比如如下println()
方法被调用时,系统需要明确知道该方法的位置
小结
解析就是将符号引用转为直接引用,得到类、字段、方法在内存中的指针或者偏移量。如果直接引用存在,那么可以肯定系统中存在该类、方法或者字段。但只存在符号引用不能确定系统中一定存在该结构。
Initialization
初始化阶段为类的静态变量赋予正确的初始值
static与final
具体描述
类的初始化是类装载的最后阶段,如果前面的步骤无误,则类可以顺利装载到系统。此时类才会开始执行Java字节码。(即:在初始化阶段才真正开始执行类中定义的Java程序代码)
初始化阶段的重要工作是执行类的初始化方法:<clinit>()
方法
- 该方法仅能由Java编译器生成并由JVM调用,开发者无法自定义一个同名的方法,更无法直接在Java程序中调用该方法
- 它是由类静态成员的赋值语句以及static语句块合并产生的
说明
在加载类前,虚拟机总是会试图加载该类的父类,因此父类<clinit>
总是在子类<clinit>
之前被调用(即父类的static块优先级高于子类)
Java编译器并不会为所有的类都产生<clinit>()
初始化方法:
- 对于非静态字段,不管是否进行显式赋值,都不会生成
<clinit>()
方法 - 静态的字段,没有显式赋值,不会生成
<clinit>()
方法 - 对于声明为
static final
的基本数据类型字段,不管是否进行显式赋值,都不会生成<clinit>()
方法
使用 static final修饰的字段进行显式赋值的时机:
- 链接阶段的准备环节赋值
- 对于基本数据类型的字段,如果使用
static final
修饰,则显式赋值通常是在链接阶段的准备环节进行 - 对于String,如果使用字面量的方式进行赋值,使用
static final
修饰,则显式赋值通常是在链接阶段的准备环节进行
- 对于基本数据类型的字段,如果使用
- 初始化阶段赋值:除在上述的准备赋值环节赋值外的情况
结论:使用static final修饰且显式赋值中不涉及到方法或构造器调用的基本数据类型或String类型的显式赋值是在链接阶段的准备环节进行
<clinit>()
线程安全性
对于
<clinit>()
方法的调用,即类的初始化,虚拟机会在内部确保其多线程环境中的安全性虚拟机会保证一个类的
<clinit>()
方法在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>()
方法,其他线程都需要阻塞等待,直到活动线程执行<clinit>()
方法完毕函数
<clinit>()
带锁线程安全,如果在一个类的<clinit>()
方法中有耗时很长的操作,就可能造成多个线程阻塞,引发死锁。并且这种死锁是很难发现的,因为看起来它们并没有可用的锁信息- 如果之前的线程成功加载类,则等在队列中的线程就没有机会再执行
<clinit>()
方法。那么当需要使用这个类时,虚拟机会直接返回给它已经准备好的信息
类的初始化情况
主动使用
Class只有在必须要首次使用时才会被装载,Java虚拟机不会无条件地装载Class类型。Java虚拟机规定一个类或接口在初次使用前,必须要进行初始化。(此处“使用”是指主动使用)
主动使用情况:(如果出现如下情况,则会对类进行初始化操作。而初始化操作之前的加载、验证、准备已经完成)
1.当创建一个类的实例时(比如使用new关键字,或者通过反射、克隆、反序列化)
2.当调用类的静态方法时(即当使用字节码invokestatic
指令)
3.当使用类、接口的静态字段时(final修饰特殊考虑),比如使用getstatic
或者putstatic
指令。(对应访问变量、赋值变量操作)
4.当使用java.lang.reflect
包中的方法反射类的方法时
5.当初始化子类时,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化
6.如果接口定义default
方法,那么直接实现或者间接实现该接口的类的初始化,该接口要在其之前被初始化
7.当虚拟机启动时用户需要指定一个要执行的主类(,虚拟机会先初始化这个主类
8.当初次调用MethodHandle
实例时,初始化该MethodHandle
指向的方法所在的类。(涉及解析REF_getstatic、REF_putStatic、REF_invokeStatic
方法句柄对应的类)
被动使用
除以上的情况属于主动使用,其他的情况均属于被动使用。被动使用不会引起类的初始化。
1.当访问一个静态字段时,只有真正声明这个字段的类才会被初始化。(当通过子类引用父类的静态变量,不会导致子类初始化)
2.通过数组定义类引用,不会触发此类的初始化
3.引用常量不会触发此类或接口的初始化(常量在链接阶段就已经被显式赋值)
4.调用ClassLoader类的loadClass()
方法加载类,并不是对类的主动使用,不会导致类的被始化
Using
开发人员可以在程序中访问和调用它的静态类成员信息(比如:静态字段、静态方法),或者使用new关键字为其创建对象实例。
Unloading
类、类加载器、类实例之间的引用关系
在类加载器的内部实现中,用一个Java集合来存放所加载类的引用,一个Class对象总是会引用它的类加载器,调用Class对象的getClassLoader()
方法,就能获得它的类加载器,因此类的Class实例与其类的加载器之间为双向关联关系。
类的实例总是引用代表该类的Class对象,在Object类中定义getclass()
方法,该方法返回代表对象所属类的Class对象的引用。此外所有的Java类都有一个静态属性class,它引用代表这个类的Class对象。
类的生命周期
当Sample类被加载、链接和初始化后,它的生命周期就开始了。当代表Sample类的Class对象不再被引用,即不可触及时,Class对象就会结束生命周期,Sample类在方法区内的数据也会被卸载,从而结束Sample类的生命周期。
类何时结束生命周期,取决于代表它的Class对象何时结束生命周期。
类的卸载
- 启动类加载器加载的类型在整个运行期间是不可能被卸载的
- 被系统类加载器和扩展类加载器加载的类型在运行期间不太可能被卸载,因为系统类加载器实例或者扩展类的实例基本上在整个运行期间总能直接或者间接的访问的到,其达到unreachable的可能性极小
- 被开发者自定义的类加载器实例加载的类型只有在很简单的上下文环境中才能被卸载,而且一般还要借助于强制调用虚拟机的垃圾收集功能才可以做到