JVM 字节码与类的加载篇-2-字节码指令集与解析
概述
- Java字节码对于虚拟机,就好像汇编语言对于计算机,属于基本执行指令
- Java 虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数,Operands)而构成。由于Java虚拟机采用面向操作数栈而不是寄存器的结构,所以大多数的指令都不包含操作数,只有一个操作码。
- 由于限制Java虚拟机操作码的长度为一个字节(0~255),指令集的操作码总数不可能超过256条。
执行模型
如果不考虑异常处理的话,那么Java虚拟机的解释器可以使用下面这个伪代码当做最基本的执行模型来理解:
字节码与数据类型
Java虚拟机的指令集中大多数的指令都包含其操作所对应的数据类型信息。例如, iload
指令用于从局部变量表中加载int型的数据到操作数栈中,而fload
指令加载的则是float类型的数据。
字符 | 说明 |
---|---|
i |
对int类型的数据操作 |
l |
对long类型的数据操作 |
s |
对short类型的数据操作 |
b |
对byte类型的数据操作 |
c |
对char类型的数据操作 |
f |
对float类型的数据操作 |
d |
对double类型的数据操作 |
也有一些指令的助记符中没有明确地指明操作类型的字母,如arraylength
指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象。还有另外一些指令,如无条件跳转指令goto
则是与数据类型无关的。
大部分的指令都没有支持整数类型byte
、char
和short
,甚至没有任何指令支持boolean
类型。编译器会在编译期或运行期将byte
和short
类型的数据带符号扩展(Sign-Extend)为相应的int
类型数据,将boolean
和char
类型数据零位扩展(Zero-Extend)为相应的int
类型数据。与之类似,在处理boolean
、byte
、short
和char
类型的数组时,会转换为使用对应的int
类型的字节码指令来处理。
因此,大多数对于boolean
、byte
、short
和char
类型数据的操作,实际上都是使用相应的int
类型作为运算类型
指令分类
JVM字节码指令集大致分类
- 加载与存储指令
- 算术指令
- 类型转换指令
- 对象创建与访问指令
- 方法调用与返回指令
- 操作数栈管理指令
- 比较控制指令
- 异常处理指令
- 同步控制指令
一个指令可以从局部变量表、常量池、堆中对象、方法调用、系统调用中等取得数据,这些数据(可能是值,可能是对象的引用)被压入操作数栈。
一个指令也可以从操作数栈中取出一到多个值( pop多次),完成赋值、加减乘除、方法体头.系统调用等等操作。
加载与存储指令
作用
加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递
常用指令
上面所列举的指令助记符中,有一部分是以尖括号结尾的(iload_<n>
)。这些指令助记符实际上代表一组指令(例如iload_<n>
代表iload_0、iload_1、iload_2、iload_3
个指令)。这几组指令都是某个带有一个操作数的通用指令(iload)
的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中。
除此之外,它们的语义与原生的通用指令完全一致(例如iload_0
的语义与操作数为0
时的iload
指令语义完全一致)。在尖括号之间的字母指定了指令隐含操作数的数据类型,<n>
代表非负的整数,<i>
代表是int
类型数据,<l>
代表long
类型,<f>
代表float
类型,<d>
代表double
类型。
操作byte
、char
、short
和boolean
类型数据时,经常用int
类型的指令来表示。
再谈操作数栈和局部变量表
操作数栈(operand stacks)
执行每一条指令之前,Java虚拟机要求该指令的操作数己被压入操作数栈中。在执行指令时,Java虚拟机会将该指令所需的操作数弹出,并且将指令的结果重新压入栈中。
以加法指令iadd
为例。假设在执行该指令前,栈顶的两个元素分别为 int值1和 int值 2,那么iadd
指令将弹出这两个int,并将求得的和int值3压入栈中。
由于iadd
指令只消耗栈顶的两个元素,因此对于离栈顶距离为2的元素,即图中的?
,iadd
指令并不关心它是否存在,更加不会对其进行修改。
局部变量表(local variables)
Java方法栈桢的另外一个重要组成部分则是局部变量区,字节码程序可以将计算的结果缓存在局部变量区中。
实际上,Java虚拟机将局部变量区当成一个数组,依次存放 this指针(仅非静态方法),所传入的参数,以及字节码中的局部变量。
和操作数栈一样,long
类型以及double
类型的值将占据两个单元,其余类型仅占据一个单元。
在栈帧中,与性能调优关系最为密切的部分就是局部变量表。局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收。在方法执行时,虚拟机使用局部变量表完成方法的传递。
局部变量压栈指令
局部变量压栈指令将给指令的局部变量表中的数据压入操作数栈
指令xload_n
表示将第n个局部变量压入操作数栈,比如iload_1、fload_0、aload_0
等指令。其中aload_n
表示将一个对象引用压栈。
指令xload
通过指定参数的形式,把局部变量压入操作数栈,当使用这个命令时,表示局部变量的数量可能超过4个,比如指令iload
、fload
等。
常量入栈指令
常量入栈指令的功能是将常数压入操作数栈,根据数据类型和入栈内容的不同,又可以分为const
系列、push
系列和ldc
指令。
总结
出栈装入局部变量表指令
出栈装入局部变量表指令用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定位置,用于给局部变量赋值。
说明
- 类似像
store
这样的命令需要带一个参数,用来指明将弹出的元素放在局部变量表的位置,为了尽可能压缩指令大小,使用专门的istore_1
指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有istore_0、istore_2、istore_3
,它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第0、2、3个位置。 - 由于常用局部变量表前几个位置,这种做法虽然增加指令数量,但是可以压缩生成的字节码的体积。如果局部变量表很大,需要存储的槽位大于3,那么可以使用
istore
指令,外加一个参数,用来表示需要存放的槽位位置
栗子执行过程1
栗子执行过程2,注意出栈过程没有标出,不再赘述
算术指令
作用
算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新压入操作数栈。
分类
大体上算术指令可以分为两种:对整型数据进行运算的指令与对浮点类型数据进行运算的指令
byte、short、char和boolean类型说明
在每一大类中都有针对Java虚拟机具体数据类型的专用算术指令,但没有直接支持byte
、short
、char
和boolean
类型的算术指令,对于这些数据的运算,都使用int
类型的指令来处理。
此外,在处理boolean
、byte
、short
和char
类型的数组时,也会转换为使用对应的int
类型的字节码指令来处理。
运算时的溢出
Java虚拟机规范并无明确规定过整型数据溢出的具体结果,仅规定在处理整型数据时,只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出异常ArithmeticException。
运算模式
- 向最接近数舍入模式:JVM要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的
- 向零舍入模式:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果
NaN值使用
当一个操作产生溢出时,将会使用有符号的无穷大表示,如果某个操作结果没有明确的数学定义的话,将会使用NaN值来表示。而且所有使用NaN值作为操作数的算术操作,结果都会返回 NaN
所有算术指令
栗子1
栗子2
栗子3(自增操作)
关于i++
和++i
单独使用时区别:无区别
二者混合使用
经典问题
比较指令
比较指令的说明
- 比较指令的作用是比较栈顶两个元素的大小,并将比较结果入栈
- 比较指令有:
dcmpg
、dcmpl
、fcmpg
、fcmpl
、lcmp
(字符d
表示double类型,f
表示float,l
表示long) - 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令。以float为例,有
fcmpg
和fcmpl
两个指令,它们的区别在于在数字比较时,若遇到NaN值,处理结果不同;指令dcmpl
和dcmpg
也是类似的,根据其命名可以推测其含义,在此不再赘述 - 指令
lcmp
针对long型整数,由于long型整数没有NaN值,故无需准备两套指令
类型转换指令
类型转换指令说明
- 类型转换指令可以将两种不同的数值类型进行相互转换
- 转换操作一般用于实现用户代码中的显式类型转换操作,或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。
宽化类型转换
转换规则
Java虚拟机直接支持以下数值的宽化类型转换(widening numeric conversion,小范围类型向大范围类型的安全转换)
- 从int类型到long、float或者double类型。对应的指令为:
i2l
、i2f
、i2d
- 从1ong类型到float、double类型。对应的指令为:
l2f
、l2d
- 从float类型到double类型。对应的指令为:
f2d
- int —> long —> float —> double
精度损失问题
- 宽化类型转换是不会因为超过目标类型最大值而丢失信息的(例如从int转换到 long,或者从int转换到double),都不会丢失任何信息,转换前后的值是精确相等的
- 从int、long类型数值转换到float,或者long类型数值转换到double时,将可能发生精度丢失—―可能丢失掉几个最低有效位上的值,转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数值。
尽管宽化类型转换可能发生精度丢失,但是这种转换永远不会导致Java虚拟机抛出运行时异常。
窄化类型转换
转换规则
Java虚拟机也直接支持以下窄化类型转换:
- 从int类型至byte、short或者char类型。对应的指令有:
i2b
、i2c
、i2s
- 从long类型到int类型。对应的指令有:
l2i
- 从float类型到int或者long类型,对应的指令有:
f2i
、f2l
- 从double类型到int、long或者float类型。对应的指令有:
d2i
、d2l
、d2f
精度损失问题
窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级,因此转换过程很可能会导致数值丢失精度。
尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况,但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常
补充说明
当将一个浮点值窄化转换为整数类型T(T限于int或long类型之一)时将遵循以下转换规则:
- 如果浮点值是NaN,那转换结果就是int或long类型的0
- 如果浮点值不是无穷大,浮点值使用IEEE 754的向零舍入模式取整,获得整数值v,如果v在目标类型T(int或long)的表示范围内,那转换结果就是v。否则将根据v的符号,转换为T所能表示的最大或者最小正数
当将一个double类型窄化转换为 float类型时将遵循以下转换规则:
通过向最接近数舍入模式舍入一个可以使用float类型表示的致字,最后结果根据下面这3条规则判断
- 如果转换结果的绝对值太小而无法使用float来表示,将返回float类型的正负零
- 如果转换结果的绝对值太大而无法使用 float来表示,将返回float类型的正负无穷大
- 对于double类型的NaN值将按规定转换为float类型的NaN值
对象创建与访问指令
创建指令
创建类实例的指令
指令 | 说明 |
---|---|
new | 它接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入栈 |
创建数组的指令
指令 | 说明 |
---|---|
newarray | 创建基本类型数组 |
anewarray | 创建引用类型数组 |
multianewarray | 创建多维数组 |
栗子1
注意:局部变量表中的this
是该方法的所属对象的引用地址
栗子2
字段访问指令
对象创建后,就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。
- 访问类字段(static字段,或者称为类变量)的指令:
getstatic
、putstatic
- 访问类实例字段(非static字段,或者称为实例变量)的指令:
getfield
、putfield
栗子
数组操作指令
数组操作指令主要有:xastore
和xaload
指令
- 把一个数组元素加载到操作数栈的指令:
baload
、caload
、saload
、iaload
、laload
、faload
、daload
、aaload
- 将一个操作数栈的值存储到数组元素中的指令:
bastore
、castore
、sastore
、iastore
、lastore
、fastore
、dastore
、aastore
- 取数组长度指令:
arraylength
。该指令弹出栈顶的数组元素,获取数组的长度,将长度压入栈
说明
- 指令
xload
表示将数组的元素压栈,比如saload
、caload
分别表示压入short数组和char数组。指令xaload
在执行时,要求操作数中栈顶元素位数组索引i
,栈顶顺位第2个元素为数组引用a
,该指令会出栈顶这两个元素并将a[i]
重新压入堆栈 xastore
则专门针对数组操作,以iastore
为例,它用于给一个int
数组的给定索引赋值。在iastore
执行前,操作数栈顶需要以此准备三个元素:值、索引、数组引用,iastore
会弹出三个值,并将值赋给数组中指定索引的位置
栗子1
栗子2
类型检查指令
检查类实例或数组类型的指令:instanceof
、checkcast
- 指令
checkcast
用于检查类型强制转换是否可以进行。如果可以进行,那么checkcast
指令不会改变操作数栈,否则它会抛出ClasscastException异常 - 指令
instanceof
用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈
栗子
方法调用与返回指令
方法调用指令
指令 | 说明 |
---|---|
invokevirtual |
用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),支持多态。它是Java语言中最常见的方法分派方式 |
invokeinterface |
用于调用接口方法,它会在运行时搜索由特定对象所实现的这个接口方法,并找出适合的方法进行调用。 |
invokespecial |
用于调用一些需要特殊处理的实例方法,包括实例初始化方法(构造器)、私有方法和父类方法。这些方法都是静态类型绑定的,不会在调用时进行动态派发。 |
invokestatic |
用于调用命名类中的类方法(static方法)。这是静态绑定的。 |
invokedynamic |
调用动态绑定的方法,用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。 |
前面4
条调用指令的分派逻辑都固化在java 虚拟机内部,而invokedynamic
指令的分派逻辑是由用户所设定的引导方法决定
栗子1:invokespecial
栗子2:invokestatic
栗子3:invokeinterface
栗子4:invokevirtual
方法返回指令
方法调用结束前,需要进行返回。方法返回指令是根据返回值的类型区分的。
- 包括
ireturn
(当返回值是 boolean、byte、char、short和int类型时使用)、lreturn
、freturn
、dreturn
和areturn
return
指令供声明为 void的方法、实例初始化方法以及类和接口的类初始化方法使用
栗子1
栗子2
操作数栈管理指令
- 将一个或两个元素从栈顶弹出,并且直接废弃:
pop
,pop2
- 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:
dup
,dup2
,dup_x1
,dup2_x1
,dup_x2
,dup2_x2
- 将栈最顶端的两个Slot数值位置交换:
swap
,Java虚拟机没有提供交换两个64位数据类型(long、double)数值的指令 - 指令
nop
,是一个非常特殊的指令,它的字节码为0x00,,它没有任何操作。它一般可用于调试、占位等。
说明
控制转移指令
条件跳转指令
条件跳转指令有:ifeq
, iflt
,ifle
,ifne
,ifgt
,ifge
,ifnull
, ifnonnull
。这些指令都接收两个字节的操作数,用于计算跳转的位置(16位符号整数作为当前位置offset)
统一含义
弹出栈顶元素,测试它是否满足某一条件,如果满足条件,则跳转到给定位置
注意
- 对于
boolean
、byte
、char
、short
类型的条件分支比较操作,都是使用int
类型的比较指令完成 - 对于
long
、float
、double
类型的条件分支比较操作,则会先执行相应类型的比较运算指令,运算指令会返回一个整型值到操作数栈中,随后再执行int
类型的条件分支比较操作来完成整个分支跳转 - 由于各类型的比较最终都会转为
int
类型的比较操作,所以Java虚拟机提供的int
类型的条件分支指令最为丰富和强大
比较指令说明
- 比较指令的作用是比较栈顶两个元素的大小,并将比较结果入栈
- 比较指令有:
dcmpg
,dcmp1
,fcmpg
,fcmpl
,lcmp
(字符d
表示double,f
表示float,l
表示long) - 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令。以float为例,有
fcmpg
和fcmpl
两个指令,它们区别在于在数字比较时,若遇到NaN值,处理结果不同。指令dcmpl
和dcmpg
类似 - 指令
lcmp
针对long型整数,由于long型整数没有NaN值,故无需准备两套指令
说明
栗子1
栗子2
栗子3
栗子4
栗子5
比较条件跳转指令
- 比较条件跳转指令将比较和跳转两个步骤合二为一
- 指令有:
if_icmpeq
、if_icmpne
、if_icmplt
、if_icmpgt
、if_icmple
、if_icmpge
、if_acmpeq
和if_acmpne
。其中指令助记符加上if_
后,以字符i
开头的指令针对int
型整数操作(也包括short和byte类型),以字符a
开头的指令表示对象引用的比较。
- 指令有:
这些指令都接收两个字节的操作数作为参数,用于计算跳转的位置。同时在执行指令时,栈顶需要准备两个元素进行比较。指令执行完成后,栈顶的这两个元素被清空,且没有任何数据入栈。如果预设条件成立,则执行跳转,否则,继续执行下一条语句。
栗子1
栗子2
多条件分支跳转指令
从助记符上看,两者都是switch
语句的实现:
tableswitch
要求多个条件分支值连续,它内部只存放起始值和终止值,以及若干个跳转偏移量,通过给定的操作数index
,可以立即定位到跳转偏移量位置,因此效率比较高- 指令
lookupswitch
内部存放着各个离散的case-offset
对,每次执行都要搜索全部的case-offse
t对,找到匹配的case
值,并根据对应的offset
计算跳转地址,因此效率较低
指令tableswitch
示意图如下,由于tableswitch
的case
值连续,因此只需要记录最低值和最高值,以及每项对应的offset
偏移量,根据给定的index
值通过简单的计算即可直接定位到offset
指令lookupswitch
处理的是离散的case
值,但是出于效率考虑,将case-offset
对按照case
值大小排序,给定index
时,需要查找与index
相等的case
,获得其offset
,如果找不到则跳转到default
。指令lookupswitch
示意图如下:
栗子1
栗子2
栗子3
无条件跳转指令
- 无条件跳转指令
goto
,接收两个字节的操作数,共同组成一个带符号的整数,用于指定指令的偏移量,指令执行的目的就是跳转到偏移量给定的位置处 - 如果指令偏移量太大,超过双字节的带符号整数的范围,则可以使用指令
goto_w,
它和goto
有相同的作用,但是它接收4
个字节的操作数,可以表示更大的地址范围
栗子1
栗子2
栗子3
异常处理指令
抛出异常指令
- 在Java中显示抛出异常的操作(throw语句)都是由
athrow
指令来实现。 - 除使用throw语句显示抛出异常情况外,JVM规范规定许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出
- 正常情况下,操作数栈的压入弹出都是一条条指令完成的。唯一的例外情况是在抛异常时,Java虚拟机会清除操作数栈上的所有内容,而后将异常实例压入调用者操作数栈上。
栗子1
栗子2
异常处理与异常表
处理异常
JVM中处理异常catch语句
不是由字节码指令来实现的(早期使用jsr、ret指令),而是采用异常表来完成的
异常表
如果一个方法定义一个try-catch
或者try-finally
异常处理,就会创建异常表。它包含了每个异常处理或者finally
块的信息。异常表保存每个异常处理信息
- 起始位置
- 结束位置
- 程序计数器记录的代码处理的偏移地址
- 被捕获的异常类在常量池中的索引
当一个异常被抛出时,JVM会在当前的方法里寻找一个匹配的处理,如果没有找到,这个方法会强制结束并弹出当前栈帧,并且异常会重新抛给上层调用的方法(再调用方法栈帧)。如果在所有栈帧弹出前仍然没有找到合适的异常处理,这个线程将终止。如果这个异常在最后一个非守护线程里抛出,将会导致JVM自己终止,比如这个线程是个main线程
不管什么时候抛出异常,如果异常处理最终匹配所有异常类型,代码就会继续执行。在这种情况下,如果方法结束后没有抛出异常,仍然执行finally
块,在return前,它直接跳到finally
块来完成目标
栗子
同步控制指令
JVM支持两种同步结构:方法级的同步和方法内部一段指令序列的同步,这两种同步都是使用monitor来支持的。
方法级的同步
方法级的同步是隐式的,无须通过字节码指令来控制,它实现在方法调用和返回操作之间。虚拟机可以从方法常量池的方法表结构中的ACC_SYNCHRONIZED
访问标志得知一个方法是否声明为同步方法
当调用方法时调用指令将会检查方法的ACC_SYNCHRONIZED
访问标志是否设置
- 如果设置了,执行线程将先持有同步锁,然后执行方法。最后在方法完成(无论是正常完成还是非正常完成)时释放同步锁
- 在方法执行期间,执行线程持有同步锁,其他任何线程都无法再获得同一个锁
- 如果一个同步方法执行期间抛出异常,并且在方法内部无法处理此异常,那这个同步方法所持有的锁将在异常抛到同步方法之外时自动释放
栗子
代码没有使用monitorenter
和monitorexit
进行同步区控制。对于同步方法而言,当虚拟机通过方法的访问标示符判断是同步方法时,会自动在方法调用前进行加锁,当同步方法执行完毕后,不管方法是正常结束还是有异常抛出,均会由虚拟机释放这个锁。
因此,对于同步方法而言monitorenter
和monitorexit
指令是隐式存在的,并未直接出现在字节码中。
方法内指定指令序列的同步
同步一段指令集序列:通常是由synchronized
语句块来表示的。JVM的指令集有monitorenter
和monitorexit
两条指令来支持synchronized
关键字的语义。
当一个线程进入同步代码块时,它使用monitorenter
指令请求进入。如果当前对象的监视器计数器为0
,则它会被准许进入,若为1
,则判断持有当前监视器的线程是否为自己,如果是则进入,否则进行等待,直到对象的监视器计数器为0
,才会被允许进入同步块。
当线程退出同步块时,需要使用monitorexit
声明退出。JVM中任何对象都有一个监视器与之相关联,用来判断对象是否被锁定,当监视器被持有后,对象处于锁定状态。
指令monitorenter
和monitorexit
在执行时,都需要在操作数栈顶压入对象,之后monitorenter
和monitorexit
的锁定和释放都是针对这个对象的监视器进行的
下图展示监视器如何保护临界区代码不同时被多个线程访问,只有当线程4离开临界区后,线程1、2、3才有可能进入
栗子