跳到主要内容

20、JVM 实战 - 字节码指令集与解析举例

1、概述

Java字节码对于虚拟机,就好像汇编语言对于计算机,属于基本执行指令。

Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数,Operands)而构成。由于 Java虚拟机采用面向操作数栈而不是寄存器的结构,所以大多数的指令都不包含操作数,只有一个操作码。

  • 由于限制了Java虚拟机操作码的长度为一个字节(即0~255),这意味着指令集的操作码总数不可能超过256条。
  • 熟悉虚拟机的指令对于动态字节码生成、反编译Class文件、Class文件修补都有着非常重要的价值。

执行模型

如果不考虑异常处理的话,那么Java虚拟机的解释器可以使用下面这个伪代码当做最基本的执行模型来理解

do{
    自动计算PC寄存器的值加1;
    根据PC寄存器的指示位置,从字节码流中取出操作码;
    if(字节码存在操作数)从字节码流中取出操作数;
    执行操作码所定义的操作;
}while(字节码长度>0);

字节码与数据类型

在Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。例如, iload指令用于从局部变量表中加载int型的数据到操作数栈中,而fload指令加载的则是float类型的数据。

对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务:

  • i代表对int类型的数据操作
  • l代表long
  • s代表short
  • b代表byte
  • c代表char
  • f代表float
  • d代表double

大部分的指令都没有支持整数类型byte、char和 short,甚至没有任何指令支持 boolean类型。**编译器会在编译期或运行期将byte和short类型的数据带符号扩展(Sign-Extend-)为相应的int类型数据,将 boolean和char类型数据零位扩展(Zero-Extend-)为相应的int类型数据。**与之类似,在处理 boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。因此,大多数对于 boolean、byte、 short和char类型数据的操作,实际上都是使用相应的int类型作为运算类型。

指令分类

由于完全介绍和学习这些指令需要花费大量时间。为了能够更快地熟悉和了解这些基本指令,这里将JVM中的字节码指令集按用途大致分成 9类。

  • 加载与存储指令
  • 算术指令
  • 类型转换指令
  • 对象的创建与访问指令
  • 方法调用与返回指令
  • 操作数栈管理指令
  • 比较控制指令
  • 异常处理指令
  • 同步控制指令

一个指令,可以从局部变量表、常量池、堆中对象、方法调用、系统调用中等取得数据,这些数据(可能是值,可能是对象的引用)被压入操作数栈。

一个指令,也可以从操作数栈中取出一到多个值(pop多次),完成赋值、加减乘除、方法传参、系统调用等等操作。

2、加载与存储指令

作用:加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递。

常用指令:

1、 【局部变量压栈指令】将一个局部变量加载到操作数栈:xload、xload_(其中x为i、1、f、d、a,n为0到3)_;
2、 【常量入栈指令】将一个常量加载到操作数栈:bipush、sipush、ldc、ldc_w、1dc2_W、aconst_null、iconst_m1、iconst_、lconst_、fconst_、dconst_
3、 【出栈装入局部变量表指令】将一个数值从操作数栈存储到局部变量表:xstore、xstore_(其中x为i、l、f、d、a,n为0到3);xastore(其中x为i、1、f、d、a、b、C、s);
4、 扩充局部变量表的访问索引的指令:wide;

例如iload_代表了iload_0、iload_1、iload_2和iload_3这几个指令。这几组指令都是某个带有一个操作数的通用指令(例如 iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中。因为iload_0只占一个字节,而iload 0是一个指令+操作数占3个字节,所以对于常用的操作固化为一体从而减少Class文件的大小。

  • 如 iload_0:将局部变链表中索引为0位置上的数据压入操作数栈中,除此之外,它们的语义与原生的通用指令完全一致(例如iload_0的语义与操作数为0时的 iload 指令语义完全一致)。

局部变量表: Java方法栈桢的另外一个重要组成部分则是局部变量区,字节码程序可以将计算的结果缓存在局部变量表之中。实际上,Java虚拟机将局部变量区当成一个数组,依次存放this指针(仅非静态方法),所传入的参数,以及字节码中的局部变量。

和操作数桟一样,long类型以及double类型的值将占据两个单元,其余类型仅占据一个单元。

 

举例:

public void foo(long l,float f){
    {
        int i = 0;
    }
    {
        String s = "Hello,World";
    }
}

对应的局部变量表的分布:

 

  • 第一个是this
  • 第二个l是long型,占据两个槽位
  • 第三个 f 是float型,占据一个槽位
  • i和s共用一个槽位

在栈帧中,与性能调优关系最为密切的部分就是局部变量表。局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收。

局部变量压栈指令

局部变量压栈指令将给定的局部变量表中的数据压入操作数栈。

大体可以分为:

  • xload_(x为i、l、f、d、a,n为0到3)
  • xload (x为i、l、f、d、a)
  • x的取值表示数据类型。

指令xload_n表示将第n个局部变量压入操作数栈,比如iload_1、fload_0、aload_0等指令。**其中aload_n表示将一个对象引用压栈。**指令xload通过指定参数的形式,把局部变量压入操作数栈,当使用这个命令时,表示局部变量的数量可能超过了4个,比如指令iload、fload等。

 

常量入栈指令

常量入栈指令的功能是将常数压入操作数栈,根据数据类型和入栈内容的不同,又可以分为const系列、push系列和 ldc指令。

指令const系列:用于对特定的常量入栈,入栈的常量隐含在指令本身里(跟局部变量表压栈指令的数值含义不同)。指令有:iconst_<i>(i从-1到5)、lconst_<l>(l从0到1)、fconst_<f>(f从0到2)、dconst_<d>(d从0到1)、aconst_null。 比如,

  • iconst_m1将-1压入操作数栈;
  • iconst_(x为0到5)将x压入栈:
  • lconst_0、 lconst_1分别将长整数0和1压入栈;
  • fconst_0、 fconst_1、 fconst_2分别将浮点数0、1、2压入栈;
  • dconst_0 和 dconst_1分别将 double型0和1压入栈
  • aconst_nul 将null压入操作数栈;

从指令的命名上不难找出规律,指令助记符的第一个字符总是喜欢表示数据类型,i表示整数,1表示长整数,f表示浮点数,d表示双精度浮点,习惯上用a表示对象引用。如果指令隐含操作的参数,会以下划线形式给出。

指令push系列:主要包括 bipush和sipush。它们的区别在于接收数据类型的不同, bipush接收8位整数作为参数, sipush接收16位整数,它们都将参数压入栈。

指令ldc系列:如果以上指令都不能满足需求,那么可以使用万能的ldc指令,它可以接收一个8位的参数,该参数指向常量池中的int、float或者String的索引,将指定的内容压入堆栈。

类似的还有ldc_w,它接收两个8位参数,能支持的索引范围大于ldc。如果要压入的元素是long或者double类型的,则使用ldc2_w指令,使用方式都是类似的。

总结如下:

类型 常数指令 范围
int(boolean,byte,char,short) iconst [-1,5]
bipush [-128,127]
sipush [-32768,32767]
ldc any int value
long lconst 0,1
ldc any long value
float fconst 0,1,2
ldc any float value
double dconst 0,1
ldc any double value
reference aconst null
ldc String literal,Class lteral

示例1:

 

示例2:

 

出栈装入局部变量表指令

出栈装入局部变量表指令用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定位置,用于给局部变量赋值。

这类指令主要以store的形式存在,比如xstore (x为i、1、f、d、a表示address)、xstore_n(x为i、1、f、d、a,n为0至3)。

  • 其中,指令istore_n将从操作数栈中弹出一个整数,并把它赋值给局部变量索引n位置。
  • 指令xstore由于没有隐含参数信息,故需要提供一个byte类型的参数类指定目标局部变量表的位置。

一般说来,类似像store这样的命令需要带一个参数,用来指明将弹出的元素放在局部变量表的第几个位置。但是,为了尽可能压缩指令大小,使用专门的istore_1指令表示将弹出的元素放置在局部变量表第1个位置。 类似的还有 istore_0、istore_2、istore_3,它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第0、2、3个位置。

由于局部变量表前几个位置总是非常常用,因此这种做法虽然增加了指令数量,但是可以大大压缩生成的字节码的体积。如果局部变量表很大,需要存储的槽位大于3,那么可以使用istore指令,外加一个参数,用来表示需要存放的槽位位置。

示例1:

 

示例2:

 

3、算术指令

1、 算术指令用于对两个操作数栈上的值进行某种特定运算,并把计算结果重新压入操作数栈;
2、 大体上算术指令可以分为两种:对整型数据进行运算的指令与对浮点类型数据进行运算的指令;

byte、short、char和boolean类型说明:

在每一大类中,都有针对Java虚拟机具体数据类型的专用算术指令。但没有直接支持byte、 short、 char和boolean类型的算术指令,对于这些数据的运算,都使用int类型的指令来处理。此外,在处理boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。

 

数据运算可能会导致溢出,例如两个很大的正整数相加,结果可能是一个负数。其实Java虚拟机规范并无明确规定过整型数据溢出的具体结果,仅规定了在处理整型数据时,只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出异常ArithmeticException.

向最接近数舍入模式:JVM要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的;

向零舍入模式:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果;

NaN值使用:当一个操作产生溢出时,将会使用有符号的无穷大表示,如果某个操作结果没有明确的数学定义的话,将会使用 NaN值来表示。而且所有使用NaN值作为操作数的算术操作,结果都会返回 NaN;

public void method1(){
   
     
    int i = 10;
    double j = i / 0.0;
    System.out.println(j); //无穷大
    double d1 = 0.0;
    double d2 = d1 / 0.0;
    System.out.println(d2); //NaN: not a number
}

所有算术指令

  • 加法指令:iadd、ladd、fadd、dadd

  • 减法指令:isub、lsub、fsub、dsub

  • 乘法指令:imu、lmu、fmul、dmul

  • 除法指令:idiv、ldiv、fdiv、ddiv

  • 求余指令:irem、lrem、frem、drem //remainder:余数

  • 取反指令:ineg、lneg、fneg、dneg //negation:取反

  • 自增指令:iinc

  • 位运算指令,又可分为:

  • 位移指令:ishl、ishr、 iushr、lshl、lshr、 lushr

  • 按位或指令:ior、lor

  • 按位与指令:iand、land

  • 按位异或指令:ixor、lxor

  • 比较指令: dcmpg、dcmpl、 fcmpg、fcmpl、lcmp

示例1:

 

示例2:自增与相加运算

 

前++与后++的问题

  • 如果不涉及赋值操作,从字节码角度看是一样的

 

  • 涉及到赋值操作时

 

  • i++是先赋值后运算
  • ++i是先运算后赋值,压栈的时机不同,i++是先压栈再自增,而++i是先自增再压栈

4、比较指令

1、 比较指令的作用是比较栈顶两个元素的大小,并将比较结果入栈;
2、 比较指令有:dcmpg,dcmpl、fcmpg、fcmpl、lcmp;

与前面讲解的指令类似,首字符d表示double类型,f 表示float,l 表示long. 3、 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令以float为例,有fcmpg和fcmpl两个指令,它们的区别在于在数字比较时,若遇到NaN值,处理结果不同;

  • 指令dcmpl和dcmpg也是类似的,根据其命名可以推测其含义,在此不再赘述。
  • 指令lcmp针对long型整数,由于long型整数没有NaN值,故无需准备两套指令。

指令fcmpg和fcmpl都从栈中弹出两个操作数,并将它们做比较,设栈顶的元素为v2,栈顶顺位第2位的元素为v1,若v1=v2,则压入0;若v1 > v2则压入1;若v1 < v2则压入 -1。

两个指令的不同之处在于,如果遇到NaN值,fcmpg会压入1,而fcmpl会压入-1。

5、类型转换指令

类型转换指令说明:

  • ①类型转换指令可以将两种不同的数值类型进行相互转换。(主要指除了boolean之外的七种类型)
  • ②这些转换操作一般用于实现用户代码中的显式类型转换操作,或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。

宽化类型转换(Widening Numeric Conversions)

转换规则: Java虚拟机直接支持以下数值的宽化类型转换(widening numeric conversion, 小范围类型向大范围类型的安全转换)。也就是说,并不需要指令执行,包括:

  • 从int类型到long、float或者double类型。对应的指令为:i2l、i2f、i2d
  • 从long类型到float、 double类型。对应的指令为:l2f、l2d
  • 从float类型到double类型。对应的指令为:f2d

简化为: int 一> long 一> float 一> double

 

精度损失问题:

  • 宽化类型转换是不会因为超过目标类型最大值而丢失信息的,例如,从int转换到long,或者从int转换到 double,都不会丢失任何信息,转换前后的值是精确相等的。
  • 但从int、long转换到 float类型数值时,或者long转换到double类型数值时,将可能发生精度丢失。

几个最低有效位上的值,转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数值。尽管宽化类型转换实际上是可能发生精度丢失的,但是这种转换永远不会导致ava虚拟机抛出运行时异常。

//举例:精度损失的问题
public void upCast2(){
   
     
    int i = 123123123;
    float f = i;
    System.out.println(f); //123123120  精度丢失

    long l = 123123123123L;
    l = 123123123123123123L;
    double d = l;
    System.out.println(d); //123123123123123120 精度丢失
}

补充说明:从byte、char和short类型到int类型的宽化类型转换实际上是不存在的

对于byte类型转为int,虚拟机并没有做实质性的转化处理,只是简单地通过操作数栈交换了两个数据。而将byte转为long时,使用的是i2l,可以看到在内部byte在这里已经等同于int类型处理,类似的还有short类型,这种处理方式有两个特点:

  • 一方面可以减少实际的数据类型,如果为short和byte都准备一套指令,那么指令的数量就会大增,而虚拟机目前的设计上,只愿意使用一个字节表示指令,因此指令总数不能超过256个,为了节省指令资源,将short和byte当做int处理也在情理之中。
  • 另一方面,由于局部变量表中的槽位固定为32位(4字节),无论是byte或者short存入局部变量表,都会占用32位空间(相当于直接转换为了int)。从这个角度说,也没有必要特意区分这几种数据类型。

 

窄化类型转换(Narrowing Numeric Conversion)

Java虚拟机也直接支持以下窄化类型转换:

  • 从int类型至byte、 short或者char类型。对应的指令有:i2b、i2c、i2s
  • 从 long类型到int类型。对应的指令有:l2i
  • 从 float类型到int或者long类型对应的指令有:f2i、f2l
  • 从 double类型到int、long或 float者类型。对应的指令有:d2i、d2、d2f

 

示例2:short类型转为byte使用的是 i2b

 

精度损失问题

窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级,因此,转换过程很可能会导致数值丢失精度。

尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况,但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常。

public void downCast4(){
   
     
    int i = 128;
    byte b = (byte)i; //byte 最大到127  转换后精度丢失,结果为-128
    System.out.println(b); //-128
}

补充说明:

1、 当将一个浮点值窄化转换为整数类型T(T限于int或long类型之一)的时候,将遵循以下转换规则:;

  • 如果浮点值是NaN,那转换结果就是int或long类型的0。

  • 如果浮点值不是无穷大的话,浮点值使用IEEE 754的向零舍入模式取整,获得整数值v,如果v在目标类型T(int或long)的表示范围之内,那转换结果就是v。否则,将根据v的符号,转换为T所能表示的最大或者最小正数。 2、 当将一个double类型窄化转换为float类型时,将遵循以下转换规则:通过向最接近数舍入模式舍入一个可以使用float类型表示的数字最后结果根据下面这3条规则判断:;

  • 如果转换结果的绝对值太小而无法使用 float来表示,将返回 float类型的正负零。

  • 如果转换结果的绝对值太大而无法使用 float来表示,将返回 float类型的正负无穷大。

  • 对于double类型的NaN值将按规定转换为 float类型的 NaN值。

6、对象的创建与访问指令

Java是面向对象的程序设计语言,虚拟机平台从字节码层面就对面向对象做了深层次的支持。有一系列指令专门用于对象操作,可进一步细分为创建指令、字段访问指令、数组操作指令、类型检查指令。

创建指令

虽然类实例和数组都是对象,但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令。

1、 创建类实例的指令:new,它接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入栈;

  2、 创建数组的指令:newarray、anewarray、multianewarray;

  • newarray:创建基本类型数组
  • anewarray:创建引用类型数组
  • multianewarray:创建多维数组

 

strings 之所以是anewArray而不是multianewArray是因为strArray在堆中相当于只是创建了一个一维数组。

字段访问指令

对象创建后,就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。

  • 访问类字段(static字段,或者称为类变量)的指令:getstatic、putstatic
  • 访问类实例字段(非static字段,或者称为实例变量)的指令:getfield、 putfield

以getstatic指令为例,它含有一个操作数,为指向常量池的Fieldref索引,它的作用就是获取Fieldref指定的对象或者值,并将其压入操作数栈。

 

图示:

 

通过下面的图示感受getstatic、putstatic与getfield、putfield

 

数组操作指令

数组操作指令主要有:xastore和xaload指令。具体为:

  • 把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload
  • 将一个操作数栈的值存储到数组元素中的指令:bastore、 castore、 sastore、iastore、 lastore、fastore、 dastore、 aastore
数组类型 加载指令 存储指令
byte(boolean) baload bastore
char caload castore
short saload sastore
int iaload iastore
long laload lastore
float faload fastore
double daload dastore
reference aaload aastore

 

取数组长度的指令:arraylength,该指令弹出栈顶的数组元素,获取数组的长度,将长度压入栈。

 说明

说明:

  • 指令xaload表示将数组的元素压栈,比如saload、caload分别表示压入short数组和char数组。指令xaload在执行时,要求操作数中栈顶元素为数组索引i,栈顶顺位第2个元素为数组引用a,该指令会弹出栈顶这两个元素,并将a[i]重新压入栈。
  • xastore则专门针对数组操作,以iastore为例,它用于给一个int数组的给定索引赋值。在iastore执行前,操作数栈顶需要以此准备3个元素:值、索引、数组引用,iastore会弹出这3个值,并将值赋给数组中指定索引的位置。

类型检查指令

检查类实例或数组类型的指令:instanceof、checkcast。

  • 指令instanceof用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈。
  • 指令checkcast用于检查类型强制转换是否可以进行。如果可以进行,那么checkcast指令不会改变操作数栈,否则它会抛出ClassCastException异常。