17、JVM实战 - 字节码与类的加载(二) -- 字节码指令集

1. 概述

  • Java字节码对于虚拟机,就好像汇编语言对于计算机,属于基本执行命令
  • Java虚拟机的指令由一个字节长度的,代表着某种特定操作含义的数字(称为操作码:Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数:Operands)构成。由于Java虚拟机采用面向操作数栈而不是寄存器的结构,所以大多数的指令都不包含操作数,只有一个操作码
  • 由于限制了Java虚拟机操作码的长度为一个字节(即0 ~ 255),这意味着指令集的操作码总数不可能超过256条 (某一个字节代表一个操作码)

1.1 执行模型

如果不考虑异常处理的话,那么Java虚拟机的解释器可以使用下面这个伪代码当做最基本的执行模型来理解
 

1.2 字节码与数据类型

在Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息
例如,iload指令用于从局部变量表中加载int类型的数据到操作数栈中,而fload指令加载的则是float类型的数据。

对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务:

  • i 代表对int类型的数据进行操作(大多数对于boolean、byte、short和char类型数据的操作,实际上都是使用相应的int类型作为运算类型)
  • l 代表long
  • s 代表short
  • b 代表 byte
  • c 代表char
  • f 代表float
  • d 代表double

 

1.3 指令的分类

  • 加载与存储指令
  • 算术指令
  • 类型转换指令
  • 方法调用与返回指令
  • 操作数栈管理指令
  • 控制转移指令
  • 异常处理指令
  • 同步控制指令

在做值相关操作时:

  • 一个指令,可以从局部变量表、常量池、堆中对象、方法调用、系统调用中等取得数据,这些数据(可能是值,可能是对象的引用)被压入操作数栈
  • 一个指令,也可以从操作数栈中取出一到多个值(pop多次),完成赋值、加减乘除、方法传参、系统调用等操作。

2. 加载与存储指令

2.1 作用

加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递

2.2 常用指令

1、 【局部变量压栈指令】将一个局部变量加载到操作数栈:xloadxload_<n>(其中x为i、l、f、d、a,n为0到3);
2、 【常量入栈指令]】将一个常量加载到操作数栈:bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst_<i>、lconst<l>、fconst_<f>、dconst<d>
3、 【出栈装入局部变量表指令】将一个数值从操作数栈存储到局部变量表:xstore、xstore_<n>(其中x为i、l、f、d、a,n为0到3);xastore(其中x为、l、f、d、a、b、c、s);
4、 扩充局部变量表的访问索引的指令:wide;

上面所列举的指令助记符中,有一部分是以尖括号结尾的(例如iload_)。这些指令助记符实际上代表了一组指令(例如iloa_代表了iload_0、iload_1、iload_2和 iload_3这几个指令)。这几组指令都是某个带有一个操作数的通用指令(例如iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中

比如:(我的理解是这么做的目的可能是因为0到3用的相对较多)

  • iload_0:将局部变量表中索引为0位置上的数据压入操作数栈中。
  • iload 4:将局部变量表中索引为4位置上的数据压入操作数栈中。

除此之外,它们的语义与原生的通用指令完全一致(例如iload_0的语义与操作数为0时的iload指令语义完全一致)。在尖括号之间的字母指定了指令隐含操作数的数据类型,代表非负的整数,代表是int类型数据,代表long类型,代表float类型,代表 double类型。

2.3 复习操作数栈和局部变量表

2.3.1 操作数栈

&nbsp;
由于iadd指令只消耗栈顶的两个元素,因为,对于离栈顶距离为2的元素,即图中的问号,iadd指令并不关心的是否存在,更加不会对其进行修改

2.3.2 局部变量表

Java方法栈帧的意外一个重要组成部分则是局部变量表,字节码程序可以将计算的结果缓存在局部变量表中。
实际上、java虚拟机将局部变量表当成一个数组,依次存放this指针(仅非静态方法),所传入的参数,以及字节码中的局部变量。
和操作数栈一样,long以及double类型的值将占据两个单元,其余类型仅占据一个单元。
&nbsp;
&nbsp;
其中,因为i的作用域有限,所以i和s共用一个槽位(槽位复用)

2.4 局部变量压栈指令

局部变量压栈指令将给定的局部变量表中的数据压入操作数栈

这类指令大体可以分为

x1oad_<n>(x为i、l、f、d、a,n0为到3)

xload(x为i、l、f、d、a)

// 说明:在这里,x的取值表示数据类型。

指令xload_n表示将第n个局部变量压入操作数栈,比如iload_1、fload_0、 load_0等指令。其中 aload_n表示将个对象引用压栈。

指令xload通过指定参数的形式,把局部变量压入操作数栈,当使用这个命令时,表示局部变量的数量可能超过了4个,比如指令iload、fload等。

2.4.1 示例:

1、 代码:;
&nbsp;
2、 局部变量表:;
&nbsp;
3、 字节码:;
&nbsp;
4、 过程:;
&nbsp;

2.5 常量入栈指令

常量入栈指令的功能是将常数压入操作数栈,根据数据类型和入栈内容的不同,又可以分为const系列、push系列和ldc指令。

2.5.1 const系列:

用于对特定的常量入栈,入栈的常量隐含在指令本身里。指令有: iconst_(i从-1到5)、lconst_(l从0到1)、 fconst_(f从0到2)、 dconst_(d从到1)、aconst_null。

比如:

  • iconst_m1将-1压入操作数栈:
  • iconst_x(x为0到5)将x压入栈
  • lconst_0、lconst_1分别将长整数0和1压入栈:
  • fconst_0、 fconst_1、 fconst_2分别将浮点数0、1、2压入栈
  • dconst_0和 dconst_1分别将double型0和1压入栈
  • aconst_null将null压入操作数栈

从指令的命名上不难找出规律,指令助记符的第一个字符总是喜欢表示数据类型,i表示整数,l表示长整数,f表示浮点数,d表示双精度浮点,习惯上用a表示对象引用。如果指令隐含操作的参数,会以下划线形式给出。

比如

int i = 3:iconst_3;
int i = 6:bipush 6;
2.5.2 push系列:

主要包括 bipusha和 sipush。它们的区别在于接收数据类型的不同, bipasha接收8位整数作为参数,sipush接收16位整数,它们都将参数压入栈。

2.5.3 ldc系列:

指令ldc系列:如果以上指令都不能满足需求,那么可以使用万能的ldc指令,它可以接收一个8位的参数,该参数指向常量池中的int、float或者 Stringl的索引,将指定的内容压入堆栈。

类似的还有ldc_w,它接收两个8位参数,能支持的索引范围大于ldc。
如果要压入的元素是long或者double类型的,则使用ldc2_w指令,使用方式都是类似的。

2.5.4 常用入栈指令示例:

&nbsp;

2.5.5 测试示例:

&nbsp;

2.6 出栈装入局部变量表指令

出栈装入局部变量表指令用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定位置,用于给局部变量赋值。

这类指令主要以store的形式存在,比如xstore(x为i、l、f、d、a)、xstore_n(x为i、l、f、d、a,n为0至3)

  • 其中,指令istore n将从操作数栈中弹出一个整数,并把它赋值给局部变量索引n位置。
  • 指令xstore由于没有隐含参数信息,故需要提供一个byte类型的参数类指定目标局部变量表的位置。

说明:
一般说来,类似像 store这样的命令需要带一个参数,用来指明将弹出的元素放在局部变量表的第几个位置。但是,为了尽可能压缩指令大小,使用专门的 istore_1指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有istore_0、 istore_2、 istore_3,它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第0、2、3个位置。

由于局部变量表前几个位置总是非常常用,因此这种做法虽然増加了指令数量,但是可以大大压缩生成的字节码的体积。如果局部变量表很大,需要存储的槽位大于3,那么可以使用 istore指令,外加一个参数,用来表示需要存放的槽位位置

2.6.1 示例1:

&nbsp;
(注意上图中操作数栈应该是出栈了,但是为了演示效果,所以没有出栈)

2.6.2 示例2:

&nbsp;
&nbsp;

3. 算术指令

3.1 概述:

3.1.1 作用

算术指令用于对两个操作数梭上的值进行某种特定运算,并把结果重新压入操作数。

3.1.2 分类

大体上算术指令可以分为两种:对整型数据进行运算的指令与对浮直类型数据进行运算的指令

3.1.3 byte、 short、char和 boolean类型说明

在每一大类中,都有针对Java虚拟机具体数据类型的专用算术指令。但没有直接支持byte、 short、char和 boolean类型的算术指令,对于这些数据的运算,都使用int类型的指令来处理。此外,在处理 boolean、byte、 short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。
&nbsp;

3.1.4 运算时的溢出

数据运算可能会导致溢出,例如两个很大的正整数相加,结果可能是一个负数。其实Java虚拟机规范并无明确规定过整型数据溢出的具体结果,仅规定了在处理整型数据时,只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出
异常Arithmeticexception

3.1.5 运算模式
  • 向最接近数舍入模式:JVM要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的;
  • 向零舍入模式:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果
3.1.6 NaN值使用

当一个操作产生溢出时,将会使用有符号的无穷大表示,如果某个操作结果没有明确的数学的话,将会使用NaN值来表示。而且所有使用NaN值作为操作数的算术操作,结果都会返回NaN

3.2 所有的算术指令包括:

加法指令:iadd ladd、fadd、dadd
减去指令:isub、lsub、fsub、dsub
乘法指令:imul、lmul、fmul、dmul
除法指令:idiv、ldiv、fdiv、ddiv
求余指令:irem、lrem、frem、drem // remainder:余数
取反指令:ineg、lneg、fneg、dneg // negation:取反
自增指令:iinc
位运算指令,又可分为
位移指令:ishl、ishr、 iushr、lshl、lshr、lushr
按位或指令:ior、lor
按位与指令:iand、land
按位异或指令:ixor、lxor
比较指令: dcmpg、dcmpl、 fcmpg、fcmpl、lcmp

3.2.1 示例1:

&nbsp;
&nbsp;

3.2.2 示例2:

&nbsp;
&nbsp;
&nbsp;
&nbsp;

3.2.3 示例3:

&nbsp;
&nbsp;

3.2.4 示例4:

&nbsp;
&nbsp;

3.2.5 示例5:

&nbsp;
&nbsp;

字节码都是:
&nbsp;

3.2.6 示例6:

&nbsp;
&nbsp;
&nbsp;

3.2.7 示例7:

&nbsp;
&nbsp;

&nbsp;

3.3 比较指令

  • 比较指令的作用是比较栈顶两个元素的大小,并将比较结果入栈

  • 比较指令有: dcmpg,dcmpl、 fcmpg、 fcmpl、lcmp

  • 与前面讲解的指令类似,首字符d表示 double类型,f表示float,l表示long

  • 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令。以 float为例,有 fcmp和fcmpl两个指令,它们的区别在于在数字比较时,若遇到NaN值,处理结果不同。

  • 指令dcmpl和 dcmpg也是类似的,根据其命名可以推测其含义,在此不再赘述。

  • 指令lcmp针对long型整数,由于long型整数没有NaN值,故无需准备两套指令。

举例
指令fcmpg和fcmpl都从栈中弹出两个操作数,并将它们做比较,设栈顶的元素为v2,栈顶顺位第2位的元素为v1,若v1=v2,则压入0:若v1>v2则压入1:若v1<v2则压入-1。

两个指令的不同之处在于,如果遇到NaN值, fcmpg会压入1,而fcmpl会压入-1。

和8.1一样

4. 类型转换指令

说明:

1、 类型转换指令可以将两种不同的数值类型进行相互转换;
2、 这些转换操作一般用于实现用户代码中的显示类型转换操作,或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题;

4.1 宽化类型转换(小转大)

4.1.1 转换规则

Java虚拟机直接支持以下数值的宽化类型转换( widening numeric conversion,小范围类型向大范围类型的安全转换)。也就是说,并不需要指令执行,包括

  • 从int类型到long、float或者 double类型。对应的指令为:i21、i2f、i2d
  • 从long类型到float、 double类型。对应的指令为:i2f、i2d
  • 从float类型到double类型。对应的指令为:f2d

简化为:int–>long–>float-> double

测试
&nbsp;
&nbsp;

4.1.2 精度损失问题

1、 宽化类型转换是不会因为超过目标类型最大值而丢失信息的,例如,从int转换到long,或者从int转换到double,都不会丢失任何信息,转换前后的值是精确相等的;
2、 从int、long类型数值转换到float,或者long类型数值转换到double时,将可能发生精度丢失一一可能丢失掉几个最低有效位上的值,转换后的浮点数值是根据IEEE754最接近含入模式所得到的正确整数值;

尽管宽化类型转换实际上是可能发生精度丢失的,但是这种转换永远不会导致Java虚拟机抛出运行时异常
&nbsp;

4.1.3 补充说明

从byte、char和 short类型到int类型的宽化类型转换实际上是不存在的。对于byte类型转为int,拟机并没有做实质性的转化处理,只是简单地通过操作数栈交換了两个数据。而将byte转为long时,使用的是i2l,可以看到在内部byte在这里已经等同于int类型处理,类似的还有 short类型,这种处理方式有两个特点:

1、 一方面可以减少实际的数据类型,如果为short和byte都准备一套指令,那么指令的数量就会大増,而虚拟机目前的设计上,只愿意使用一个字节表示指令,因此指令总数不能超过256个,为了节省指令资源,将short和byte当做int处理也在情理之中
2、 另一方面,由于局部变量表中的槽位固定为32位,无论是byte或者short存入局部变量表,都会占用32位空间从这个角度说,也没有必要特意区分这几种数据类型;

4.2 窄化类型转换(大转小)

4.2.1 转换规则

Java虚拟机也直接支持以下窄化类型转换:

  • 从主int类型至byte、 short或者char类型。对应的指令有:i2b、i2c、i2s
  • 从long类型到int类型。对应的指令有:l2i
  • 从float类型到int或者long类型。对应的指令有:f2i、f2l
  • 从double类型到int、long或者float类型。对应的指令有:d2i、d2l、d2f

&nbsp;
&nbsp;

4.2.2 精度损失问题

窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级,因此,转换过程很可能会导致数值丢失精度。

尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况,但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常
&nbsp;
结果是-128,因为int类型砍掉高位之后只剩下1000 0000就是-128

4.2.3 补充说明

1、 当将一个浮点值窄化转换为整数类型T(T限于int或long类型之一)的时候,将遵循以下转换规则:;

1、 如果浮点值是NaN,那转换结果就是int或long类型的0;
2、 如果浮点值不是无穷大的话,浮点值使用IEEE754的向零含入模式取整,获得整数值Vv如果v在目标类型T(int或long)的表示范围之内,那转换结果就是v否则,将根据v的符号,转换为T所能表示的最大或者最小正数;
2、 当将一个double类型窄化转换为float类型时,将遵循以下转换规则:通过向最接近数舍入模式舍入一个可以使用float类型表示的数字最后结果根据下面这3条规则判断;

1、 如果转换结果的绝对值太小而无法使用float来表示,将返回float类的正负零;
2、 如果转换结果的绝对值太大而无法使用float来表示,将返回float类型的正负无穷大;
3、 对于double类型的NaN值将按规定转換为float类型的NaN值;

5 对象的创建与访问指令

Java是面向对象的程序设计语言,虚拟机平台从字节码层面就对面向对象做了深层次的支持。有一系列指令专门用于对象操作,可进一步细分为创建指令、字段访问指令、数组操作指令、类型检查指令。

5.1 创建指令

虽然类实例和数组都是对象,但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令:

5.1.1 创建类实例的指令:
  • 创建类实例的指令 new

  • 它接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入栈。

示例:
&nbsp;

5.1.2 创建数组的指令:
  • 创建数组的指令: newarray、 anewarray、 multianewarray.

  • newarray:创建基本类型数组

  • anewarray:创建引用类型数组

  • multilanewarra/创建多维数组

上述创建指令可以用于创建对象或者数组,由于对象和数组在Java中的广泛使用,这些指令的使用频率也非常高。

示例:
&nbsp;
&nbsp;

5.2 字段访问指令

对象创建后,就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。

  • 访问类字段( static字段,或者称为类变量)的指令:getstatic、 putstatic
  • 访问类实例字段(非 static字段,或者称为实例变量)的指令: getfield、 putfield

举例1:
以getstatic指令为例,它含有一个操作数,为指向常量池的Fieldref索引,它的作用就是获取 Fieldref指定的对象或者值,并将其压入操作数栈。

public void sayhello(){

    System. out.println("hello");
}

对应的字节码指令:

0 getstatic #8 <java/lang/System. out>
3 1dc #9 <hello>
5 invokevirtual #10 <java/io/Printstream println>
8 return

举例2:
&nbsp;

5.3 数组操作指令

数组操作指令主要有: xastore和 xload指令。具体为:

  • 把一个数组元素加载到操作数栈的指令: baload、 caload、 saload、 iaload、laload、 faload、daload、 aaload

  • 将一个操作数栈的值存储到数组元素中的指令: bastore、 castore、 sastore、 iastore、lastore、faster、 dastore、 aastore
    即:
    &nbsp;

  • 取数组长度的指令: arraylength

  • 该指令弹出栈顶的数组元素,获取数组的长度,将长度压入栈。

5.3.1 说明
  • 指令xaload表示将数组的元素压栈,比如saload、 caload分别表示压入 short数组和char数组。指令xaload在执行时,要求操作数中栈顶元素为数组索引i,栈顶顺位第2个元素为数组引用a,该指令会弹出栈顶这两个元素,并将a[i]重新压入堆栈。
  • xastore则专门针对数组操作,以 iastore为例,它用于给一个int数组的给定索引赋值。在 iastore执行前操作数栈顶需要以此准备3个元素:值、索引、数组引用, iastore会弹出这3个值,并将值赋给数组中指定索引的位置。

&nbsp;

5.4 类型检查指令

检查类实例或数组类型的指令: instanceof、 checkcast.

  • 指令checkcast用于检查类型强制转换是否可以进行。如果可以进行,那么checkcast指令不会改变操作数栈否则它会抛出ClassCasteException异常。
  • 指令 instanceof用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈。

&nbsp;
&nbsp;

6 方法调用与返回指令

6.1 方法调用指令

方法调用指令: invokevirtual、 invokeinterface、invokespecial、 invokestatic、 invokedynamic

以下5条指令用于方法调用:

  • invokevirtual指令用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),支持多态。这也是Java语言中最常见的方法分派方式
  • invokeinterface指令用于调用接口方法,它会在运行时搜索由特定对象所实现的这个接口方法,并找出适合的方法进行调用
  • invokespecia指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法(构造器)、私有方法和父类方法。这些方法都是静态类型绑定的,不会在调用时进行动态派发。
  • invokestatic指令用于调用命名类中的类方法( static方法)。这是静态绑定的。
  • invokedynamic:调用动态绑定的方法,这个是JDK1.7后新加入的指令。用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。前面4条调用指令的分派逻辑都固化在java虚拟机内部,而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。

6.2 方法返回指令

方法调用结束前,需要进行返回。方法返回指令是根据返回值的类型区分的。

  • 包括 ireturn(当返回值是 boolean、byte、char、 short和int类型时使用)、lreturn、 freturn、dreturn和areturn
  • 另外还有一条 return指令供声明为void的方法、实例初始化方法以及类和接口的类初始化方法使用。

&nbsp;
举例:
通过ireturn指令,将当前函数操作数栈的顶层元素弹出,并将这个元素压入调用者函数的操作数栈中(因为调用者 非常关心函数的返回值),所有在当前函数操作数栈中的其他元素都会被丢弃。

如果当前返回的是 synchronized方法,那么还会执行一个隐含的 monitorexit指令,退出临界区。

7. 操作数栈管理指令

如同操作一个普通数据结构中的堆栈那样,JVM提供的操作数栈管理指令,可以用于直接操作操作数栈的指令。

这类指令包括如下内容:

  • 将一个或两个元素从栈顶弹出,并且直接废弃:pop,pop2
  • 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup,dup2,dup_×1,dup2_x1, dup x2, dup2 x2;
  • 将栈最顶端的两个Slot数值位置交换:swap。Java虚拟机没有提供交换两个64位数据类型(long、 double)数值的指令
  • 指令nop,是一个非常特殊的指令,它的字节码为0x00。和汇编语言中的nop一样,它表示什么都不做。这条指令一般可用于调试、占位等。

这些指令属于通用型,对栈的压入或者弹出无需指明数据类型。

7.1 说明:

  • 不带_x的指令是复制栈顶数据并压入栈顶。包括两个指令,dup和dup2.dup的系数代表要复制的Slot个数。

  • dup开头的指令用于复制1个Slot的数据。例如1个int或1个reference类型数据

  • dup2开头的指令用于复制2个Slot的数据。例如1个long,或2个int,或1个int+1个float类型数据

  • 带_x的指令是复制栈顶数据并插入栈顶以下的某个位置。共有4个指令,dup_x1,dup2_x1,dup_x2,dup2_x2,对于带_x的复制插入指令,只要将指令的dup和x的系数相加,结果即为需要插入得位置因此

  • dup_x1插入位置:1+1=2,即顶2个Slot下面

  • dup_x2插入位置:1+2=3,即栈顶3个Slot下面

  • dup2_x1插入位置:2+1=3,即栈顶3个Slot下面

  • dup2_x2插入位置:2+2=4,即栈顶4个Slot下面

  • pop:将栈顶的1个Slot数值出栈。例如1个 short.类型数值

  • pop2:将栈顶的2个Slot数值出栈。例如1个double 类型数值,或者2个int类型值

&nbsp;

8. 控制转移指令

8.1 比较指令

  • 比较指令的作用是比较占栈顶两个元素的大小,并将比较结果入栈。

  • 比较指令有: dcmpg,dcmpl、 fcmp、fcmpl、lcmp

  • 与前面讲解的指令类似,首字符d表示double类型,f表示float,l表示long

  • 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令。以float为例,有fcmpg和fcmpl两个指令,它们的区别在于在数字比较时,若遇到NaN值,处理结果不同。

  • 指令dcmpl和 dcmpg也是类似的,根据其命名可以推测其含义,在此不再赘述。

  • 指令lcmp针对long型整数,由于long型整数没有NaN值,故无需准备2套指令

举例
指令fcmp和fcmpl都从中弹出两个操作数,并将它们做比较,设栈顶的元素为v2,顶顺位第2位的元素为v1,若v1=v2,则压入0;若v1>v2则压入1:若v1<v2则压入-1

两个指令的不同之处在于,如果遇到NaN值, fcmpg会压入1,而fcmpl会压入-1

8.2 条件跳转指令

条件跳转指令通常和比较指令结合使用。在条件跳转指令执行前,一般可以先用比较指令进行栈顶元素的准备,然后进行条件跳转。

条件跳转指令有:ifeq,iflt,ifle,ifne,ifgt,ifge, ifnull, ifnonnull。这些指令都接收两个字节的操作数,用于计算跳转的位置(16位符号整数作为当前位置的offset)。

它们的统一含义为:弹出栈顶元素,测试它是否满足某一条件,如果满足条件,则跳转到给定位置

具体说明:
&nbsp;

  • 测试1:
    &nbsp;
    &nbsp;
  • 测试2:
    &nbsp;
    &nbsp;
  • 测试3:
    &nbsp;
  • 测试4:
    &nbsp;
  • 测试5:
    &nbsp;
    &nbsp;

8.3 比较条件跳转指令

比较条件跳转指令类似于比较指令和条件跳转指令的结合体,它将比较和跳转两个步骤合二为一。

这类指令有:if_ icmpeg、if_ cmpne、if_ icmplt、if_ icmpgt、if_ icmple、if_ icmpge、if_ acmped和if_ acmpne。其中指令助记符加上“if_”后,以字符“i”开头的指令针对int型整数操作(也包括 short和byte类型),以字符“a”开头的指令表示对象引用的比较。

具体说明:
&nbsp;

这些指令都接收两个字节的操作数作为参数,用于计算跳转的位置。同时在执行指令时,栈顶需要准备两个元素进行比较。指令执行完成后,栈顶的这两个元素被清空,且没有任何数据入栈。如果预设条件成立,则执行跳转,否则,继续执行下条语句

  • 练习1:
    &nbsp;
    &nbsp;
  • 练习2:
    &nbsp;
    &nbsp;

8.4 多条件分支跳转指令

多条件分支跳转指令是专为 switch-case语句设计的,主要有 tableswitch和lookupswitch

&nbsp;

从助记符上看,两者都是 switch语句的实现,它们的区别:

  • tableswitch要求多个条件分支值是连续的,它内部只存放起始值和终止值,以及若干个跳转偏移量,通过给定的操作数 index,可以立即定位到跳转偏移量位置,因此效率比较高
  • 指令lookupswitch内部存放着各个离散的case- offset对,每次执行都要搜索全部的case- offset对,找到匹配的case值,并根据对应的 offset计算跳转地址,因此效率较低。

指令tableswitch的示意图如下图所示。由于tableswitch的case值是连续的,因此只需要记录最低值和最高值,以及每项对应的 offset偏移量,根据给定的 indext值通过简单的计算即可直接定位到 offset。
&nbsp;
指令lookupswitch处理的是离散的case值,但是出于效率考虑,将case-offset对按照case值大小排序,给定index时,需要查找与index相等的case,获得其offset,如果找不到就跳转到default。zhilinglookupswtich如下图所示:
&nbsp;

  • 练习1:
    &nbsp;
    &nbsp;
  • 练习2:
    &nbsp;
    &nbsp;
  • 练习3:
    &nbsp;
    先hashcode比较再用equals
    &nbsp;
    。。。。

8.5 无条件跳转指令

目前主要的无条件跳转指令为goto。指令goto接收两个字节的操作数,共同组成一个带符号的整数,用于指定指令的偏移量指令执行的目的就是跳转到偏移暈给定的位置处

如果指令偏移量太大,超过双字节的帯符号整数的范围,则可以使用指令goto_w,它和goto有相同的作用,但是它接收4个字节的操作数,可以表示更大的地址范围。

指令jsr、jsr_w、ret虽然也是无条件跳转的,但主要用于try-final1y语句,且已经被虚拟机逐渐废弃,故不在这里介绍这两个指令。
&nbsp;

  • 练习1:
    &nbsp;
    &nbsp;
  • 练习2:
    &nbsp;
    &nbsp;
  • 练习3:
    &nbsp;
    &nbsp;

9. 异常处理指令

异常及异常的处理
过程一:异常对象的生成过程 --> throw(手动/自动) -->指令: athrow
过程二: 异常的处理:抓抛模型:try-catch-finally --> 使用异常表

9.1 抛出异常指令:athrow指令

在]ava程序中显示抛出异常的操作( throw语句)都是由 athrow指令来实现。

除了使用 throw语句显示抛出异常情况之外,JVM规范还规定了许多运行时异常会在其他]ava虚拟机指令检测到异常状况时自动抛出。例如,在之前介绍的整数运算时,当除数为零时,虚拟机会在idiv或ldiv指令中抛出Arithmeticexception异常。

注意:
正常情况下,操作数栈的压入弹出都是一条条指令完成的。唯一的例外情况是在抛异常时,]ava虚拟机会清除操作数根上的所有内容,而后将异常实例压入调用者操作数上

  • 练习1:
    &nbsp;
  • 练习2:
    &nbsp;
    &nbsp;
  • 练习3:
    &nbsp;
    &nbsp;

9.2 异常处理与异常表

1、 处理异常:;
在Java虚拟机中,处理异常( catch语句)不是由字节码指令来实现的(早期使用jsr、ret指令),而是采用异常表来完成
2、 异常表:;
如果一个方法定义了一个try- catch或者try- final1y的异常处理,就会创建一个异常表。它包含了每个异常处理或者finally块的信息。异常表保存了每个异常处理信息。比如:

  • 起始位置
  • 结束位置
  • 程序计数器记录的代码处理的偏移地址
  • 被捕获的异常类在常量池中的索引

当一个异常被抛出时,JVM会在当前的方法里寻找一个匹配的处理,如果没有找到,这个方法会强制结束并弹出当前栈帧,并且异常会重新抛给上层调用的方法(在调用方法帧)。如果在所有帧弹出前仍然没有找到合适的异常处理,这个线程将终止。如果这个异常在最后一个非守护线程里抛出,将会导致JVM自己终止,比如这个线程是个main线程。

不管什么时候抛出异常,如果异常处理最终匹配了所有异常类型,代码就会继续执行。在这种情况下,如果方法结束后没有抛出异常,仍然执行finally块,在 return前,它直接跳到 finally块来完成目标

  • 练习1:
    &nbsp;
    &nbsp;
  • 练习2:返回结果是“hello”
    &nbsp;

10. 同步控制指令

10.1 方法级的同步

方法级的同步:是隐式的,即无须通过字节码指令来控制,它实现在方法调用和返回操作之中。虚拟机可以从方法常量池的方法表结构中的 ACC SYNCHRONIZED访问标志得知一个方法是否声明为同步方法;

当调用方法时,调用指令将会检査方法的 ACC SYNCHRONIZED访问标志是否设置:

  • 如果设置了,执行线程将先持有同步锁,然后执行方法。最后在方法完成(无论是正常aa完成还是非正常完成)时释放同步锁。
  • 在方法执行期间,执行线程持有了同步锁,其他任何线程都无法再获得同一个锁。
  • 如果一个同步方法执行期间抛出了异常,并且在方法内部无法处理此异常,那这个同步方法所持有的锁将在异常抛到同步方法之外时自动释放。

举例

private int i = 0;
public synchronized void add(){

    i++;
}

对应的字节码:

e aload_0;
1 dup
2 getfield #2 < com/atguigu/javal/SynchronizedTest.i>
5 iconst_1
6 iadd
7 putfield #2 (com/atguigu/java1/SynchronizedTest.i>

同一段代码,有无同步锁,字节码是相同的,区别是访问标识
&nbsp;

10.2 方法内指定指令序列的同步

同步一段指令集序列:通常是由java中的 synchronized语句块来表示的。jvm的指令集有 monitorenter和monitorexit两条指令来支持 synchronized关键字的语义。

当一个线程进入同步代码坝时,它使用 monitorenter指令请求进入。如果当前对象的监视器计数器为0,则它会被准许进入,若为1,则判断持有当前监视器的线程是否为自己,如果是,则进入,否则进行等待,直到对象的监视器计数器为0,才会被允许进入同步块。

当线程退出同步块时,需要使用monitorexiti声明退出。在Java虚拟机中,任何对象都有一个监视器与之相关联,用来判断对象是否被锁定,当监视器被持有后,对象处于锁定状态。

指令monitorenter和 monitorexit在执行时,都需要在操作数栈顶压入对象,之后 monitorenter和 monitorexitl的锁定和释放都是针对这个对象的监视器进行的。

下图展示了监视器如何保护临界区代码不同时被多个线程访问,只有当线程4离开临界区后,线程1、2、3才有可能进入。
&nbsp;

  • 练习:
    &nbsp;