Java字节码「随身手册」

294 阅读33分钟

随身手册

在 Android 编程中,如果要阅读及修改字节码,则需要针对 Class文件 结构进行解析翻译。 JVM 定义 Class文件 结构及指令集,通过查阅字节码表及指令集可了解 class文件 的内容逻辑。下面通过整理涉及的所有表格内容及指令,供查询使用。

分有两大部分内容:Class 文件结构描述表字节码指令表

表格参考来自于 “深入理解Java虚拟机:JVM高级特定及最佳实践”

Class 文件结构描述表

Class文件Java文件 编译而来,以 JVM 定义的特定结构来描述文件定义的内容。主要表格分类为:

  • Class 文件结构表
  • 常量表
  • 访问标志表
  • 字段表
  • 方法表
  • 属性表
  • 特殊字符串表

Class文件结构表

类型名称描述数量
u4(4个字节)magic确定该文件是否为一个能被虚拟机接受的Class文件,类似于ID1
u2(2个字节)minot_version次版本号1
u2(2个字节)mahor_version主版本号1
u2(2个字节)constant_pool_count常量池容量计数值,从1开始计算,0则表示不引用任何一个常量池项目1
cp_infoconstant_pool常量池constant_pool_count-1
u2(2个字节)access_flags访问标志1
u2(2个字节)this_class类索引1
u2(2个字节)super_class父类索引1
u2(2个字节)interfaces_count实现接口的数目1
u2(4个字节)interfaces接口索引interfaces_count
u2(4个字节)fields_count字段的数目1
field_infofields字段内容fields_count
u2(2个字节)methods_count方法的数目1
method_infomethods方法内容methods_count
u2(2个字节)attributes_count属性的数目1
attribute_infoattributes属性内容attributes_count

常量表

常量池主要存放两种类型:

  • 字面量,包含文本字符串,final的常量值等
  • 符号引用,类和接口的全限定名,字段的名称和描述符,方法的名称和描述符

Class文件 只保存各个方法,字段端的信息,不保存内存信息。只有经过运行期转换才能得到真正的内存入口。当虚拟机运行时,需要从常量池中获取到对应的符号引用,再经过类创建或者运行时解析,得到具体的内存地址。

类型子结构标志描述
CONSTANT_Utf8_infotagu1 = 1UTF-8编码的字符串
-lenghtu2UTF-8编码的字符串占用的字节数
-bytesu1长度为lenght的UTF-8编码的字符串
CONSTANT_Integer_infotagu1=3整型字面量
-bytesu4按照高位在前存储的int值
CONSTANT_Float_infotagu1=4浮点型字面量
-bytesu4按照高位在前存储的float值
CONSTANT_Long_infotagu1=5长整型字面量
-bytesu8按照高位在前存储的long值
CONSTANT_Double_infotagu1=6双精度浮点型字面量
-bytesu8按照高位在前存储的double值
CONSTANT_Class_infotagu1=7类或接口的符号引用
-bytesu2指向全限定名常量项的索引
CONSTANT_String_infotagu1=8字符串类型字面量
-bytesu2指向字符串字面量的索引
CONSTANT_Fieldref_infotagu1=9字段的符号引用
-indexu2指向声明字段的类或者接口描述符 CONSTANT_Class_info 的索引项
-indexu2指向声明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项
CONSTANT_Methodred_infotagu1=10类中方法的符号引用
-indexu2指向声明字段的类或者接口描述符 CONSTANT_Class_info 的索引项
-indexu2指向声明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项
CONSTANT_InterfaceMethodref_infotagu1=11接口中方法的符号引用
-indexu2指向声明字段的类或者接口描述符 CONSTANT_Class_info 的索引项
-indexu2指向声明字段的类或者接口描述符CONSTANT_NameAndType_info 的索引项
CONSTANT_NameAndType_infotagu1=12字段或方法的部分符号引用
-indexu2指向该字段或方法名称常量项的索引
-indexu2指向该字段或方法名称常量项的索引
CONSTANT_MethodHandle_infotagu1=15表示方法句柄
-reference_kindu1值必须在[1,9]中,它决定了方法句柄的类型。方法句柄类型的值表示方法句柄的字节码行为
-reference_indexu2值必须是对常量池的有效索引
CONSTANT_MethodType_infotagu1=16识别方法类型
-descriptor_indexu2值必须是对常量池的有效索引,常量池在该索引处的项必须是CONSTANT_Utf8_info结构,表示方法的描述符
CONSTANT_InvokeDynamic_infotagu1=18表示一个动态方法调用点
-bootstrap_method_attar_indexu2值必须是对当前Class文件中引导方法表的 bootstrap_methods[]数组的有效索引
-name_and_type_indexu2值必须是对当前常量池的有效索引,常量池在该索引处的值必须是CONSTANT_NameAndType_info结构,表示方法名和方法描述符

访问标志表

访问标志表根据以下不同标志类型进一步划分:

  1. 类访问标志
  2. 内部类访问标
  3. 字段访问标志
  4. 方法访问标志

类访问标志

用于识别一些类或者接口层次的访问信息,包括这个 Class文件 是类还是接口,是否被定义成 public 类型,是否被定义成 abstract类 类型,如果是类的话,是否被声明为 final 等。

标志名称标志值描述
ACC_PUBLIC0x0001是否为public类型
ACC_FINAL0x0010是否被声明为final,只有类可设置
ACC_SUPER0x0020是否允许使用invokespecial字节码指令的新语意,invokespecial指令的语意在JDK1.0.2发生过变化,为了区别这条指令使用哪种语意,JDK1.0.2之后编译出来的类的这个标识必须都为真
ACC_INTERFACE0x0200标识这个是一个接口
ACC_ABSTRACT0x0400是否为abstract类型,对于接口或者抽象类来说,此标志的值都为真,其他类型为假
ACC_SYNTHETIC0x1000标识这个类并非由用户代码产生的
ACC_ANNOTATION0x2000标识这是一个注解
ACC_ENUM0x4000标识这是一个枚举

内部类访问标表

标志名称标志值描述
ACC_PUBLIC0x0001内部类是否为public
ACC_PRIVATE0x0002内部类是否为private
ACC_PROTECTED0x0004内部类是否为protected
ACC_STATIC0x0008内部类是否为protected
ACC_FINAL0x0010内部类是否为protected
ACC_INTERFACE0x0020内部类是否为接口
ACC_ABSTRACT0x0400内部类是否为abstract
ACC_SYNTHETIC0x1000内部类是否并非由用户代码产生
ACC_ANNOTATION0x2000内部类是否是一个注解
ACC_ENUM0x4000内部类是否是一个枚举

字段访问标志

标志名称标志值描述
ACC_PUBLIC0x0001字段是否为public
ACC_PRIVATE0x0002字段是否为private
ACC_PROTECTED0x0004字段是否为protected
ACC_STATIC0x0008字段是否为static
ACC_FINAL0x0010字段是否为final
ACC_VOLATILE0x0040字段是否为volatile
ACC_TRANSIENT0x0080字段是否为transient
ACC_SYNTHETIC0x1000字段是否由编译器自动产生的
ACC_ENUM0x4000字段是否为enum

方法访问标志

标志名称标志值描述
ACC_PUBLIC0x0001方法是否为public
ACC_PRIVATE0x0002方法是否为private
ACC_PROTECTED0x0004方法是否为protected
ACC_STATIC0x0008方法是否为static
ACC_FINAL0x0010方法是否为final
ACC_SYNCHRONIZED0x0020方法是否为synchronized
ACC_BRIDGE0x0040方法是否由编译器产生的桥接方法
ACC_VARARGS0x0080方法是否接受不定参数
ACC_NATIVE0x0100方法是否为native
ACC_ABSTRACT0x0400方法是否为abstract
ACC_STRICTFP0x0800方法是否为strictfp
ACC_SYNTHETIC0x1000方法是否由编译器自动产生的

字段表

用于描述接口和类中声明的变量,包括 类级别变量实例级别变量

类型名称数量
u2access_flags1
u2name_index1
u2descriptor_index1
u2attributes_count1
u2attributesattributes_count
其中 access_flags 见为访问标志表中的字段访问标志。

方法表

方法表包含访问标志,名称索引,描述符索引以及属性表等几项

类型名称数量
u2access_flags1
u2name_index1
u2descriptor_index1
u2attributes_count1
attribute_infoattributesattributes_count
其中方法的 access_flags 见上述的方法访问标志

属性表

属性表是解释 Class文件字段表方法表中携带的属性的表格,属性是用于描述某些场景专有的信息。

属性名称使用位置含义
Code方法表Java代码编译成的字节码指令
ConstantValue字段表final关键字定义的常量值
Deprecated类,方法表,字段表final关键字定义的常量值
Exceptions方法表final方法抛出的异常
EnclosingMethod类文件仅当一个类为局部类或者匿名类时才能拥有这个属性,这个属性用于标识这个类所在的外围方法
InnerClasses类文件内部类列表
LineNumberTableCode属性Java源码的行号与字节码指令的对应关系
LocalVariableTableCode属性方法的局部变量描述
StackMapTableCode属性JDK1.6中新增的属性,供新的类型检查校验器(Type Checker)检查和处理目标方法的局部变量和操作数栈锁需要的类型是否匹配
Signature类,方法表,字段表JDK1.5中新增的属性,这个属性用于支持泛型情况下的方法签名,在java语言中,任何类,接口,初始化方法或成员的泛型签名如果包含了类型变量(Type Variables)或者参数化类型(Parameterized Types),则Signature属性会为它记录泛型签名信息。由于java的泛型采用擦除法实现,在为了类型信息被擦除后导致签名混乱,需要这个属性记录泛型中的相关信息
SourceFile类文件记录源文件名称
SourceDebugExtension类文件JDK1.6中新增的属性,SourceDebugExtension属性用于存储额外的调试信息。譬如在进行JSP文件调试时,无法通过Java堆栈来定位到JSP文件的行号,JSR-45规范为这些非Java语言编写,却需要编译成字节码并运行在Java虚拟机中的程序提供了一个进行调试的标准机制,使用SourceDebugExtension属性就可以用于存储这个标准所新加入的调试信息
Synthetic类,方法表,字段表标识方法或者字段是否为编译器自动生成的
LocalVariableTypeTableJDK1.5中新增的属性,它使用特征签名代替描述符,是为了引入泛型语法之后能描述泛型参数化类型而添加的
RuntimevisibleAnnotations类,方法表,字段表JDK1.5中新增的属性,为动态注解提供支持。RuntimevisibleAnnotations 属性用于指明哪些注解是运行时(实际上运行时就是进行反射调用)可见的
RuntimeInvisibleAnnotations类,方法表,字段表JDK1.5中新增的属性,与 RuntimevisibleAnnotations 属性作用刚好相反, 用于指明哪些注解是运行时不可见的
RuntimeVisibleParameterAnnotations方法表JDK1.5中新增的属性,作用与 RuntimevisibleAnnotations 属性类似,只不过作用对象为方法参数
RuntimeInvisibleParameterAnnotations方法表JDK1.5中新增的属性,作用与 RuntimeInvisibleAnnotations 属性类似,只不过作用对象为方法参数
AnnotationDetault方法表JDK1.5中新增的属性,用于记录注解类元素的默认值
BootstrapMethods类文件JDK1.5中新增的属性,用于保存 invokedynamic 指令引用的引导方法限定符

上述的每一个属性都需要从常量池中引用一个 CONSTANT_Utf8_info 类型常量来标示。还包含 attribute_length(u4) 用于标示属性值所占用的位数,后面再跟着属性内容。

Code属性结构

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2max_stack1
u2max_locals1
u4code_length1
u1codecode_lenght
u2exception_table_lenght1
exception_infoexception_tableexception_table_length
u2attributes_count1
attribute_infoattributesattributes_count

异常属性结构

类型名称数量
u2start_pc1
u2end_pc1
u2handler_pc1
u2catch_type1

Exceptions属性结构

区别与异常表,该表主要是列举中方法中可能抛出的受检查异常,也就是方法描述时throws关键字列举的异常

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2number_of_exceptions1
u2exception_index_tablenumber_of_exceptions

LineNumberTable属性结构

用于描述Java源码行号与字节码行号之间的对应关系,默认生成到 Class文件 中。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2line_number_table_length1
line_number_infoline_number_tableline_number_table_length
其中line_number_info包含start_pc和line_number两个u2类型的数据项。

LocalVariableTable属性结构

用于描述栈帧中局部变量表中的变量与 Java 源码中定义的变量之间的关系,默认生成到 Class文件 中。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2local_variable_table_lenght1
local_variable_infolocal_variable_tablelocal_variable_table_lenght

其中 local_variable_info 是代表栈帧与源码中局部变量的关联,见下表:

类型名称含义数量
u2start_pc局部变量的生命周期开始的字节码偏移量1
u2length局部变量的生命周期开始的作用范围覆盖长度1
u2name_index指向常量池 CONSTANT_Utf8_info 索引1
u2descriptor_index指向常量池 CONSTANT_Utf8_info 索引1
u2index局部变量在栈帧局部变量表中Slot的位置1

SourceFile属性结构

用于记录生成该 Class文件 的源码文件名称。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2sourcefile_index1

其中 sourcefile_index 为指向常量池 CONSTANT_Utf8_info 索引。

ConstantValue属性结构

用于通知虚拟机自动为静态变量赋值。只有被 static 关键字修饰的变量才可以使用这项属性。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2constant_index1

InnerClasses属性结构

用于记录内部类与宿主类之间的关联。如果一个类中定义了内部类,编译器则会为它生成内部类 InnerClasses 属性。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2number_of_classes1
inner_classes_infoinner_classesnumber_of_classes

每一个 inner_classes_info 代表一个内部类信息,结构如下:

类型名称含义数量
u2inner_class_info_index指向常量池 CONSTANT_Class_info 索引1
u2outer_class_info_index指向常量池 CONSTANT_Class_info 索引1
u2inner_name_index指向常量池 CONSTANT_Utf8_info 索引,代表这个内部类的名称,如果匿名则为01
u2inner_class_access_flags内部类的访问标志,见上述访问标志篇章1

Deprecated/Synthetic属性结构

前者是用于标示某个类,字段或者方法是否不再推荐使用。

后者是用于标示字段或者方法不是由 Java 源码直接产生。所有由非用户代码生成的方法都需要设置 Synthetic 属性或者 ACC_SYNTHETIC 标志,但是 <init><clinit> 除外。他们的结构如下:

类型名称数量
u2attribute_name_index1
u4attribute_length1

StackMapTable属性结构

JDK1.6 之后添加在 Class 文件规范中,位于 Code属性表 中,该属性会在虚拟机类加载的字节码校验阶段被新类型检查检验器(Type Checker)使用。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2number_of_entries1
stack_map_framestack_map_frame_entriesnumber_of_entries

Signature属性结构

JDK1.5 发布之后添加到 Class 文件规范中,它是一个可选的定长属性,可出现在类,属性表,方法表结构的属性表中。该属性会记录泛型签名信息,在 Java 语言中泛型采用的是擦除法实现的伪泛型,在字节码(Code属性)中,泛型信息编译之后都统统被擦除掉。由于无法像 C# 等运行时支持获取真泛型类型,添加该属性用于弥补该缺陷,现在 Java 反射已经能获取到泛型类型。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2signature_index1

其中 signature_index 值必须是一个对常量池的有效索引且为 CONSTANT_Utf8_info,表示类签名,方法类型签名或字段类型签名。如果当前Signature属性是类文件的属性,则这个结构表示类签名,如果当前Signature属性是方法表的属性,则表示方法类型签名,如果当前Signature属性是字段表的属性,则表示字段类型签名。

BootstrapMethods属性结构

JDK1.7 发布后添加到 Class 文件规范中,是一个复杂变长的属性,位于类文件的属性表中。

类型名称数量
u2attribute_name_index1
u4attribute_length1
u2num_bootstrap_methods1
bootstrap_methodbootstrap_methodsnum_bootstrap_methods

其中 bootstrap_method 结构如下

类型名称数量
u2bootstrap_method_ref1
u2num_bootstrap_arguments1
u2bootstrap_argumentsnum_bootstrap_arguments

特殊字符串表

所谓全限定名,就是使用 "." 分割类全名。比如 com/yummylau/TestClass 把类全名的 "." 换成 "/",变成 com.yummylau.TestClass,多个全限定名可使用多个 ";"分割。 而简单名称则没有类型和参数修饰的方法或者字段的名字,比如方法 inc() 和字段 m 分别标示为 inc 和 m 。特殊字符串表包含一些基础类型的描述及方法描述。如下:

  • 描述符
标识字符含义
B基本类型 byte
C基本类型 char
D基本类型 double
F基本类型 float
I基本类型 int
J基本类型 long
S基本类型 short
Z基本类型 boolean
V基本类型 void
L对象类型,比如 Ljava/lang/Object

针对数组,每一个维度使用一个前置的"["字符来描述,比如定义一个 “java.lang.String[][]”数组,被记录为“[[java.lang.String;”一个整型数组 “int[]” 被记录为[I 针对方法

方法场景描述符
void inc()()V
java.lang.String toString()()Ljava/lang/String;
int indexOf(char[]source,int sourceOffest,int sourceCount,char[] target,int targetOffset,int targetCOunt,int formIndex)([CII[CIII)I

字节码指令表

按照指令的类型/目标数据类型/常用指令等进一步划分为以下内容:

  • 字节码指令总表
  • 数据类型在指令中的转化
  • 指令集支持的数据类型
  • 加载/存储指令
  • 运算指令
  • 类型转化指令
  • 对象创建与访问指令
  • 操作数栈管理指令
  • 控制转移指令
  • 方法调用和返回指令
  • 异常处理指令
  • 同步指令

字节码指令总表

tip : 更为具体的描述可参考 官方JVM指令文档

字节码助记符指令含义
0x00nop什么都不做
0x01aconst_null将 null 推送至栈顶
0x02iconst_m1将 int 型 -1 推送至栈顶
0x03iconst_0将 int 型 0 推送至栈顶
0x04iconst_1将 int 型 1 推送至栈顶
0x05iconst_2将 int 型 2 推送至栈顶
0x06iconst_3将 int 型 3 推送至栈顶
0x07iconst_4将 int 型 4 推送至栈顶
0x08iconst_5将 int 型 5 推送至栈顶
0x09lconst_0将 long 型 0 推送至栈顶
0x0alconst_1将 long 型 1 推送至栈顶
0x0bfconst_0将 float 型 0 推送至栈顶
0x0cfconst_1将 float 型 1 推送至栈顶
0x0dfconst_2将 float 型 2 推送至栈顶
0x0edconst_0将 double 型 0 推送至栈顶
0x0fdconst_1将 double 型 1 推送至栈顶
0x10bipush将单字节的常量(-128 - 127)推送至栈顶
0x11sipush将一个短整形常量常量(-32768 - 32767)推送至栈顶
0x12ldc将 int, float, String 型常量值从常量池中推送至栈顶
0x13ldc_w将 int, float, String 型常量值从常量池中推送至栈顶(宽索引)
0x14ldc2_w将 long 或 float 型常量值从常量池中推送至栈顶(宽索引)
0x15iload将指定的 int 型本地变量推送至栈顶
0x16lload将指定的 long 型本地变量推送至栈顶
0x17fload将指定的 float 型本地变量推送至栈顶
0x18dload将指定的 dload 型本地变量推送至栈顶
0x19aload将指定的引用类型本地变量推送至栈顶
0x1aiload_0将第一个 int 型本地变量推送至栈顶
0x1biload_1将第二个 int 型本地变量推送至栈顶
0x1ciload_2将第三个 int 型本地变量推送至栈顶
0x1diload_3将第四个 int 型本地变量推送至栈顶
0x1elload_0将第一个 long 型本地变量推送至栈顶
0x1flload_1将第二个 long 型本地变量推送至栈顶
0x20lload_2将第三个 long 型本地变量推送至栈顶
0x21lload_3将第四个 long 型本地变量推送至栈顶
0x22fload_0将第一个 float 型本地变量推送至栈顶
0x23fload_1将第二个 float 型本地变量推送至栈顶
0x24fload_2将第三个 float 型本地变量推送至栈顶
0x25fload_3将第四个 float 型本地变量推送至栈顶
0x26dload_0将第一个 double 型本地变量推送至栈顶
0x27dload_1将第二个 double 型本地变量推送至栈顶
0x28dload_2将第三个 double 型本地变量推送至栈顶
0x29dload_3将第四个 double 型本地变量推送至栈顶
0x2aaload_0将第一个引用类型本地变量推送至栈顶
0x2baload_1将第二个引用类型本地变量推送至栈顶
0x2caload_2将第三个引用类型本地变量推送至栈顶
0x2daload_3将第四个引用类型本地变量推送至栈顶
0x2eiaload将 int 型数组指定索引的值推送至栈顶
0x2flaload将 long 型数组指定索引的值推送至栈顶
0x30faload将 float 型数组指定索引的值推送至栈顶
0x31daload将 double 型数组指定索引的值推送至栈顶
0x32aaload将引用型数组指定索引的值推送至栈顶
0x33baload将 boolean 或 byte 型数组指定索引的值推送至栈顶
0x34caload将 char 型数组指定索引的值推送至栈顶
0x35saload将 short 型数组指定索引的值推送至栈顶
0x36istore将栈顶 int 型数值存入指定本地变量
0x37lstore将栈顶 long 型数值存入指定本地变量
0x38fstore将栈顶 float 型数值存入指定本地变量
0x39dstore将栈顶 double 型数值存入指定本地变量
0x3aastore将栈顶引用型数值存入指定本地变量
0x3bistore_0将栈顶 int 型数值存入第一个本地变量
0x3cistore_1将栈顶 int 型数值存入第二个本地变量
0x3distore_2将栈顶 int 型数值存入第三个本地变量
0x3eistore_3将栈顶 int 型数值存入第四个本地变量
0x3flstore_0将栈顶 long 型数值存入第一个本地变量
0x40lstore_1将栈顶 long 型数值存入第二个本地变量
0x41lstore_2将栈顶 long 型数值存入第三个本地变量
0x42lstore_3将栈顶 long 型数值存入第四个本地变量
0x43fstore_0将栈顶 float 型数值存入第一个本地变量
0x44fstore_1将栈顶 float 型数值存入第二个本地变量
0x45fstore_2将栈顶 float 型数值存入第三个本地变量
0x46fstore_3将栈顶 float 型数值存入第四个本地变量
0x47dstore_0将栈顶 double 型数值存入第一个本地变量
0x48dstore_1将栈顶 double 型数值存入第二个本地变量
0x49dstore_2将栈顶 double 型数值存入第三个本地变量
0x4adstore_3将栈顶 double 型数值存入第四个本地变量
0x4bastore_0将栈顶引用型数值存入第一个本地变量
0x4castore_1将栈顶引用型数值存入第二个本地变量
0x4dastore_2将栈顶引用型数值存入第三个本地变量
0x4eastore_3将栈顶引用型数值存入第四个本地变量
0x4fiastore将栈顶 int 型数值存入指定数组的指定索引位置
0x50lastore将栈顶 long 型数值存入指定数组的指定索引位置
0x51fastore将栈顶 float 型数值存入指定数组的指定索引位置
0x52dastore将栈顶 double 型数值存入指定数组的指定索引位置
0x53aastore将栈顶引用型数值存入指定数组的指定索引位置
0x54bastore将栈顶 boolean 或 byte 型数值存入指定数组的指定索引位置
0x55castore将栈顶 char 型数值存入指定数组的指定索引位置
0x56sastore将栈顶 short 型数值存入指定数组的指定索引位置
0x57pop将栈顶数值弹出(数值不能是 long 或 double 类型)
0x58pop_2将栈顶的一个(对于 long 或 double 类型)或两个数值(对于非 long 或 double 的其他类型)弹出
0x59dup复制栈顶数值并将复制值压入栈顶
0x5adup_x1复制栈顶数值并将两个复制值压入栈顶
0x5bdup_x2复制栈顶数值并将三个(或两个)复制值压入栈顶
0x5cdup_2复制栈顶一个(对于 long 或 double 类型)或两个(非 long 或 double 的其他类型)数值并将复制值压入栈顶 )
0x5ddup_2_x1dup_x1 指令的双倍版本
0x5edup_2_x2dup_x2 指令的双倍版本
0x5fswap将栈最顶端的两个数值互换(数值不能是 long 或 double 类型)
0x60iadd将栈顶两 int 型数值相加并将结果压入栈顶
0x61ladd将栈顶两 long 型数值相加并将结果压入栈顶
0x62fadd将栈顶两 float 型数值相加并将结果压入栈顶
0x63dadd将栈顶两 double 型数值相加并将结果压入栈顶
0x64isub将栈顶两 int 型数值相减并将结果压入栈顶
0x65lsub将栈顶两 long 型数值相减并将结果压入栈顶
0x66fsub将栈顶两 float 型数值相减并将结果压入栈顶
0x67dsub将栈顶两 double 型数值相减并将结果压入栈顶
0x68imul将栈顶两 int 型数值相乘并将结果压入栈顶
0x69lmul将栈顶两 long 型数值相乘并将结果压入栈顶
0x6afmul将栈顶两 float 型数值相乘并将结果压入栈顶
0x6bdmul将栈顶两 double 型数值相乘并将结果压入栈顶
0x6cidiv将栈顶两 int 型数值相除并将结果压入栈顶
0x6dldiv将栈顶两 long 型数值相除并将结果压入栈顶
0x6efdiv将栈顶两 float 型数值相除并将结果压入栈顶
0x6fddiv将栈顶两 double 型数值相除并将结果压入栈顶
0x70irem将栈顶两 int 型数值作取模运算并将结果压入栈顶
0x71lrem将栈顶两 long 型数值作取模运算并将结果压入栈顶
0x72frem将栈顶两 float 型数值作取模运算并将结果压入栈顶
0x73drem将栈顶两 double 型数值作取模运算并将结果压入栈顶
0x74ineg将栈顶两 int 型数值作负并将结果压入栈顶
0x75lneg将栈顶两 long 型数值作负并将结果压入栈顶
0x76fneg将栈顶两 float 型数值作负并将结果压入栈顶
0x77dneg将栈顶两 double 型数值作负并将结果压入栈顶
0x78ishl将栈顶两 int 型数值左移位指定位数并将结果压入栈顶
0x79lshl将栈顶两 long 型数值左移位指定位数并将结果压入栈顶
0x7aishr将栈顶两 int 型数值右(带符号)移位指定位数并将结果压入栈顶
0x7blshr将栈顶两 long 型数值右(带符号)移位指定位数并将结果压入栈顶
0x7ciushr将栈顶两 int 型数值右(无符号)移位指定位数并将结果压入栈顶
0x7dlushr将栈顶两 long 型数值右(无符号)移位指定位数并将结果压入栈顶
0x7eiand将栈顶两 int 型数值作 “按位与” 并将结果压入栈顶
0x7fland将栈顶两 long 型数值作 “按位与” 并将结果压入栈顶
0x80ior将栈顶两 int 型数值作 “按位或” 并将结果压入栈顶
0x81lor将栈顶两 long 型数值作 “按位或” 并将结果压入栈顶
0x82ixor将栈顶两 int 型数值作 “按位异或” 并将结果压入栈顶
0x83lxor将栈顶两 long 型数值作 “按位异或” 并将结果压入栈顶
0x84iinc将栈顶 int 型变量增加指定值(如i++, i--, i+=2等)
0x85i2l将栈顶 int 型数值强制转成 long 型数值并将结果压入栈顶
0x86i2f将栈顶 int 型数值强制转成 float 型数值并将结果压入栈顶
0x87i2d将栈顶 int 型数值强制转成 double 型数值并将结果压入栈顶
0x88l2i将栈顶 long 型数值强制转成 int 型数值并将结果压入栈顶
0x89l2f将栈顶 long 型数值强制转成 float 型数值并将结果压入栈顶
0x8al2d将栈顶 long 型数值强制转成 double 型数值并将结果压入栈顶
0x8bf2i将栈顶 float 型数值强制转成 int 型数值并将结果压入栈顶
0x8cf2l将栈顶 float 型数值强制转成 long 型数值并将结果压入栈顶
0x8df2d将栈顶 float 型数值强制转成 double 型数值并将结果压入栈顶
0x8ed2i将栈顶 double 型数值强制转成 int 型数值并将结果压入栈顶
0x8fd2l将栈顶 double 型数值强制转成 long 型数值并将结果压入栈顶
0x90d2f将栈顶 double 型数值强制转成 float 型数值并将结果压入栈顶
0x91i2b将栈顶 int 型数值强制转成 byte 型数值并将结果压入栈顶
0x92i2c将栈顶 int 型数值强制转成 char 型数值并将结果压入栈顶
0x93i2s将栈顶 int 型数值强制转成 short 型数值并将结果压入栈顶
0x94lcmp比较栈顶两 long 型数值的大小,并将结果(1, 0 或 -1)压入栈顶
0x95fcmpl比较栈顶两 float 型数值的大小,并将结果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 -1 压入栈顶
0x96fcmpg比较栈顶两 float 型数值的大小,并将结果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 1 压入栈顶
0x97dcmpl比较栈顶两 double 型数值的大小,并将结果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 -1 压入栈顶
0x98dcmpg比较栈顶两 double 型数值的大小,并将结果(1, 0 或 -1)压入栈顶; 当其中一个数值为 “NaN” 时,将 1 压入栈顶
0x99ifeg当栈顶 int 型数值等于 0 时跳转
0x9aifne当栈顶 int 型数值不等于 0 时跳转
0x9biflt当栈顶 int 型数值小于 0 时跳转
0x9cifge当栈顶 int 型数值大于或等于 0 时跳转
0x9difgt当栈顶 int 型数值大于 0 时跳转
0x9eifle当栈顶 int 型数值小于或等于 0 时跳转
0x9fif_icmpeq比较栈顶两 int 型数值的大小,当结果等于 0 时跳转
0xa0if_icmpne比较栈顶两 int 型数值的大小,当结果不等于 0 时跳转
0xa1if_icmplt比较栈顶两 int 型数值的大小,当结果小于 0 时跳转
0xa2if_icmpge比较栈顶两 int 型数值的大小,当结果大于或等于 0 时跳转
0xa3if_icmpgt比较栈顶两 int 型数值的大小,当结果大于 0 时跳转
0xa4if_icmple比较栈顶两 int 型数值的大小,当结果小于或等于 0 时跳转
0xa5if_icmpeq比较栈顶两引用型数值,当结果相等时跳转
0xa6if_icmpnc比较栈顶两引用型数值,当结果不相等时跳转
0xa7goto无条件跳转
0xa8jsr跳转至指定的 16 位 offset 位置,并将 jsr 的下一条指令地址压入栈顶
0xa9ret返回至本地变量指定的 index 的指令位置(一般与 jsr 或 jsr_w 联合使用)
0xaatableswitch用于 switch 条件跳转, case 值连续(可变长度指令)
0xablookupswitch用于 switch 条件跳转, case 值连不续(可变长度指令)
0xacireturn从当前方法返回 int
0xadlreturn从当前方法返回 long
0xaefreturn从当前方法返回 float
0xafdreturn从当前方法返回 double
0xb0areturn从当前方法返回对象引用
0xb1return从当前方法返回 void
0xb2getstatic获取指定类的静态域,并将其值压入栈顶
0xb3putstatic为指定的类的静态域赋值
0xb4getfield获取指定类的实例域,并将其值压入栈顶
0xb5putfield为指定的类的实例域赋值
0xb6invokevirtual调用实例方法
0xb7invokespecial调用超类构造方法, 实例初始化方法,私有方法
0xb8invokestatic调用静态方法
0xb9invokeinterface调用接口方法
0xbainvokedynamic调用动态方法
0xbbnew创建一个对象,并将其引用值压入栈顶
0xbcnewarray创建一个指定的原始类型(如 int, float等)的数组,并将其引用值压入栈顶
0xbdanewarray创建一个引用型(如 类,接口,数组)的数组,并将其引用值压入栈顶
0xbearraylength获得数组的长度值并压入栈顶
0xbfathrow将栈顶的异常抛出
0xc0checkcast检验类型转换, 检验未通过将抛出 ClassCastException
0xc1instanceof检验对象是否时指定类的实例, 如果是, 则将 1 压入栈顶,否则将 0 压入栈顶
0xc2monitorenter获得对象的锁,用于同步方法或同步块
0xc3monitorexit释放对象的锁,用于同步方法或同步块
0xc4wide扩展本地变量的宽度
0xc5multianewarray创建指定类型和指定维度的多维数组(执行该指令时,操作栈中必须包含各维度的长度值),并将其引用值压入栈顶
0xc6ifnull为 null 时跳转
0xc7ifnonnull不为 null 时跳转
0xc8goto_w无条件跳转(宽索引)
0xc9jsr_w跳转至指定的 32 位 offset 位置,并将 jsr_w 的下一条指令地址压入栈顶

数据类型在指令中的转化

数据类型byteshortintlongfloatdoublecharreference
简化转化bsilfdca

指令集支持的数据类型

下面表格中T+指令构成 opcode, T 为上面表格各数据类型的简化转化。

opcodebyteshortintlongfloatdoublecharreference
Tipushbipushsipush
Tconsticonstlconstfconstdconstaconst
Tloadiloadlloadfloaddloadaload
Tstoreistorelstorefstoredstoreastore
Tinciinc
Taloadbaloadsaloadialoadlaloadfaloaddaloadcaloadaaload
Tastorebastoresastoreiastorelastorefastoredastorecastoreaastore
Taddiaddladdfadddadd
Tsubisublsubfsubdsub
Tmulimullmulfmuldmul
Tdividivldivfdivddiv
Tremiremlremfremdrem
Tnegineglnegfnegdneg
Tshlishllshl
Tshrishrlshr
Tushriushrlushr
Tandiandland
Toriorlor
Txorixorlxor
i2Ti2bi2si2li2fi2d
l2Tl2il2fl2d
f2Tf2if2lf2d
d2Td2id2ld2f
Tcmplcmp
Tcmlfcmldcml
Tcmpgfcmpgdcmpg
if_TcmpOPif_icmpOPif_acopOP
Treturnireturnlreturnfreturndreturnareturn

大部分指令没有支持 byte,char 和 short 甚至是 boolean,编译器会在编译器或者运行期把这类数据扩展为 int 类型数据。

加载/存储指令

加载/存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输。

  • 将一个局部变量加载到操作栈: TloadTload_n 后者表示是一组指令。
  • 将一个数值从操作数栈存储到局部变量表: TstoreTstore_n 后者表示是一组指令。
  • 将一个常量加载到操作数栈: TipushldcT_const
  • 扩充局部变量表的访问索引指令:wide

运算指令

对操作数栈的数值进行运算之后把结果重新存入操作栈栈顶。

  • 加法指令 Tadd
  • 减法指令 Tsub
  • 乘法指令 Tmul
  • 除法指令 Tdiv
  • 求余指令 Trem
  • 取反指令 Tneg
  • 位移指令 Tshl, Tshr, Tushr
  • 按位或指令 Tor
  • 按位与指令 Tand
  • 按位异或指令 Txor
  • 局部变量自增指令 Tinc
  • 比较指令 Tcmpg ,Tcmpl

类型转化指令

类型转化指令用于将两种不同的数值类型进行相互转换,这种转换操作一般用于实现用户代码中的显式转换操作,或者用于处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。

  • int类型转其他 i2T
  • long类型转其他 l2T
  • float类型转其他 f2T
  • double类型转其他 d2T

对象创建与访问指令

尽管类实例和数组都是对象,但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令。

  • 创建类实例 new
  • 创建数组 newarray, anewarray, multianewarray
  • 访问类变量和实例变量 getfield, putfieldgetstaticputstatic
  • 把一个数组元素加载到操作数栈 Taload
  • 将一个操作数栈的值存储到数组元素中 Tastore
  • 取数组长度的指令 arraylength
  • 检查类实例类型 instanceof, checkcast

操作数栈管理指令

  • 将操作数栈栈顶一个或者两个元素出栈 poppop2
  • 复制栈顶一个或两个数值并将复制值重新压入栈顶 dupdup2, dup_x1dup2_x1,dup_x2dup2_x2
  • 将栈最顶端两个数值互换 swap

控制转移指令

让虚拟机可以有条件或者无条件地从特定位置指令执行程序而不是在控制转移指令的下一条指令执行程序。

  • 条件分支 ifeq, ifit, ifle, ifne, ifgt, ifge, ifull, ifnonnull, if_icmpeq, if_icmpne, if_icmplt, if_icmpgt, if_icmple, if_icmpge, if_acmpeq, if_acmpne
  • 复合条件分支 tableswitch, lookupswitch
  • 无条件分支 goto, goto_w, jsr, jsr_w, ret

方法调用和返回指令

  • 调用对象的实例方法 invokevirtual,根据对象的实际类型进行分派
  • 调用接口方法 invokeinterface , 会在运行时搜索一个实现了这个接口的方法的对象,找到适合的方法进行调用
  • 调用一些需要特殊处理的实例方法 invokespecial,包括实例初始化方法,私有方法和父类方法
  • 调用类方法 invokestatic 用于调用static方法
  • 运行时动态解析处调用点限定符所引用的方法并执行该方法 invokedynamic ,区别于前面4条指令,它们都在固化在jvm内部,而该指令的分派逻辑是由用户所设定的引导方法决定的。

异常处理指令

athrow 指令用于完成显式抛出异常(throw语句)的操作,除了用throw语句之外,JVM还规定在运行时会在其他 JVM指令检测到异常状况的时候自动抛出。比如当除数为0的时候,JVM会在 idivldiv 中抛出 ArithmeticException 异常。

同步指令

JVM 使用管程(Monitor)来支持以下同步场景:

  • 方法级的同步,不需要字节码控制,实现于方法调用和返回操作志宏。从方法表中 ACC_SYNCHRONIZED 得到一个方法是否是同步,如果被设置,则执行线程需要先持有管程才能执行,执行完之后释放管程。
  • 方法内部一段指令序列的同步,由monitorentermonitorexit来支持 synchronized 功能。

如果你也会用到 Java 字节码文件结构及指令信息,赶紧收藏起来吧~

欢迎关注 「Android之禅」公众号,和你分享有价值有思考的技术文章。
可添加微信 「Ming_Lyan」备注 “进群” 加入技术交流群,讨论技术问题严禁一切广告灌水。
如有 Android 领域有遇到技术难题亦或对未来职业规划有疑惑,一起讨论交流。
欢迎来扰。