JVM模板解释器:如何根据字节码生成汇编码?

1、背景

仅针对JVM的模板解释器:

如何根据opcode和寻址模式,将bytecode生成汇编码。

本文的示例中所使用的字节码和汇编码,请参见上篇博文:按值传递还是按引用?

2、寻址模式

本文不打算深入展开寻址模式的阐述,我们聚焦Intel的IA32-64架构的指令格式:
这里写图片描述

简要说明下,更多的请参考intel的手册:

— Prefixes : 用于修饰操作码Opcode,赋予其lock、repeat等的语义.
— REX Prefix
—- Specify GPRs and SSE registers.
—- Specify 64-bit operand size.
—- Specify extended control registers.
Opcode:操作码,如mov、push.
Mod R/M:寻址相关,具体见手册。
SIB:和Mod R/M结合起来指定寻址。
Displacement:配合Mod R/M和SIB指定寻址。
Immediate:立即数。

对上面的Opcode、Mod R/W、SIB、disp、imm如果不明白,看句汇编有个概念:

如果这句汇编也不太明白,那么配合下面的:

— Base + (Index ∗ Scale) + Displacement — Using all the addressing components together allows efficient
indexing of a two-dimensional array when the elements of the array are 2, 4, or 8 bytes in size.

3、合法的值(64位)

关注下这4个参数的合法取值:

• Displacement — An 8-bit, 16-bit, or 32-bit value.
• Base — The value in a 64-bit general-purpose register.
• Index — The value in a 64-bit general-purpose register.
• Scale factor — A value of 2, 4, or 8 that is multiplied by the index value.

4、Mod R/M(32位寻址)

我们在后文将会用到Mod R/M字节,所以将32位寻址的格式贴在这里:

这里写图片描述

上表的备注,其中第1条将在我们的示例中用到,所以这里留意下:

  1. The [–][–] nomenclature means a SIB follows the ModR/M byte.
  2. The disp32 nomenclature denotes a 32-bit displacement that follows the ModR/M byte (or the SIB byte if one is present) and that is
    added to the index.
  3. The disp8 nomenclature denotes an 8-bit

5、SIB(32位寻址)

同样,因为用到了Mod R/M字节,那么SIB字节也可能要用到:

这里写图片描述

6、示例

6.1、准备工作

来看个实际的例子。

下面的代码是生成mov汇编码:

prefix(dst,src)就是处理prefix和REX prefix,这里我们不关注。

emit_int8((unsigned char) 0x89)顾名思义就是生成了一个字节,那字节的内容0x89代表什么呢?

先不急,还有一句emit_operand(src,dst),这是一段很长的代码,我们大概看下:

上面的代码的关注点已经标出,这里我们将其抽出,并将前文中的emit_int8((unsigned char) 0x89)结合起来:

最终其生成了如下的汇编代码(64位机器):

好了,问题来了:

上面这句汇编怎么得出的?

6.2、计算过程

我们给个下面的值:

进行简单的运算就可以得到:

合起来就是三个字节:

1、0x89对应什么?

这里写图片描述

从上表可以看出因为JVM工作在64位下,所以需要配合REX.W来“起头”,不过在我们这个例子中,其恰好是0。

主要看那个89/r:

2、0x04代表什么?

现在我们要用到上面的Mod R/M表和SIB表了。

用第二个字节0x04查Mod R/M表,可知源操作数是寄存器EAX,同时可知寻址类型是[–][–]类型,含义为:

The [–][–] nomenclature means a SIB follows the ModR/M byte.

3、0x19代表什么?

继续查SIB表,对应字节0x19的是:

4、汇编代码:

7、结语

本文简要探讨了:

如何根据opcode和寻址模式,将bytecode生成汇编码。

终。

1 收藏 评论

关于作者:foreach_break

关注web、数据、分布式. 个人主页 · 我的文章 · 15 ·  

相关文章

可能感兴趣的话题



直接登录
跳到底部
返回顶部