1.动机
从机器层面上来看,控制流类的跳转指令分为无条件跳转和有条件跳转,无条件跳转 JMP,有条件跳转 JEQ、JNE、JLT、JGT、JLE、JGE,这部分指令是需要通过检查 condition code (SW 寄存器)来决定跳转条件;J 类型指令依赖的 condition code 是通过比较指令(比如 CMP)的结果来设置的。如下图所示,JNE跳转指令通过检查SW寄存器的状态以决定是否发生跳转。因此,为了支持控制流功能,首先要打通比较功能。
2.LLVM IR 中的比较指令
LLVM IR提供的 int 类型比较指令为 icmp。其接受三个参数:比较方案以及两个比较参数。
%result = icmp ule i32 %a, %b
ule是比较方案,其中 u 为 unsigned int,le 为 lower than or equal,%a和%b就是用来比较的两个数,而icmp则返回一个i1类型的值,用来表示结果是否为真。
与ule类似的比较方案有多种,如:
等于与不等于:eq、ne;
无符号比较:ugt、uge、ult、ule, 分别对应无符号的大于、大于等于、小于、小于等于;
有符号比较:sgt、sge、slt、sle, 分别对应有符号的大于、大于等于、小于、小于等于。
3.实现比较功能的添加
3.1 定义format
class FA<bits<8> op, dag outs, dag ins, string asmStr,
list<dag> pattern, InstrItinClass itin>
: Cpu0Inst<outs, ins, asmStr, pattern, itin, FrmA>
{
bits<4> ra;
bits<4> rb;
bits<4> rc;
bits<12> shamt;
let Opcode = op;
let Inst{23-20} = ra;
let Inst{19-16} = rb;
let Inst{15-12} = rc;
let Inst{11-0} = shamt;
}
rb
、rc
为两个寄存器类型源操作数,用于存放比较的数据,ra
为寄存器类型目的操作数,用来存放比较的结果。
class FL<bits<8> op, dag outs, dag ins, string asmStr,
list<dag> pattern, InstrItinClass itin>
: Cpu0Inst<outs, ins, asmStr, pattern, itin, FrmL>
{
bits<4> ra;
bits<4> rb;
bits<16> imm16;
let Opcode = op;
let Inst{23-20} = ra;
let Inst{19-16} = rb;
let Inst{15-0} = imm16;
}
rb
为寄存器类型源操作数,用于存放比较的数据,imm16
是用于比较的16位立即数,ra
为寄存器类型目的操作数,用来存放比较的结果。
3.2 定义指令
class SetCC_R<bits<8> op, string instrAsm, PatFrag condOp,
RegisterClass RC>
: FA<op, (outs GPROut:$ra), (ins RC:$rb, RC:$rc),
!strconcat(instrAsm, "\t$ra, $rb, $rc"),
[(set GPROut:$ra, (condOp RC:$rb, RC:$rc))],
IIAlu>, Requires<[HasSlt]> {
let shamt = 0;
}
def SLT : SetCC_R<0x28, "slt", setlt, CPURegs>;
def SLTu : SetCC_R<0x29, "sltu", setult, CPURegs>;
SetCC_R
继承自上面定义的FA
。SLT
、SLTu
对应着小于、无符号小于两种比较方案
class SetCC_I<bits<8> op, string instrAsm, PatFrag condOp, Operand Od,
PatLeaf immType, RegisterClass RC>
: FL<op, (outs GPROut:$ra), (ins RC:$rb, Od:$imm16),
!strconcat(instrAsm, "\t$ra, $rb, $imm16"),
[(set GPROut:$ra, (condOp RC:$rb, immType:$imm16))],
IIAlu>, Requires<[HasSlt]>;
class FMem<bits<8> op, dag outs, dag ins, string asmStr, list<dag> pattern,
InstrItinClass itin>
: FL<op, outs, ins, asmStr, pattern, itin> {
bits<20> addr;
let Inst{19-16} = addr{19-16};
let Inst{15-0} = addr{15-0};
let DecoderMethod = "DecodeMem";
}
def SLTi : SetCC_I<0x26, "slti", setlt, simm16, immSExt16, CPURegs>;
def SLTiu : SetCC_I<0x27, "sltiu", setult, simm16, immSExt16, CPURegs>;
SetCC_I
继承自上面定义的FL
。SLTi
、SLTiu
对应着立即数小于、立即数无符号小于两种比较方案。
3.3 定义Pattern
上述四条指令只提到了小于、无符号小于两种比较方案,另外的比较方案没有定义。针对这种指令集中没有定义的比较方案需要借助Pattern
定义。
指令选择过程就是DAG的模式匹配过程,模式的定义其主要在td文件中进行描述。当一个匹配找到后,将其DAG中的Node替换为具体的机器指令或伪指令。所以td文件中的Pattern
的定义对于指令选择起到至关重要的作用。
每一个Pattern
记录继承自 Pat class,其有两个参数,第一个参数DAG图中待匹配的模式,第二个参数是一个由机器指令组成DAG,当一个 Pattern 匹配后,将使用第二个参数替换第一个参数。以大于和大于等于为例,比较方案的模式定义如下:
大于(setgt、setugt)
multiclass SetgtPatsSlt<RegisterClass RC, Instruction SLTOp, Instruction SLTuOp> {
def : Pat<(setgt RC:$lhs, RC:$rhs),
// a > b is equal to b < a is equal to setlt(b, a)
(SLTOp RC:$rhs, RC:$lhs)>;
def : Pat<(setugt RC:$lhs, RC:$rhs),
(SLTuOp RC:$rhs, RC:$lhs)>;
}
defm : SetgtPatsSlt<CPURegs, SLT, SLTu>;
大于等于(setge、setuge)
multiclass SetgePatsSlt<RegisterClass RC, Instruction SLTOp, Instruction SLTuOp> {
def : Pat<(setge RC:$lhs, RC:$rhs),
// a >= b is equal to b <= a
(XORi (SLTOp RC:$lhs, RC:$rhs), 1)>;
def : Pat<(setuge RC:$lhs, RC:$rhs),
(XORi (SLTuOp RC:$lhs, RC:$rhs), 1)>;
}
defm : SetgePatsSlt<CPURegs, SLT, SLTu>;
4.测试 (以大于为例)
测试用例
int test_setxx()
{
int a = 5;
int b = 3;
int c;
c = (a > b); // sgt, c = 1
return (c);
}
LLVM IR
%a = alloca i32, align 4
%b = alloca i32, align 4
%c = alloca i32, align 4
store i32 5, i32* %a, align 4
store i32 3, i32* %b, align 4
%0 = load i32, i32* %a, align 4
%1 = load i32, i32* %b, align 4
%cmp = icmp sgt i32 %0, %1
%conv = zext i1 %cmp to i32
store i32 %conv, i32* %c, align 4
%2 = load i32, i32* %c, align 4
ret i32 %2
}
指令选择前后的DAG
汇编
test_setxx:
.frame $fp,16,$lr
.mask 0x00000000,0
.set noreorder
.set nomacro
# %bb.0: # %entry
addiu $sp, $sp, -16
addiu $2, $zero, 5
st $2, 12($sp)
addiu $2, $zero, 3
st $2, 8($sp)
ld $2, 12($sp)
ld $3, 8($sp)
cmp $sw, $3, $2
andi $2, $sw, 1
st $2, 4($sp)
ld $2, 4($sp)
addiu $sp, $sp, 16
ret $lr
nop
.set macro
.set reorder
.end test_setxx
$func_end0:
.size test_setxx, ($func_end0)-test_setxx
# -- End function
5.总结
LLVM编译器后端的主要工作是将LLVM中间端表达式(IR)转换成汇编文件,Cpu0 是一个非常简单的 RISC 架构处理器,本文以Cpu0作为硬件的例子,来构建能适配它的编译器后端,主要讲述了比较指令在整个控制流当中的作用并梳理了在LLVM后端中添加比较功能的过程。在编译器后端的开发过程中有一定的参考作用。可能存在认知上的偏差,也请大佬多多指教,笔者也会在学习中一步步改正错误,欢迎交流技术心得。
参考文献
https://llvm.org/docs/WritingAnLLVMBackend.html
https://llvm.org/docs/tutorial/MyFirstLanguageFrontend/LangImpl05.html
https://zhuanlan.zhihu.com/p/386457923
https://zhuanlan.zhihu.com/p/163328574