寄存器分配算法

Algorithm for register allocation

本文关键字:算法 分配 寄存器      更新时间:2023-10-16

我正在尝试为Trees实现一种代码生成/寄存器分配算法,以支持我的旧算法,在旧算法中,我将所有内容都放在堆栈上。现在我正在尝试实现Sethi Ullman算法,但从我在维基百科和一些网页上发现的内容来看,算法的某些部分对我来说仍然不清楚

我想用一些伪代码/C/C++工作代码来解释我缺少的部分。

1( 我应该使用哪种方法来选择免费注册?即将使用的寄存器堆栈。我使用的是我认为非常糟糕的寄存器:交替返回寄存器:如果以前使用的寄存器是R0,则返回R1。如果是R1,则返回R0,依此类推。这对小表达式不起作用。

2( label(left) >= K and label(right) >= K时我该怎么办?

以下是labelsethi-ullman的功能

REG reg()
{
    static REG r = REG_NONE;
    switch(r) {
        case REG_NONE:
            r = REG_r0;
            break;
        case REG_r0:
            r = REG_r1;
            break;
        case REG_r1:
            r = REG_r0;
            break;
        default:
            assert(0);
            break;
    }
    return r;
}
void SethiUllman(AST *node)
{
    static const int K = 2;
    if(node->left != NULL && node->right != NULL) {
            int l = node->left->n;
            int r = node->right->n;
            if(l >= K && r >= K) {
                SethiUllman(node->right);
                node->n = node->n - 1;
                //emit(node->right, REG_r0);
                SethiUllman(node->left);
                //emit(node->left, REG_r1);
            }
            else if(l >= r) {
                SethiUllman(node->left);
                SethiUllman(node->right);
                node->n = node->n - 1;
            }
            else if(l < r) {
                SethiUllman(node->right);
                SethiUllman(node->left);
                node->n = node->n - 1;
            }
            node->reg = reg();
            printf("%s %s,%sn", 
                         op_string(node->type),
                         reg_string(node->left->reg),
                         reg_string(node->right->reg));
        }
    else if(node->type == TYPE::id) {
        node->n = node->n + 1;
        node->reg = reg();
        emit(node);
    }
    else {
        node->reg = reg();
        emit(node);
    }
}
void label(AST *node)
{
    if(node == NULL)
        return;
    label(node->left);
    label(node->right);
    if(node->left != NULL && node->right != NULL) {
        int l = node->left->n;
        int r = node->right->n;
        if(l == r)
            node->n = 1 + l;
        else
            node->n = max(1, l, r);
    }
    else if(node->type == TYPE::id) {
        node->n = 1;
    } else if(node->type == TYPE::number) {
        node->n = 0;
    }
}

对于像这样的exp中的树:

2+b*3

它确实生成:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1
LOAD R1,2
ADD R1,R0

来自这样一个:

8+(2+b*3)

它确实生成:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1
LOAD R1,2
ADD R1,R0
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
ADD R0,R1

上面我只提供了主要的算法,但如果需要,我可以为您机器上的测试用例提供完整的代码。

我不太明白为什么8+(2+b*3)表达式不能"工作",因为对我来说,该表达式在计算中不需要超过2个寄存器。但是,如果不能在两个寄存器中执行整个计算,则需要进行"溢出"操作——将寄存器存储在临时(堆栈(位置,然后在再次需要时从该临时位置恢复值。

这是你发布的代码:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R1,R0     ; R1 = 2+(b*3)
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
ADD R0,R1

我们可以重写它,使用溢出:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R1,R0     ; R1 = 2+(b*3)
STORE R1, [tmp]
LOAD R1,8 < R1 is not preserved. I don't know how it should be done.
LOAD R0, [tmp]
ADD R0,R1

然而,可以做到不溢出,这表明你使用的实际算法是错误的:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R0,R1     ; R0 = 2+(b*3)
LOAD R1,8     ; Use R0 above -> R1 is now free.
ADD R0,R1

或者,同样:

LOAD R0,[b]
LOAD R1,3
MUL R0,R1     ; R0 = b*3
LOAD R1,2     
ADD R1,R0     ; R1 = 2+(b*3)
LOAD R0,8     ; Store in R1 above -> R0 is now free.
ADD R0,R1

我不确定,但我认为这很可能是您选择第一条ADD指令的左/右操作数的方法。

我会在代码后面添加一些打印输出,看看它在不同的情况下会做什么。