x86-64 程序集:为什么偏移 25 字节

x86-64 assembly: why offset 25 bytes?

本文关键字:字节 为什么 程序集 x86-64      更新时间:2023-10-16

我今天通过分析与这个 c++ 示例对应的汇编代码开始学习 x86 汇编(我知道存在类似 atoi 的东西,但我想保持示例最小(:

#include <vector>
std::vector<int> range(int N) {
    std::vector<int> v(N);
    for (unsigned int i = 0; i < N; ++i)
        v[i] = i;
    return v;
}
int main() {
    return range(100).back();
}

如果使用 g++ -O0 -S -fno-stack-protector return_by_value.cpp 编译,则会导致以下摘录:

... <snip>
_Z5rangei:
.LFB509:
    .cfi_startproc
    .cfi_personality 0x3,__gxx_personality_v0
    .cfi_lsda 0x3,.LLSDA509
    pushq   %rbp
    .cfi_def_cfa_offset 16
    .cfi_offset 6, -16
    movq    %rsp, %rbp
    .cfi_def_cfa_register 6
    pushq   %rbx
    subq    $40, %rsp
    .cfi_offset 3, -24
    movq    %rdi, -40(%rbp)
    movl    %esi, -44(%rbp)
    leaq    -25(%rbp), %rax
    movq    %rax, %rdi
    call    _ZNSaIiEC1Ev
    movl    $0, -24(%rbp)
    movl    -44(%rbp), %eax
    movslq  %eax, %rsi
    leaq    -25(%rbp), %rcx
    leaq    -24(%rbp), %rdx
    ... <snip>

我很惊讶地看到一个奇数(即不是 8 的倍数(偏移量:leaq -25(%rbp), %rax ,特别是因为它是一个q指令,而且我们还-24(%rbp).编译器读取 8 个字节边界的原因是什么?

看看这个片段:

leaq    -25(%rbp), %rax
movq    %rax, %rdi
call    _ZNSaIiEC1Ev

_ZNSaIiEC1Ev被拆解为std::allocator<int>::allocator(),所以-25(%rbp)是传递给构造函数的allocator<int>对象的地址。如果我们在 GCC 中打印此对象的sizeof,我们将得到 1。由于对象的大小为 1,因此无需将其对齐为 8 个字节,并且可以放置在任何内存地址中。

您稍后看到的-24(%rbp)是不同对象的地址,并且编译器不会跨 8 字节边界读取。

请注意,lea指令实际上并不访问内存 - 它只计算一个地址。因此,它具有q后缀的事实并不意味着它访问 8 个字节。