编译器如何为编译器生成的临时函数确定所需的堆栈大小

How does the compiler determine the needed stack size for a function with compiler generated temporaries?

本文关键字:编译器 堆栈 函数      更新时间:2023-10-16

考虑以下代码:

class cFoo {
    private:
        int m1;
        char m2;
    public:
        int doSomething1();
        int doSomething2();
        int doSomething3();
}
class cBar {
    private:
        cFoo mFoo;
    public:
        cFoo getFoo(){ return mFoo; }
}
void some_function_in_the_callstack_hierarchy(cBar aBar) {
    int test1 = aBar.getFoo().doSomething1();
    int test2 = aBar.getFoo().doSomething2();
    ...
}

在调用getFoo()的行中,编译器将生成cFoo的临时对象,以便能够调用doSomething1()。编译器是否重用用于这些临时对象的堆栈内存?"some_function_in_the_callstack_hierarchy"的调用将保留多少堆栈内存?它是否为每个生成的临时保留内存?

我的猜测是编译器只为cFoo的一个对象保留内存,并将为不同的调用重用内存,但是如果我添加

    int test3 = aBar.getFoo().doSomething3();

我可以看到"some_function_in_the_callstack_hierarchy"所需的堆栈大小要大得多,这不仅仅是因为额外的局部int变量。

另一方面,如果i替换
cFoo getFoo(){ return mFoo; }
带引用的

(仅用于测试目的,因为返回对私有成员的引用是不好的)

const cFoo& getFoo(){ return mFoo; }

它需要更少的堆栈内存,比一个cFoo的大小。

所以对我来说,编译器似乎为函数中每个生成的临时对象保留了额外的堆栈内存。但这样做效率很低。有人能解释一下吗?

优化编译器正在将您的源代码转换为一些内部表示,并将其规范化。

使用自由软件编译器(如GCC &Clang/LLVM),您可以查看内部表示(至少通过修补编译器代码或在某些调试器中运行它)。

顺便说一句,有时,临时值甚至不需要任何堆栈空间,例如,因为它们已经被优化,或者因为它们可以放在寄存器中。而且它们经常会重用当前调用帧中一些不需要的插槽。而且(特别是在c++中)很多(小)函数都是内联的——就像你的getFoo一样——(所以它们自己没有任何调用框架)。最近的GCC甚至有时能够尾部调用优化(本质上是重用调用者的调用框架)。

如果您使用GCC(即g++)进行编译,我建议使用优化选项和开发人员选项(以及其他一些选项)。也可以使用-Wstack-usage=48(或其他值,以字节为单位)和/或-fstack-usage

首先,如果你能读汇编代码,用g++ -S -fverbose-asm -O yourcode.cc编译yourcode.cc,并查看发出的yourcode.s

(不要忘记使用优化标志,因此将-O替换为-O2-O3 ....)

然后,如果你对编译器是如何优化的更好奇,试试g++ -O -fdump-tree-all -c yourcode.cc,你会得到很多所谓的"转储文件",其中包含与GCC相关的内部表示的部分文本呈现。

如果你更好奇,看看我的GCC MELT,尤其是它的文档页面(其中包含大量幻灯片;引用).

所以对我来说,编译器似乎为函数中每个生成的临时对象保留了额外的堆栈内存。

在一般情况下当然不会(当然假设您启用了一些优化)。即使预留了一些空间,也会很快被重用。

顺便说一句:注意c++ 11标准没有提到堆栈。可以想象一些不使用任何堆栈的c++程序(例如,整个程序优化检测一个没有递归的程序,其堆栈空间和布局可以优化以避免任何堆栈)。我不知道任何这样的编译器,但我知道编译器可以相当聪明....)

试图分析编译器将如何处理特定的代码段正变得越来越困难,因为优化策略变得越来越激进。

编译器所要做的就是实现c++标准并编译代码,而不引入或取消任何副作用(除了一些例外,例如返回和命名返回值优化)。

你可以从你的代码中看到,因为cFoo不是一个多态类型,没有成员数据,编译器可以优化出对象的创建,并直接调用本质上是static函数的东西。我可以想象,甚至在我写这篇文章的时候,一些编译器已经在这样做了。您可以随时检查输出程序集以确保无误。

编辑:OP现在介绍了类成员。但是由于这些从来没有初始化,并且是private,编译器可以不需要考虑太多就删除它们。因此这个答案仍然适用。

临时对象的生存时间到包含完整表达式的结尾为止,请参见标准的"12.2临时对象"段落。

即使使用最低优化设置,编译器也不太可能在临时对象的生命周期结束后重用空间。