编译器如何为编译器生成的临时函数确定所需的堆栈大小

How does the compiler determine the needed stack size for a function with compiler generated temporaries?

本文关键字：编译器堆栈函数更新时间：2023-10-16

考虑以下代码:

class cFoo {
    private:
        int m1;
        char m2;
    public:
        int doSomething1();
        int doSomething2();
        int doSomething3();
}
class cBar {
    private:
        cFoo mFoo;
    public:
        cFoo getFoo(){ return mFoo; }
}
void some_function_in_the_callstack_hierarchy(cBar aBar) {
    int test1 = aBar.getFoo().doSomething1();
    int test2 = aBar.getFoo().doSomething2();
    ...
}

在调用getFoo()的行中，编译器将生成cFoo的临时对象，以便能够调用doSomething1()。编译器是否重用用于这些临时对象的堆栈内存?"some_function_in_the_callstack_hierarchy"的调用将保留多少堆栈内存?它是否为每个生成的临时保留内存?

我的猜测是编译器只为cFoo的一个对象保留内存，并将为不同的调用重用内存，但是如果我添加

    int test3 = aBar.getFoo().doSomething3();

我可以看到"some_function_in_the_callstack_hierarchy"所需的堆栈大小要大得多，这不仅仅是因为额外的局部int变量。

另一方面，如果i替换

cFoo getFoo(){ return mFoo; }

带引用的

(仅用于测试目的，因为返回对私有成员的引用是不好的)

const cFoo& getFoo(){ return mFoo; }

它需要更少的堆栈内存，比一个cFoo的大小。

所以对我来说，编译器似乎为函数中每个生成的临时对象保留了额外的堆栈内存。但这样做效率很低。有人能解释一下吗?

优化编译器正在将您的源代码转换为一些内部表示，并将其规范化。

使用自由软件编译器(如GCC &Clang/LLVM)，您可以查看内部表示(至少通过修补编译器代码或在某些调试器中运行它)。

顺便说一句，有时，临时值甚至不需要任何堆栈空间，例如，因为它们已经被优化，或者因为它们可以放在寄存器中。而且它们经常会重用当前调用帧中一些不需要的插槽。而且(特别是在c++中)很多(小)函数都是内联的——就像你的getFoo一样——(所以它们自己没有任何调用框架)。最近的GCC甚至有时能够尾部调用优化(本质上是重用调用者的调用框架)。

如果您使用GCC(即g++)进行编译，我建议使用优化选项和开发人员选项(以及其他一些选项)。也可以使用-Wstack-usage=48(或其他值，以字节为单位)和/或-fstack-usage

首先，如果你能读汇编代码，用g++ -S -fverbose-asm -O yourcode.cc编译yourcode.cc，并查看发出的yourcode.s

^{(不要忘记使用优化标志，因此将-O替换为-O2或-O3 ....)}

然后，如果你对编译器是如何优化的更好奇，试试g++ -O -fdump-tree-all -c yourcode.cc，你会得到很多所谓的"转储文件"，其中包含与GCC相关的内部表示的部分文本呈现。

如果你更好奇，看看我的GCC MELT，尤其是它的文档页面(其中包含大量幻灯片;引用).

所以对我来说，编译器似乎为函数中每个生成的临时对象保留了额外的堆栈内存。

在一般情况下当然不会(当然假设您启用了一些优化)。即使预留了一些空间，也会很快被重用。

^{顺便说一句:注意c++ 11标准没有提到堆栈。可以想象一些不使用任何堆栈的c++程序(例如，整个程序优化检测一个没有递归的程序，其堆栈空间和布局可以优化以避免任何堆栈)。我不知道任何这样的编译器，但我知道编译器可以相当聪明....)}

试图分析编译器将如何处理特定的代码段正变得越来越困难，因为优化策略变得越来越激进。

编译器所要做的就是实现c++标准并编译代码，而不引入或取消任何副作用(除了一些例外，例如返回和命名返回值优化)。

你可以从你的代码中看到，因为cFoo不是一个多态类型，没有成员数据，编译器可以优化出对象的创建，并直接调用本质上是static函数的东西。我可以想象，甚至在我写这篇文章的时候，一些编译器已经在这样做了。您可以随时检查输出程序集以确保无误。

编辑:OP现在介绍了类成员。但是由于这些从来没有初始化，并且是private，编译器可以不需要考虑太多就删除它们。因此这个答案仍然适用。

临时对象的生存时间到包含完整表达式的结尾为止，请参见标准的"12.2临时对象"段落。

即使使用最低优化设置，编译器也不太可能在临时对象的生命周期结束后重用空间。