C++14中的递归lambda函数

Recursive lambda functions in C++14

本文关键字：lambda 函数递归 C++14 更新时间：2023-10-16

在C++11中编写递归lambda函数有一个经常重复的"技巧"，如下所示：

std::function<int(int)> factorial;
factorial = [&factorial](int n)
{ return n < 2 ? 1 : n * factorial(n - 1); };
assert( factorial(5) == 120 );

（例如C++0x中的递归lambda函数。）

然而，这种技术有两个直接的缺点：std::function<Sig>对象的目标（通过引用捕获）与非常特定的std::function<Sig>对象（此处为factorial）绑定。这意味着生成的函子通常不能从函数中返回，否则引用将处于悬空状态。

另一个（虽然不那么直接）问题是，std::function的使用通常会阻止编译器优化，这是其实现中需要类型擦除的副作用。这不是假设性的，可以很容易地进行测试。

在递归lambda表达式非常方便的假设情况下，有没有办法解决这些问题？

问题的关键在于，在C++lambda表达式中，隐式this参数将始终引用表达式的封闭上下文的对象（如果存在），而不是lambda表达式产生的函子对象。

借用匿名递归（有时也称为"开放递归"），我们可以使用C++14的通用lambda表达式来重新引入显式参数，以引用我们潜在的递归函子：

auto f = [](auto&& self, int n) -> int
{ return n < 2 ? 1 : n * self(/* hold on */); };

呼叫者现在有了进行形式为例如f(f, 5)的呼叫的新负担。由于我们的lambda表达式是自引用的，所以它实际上是自己的调用者，因此我们应该有return n < 2 ? 1 : n * self(self, n - 1);。

由于在第一个位置显式传递函子对象本身的模式是可预测的，我们可以重构这个丑陋的疣：

template<typename Functor>
struct fix_type {
    Functor functor;
    template<typename... Args>
    decltype(auto) operator()(Args&&... args) const&
    { return functor(functor, std::forward<Args>(args)...); }
    /* other cv- and ref-qualified overloads of operator() omitted for brevity */
};
template<typename Functor>
fix_type<typename std::decay<Functor>::type> fix(Functor&& functor)
{ return { std::forward<Functor>(functor) }; }

这允许一个人写：

auto factorial = fix([](auto&& self, int n) -> int
{ return n < 2 ? 1 : n * self(self, n - 1); });
assert( factorial(5) == 120 );

我们成功了吗？由于fix_type<F>对象包含自己的函子，每次调用都会将其传递给它，因此永远不会有悬空引用的风险。因此，我们的factorial对象可以无休止地复制、从函数中移动、进出函数，而不会带来麻烦。

除了。。。虽然"外部"调用方可以很容易地进行形式为factorial(5)的调用，但事实证明，在我们的lambda表达式中，递归调用看起来仍然像self(self, /* actual interesting args */)。我们可以通过将fix_type更改为不将functor传递给自己，而是传递*this来改进这一点。也就是说，我们传入fix_type对象，该对象负责在第一个位置传递正确的"隐式为显式"参数：return functor(*this, std::forward<Args>(args)...);。然后递归变成n * self(n - 1)，这是应该的。

最后，这是为main生成的代码，它使用return factorial(5);而不是断言（对于fix_type的任何一种风格）：

00000000004005e0 <main>:
  4005e0:       b8 78 00 00 00          mov    eax,0x78
  4005e5:       c3                      ret    
  4005e6:       66 90                   xchg   ax,ax

编译器能够优化所有内容，就像使用普通递归函数一样。

成本是多少

精明的读者可能注意到了一个奇怪的细节。在从非泛型lambda到泛型lambda的过程中，我添加了一个显式返回类型（即-> int）。为什么？

这与要推导的返回类型是条件表达式的类型有关，哪种类型取决于对self的调用，正在推导哪种类型。快速阅读普通函数的Return类型推导会建议按照以下方式重写lambda表达式：

[](auto&& self, int n)
{
    if(n < 2) return 1;               // return type is deduced here
    else return n * self(/* args */); // this has no impact
}

GCC实际上只接受第一种形式的fix_type（通过functor的形式）的代码。我无法确定抱怨另一种形式（*this通过）是否正确。我让读者来选择要做什么样的权衡：更少的类型推导，或者更少丑陋的递归调用（当然，也完全有可能访问任何一种风格）。

GCC 4.9示例

完整的代码，第一种味道
完整代码，第二种口味
完整代码，第一种风格，C++11
一组相互递归lambda表达式的变差fix的例子

它不是lambda表达式，但几乎没有更多的代码，可以与C++98一起使用，可以递归：

struct {
    int operator()(int n) const {
        return n < 2 ? 1 : n * (*this)(n-1);
    }
} fact;
return fact(5);

根据[class.local]/1，它可以访问封闭函数可以访问的所有名称，这对于成员函数中的私有名称很重要。

当然，不是lambda，如果您想捕获函数对象外部的状态，就必须编写一个构造函数。