我是否应该通过右值引用返回右值引用参数

Should I return an rvalue reference parameter by rvalue reference?

本文关键字:引用 返回 参数 是否      更新时间:2023-10-16

我有一个函数,它就地修改std::string&左值引用,返回对输入参数的引用:

std::string& transform(std::string& input)
{
// transform the input string
...
return input;
}

我有一个辅助函数,它允许对右值引用执行相同的内联转换:

std::string&& transform(std::string&& input)
{
return std::move(transform(input)); // calls the lvalue reference version
}

请注意,它返回一个右值引用

我已经阅读了几个关于 SO 的关于返回右值引用的问题(例如,这里和这里),并得出结论,这是不好的做法。

从我所读到的内容来看,似乎共识是,由于返回值右值,再加上考虑到 RVO,仅按值返回将同样有效:

std::string transform(std::string&& input)
{
return transform(input); // calls the lvalue reference version
}

但是,我也读到返回函数参数会阻止 RVO 优化(例如这里和这里)

这让我相信会从transform(...)的左值引用版本的std::string&返回值复制到std::string返回值。

这是对的吗?

保留我的std::string&& transform(...)版本更好吗?

没有正确的答案,但按值返回更安全。

我已经阅读了几个关于 SO 的有关返回右值引用的问题,并得出结论,这是不好的做法。

返回对参数的引用会将协定强加给调用方,该协定要么

  1. 参数不能是临时的(这正是右值引用所表示的),或者
  2. 返回值不会保留在调用方上下文中的下一个分号之后(当临时值被销毁时)。

如果调用方传递临时并尝试保存结果,则会获得一个悬而未决的引用。

从我所读到的内容来看,似乎共识是,由于返回值是右值,再加上考虑到 RVO,仅按值返回将同样有效:

按值返回会增加移动构造操作。这样做的成本通常与对象的大小成正比。通过引用返回只需要机器确保一个地址在寄存器中,而按值返回需要在参数std::string中将几个指针归零,并将它们的值放入要返回的新std::string中。

它很便宜,但不是零。

令人惊讶的是,标准库目前采取的方向是快速且不安全并返回引用。(我知道唯一实际执行此操作的功能是从<tuple>std::get。碰巧的是,我已经向C++核心语言委员会提出了解决这个问题的建议,修订正在进行中,就在今天,我开始调查实施情况。但这很复杂,而且不是一件确定的事情。

std::string transform(std::string&& input)
{
return transform(input); // calls the lvalue reference version
}

编译器不会在此处生成move。如果input根本不是引用,并且您确实return input;它会,但是没有理由相信transform会仅仅因为它是一个参数而返回input,并且无论如何它都不会从右值引用类型推断所有权。(参见 C++14 §12.8/31-32。

您需要做:

return std::move( transform( input ) );

或等效

transform( input );
return std::move( input );

上述版本的transform的一些(非代表性)运行时:

在科里鲁上运行

#include <iostream>
#include <time.h>
#include <sys/time.h>
#include <unistd.h>
using namespace std;
double GetTicks()
{
struct timeval tv;
if(!gettimeofday (&tv, NULL))
return (tv.tv_sec*1000 + tv.tv_usec/1000);
else
return -1;
}
std::string& transform(std::string& input)
{
// transform the input string
// e.g toggle first character
if(!input.empty())
{
if(input[0]=='A')
input[0] = 'B';
else
input[0] = 'A';
}
return input;
}
std::string&& transformA(std::string&& input)
{
return std::move(transform(input));
}
std::string transformB(std::string&& input)
{
return transform(input); // calls the lvalue reference version
}
std::string transformC(std::string&& input)
{
return std::move( transform( input ) ); // calls the lvalue reference version
}

string getSomeString()
{
return string("ABC");
}
int main()
{
const int MAX_LOOPS = 5000000;
{
double start = GetTicks();
for(int i=0; i<MAX_LOOPS; ++i)
string s = transformA(getSomeString());
double end = GetTicks();
cout << "nRuntime transformA: " << end - start << " ms" << endl;
}
{
double start = GetTicks();
for(int i=0; i<MAX_LOOPS; ++i)
string s = transformB(getSomeString());
double end = GetTicks();
cout << "nRuntime transformB: " << end - start << " ms" << endl;
}
{
double start = GetTicks();
for(int i=0; i<MAX_LOOPS; ++i)
string s = transformC(getSomeString());
double end = GetTicks();
cout << "nRuntime transformC: " << end - start << " ms" << endl;
}
return 0;
}

输出

g++ -std=c++14 -O2 -Wall -pedantic -pthread main.cpp && ./a.out
Runtime transformA: 444 ms
Runtime transformB: 796 ms
Runtime transformC: 434 ms

这让我相信从 std::string& 转换 (...) 的左值引用版本的返回值为 标准::字符串返回值。

这是对的吗?

如果编译器不执行 RVO,则返回引用版本不会允许 std::string 复制发生,但返回值版本将具有 copy。但是,RVO 有其局限性,因此 C++11 添加 r 值引用并移动构造函数/赋值/std::move 以帮助处理这种情况。是的,RVO 比移动语义更有效,移动比复制便宜,但比 RVO 更昂贵。

保留我的 std::string&& transform(...) 版本更好吗?

这在某种程度上很有趣和奇怪。正如Potatoswatter回答的那样,

std::string transform(std::string&& input)
{
return transform(input); // calls the lvalue reference version
} 

您应该手动调用 std::move。

但是,您可以单击此developerworks链接:RVO V.S. std::move以查看更多详细信息,这些详细信息清楚地解释了您的问题。

如果你的问题纯粹是面向优化的,最好不要担心如何传递或返回参数。 编译器足够聪明,可以将您的代码分为纯引用传递、复制 elision、函数内联,甚至是移动语义(如果它是最快的方法)。

基本上,移动语义在某些深奥的情况下可以使你受益。 假设我有一个矩阵对象,它将double**作为成员变量保存,并且此指针指向两个二元数组double。 现在假设我有这个表达式:
Matrix a = b+c;
复制构造函数(或 assigment 运算符,在本例中)将获取bc的总和作为 temorary,将其作为 const 引用传递,在a内部指针上重新分配m*ndoubles量,然后,它将在 Sum-array 上运行a+b并将一个接一个地复制其值。 简单的计算表明,它最多可以采取O(nm)步(可以通用为O(n^2))。移动语义只会将隐藏的double**从临时a重新连接到内部指针中。这需要O(1).
现在让我们考虑一下std::string: 将其作为引用传递需要O(1)步骤(获取内存地址,传递它,取消引用它等,这在任何种类上都不是线性的)。 将其作为 r-value-reference 传递需要程序将其作为引用传递,重新连接隐藏的底层 C-char*,其中包含内部缓冲区,将原始缓冲区清空(或在它们之间交换),复制sizecapacity以及更多操作。我们可以看到,尽管我们仍处于O(1)区域 - 实际上可以有更多的步骤,而不仅仅是将其作为常规参考传递。

好吧,事实是我没有对其进行基准测试,这里的讨论纯粹是理论上的。 尽管如此,我的第一段仍然是正确的。 作为开发人员,我们假设了很多事情,但除非我们将所有内容都基准测试到死 - 编译器在 99% 的时间内比我们更了解

考虑到这个论点,我会说将其保留为引用传递而不是移动语义,因为它与 backword 兼容,并且对于尚未掌握 C++11 的开发人员来说更容易理解。