编写高性能C++二传手

Writing performant C++ setters

本文关键字:二传手 C++ 高性能      更新时间:2023-10-16

阅读了有效的现代C++后,我试图找出如何在C++类中为setter传递参数的最佳方法; 想象一下以下场景:

您正在编写解析输入文件(例如 CVS 格式(的应用程序,将其馈送到模型类中,然后将实例列表传递给数据库驱动程序以进行批量插入。

我们可以只谈论最新和最伟大的C++14;我写了我试图用一列来表示这一点的尝试:

class Person {
std::wstring _name;
public:
template<typename T>
inline void setName(T&& name) { _name = std::forward<T>(name); }
};

我还编写了以下代码片段来测试性能:

const auto start = std::chrono::system_clock::now();
std::vector<std::shared_ptr<Person>> vec;
for (auto i = 0; i < 999999; i++)
{
auto p = std::make_shared<Person>();
p->setName(L"John Chester Doe");
vec.emplace_back(p);
}   
const auto end = std::chrono::system_clock::now();
std::cout << "Took " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << " ms" << std::endl;

在我的系统上,这需要 ~175 毫秒MSVC2017使用/O2 发布 x64 编译,关闭 SDL,没有安全检查 (/sdl-/GS-(。出于好奇,我在 C# 中尝试了同样的事情:

class Person
{
public string Name { get; set; }
} 

var sw = System.Diagnostics.Stopwatch.StartNew();
var i = 0;
var vec = new System.Collections.Generic.List<Person>();
for (; i < 999999; i++)
{
var p = new Person();
p.Name = "John Chester Doe";
vec.Add(p);
}
sw.Stop();
System.Console.WriteLine("Took {0}ms", sw.ElapsedMilliseconds);

这在释放模式下产生 77 毫秒!所以我的问题是我自然做错了什么?为什么我的C++代码在本质上相同的操作上比 C# 代码慢?

我尝试在C++中使用结构(没有区别(,通过 const ref 传递值(较慢(,使用 std::move 传递值(较慢(。我也尝试使用noexcept (没有太大区别(甚至std::string(没有太大区别(。

谢谢!

编辑

感谢大家的建议,真的很感激。看起来我想要实现的最佳方法是这样的:

std::vector<Person> vec;
vec.reserve(999999);
for (auto i = 0; i < 999999; i++)
{
vec.emplace_back();
vec.back().setName(L"John Chester Doe");
}

这是预分配的 75 毫秒,没有 vec.reserve 是 130 毫秒。

"比较橙子和苹果"是我能在这里给出的最好的描述。您的 C# 代码最接近C++等效代码,如下所示:

#include <iostream>
#include <deque>
#include <chrono>
#include <string>
struct Person {
std::wstring _name;
Person() = default;
Person(Person&& p) = default;
Person(const Person& p) = default;
Person(const std::wstring& n) : _name(n) {}
};
int main()
{
std::deque<Person> vec; 
const std::wstring n =  L"John Chester Doe";
const auto start = std::chrono::system_clock::now();
for (auto i = 0; i < 999999; i++)
{
vec.emplace_back(n);
}   
const auto end = std::chrono::system_clock::now();
std::cout << "Took " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << " ms" << std::endl;
}

这至少比您的变体快 3 倍。也许我可以让它更快,将所有内存的分配移动到 deque 的初始化中,但这会将循环更改为范围循环。是的,C#和Java做同样的事情。它试图将大部分可预测的工作卸载到编译时间,例如收集类似的文字,投影可用内存并更有效地分配它等。主要是因为CLR的工作原理类似于Java机器。

我的理解是,C# 编译器在后台执行的操作大致转换为以下C++代码:

class Person {
std::wstring _name;
public:
template<typename T>
inline void setName(T&& name) { _name = std::forward<T>(name); }
};

对于插入部分:

std::vector<Person> vec;
vec.reserve(999999);
for (auto i = 0; i < vec.size(); i++)
{
vec.emplace_back();
vec.back().setName(L"John Chester Doe");
}

再次感谢您的时间,如果有任何其他建议如何改进这一点,我将很高兴听到。