如何在c++中加速返回指向对象的指针的函数
How to speed up a function that returns a pointer to object in c++?
我是一名机械工程师,所以请理解我没有受过正确编码的培训。我有一个有限元代码,它使用网格来制作构成模型的元素。这个元素对这个问题不重要,所以我把它省略了。图元和轴网是从文件中读入的,该零件可以工作。
class Grid
{
private:
int id;
double x;
double y;
double z;
public:
Grid();
Grid(int, double, double, double);
int get_id() { return id;};
};
Grid::Grid() {};
Grid::Grid(int t_id, double t_x, double t_y double t_z)
{
id = t_id; x = t_x; y = t_y; z = t_z;
}
class SurfaceModel
{
private:
Grid** grids;
Element** elements;
int grid_count;
int elem_count;
public:
SurfaceModel();
SurfaceModel(int, int);
~SurfaceModel();
void read_grid(std::string);
int get_grid_count() { return grid_count; };
Grid* get_grid(int);
};
SurfaceModel::SurfaceModel()
{
grids = NULL;
elements = NULL;
}
SurfaceModel::SurfaceModel(int g, int e)
{
grids = new Grid*[g];
for (int i = 0; i < g; i++)
grids[i] = NULL;
elements = new Element*[e];
for (int i = 0; i < e; i++)
elements[i] = NULL;
}
void SurfaceModel::read_grid(std::string line)
{
... blah blah ...
grids[index] = new Grid(n_id, n_x, n_y, n_z);
... blah blah ....
}
Grid* SurfaceModel::get_grid(int i)
{
if (i < grid_count)
return grids[i];
else
return NULL;
}
当我需要实际使用网格时,我会使用get_grid,可能是这样的:
SurfaceModel model(...);
.... blah blah .....
for (int i = 0; i < model.get_grid_count(); i++)
{
Grid *cur_grid = model.get_grid(i);
int cur_id = cur_grid->get_id();
}
我的问题是,对get_grid的调用似乎比我认为的简单返回对象所花费的时间更多。我在代码上运行了gprof,发现在进行一个非常大的模拟时,get_grid被调用了大约40亿次,而使用x、y、z的另一个操作也发生了同样的情况。这个运算做一些乘法运算。我发现get_grid和math花费的时间大致相同(约40秒)。这似乎是我做错了什么。有没有更快的方法把那个物体弄出来?
我想您忘记设置grid_count
和elem_count
了。
这意味着,它们将具有未初始化(不确定)的值。如果为这些值进行循环,则很容易循环大量迭代。
SurfaceModel::SurfaceModel()
: grid_count(0),
grids(NULL),
elem_count(0),
elements(NULL)
{
}
SurfaceModel::SurfaceModel(int g, int e)
: grid_count(g),
elem_count(e)
{
grids = new Grid*[g];
for (int i = 0; i < g; i++)
grids[i] = NULL;
elements = new Element*[e];
for (int i = 0; i < e; i++)
elements[i] = NULL;
}
但是,我建议您在这个程序中去掉new
的每个实例(并为网格使用向量)
在现代CPU上,访问内存通常比做乘法花费更长的时间。在现代系统上获得良好的性能通常意味着更多地关注优化内存访问,而不是优化计算。因为您将网格对象存储为动态分配的指针数组,所以网格对象本身将不连续地存储在内存中,并且在尝试访问它们时可能会遇到许多缓存未命中。在这个例子中,您可能会看到通过将网格对象直接存储在数组或向量中来显著加速,因为您将访问循环中的连续内存,从而获得良好的缓存利用率和有效的硬件预取。
40亿次一微秒(在许多情况下这是一个非常可接受的时间)会产生4000秒。由于你只有大约40秒(如果我说得对的话),我怀疑这里有什么严重的问题。如果任务仍然很慢,我会考虑使用并行计算。
- 对象指针在c++中是如何工作的
- C++ 对象指针数组的复制构造函数
- 在对象指针上调用 Delete 是否会递归删除其动态分配的成员
- 什么更好?返回对象指针列表?或返回指向对象列表的指针?
- 正确初始化和销毁对象指针的C++数组?
- 如何深度复制链表对象指针
- 对象指针 c++ 的全局向量错误
- 如何将 c++ 类包装到 python 中,以便我可以使用 pybind11 访问其成员的公共方法(成员是一个对象指针)
- 静态对象指针
- 正在将对象指针数组初始化为NULL
- 如何使用条件表达式返回对象指针?
- std::flush可以用于将对象指针转换为其封闭数组指针吗
- 使用C对象指针构建PyObject*
- 如何在使用对象指针时访问成员函数
- 静态强制转换允许转换对象指针,但不允许转换整数
- C++ abort() 在函数内的抽象类对象指针调用上
- 指向函数的对象指针
- 访问指向对象指针向量的指针的第一个元素?
- 如何将对象/指针正确存储到 Qlist 中
- 对象指针打印结果以相反的顺序进行