缓存局部性与函数调用
Cache locality vs Function Calls
我有一个执行任务的函数,让我们将这个函数称为F()
。现在,我需要在足够小的时候n
做这个任务。我可以想到做两件事:
-
//Code Here... Code-for-function-F() Code-for-function-F() . . . Code-for-function-F() //following code
-
//Code Here for(int i=0; i<n; ++i) F() //Following code
在第一种情况下,我避免了函数调用开销。但是由于代码重复了 n 次,因此代码可能相当大,并且会导致缓存局部性/性能变差。对于第二种情况,缓存将得到更好的利用,但由于函数调用而导致开销。我想知道是否有人对两者中哪一种更好的方法进行了分析。
PS:我知道实际答案可能取决于代码分析告诉我的内容,两者之间有理论上更好的方法吗?我在Linux上使用c ++。
当问题是哪个代码更快时,没有一个适合所有人的答案。你必须衡量它。
但是,您想到的优化,循环展开和函数内联,是编译器真正擅长的技术。在代码中显式应用它们很少有助于编译器执行更好的优化。我宁愿担心通过编写不必要的聪明代码来阻止此类编译器优化。
如果你有一个具体的例子,我建议你看看Godbolt。这是一个很好的工具,可以帮助您查看代码变体对编译器输出的影响。
另外不要忘记D.Knuth的名言:
程序员浪费大量时间思考或担心 关于他们程序的非关键部分的速度,以及这些 效率的尝试实际上会产生强烈的负面影响,当 考虑调试和维护。我们应该忘记小 效率,比如说大约 97% 的时间:过早优化是 万恶之源。然而,我们不应该在这方面放过我们的机会。 临界 3%。
它经常被引用不完整,而最后一部分与其他部分一样重要:">然而,我们不应该放弃我们的关键3%的机会。要知道这3%在哪里,你必须分析你的代码。
TL;DR:不要过早进行优化。首先测量和剖析,然后您才知道哪里值得改进,以及是否可以获得改进。
- 函数调用中参数的顺序重要吗
- 基于另一个成员参数将函数调用从类传递给它的一个成员
- 变量没有改变?通过向量的函数调用
- 在两个类中共享相同的函数调用,并在不需要时避免空实例化
- 是否有C++编译器选项允许激进地删除所有函数调用,并将参数传递给具有空体的函数
- 我知道函数调用中存在歧义.有没有办法调用foo()函数
- 模板函数调用
- 获取从C++中同一类中的构造函数调用的方法返回的值
- 析构函数调用
- 成员函数调用和C++对象模型
- 使用共享指针的函数调用,其对象应为 const
- C++:编译时检查匹配的函数调用对?
- 函数调用C++中的参数太少
- 来自 DLL 的函数调用 [表观调用的括号前面的表达式必须具有(指向-)函数类型]
- 返回指向对象的指针的函数调用是否为 prvalue?
- C++ 如何重载 [] 运算符并进行函数调用
- 代码的效率. 转到和函数调用
- 是同一作用域的函数部分中的函数调用
- 如何封装一个函数,以便它只能由同一类中的一个其他函数调用?
- 缓存局部性与函数调用