缓存局部性与函数调用

Cache locality vs Function Calls

本文关键字:函数调用 局部性 缓存      更新时间:2023-10-16

我有一个执行任务的函数,让我们将这个函数称为F()。现在,我需要在足够小的时候n做这个任务。我可以想到做两件事:

  1. //Code Here... Code-for-function-F() Code-for-function-F() . . . Code-for-function-F() //following code

  2. //Code Here for(int i=0; i<n; ++i) F() //Following code

在第一种情况下,我避免了函数调用开销。但是由于代码重复了 n 次,因此代码可能相当大,并且会导致缓存局部性/性能变差。对于第二种情况,缓存将得到更好的利用,但由于函数调用而导致开销。我想知道是否有人对两者中哪一种更好的方法进行了分析。

PS:我知道实际答案可能取决于代码分析告诉我的内容,两者之间有理论上更好的方法吗?我在Linux上使用c ++。

当问题是哪个代码更快时,没有一个适合所有人的答案。你必须衡量它。

但是,您想到的优化,循环展开和函数内联,是编译器真正擅长的技术。在代码中显式应用它们很少有助于编译器执行更好的优化。我宁愿担心通过编写不必要的聪明代码来阻止此类编译器优化。

如果你有一个具体的例子,我建议你看看Godbolt。这是一个很好的工具,可以帮助您查看代码变体对编译器输出的影响。

另外不要忘记D.Knuth的名言:

程序员浪费大量时间思考或担心 关于他们程序的非关键部分的速度,以及这些 效率的尝试实际上会产生强烈的负面影响,当 考虑调试和维护。我们应该忘记小 效率,比如说大约 97% 的时间:过早优化是 万恶之源。然而,我们不应该在这方面放过我们的机会。 临界 3%。

它经常被引用不完整,而最后一部分与其他部分一样重要:">然而,我们不应该放弃我们的关键3%的机会。要知道这3%在哪里,你必须分析你的代码。

TL;DR:不要过早进行优化。首先测量和剖析,然后您才知道哪里值得改进,以及是否可以获得改进。