缓存局部性与函数调用

Cache locality vs Function Calls

本文关键字：函数调用局部性缓存更新时间：2023-10-16

我有一个执行任务的函数，让我们将这个函数称为F()。现在，我需要在足够小的时候n做这个任务。我可以想到做两件事：

//Code Here... Code-for-function-F() Code-for-function-F() . . . Code-for-function-F() //following code
//Code Here for(int i=0; i<n; ++i) F() //Following code

在第一种情况下，我避免了函数调用开销。但是由于代码重复了 n 次，因此代码可能相当大，并且会导致缓存局部性/性能变差。对于第二种情况，缓存将得到更好的利用，但由于函数调用而导致开销。我想知道是否有人对两者中哪一种更好的方法进行了分析。

PS：我知道实际答案可能取决于代码分析告诉我的内容，两者之间有理论上更好的方法吗？我在Linux上使用c ++。

当问题是哪个代码更快时，没有一个适合所有人的答案。你必须衡量它。

但是，您想到的优化，循环展开和函数内联，是编译器真正擅长的技术。在代码中显式应用它们很少有助于编译器执行更好的优化。我宁愿担心通过编写不必要的聪明代码来阻止此类编译器优化。

如果你有一个具体的例子，我建议你看看Godbolt。这是一个很好的工具，可以帮助您查看代码变体对编译器输出的影响。

另外不要忘记D.Knuth的名言：

程序员浪费大量时间思考或担心关于他们程序的非关键部分的速度，以及这些效率的尝试实际上会产生强烈的负面影响，当考虑调试和维护。我们应该忘记小效率，比如说大约 97% 的时间：过早优化是万恶之源。然而，我们不应该在这方面放过我们的机会。临界 3%。

它经常被引用不完整，而最后一部分与其他部分一样重要：">然而，我们不应该放弃我们的关键3%的机会。要知道这3%在哪里，你必须分析你的代码。

TL;DR：不要过早进行优化。首先测量和剖析，然后您才知道哪里值得改进，以及是否可以获得改进。