避免循环中的条件语句和函数调用

Avoiding conditionals and function invocations inside a loop

本文关键字:语句 函数调用 条件 循环      更新时间:2023-10-16

我有一个代码如下:

void function(int parameter)
{
  for( ... ) // a big loop
  {
    double a = ...;
    for( ... ) // a big loop
    {
      double b = ...;
      double value;
      if(parameter == 1)
        value = some_math_expression_1(a, b);
      else if(parameter == 2)
        value = some_math_expression_2(a, b);
      ...
    }
  }
}

这个想法是,根据参数,我想对ab应用一些数学表达式。这个函数执行了很多次,而且必须很快,我想知道每次迭代时的条件分支是否会引入我可以节省的开销。

现在,我已经写了这样的代码:

void function(int parameter)
{
  if(parameter == 1)
    function1();
  else if(parameter == 2)
    function2();
  else
    ...
}

这样,如果我在每个functionX()中重复代码,我就可以直接应用数学表达式。显而易见的问题是,当我想更改某段代码时,我必须做几次(我现在有大约10个数学表达式)。

我可以使用什么方法来避免function中的任何开销?

如果我传递一个指向函数some_math_expression_Xfunction的指针(我会更改函数调用的条件),该怎么办?

如果我将整个函数编码为宏(uf),并将数学表达式设置为参数,会怎么样?

如果我使用模板并将数学表达式作为指向内联函数的指针传递(这可能吗),该怎么办?

编辑:感谢您的回答。我知道我可以使用你提出的方法(指向函数数组的指针,或者依赖于分支预测器)。然而,你对避免开销方面什么会更好有一些见解吗?数学表达式非常简单(类似于a*b),除了长循环之外,function还被调用多次(分支预测在调用之间"存活"吗?)。

您可以将函数转换为模板:

void functionT<int PARAMETER>()
{
  for( ... ) // a big loop
  {
    double a = ...;
    for( ... ) // a big loop
    {
      double b = ...;
      double value;
      if(PARAMETER == 1) //Constant condition!!!
        value = some_math_expression_1(a, b);
      else if(PARAMETER == 2)  //Constant condition!!!
        value = some_math_expression_2(a, b);
      ...
    }
  }
}

由于条件总是true或false,编译器将优化条件树,只留下真正的数学表达式。没有分支,也没有函数调用!

现在,你只能在参数不变的情况下使用它:

functionT<1>();

但没有变量:

int x = 1;
functionT<x>(); //Error

如果你需要,你可以做一个包装:

void function(int parameter)
{
    switch (parameter)
    {
        case 1: functionT<1>(); break;
        case 2: functionT<2>(); break;
    }
}

别担心。现代CPU有分支预测器,它们可以正确地预测所采取的分支。

您可以设置一个函数指针的常量数组,并调用与parameter关联的函数。

但是,如果数学表达式很小,switch()语句可能会更快。

switch (parameter) {
    case 1:
        value = math expression 1;
        break;
    case 2:
        ...
}

首先,我会一如既往地说,您现在应该基准测试/衡量这个过程需要多长时间,因为一如既往,这可能是过早的优化,您可能会发现这不是代码中需要很长时间的部分。

但假设你已经测量并发现这是你代码中的瓶颈,我会做一些事情

首先,正如你所说,在这里(只要你的数学函数足够简单)最会让你丧命的是分支预测。因此,为了摆脱分支,我会创建一个函数指针数组,而不是进行

if(parameter == 1)
    function1();
if...

你可以做:

array_of_functions[parameter]();

这将消除所有分支预处理,并将大大提高吞吐量,因为您的管道将不必冲洗。编译器也应该能够内联函数。

它取决于许多因素,但通常情况下,您可能希望使它在大多数情况下连续调用第一个或第二个函数。这将使现代CPU执行速度更快(请参阅为什么处理排序数组比处理未排序数组更快?)。

您可以使用数组和函数指针,但这可能不会加快速度,需要尝试。您可以使用http://www.boost.org/doc/libs/1_54_0/doc/html/function/tutorial.html#idp59212272以提供帮助,但静态函数不需要它。

我认为最有效的方法之一是创建一个函数指针数组,然后可以直接传递函数指针,而不仅仅是参数。这将节省在嵌套循环中使用if/switch语句所产生的任何类型的开销。

例如:

double expression_0(double a, double b) {...};
double expression_1(double a, double b) {...};
void function(double (*expression)(double, double)) {
    for (...) {
        ...
        double a = ...;
        for (...) {
            double b = ...;
            double result = (*expression)(a, b);
        }
    }
}
int main() {
    double (*fpointers[2]) (double, double);
    fpointers[0] = expression_0;
    fpointers[1] = expression_1;
    int parameter = ...;
    function(fpointers[parameter]);
}

如果所有函数都有相同的签名,那么最简单的方法就是:

void function(int parameter)
{
  double ( *fn )( double, double );
  switch( parameter )
  {
    case 1:  fn = &some_math_expression_1;  break;
    case 2:  fn = &some_math_expression_2;  break;
    ...
  }
  for( ... ) // a big loop
  {
    double a = ...;
    for( ... ) // a big loop
    {
      double b = ...;
      double value = fn( a, b );
      ...
    }
  }
}