如何优化此 S 曲线函数

How can i optimize this S-curve function?

本文关键字:曲线 函数 优化 何优化      更新时间:2023-10-16

我正在研究一个生成"S曲线"的伽马函数。我需要在实时环境中运行它,所以我需要尽可能加快它的速度。

代码如下:

float Gamma = 2.0f; //Input Variable
float GammaMult = pow(0.5f, 1.0f-Gamma);
if(Input<1.0f && Input>0.0f)
{
    if(Input<0.5f)
    {
        Output = pow(Input,Gamma)*GammaMult;
    }
    else
    {
        Output  = 1.0f-pow(1.0f-Input,Gamma)*GammaMult;
    }
}
else
{
   Output  = Input;
}

有什么方法可以优化此代码吗?

如果

指令集支持饱和算法或使用最大/最小内部函数,例如 x86 MAXSS Input<1.0f && Input>0.0f,您可以通过消除上的分支来避免流水线停滞

您还应该通过舍入饱和Input来消除其他分支。完整算法:

float GammaMult = pow(0.5f, 1.0f-Gamma);
Input = saturate(Input); // saturate via assembly or intrinsics
// Input is now in [0, 1]
Rounded = round(Input); // round via assembly or intrinsics
Coeff = 1 - 2 * Rounded
Output = Rounded + Coeff * pow(Rounded + Coeff * Input,Gamma)*GammaMult;

舍入也应通过 asm/内部函数完成。

例如,如果对数组的连续值使用此函数,则应考虑对目标架构支持 SIMD 进行矢量化处理。

你的代码似乎很好。瓶颈(如果存在)是pow功能。唯一的解决方案是更深入地了解低级细节,并尝试实现自己的pow功能。例如,如果 2 个浮点数对您来说足够了,您可能会发现一些基于近似的算法更快。

看这个: 在浮点中实现 pow() 函数的最有效方法