优化与零的简单比较以提高性能
Optimize simple comparison with zero for performance
我的代码中有一个瓶颈(大约 20% 的 CPU 时间(,在以下 if 语句中:
if (a == 0) { // here
...
}
其中a
是一个uint8_t
,所以是一个从0到255的数字。
是否有任何低级优化可以使其更快?
我想过使用按位 NOR (~(a| 0))
,但这只有在 1 位时才有效a
对吧?
以防万一:在这种特殊情况下,我不关心代码的可读性。
除非你的编译器是垃圾,否则你无法做任何事情来加速整数比较。
但是,您观察到的瓶颈可能并不是比较本身,而是不吉利的分支预测的结果。
有两种方法可以解决此问题:
如果"分支或不分支">遵循一种模式,请在程序逻辑中将最后一秒的决定进一步向上移动,您可以在其中使用该模式,只是不要在热函数中分支。这可能需要认真思考。一种找出您是否有模式的黑客方法:打印1
如果您分支并0
其他足够的调用,Zip 将启动并查看生成的存档是否比您打印的值数量小得多(以位为单位(。(当然,如果你喜欢它更理论化,也有聪明的公式。
如果大多数时候选择一个分支而不是另一个分支,则可以告诉编译器哪个分支是可能的分支。使用 gcc,签出__builtin_expect
,对于其他编译器,请阅读手册。
对于这两种解决方案都很重要:您需要衡量这是否真的有帮助。尤其是第二个不会神奇地变得更好,甚至可能会让事情变得更糟。
相关文章:
- 比较并显示使用最小值(a,b)和最大值(a、b)升序排列的4个数字
- 为什么比较运算符如此快速
- 我可以使用 g++ 进行三种比较 (<=>) 吗?
- 比较字符数组
- 将模板化的类型与C++中的某些类/类型进行比较
- C++自定义比较函数
- 如何比较自定义类的std::变体
- 多个If语句与使用逻辑运算符计算条件的单个语句的比较
- std::设置自定义比较器
- 布尔比较运算符是如何在C++中工作的
- C++将目录中的所有文件与::filesystem进行比较
- shell排序中的交换和比较
- 如何在C++中比较两个char数组
- catch框架有没有办法比较流或文件
- 从文件中读取多个字节,并将它们存储在C++中进行比较
- 智能指针作为无序映射键,并通过引用进行比较
- 比较if语句中的数组值和int值
- 对于循环变体比较
- 使用自定义比较函数使用std::sort()对矢量字符串进行排序时出现问题
- 比较两个大小不等的映射c++