如果使用较小的数字,则开关案例更快

Is switch case faster if using smaller numbers?

本文关键字:开关 案例 数字 如果      更新时间:2023-10-16

我想知道,如果我在 switch-case语句中通过某些偏移(或类似的东西)更改"巨大"数字是否可以优化某些内容。所以我做了一个测试:

#include <iostream>
#include <iomanip>
#include <chrono>
int main() {
    uint32_t f = 0x12345688;
    std::chrono::time_point<std::chrono::system_clock> start, end;
    int i = -1;
    start = std::chrono::system_clock::now();
    switch (f)
    {
        case 0x1234500 : i = 0; break;
        case 0x1234522 : i = 2; break;
        case 0x1234555 : i = 5; break;
        case 0x1234588 : i = 8; break;
        default : break;
    }
    end = std::chrono::system_clock::now();
    std::chrono::duration<double> elapsed_seconds = end-start;
    std::cout << "elapsed time: " << elapsed_seconds.count() << "sn";
    int j = -1;
    start = std::chrono::system_clock::now();
    switch (f & 0xf)
    {
        case (0x1234500 & 0xf) : j = 0; break;
        case (0x1234522 & 0xf) : j = 2; break;
        case (0x1234555 & 0xf) : j = 5; break;
        case (0x1234588 & 0xf) : j = 8; break;
        default : break;
    }
    end = std::chrono::system_clock::now();
    elapsed_seconds = end-start;
    std::cout << "elapsed time: " << elapsed_seconds.count() << "sn";
    return 0;
}

似乎总是第二个开关案例更快。

有理由使案例中的小数字更快地进行声明(案例之间的"差距"相同)?

此基准测试方法是胡说八道,因为编译器可以静态地确定两种情况之间的i值。您的实际代码可能最终会出现这样的内容:

start = std::chrono::system_clock::now();
switch (f)
{
    case 0x1234500 : i = 0; break;
    case 0x1234522 : i = 2; break;
    case 0x1234555 : i = 5; break;
    case 0x1234588 : i = 8; break;
    default : break;
}
end = std::chrono::system_clock::now();
std::chrono::duration<double> elapsed_seconds = end-start;
std::cout << "elapsed time: " << elapsed_seconds.count() << "sn";
// i = -1;  this line isn't needed, the value isn't used, lets optimize it away
start = std::chrono::system_clock::now();
// Oh great, we already know the value of i
// Because nothing in the previos code could have affected f
// i will get the same value as it did above, and we removed i = -1
// So lets optimize away this pointless code here
end = std::chrono::system_clock::now();
elapsed_seconds = end-start;

您可以尝试将i声明为volatile,但这可能会阻止编译器其他进行优化,因此它可能不会进行有效的基准测试。

测试之间的i = -1;是没有意义的,因为编译器可以扣除该值未使用。因此,该代码也会被删除。

最好的方法可能是从文件或用户输入中读取常数0x12345688,以便编译器无法对其进行任何假设。对于两个测试用例,您需要两次。

一般:这样的基准测试时,请始终拆卸代码,以验证您的测试不是胡说八道。

性能最重要的是,数字是连续。这是因为编译器可以使用该值来索引内存地址,该内存地址指定开关应在何处跳动以处理相关情况。大差距使索引变得不可能,因为它会跳得很远,并且编译器将不得不插入大量的空代码以填补未使用的空间。

少量数字可以使它少量更快 - 您只能保存一个指令,因为编译器可以减去,然后能够静止使用索引。

上述所有内容均取决于编译器。愚蠢的编译器可能根本不使用索引。