测量CPU时钟速度

Measuing CPU clock speed

本文关键字：速度时钟 CPU 测量更新时间：2023-10-16

我正在尝试测量CPU的速度。我不确定我的方法是准确的。基本上，我尝试了一个带有诸如UINT_MAX之类的值的空for循环，但是程序很快终止了，因此我尝试了UINT_MAX * 3，等等...

然后我意识到编译器正在优化循环，因此我添加了一个volatile变量以防止优化。以下程序大约需要1.5秒才能完成。我想知道该算法用于测量时钟速度的准确性。另外，我怎么知道该过程中涉及多少核心？

#include <iostream>
#include <limits.h>
#include <time.h>
using namespace std;
int main(void)
{
    volatile int v_obj = 0;
    unsigned long A, B = 0, C = UINT32_MAX;
    clock_t t1, t2;
    t1 = clock();
    for (A = 0; A < C; A++) {
        (void)v_obj;
    }
    t2 = clock();
    std::cout << (double)(t2 - t1) / CLOCKS_PER_SEC << std::endl;
    double t = (double)(t2 - t1) / CLOCKS_PER_SEC;
    unsigned long clock_speed = (unsigned long)(C / t);
    std::cout << "Clock speed : " << clock_speed << std::endl;
    return 0;
}

这根本无法测量时钟速度，它可以测量每秒可以进行多少次循环迭代。没有规则说一个迭代将每个时钟周期运行。 May 是这种情况，您实际上可能发现情况是如此 - 当然，具有优化的代码和合理的CPU，无用的循环不应慢得多。但是，它可能以一半的速度运行，有些处理器每2个周期都无法退休超过1个分支。在深奥的目标上，所有赌注都关闭了。

所以不，这不会测量时钟周期，除了意外。通常，很难获得经验时钟速度（您可以询问您的操作系统，因为

>

如果测量循环所需的壁时钟时间，则必须知道（至少）每次迭代的循环次数。这是一个足够严重的组装问题，需要对预期的微体系结构的相当详细的了解（也许每个依赖的指令链也许只有一个只能合理地进行1个周期，例如add eax, 1？一个足够长的链条，在测试/分支吞吐量上差异很小足以忽略），因此显然您在那里所做的任何事情都不是便携式的，并且内置的假设可能会变成false（实际上还有其他答案，因此可以做到这一点，并假设addps的延迟为3，而它不't在Skylake上不再存在，并且没有旧的AMD）。在C中？现在放弃。编译器可能正在滚动一些随机代码生成器，并且依靠它是合理的，就像对熊一样做同样的事情。猜测您既不能控制，甚至不知道的迭代的循环数量只是愚蠢的。如果仅在您自己的计算机上，则可以检查代码，但是您也可以手动检查时钟速度。
如果您测量在给定数量的壁时钟时间中经过的时钟周期的数量..但这很棘手。因为rdtsc不测量时钟周期（不再），因此没有其他任何东西更接近。您可以测量的东西，但是使用频率缩放和涡轮增压，通常不会是实际的时钟周期。您可以从性能计数器中获得实际时钟周期，但是您不能从用户模式下做到这一点。显然，您尝试这样做的任何方法都不是便携式的，因为您不能端口地索要经过的时钟周期的数量。

因此，如果您正在这样做以获取实际信息，而不仅仅是要乱七八糟，那么您应该只询问操作系统。对于Windows，请查询WMI中的CurrentClockSpeed或MaxClockSpeed，无论您想要哪个。在Linux上，/proc/cpuinfo中有东西。仍然无法移植，但是没有解决方案是。

至于

我怎么知道该过程中涉及多少核心？

1。当然，您的线程可能会在内核之间迁移，但是由于您只有一个线程，因此随时仅在一个核心上。

良好的优化器可以删除循环，因为

for (A = 0; A < C; A++) {
    (void)v_obj;
}

对程序状态具有相同的影响；

A = C;

因此，优化器完全可以自由放松您的循环。

因此，您不能以这种方式测量CPU速度，因为它取决于编译器与计算机上一样多（更不用说可变时钟速度和已经提到的多层架构）