在 Windows 上以C++计算 CPU 时间

Computing CPU time in C++ on Windows

本文关键字:CPU 时间 计算 C++ Windows 上以      更新时间:2023-10-16

C++有什么方法可以计算在CPU时间内运行给定程序或例程需要多长时间?

我使用在Windows 7上运行的Visual Studio 2008。

如果你想知道一个进程使用的CPU时间总量,clockrdtsc(无论是直接还是通过编译器内部函数)都不是最好的选择,至少IMO是这样。如果您需要代码可移植,您能做的最好的事情就是使用clock,尽可能静态地测试系统,并希望最好(但如果您这样做,请注意clock的分辨率是CLOCKS_PER_SEC,可能是也可能不是 1000,即使它是, 你的实际计时分辨率通常不会那么好——它可能会给你以毫秒为单位的时间,但至少通常一次前进几十毫秒)。

但是,由于您似乎不介意特定于Windows的代码,因此您可以做得更好。至少如果我对你正在寻找的东西的理解是正确的,你真正想要的可能是GetProcessTimes,这将(分别)告诉你进程的内核模式和用户模式 CPU 使用率(以及开始时间和退出时间,如果你关心的话,你可以从中计算使用的墙时间)。还有QueryProcessCycleTime,它将告诉您进程使用的 CPU 时钟周期总数(所有线程中的用户和内核模式的总和)。就我个人而言,我很难想象后者有多大用处——计算单个时钟周期对于需要密集优化的小段代码很有用,但我不太确定如何将其应用于完整的过程。GetProcessTimes使用 FILETIME 结构,它支持 100 纳秒的分辨率,但实际上大多数时候你会看到调度程序时间片的倍数(随 Windows 版本而异,但在毫秒到几十毫秒的数量级)。

无论如何,如果你真的想要从头到尾的时间,GetProcessTimes会让你这样做——如果你生成程序(例如,使用CreateProcess),你将得到一个进程的句柄,当子进程退出时,它会发出信号。然后,可以在该句柄上调用GetProcessTimes,并检索时间,即使子句柄已经退出 - 只要进程的至少一个句柄保持打开状态,句柄将保持有效。

这是一种方法。它以毫秒为单位测量常规执行时间。

clock_t begin=clock();在执行路由之前开始,clock_t end=clock();在例程退出后立即开始。

然后将两个时间集相互减去,结果是毫塞科德值。

#include <stdio.h>
#include <iostream>
#include <time.h>
using namespace std;
double get_CPU_time_usage(clock_t clock1,clock_t clock2)
{
double diffticks=clock1-clock2;
double diffms=(diffticks*1000)/CLOCKS_PER_SEC;
return diffms;
} 
void test_CPU_usage()
{
cout << "Standby.. measuring exeution time:  ";
for (int i=0; i<10000;i++)
{
cout << "b\" << std::flush;
cout << "b|" << std::flush;
cout << "b/" << std::flush;
cout << "b-" << std::flush;
}
cout << " nn";
}
int main (void)
{
clock_t begin=clock();
test_CPU_usage();
clock_t end=clock();
cout << "Time elapsed: " << double(get_CPU_time_usage(end,begin)) << " ms ("<<double(get_CPU_time_usage(end,begin))/1000<<" sec) nn";
return 0;
}

clock() 函数 [由 Visual C++ 2008 提供] 不返回程序使用的处理器时间,而它应该返回(根据 C 标准和/或 C++ 标准)。也就是说,为了测量Windows上的CPU时间,我有这个帮助程序类(不可避免地是不可移植的):

class ProcessorTimer
{
public:
ProcessorTimer() { start(); }
void start() { ::GetProcessTimes(::GetCurrentProcess(), &ft_[3], &ft_[2], &ft_[1], &ft_[0]); }
std::tuple<double, double> stop()
{
::GetProcessTimes(::GetCurrentProcess(), &ft_[5], &ft_[4], &ft_[3], &ft_[2]);
ULARGE_INTEGER u[4];
for (size_t i = 0; i < 4; ++i)
{
u[i].LowPart = ft_[i].dwLowDateTime;
u[i].HighPart = ft_[i].dwHighDateTime;
}
double user = (u[2].QuadPart - u[0].QuadPart) / 10000000.0;
double kernel = (u[3].QuadPart - u[1].QuadPart) / 10000000.0;
return std::make_tuple(user, kernel);
}
private:
FILETIME ft_[6];
};

class ScopedProcessorTimer
{
public:
ScopedProcessorTimer(std::ostream& os = std::cerr) : timer_(ProcessorTimer()), os_(os) { }
~ScopedProcessorTimer()
{
std::tuple<double, double> t = timer_.stop();
os_ << "user " << std::get<0>(t) << "n";
os_ << "kernel " << std::get<1>(t) << "n";
}
private:
ProcessorTimer timer_;
std::ostream& os_;
}

例如,可以通过在该 {} 块的开头定义一个 ScopedProcessorTimer 来测量执行块需要多长时间。

__rdtscp

内函数将为您提供 CPU 周期中的时间,但需要注意一些。 这是 MSDN 文章

这实际上取决于您要测量的内容。为了获得更好的结果,取几百万次(如果不是十亿次)迭代的平均值。

此代码是进程 CPU 使用情况

ULONGLONG LastCycleTime = NULL;
LARGE_INTEGER LastPCounter;
LastPCounter.QuadPart = 0; // LARGE_INTEGER Init
// cpu get core number
SYSTEM_INFO sysInfo;
GetSystemInfo(&sysInfo);
int numProcessors = sysInfo.dwNumberOfProcessors;
HANDLE hProcess = OpenProcess(PROCESS_QUERY_INFORMATION | PROCESS_VM_READ, FALSE, Process::pid);
if (hProcess == NULL)
nResult = 0;
int count = 0;
while (true)
{
ULONG64 CycleTime;
LARGE_INTEGER qpcLastInt;
if (!QueryProcessCycleTime(hProcess, &CycleTime))
nResult = 0;
ULONG64 cycle = CycleTime - LastCycleTime;
if (!QueryPerformanceCounter(&qpcLastInt))
nResult = 0;
double Usage = cycle / ((double)(qpcLastInt.QuadPart - LastPCounter.QuadPart));
// Scaling
Usage *= 1.0 / numProcessors;
Usage *= 0.1;
LastPCounter = qpcLastInt;
LastCycleTime = CycleTime;
if (count > 3)
{
printf("%.1f", Usage);
break;
}
Sleep(1); // QueryPerformanceCounter Function Resolution is 1 microsecond
count++;
}
CloseHandle(hProcess);