查询时间/周期是针对所有内核/线程的序列化请求还是并行请求?

Is querying time/cycles a serialized or a parallel request for all cores/threads?

本文关键字:请求 序列化 线程 并行 周期 时间 查询 内核      更新时间:2023-10-16

假设有一个简单的"哪个线程首先完成循环"基准,

#include<thread>
#include<iostream>
#include<mutex>
int main()
{
std::mutex m;
std::thread t1([&](){
auto c1=clock();
for(int i=0;i<1000000;i++){ /* some unremovable logic here */  }
auto c2=clock();
std::lock_guard<std::mutex> g(m);
std::cout<<"t1:  "<<c2-c1<<"  "<<std::endl;
});
std::thread t2([&](){
auto c1=clock();
for(int i=0;i<1000000;i++){ /* some unremovable logic here */  }
auto c2=clock();
std::lock_guard<std::mutex> g(m);
std::cout<<"t2:  "<<c2-c1<<"  "<<std::endl;
});

t1.join();
t2.join();
return 0;
}

我们是否可以信任clock()或任何其他时间/时钟请求函数不会在线程之间序列化并且始终独立,以便测量它不会改变线程完成工作的顺序?

如果整个 CPU 有一个时钟周期计数器,C++如何计算每个线程的时钟周期计数器?如果多个线程同时查询相同的数据,它是否只是广播相同的数据?还是将后面的微操作中的操作序列化为一次为一个线程提供服务?

上面的代码编译并给出了这个结果(带有if(t1.joinable())if(t2.joinable())(:

t1:  2  
t2:  3 

这是否意味着线程 1 绝对首先完成,还是实际上稍后完成,但首先为其请求时钟,因此线程 2 有延迟?

不检查它们是否可加入:

t1:  1
t2:  1

std::chrono::system_clock标准:

23.17.7.1 类system_clock [时间-时钟.系统]

类 system_clock 的对象表示来自 系统范围的实时时钟。

系统范围的实时时钟,意味着所有进程检索相同的时间点。并且调用不应导致阻塞。