生成多个 std::thread 并重用它

Spawn multiple std::thread and reuse it

本文关键字:thread std      更新时间:2023-10-16

在线程方面,我是一个菜鸟,需要一些帮助/建议。首先,您能否在以下代码中检查我的理解是否正确:

std::vector<std::unique_ptr<Object>> totalObjects(512);
std::vector<Object*> objectsToUpdate(32);
std::vector<std::thread> threadsPool(32);
int nrObjectsToUpdate; //Varies between 1 and 32 for each update.
findObjectsToUpdate(totalObjects, objectsToUpdate, nrObjectsToUpdate);
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i] = std::thread(objectsToUpdate[i]->updateTask1());
//All tasks in this step must be completed before 
//we can move on to the next, i.e. updateTask2();.
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i].join();
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i] = std::thread(objectsToUpdate[i]->updateTask2());
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i].join();

我应该为每个 updateTask1(( 和 updateTask2(( 生成一个线程吗?对于每次更新,我是否需要重新创建 std::thread((?或者我可以简单地通过某些成员函数再次重用它吗?如果我为 updateTask1(( 创建线程,是否可以重用 updateTask2((?的所有线程对象,即使用某个 std::thread 成员函数切换函数指针?

假设我们创建了 100 个线程,并且有一个四核 CPU(4 个内核(,在所有线程完成之前,所有 CPU 内核都会繁忙吗?我知道至少 4 个内核意味着 4 个线程。

感谢所有可以给予的帮助和解释。

要使用的最佳线程数取决于应用程序和硬件,因此应生成的线程数取决于应用程序。

例如,

某些应用程序可能运行良好,每个内核有多个线程,因为这些线程不会相互干扰(例如,核心 1 上的线程 X 和线程 Y 不会争夺计算资源,因此每个内核有多个线程可以获得优势(。但是,每个内核有多个线程时,其他应用程序的性能可能会更差,因为仅使用一个线程可能需要内核的大部分资源,因此当每个内核使用其他线程时,线程会干扰。您应该做一些测试,找出最适合您的应用程序的线程配置。多线程通常并不简单,性能结果可能令人惊讶。

您可以使用许多东西来帮助确定线程数和线程调度(不过您仍应进行性能测试(。

您可以使用unsigned num_cpus = std::thread::hardware_concurrency();来获取可用 CPU 的数量。虽然您可能知道正在使用的 CPU 的内核数,但您可能希望在另一台不知道内核数的计算机上运行它。

此外,还有处理器关联,本质上是将某些线程固定到特定的 CPU。默认情况下,允许操作系统将任何生成的线程调度到任何 CPU。有时,这会导致每个 CPU 有多个线程,并且某些 CPU 未用于多线程组件的某些部分。您可以使用pthread_setaffinity_np显式设置特定线程以使用特定 CPU,如下所示(对要固定到内核的每个线程执行此操作(:

cpu_set_t cpu_set;
CPU_ZERO(&cpu_set);
CPU_SET(i, &cpu_set);
int rc = pthread_setaffinity_np(threadsPool[i].native_handle(),
                                sizeof(cpu_set_t), &cpu_set);
// Check for error
if (rc != 0) 
    std::cerr << "pthread_setaffinity_np error: " << rc << "n";

如果我为 updateTask1(( 创建线程,是否可以重用 updateTask2((?的所有线程对象,即使用某个 std::thread 成员函数切换函数指针?

是的,你可以这样做。程序中关于将线程用于updateTask1()updateTask2()的逻辑是正确的,但是,从语法上讲,您在分配线程时犯了错误。

threadsPool[i] = std::thread(objectsToUpdate[i]->updateTask1());

不正确。您希望使用成员函数作为为每个线程生成的函数,因此您需要传递对该函数的引用,以及要绑定到的对象,后跟任何其他参数(为了示例,我将补充 updateTask1 函数采用对象 ID i(。然后,线程的分配应如下所示:

threadsPool[i] = std::thread(&Object::updateTask1,  // Reference to function
                             objectsToUpdate[i]  ,  // Object to bind to
                             i );                   // Additional argument -- thread number

然后,您可以对 updateTask2 使用相同的语法。下面是演示的现场演示,其中包括处理器关联。