生成多个 std::thread 并重用它

Spawn multiple std::thread and reuse it

本文关键字：thread std 更新时间：2023-10-16

在线程方面，我是一个菜鸟，需要一些帮助/建议。首先，您能否在以下代码中检查我的理解是否正确：

std::vector<std::unique_ptr<Object>> totalObjects(512);
std::vector<Object*> objectsToUpdate(32);
std::vector<std::thread> threadsPool(32);
int nrObjectsToUpdate; //Varies between 1 and 32 for each update.
findObjectsToUpdate(totalObjects, objectsToUpdate, nrObjectsToUpdate);
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i] = std::thread(objectsToUpdate[i]->updateTask1());
//All tasks in this step must be completed before 
//we can move on to the next, i.e. updateTask2();.
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i].join();
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i] = std::thread(objectsToUpdate[i]->updateTask2());
for(int i = 0; i < nrObjectsToUpdate; i++)
    threadsPool[i].join();

我应该为每个 updateTask1(( 和 updateTask2(( 生成一个线程吗？对于每次更新，我是否需要重新创建 std：：thread((？或者我可以简单地通过某些成员函数再次重用它吗？如果我为 updateTask1(( 创建线程，是否可以重用 updateTask2((？的所有线程对象，即使用某个 std：：thread 成员函数切换函数指针？

假设我们创建了 100 个线程，并且有一个四核 CPU(4 个内核(，在所有线程完成之前，所有 CPU 内核都会繁忙吗？我知道至少 4 个内核意味着 4 个线程。

感谢所有可以给予的帮助和解释。

要使用的最佳线程数取决于应用程序和硬件，因此应生成的线程数取决于应用程序。

例如，

某些应用程序可能运行良好，每个内核有多个线程，因为这些线程不会相互干扰(例如，核心 1 上的线程 X 和线程 Y 不会争夺计算资源，因此每个内核有多个线程可以获得优势(。但是，每个内核有多个线程时，其他应用程序的性能可能会更差，因为仅使用一个线程可能需要内核的大部分资源，因此当每个内核使用其他线程时，线程会干扰。您应该做一些测试，找出最适合您的应用程序的线程配置。多线程通常并不简单，性能结果可能令人惊讶。

您可以使用许多东西来帮助确定线程数和线程调度(不过您仍应进行性能测试(。

您可以使用unsigned num_cpus = std::thread::hardware_concurrency();来获取可用 CPU 的数量。虽然您可能知道正在使用的 CPU 的内核数，但您可能希望在另一台不知道内核数的计算机上运行它。

此外，还有处理器关联，本质上是将某些线程固定到特定的 CPU。默认情况下，允许操作系统将任何生成的线程调度到任何 CPU。有时，这会导致每个 CPU 有多个线程，并且某些 CPU 未用于多线程组件的某些部分。您可以使用pthread_setaffinity_np显式设置特定线程以使用特定 CPU，如下所示(对要固定到内核的每个线程执行此操作(：

cpu_set_t cpu_set;
CPU_ZERO(&cpu_set);
CPU_SET(i, &cpu_set);
int rc = pthread_setaffinity_np(threadsPool[i].native_handle(),
                                sizeof(cpu_set_t), &cpu_set);
// Check for error
if (rc != 0) 
    std::cerr << "pthread_setaffinity_np error: " << rc << "n";

如果我为 updateTask1(( 创建线程，是否可以重用 updateTask2((？的所有线程对象，即使用某个 std：：thread 成员函数切换函数指针？

是的，你可以这样做。程序中关于将线程用于updateTask1()和updateTask2()的逻辑是正确的，但是，从语法上讲，您在分配线程时犯了错误。

threadsPool[i] = std::thread(objectsToUpdate[i]->updateTask1());

不正确。您希望使用成员函数作为为每个线程生成的函数，因此您需要传递对该函数的引用，以及要绑定到的对象，后跟任何其他参数(为了示例，我将补充 updateTask1 函数采用对象 ID i(。然后，线程的分配应如下所示：

threadsPool[i] = std::thread(&Object::updateTask1,  // Reference to function
                             objectsToUpdate[i]  ,  // Object to bind to
                             i );                   // Additional argument -- thread number

然后，您可以对 updateTask2 使用相同的语法。下面是演示的现场演示，其中包括处理器关联。