OpenMP 任务等待不起作用

OpenMP taskwait not working

本文关键字:不起作用 等待 任务 OpenMP      更新时间:2023-10-16

在下面的代码中,我使用#pragma omp parallel创建了一个并行区域。

在并行区域内,有一段代码只需要由一个线程执行,这是使用#pragma omp single nowait实现的。

在内部,顺序区域有一个可以并行化的FOR循环,我使用#pragma omp taskloop来实现它。

循环完成后,我使用了#pragma omp taskwait以确保其余代码仅由一个线程执行。但是,似乎行为不像我期望的那样。多个线程正在访问#pragma omp taskwait之后的代码部分,该部分在定义为#pragma omp single nowait的区域下声明。

std::vector<std::unordered_map<int, int>> veg_ht(n_comp + 1);
vec_ht[0].insert({root_comp_id, root_comp_node});
#pragma omp parallel
{
#pragma omp single
{
int nthreads = omp_get_num_threads();
for (int l = 0; l < n_comp; ++l) {
int bucket_count = vec_ht[l].bucket_count();
#pragma omp taskloop 
for (int bucket_id = 0; bucket_id < bucket_count; ++bucket_id) {
if (vec_ht[l].bucket_size(bucket_id) == 0) { continue; }
int thread_id = omp_get_thread_num();
for (auto it_vec_ht = vec_ht[l].begin(bucket_id); it_vec_ht != vec_ht[l].end(bucket_id); ++it_vec_ht) {
// some operation --code removed for minimality
} // for it_vec_ht[l]  
} // for bucket_id taskloop
#pragma omp taskwait 
// Expected that henceforth all code will be accessed by one thread only
for (int tid = 0; tid < nthreads; ++tid) {
// some operation --code removed for minimality
} // for tid
} // for l
} // pragma omp single nowait
} // pragma parallel

看起来您不一定需要使用封闭的并行/单个/任务循环布局。如果不打算指定线程数,则系统应默认使用最大可用线程数。您可以使用 OMP 并行 for' 在 OMP 构造外部获取此值omp_get_max_threads()'. Then you can use just the taskloop structure, or just replace it with a#pragma。

我认为您的代码的问题是#pragma omp taskwait行。单个线程在遇到taskloop构造时应分叉为多个线程,然后折叠回单个线程。我认为您可能会使用#pragma omp taskwait命令触发单个线程的全新分叉。绝对不会触发线程分叉的#pragma omp taskwait的替代方案是#pragma omp barrier.我认为进行这种替换将使您的代码以当前形式工作。