如何用CUDA推力去除嵌套环以进行全对距离检查

How to remove a nested loop with CUDA Thrust for an all-pair distance check?

本文关键字:检查 距离 嵌套 CUDA 何用      更新时间:2023-10-16

我有两个数组 array1 array2 带有 n m m 要素分别。我想找到元素之间的所有对距离。那么CPU上的蛮力算法是:

for(int i =0; i<n; i++)
{
    for(int j =0; j<m; j++)
    {
         array_pair_distances[i][j] = array1[i]-array2[j];
    }       
}

使用cuda推力,我只是通过使用throust ::变换和一个单循环将此 n*m 问题转变为n或m问题。我的问题是如何使用推力删除最后一个循环?

编辑:添加了用推力和一个循环的实现示例。代码检查对距离是否大于0.1,并返回int。

#include <stdio.h>
#include <iostream>
#include <cuda.h>
#include <thrust/host_vector.h>
#include <thrust/device_vector.h>
#include <thrust/random.h>
#include <thrust/fill.h>
#include <thrust/transform.h>
#include <thrust/reduce.h>
struct PairDistanceCheck : public thrust::binary_function<float,float,int>
{
    __host__ __device__
        int operator()(const float& a, const float& b) const
        {
           if(thrust::get<0>(a) - thrust::get<0>(b) > 0.1)
           {
                return 1;
           } 
           else return 0;
        }
};
void function()
{
    int n = 1000;
    int m = 2000;
    // Initialization of host vectors 
    thrust::host_vector<float> h_1 (n);
    thrust::host_vector<float> h_2 (m);
    // Fill host_vectors with data
    *
    *
    *
    //
    // Copy host_vectors to device_vectors
    thrust::device_vector<float> d_1 = h_1;
    thrust::device_vector<float> d_2 = h_2;
    thrust::device_vector<float> d_temp (m);
    thrust::device_vector<int> d_sum (m);
    thrust::fill(d_sum.begin(), d_sum.end(), 0);
    thrust::device_vector<int> d_result (m);
    for (int i=0; i<n; i++)
    {
        // Filling device_vector d_temp with element i from d_2
        thrust::fill(d_temp.begin(), d_temp.end(), d_2[i]);
        thrust::transform((d_1.begin(), d_1.end(), d_temp.begin(), d_result.begin(), PairDistanceCheck());
        // Summing the vectors
        thrust::transform(d_sum.begin(), d_sum.end(), d_result.begin(), d_sum.begin(), thrust::plus<int>());
    }
    // Final sum
    int sum = thrust::reduce(d_sum.begin(), d_sum.end(), (int) 0, thrust::plus<int>());
    return 0;
}

非常简短的答案是您不能。

推力没有外产品算法,这是执行您感兴趣的计算所需的。输入向量,然后直接减去它们。但与适当的外产品实施相比,这将非常效率低下(内存和性能(。