在 CUDA 5.5 中启动内核函数时发生的错误

Errors that occur when I start the kernel function in CUDA 5.5

本文关键字：错误内核 CUDA 启动函数更新时间：2023-10-16

我安装了CUDA5.5。开发环境正在使用 Visual Studio 2010 Professional。我尝试像下面这样运行源代码。但是，由于某种原因，红线被绘制到Visual Studio上的"<<<"部分。它显示错误"表达式。必需"和。如果有人发生同样的现象，请告诉我如何解决。

开发环境--------------------------------------------------------------------------

         OS:Windows7 64bit
         Visual Studio 2010 Professional SP1
         CUDA 5.5

现象-----------------------------------------------------------------------------------------

↓源代码"<<<"的红色部分带有下划线，您将看到以下内容。但是，第三个下划线仅显示"<"。它似乎是："需要表达。错误"，然后将鼠标指针移动到红线的位置。

源代码---------------------------------------------------------------------------

#include <cuda_runtime.h>
#include <stdio.h> 
#include <math.h> 
#include <cuda.h> 
#define N 256

__global__ void matrix_vector_multi_gpu_1_1(float *A_d, float *B_d, float *C_d){
    int i,j;
    for(j=0;j<N;j++){
        A_d[j]=0.0F;
        for(i=0;i<N;i++){
            A_d[j]=A_d[j]+B_d[j*N+i]*C_d[i];
        }
    }
  }
int main(){
    int i,j;
    float A[N], B[N*N], C[N];
    float *A_d, *B_d, *C_d;
    dim3 blocks(1,1,1);
    dim3 threads(1,1,1);
    for(j=0;j<N;j++){
        for(i=0;i<N;i++){
            B[j*N+i]=((float)j)/256.0;
        }
    }
    for(j=0;j<N;j++){
        C[j]=1.0F;
    }
    cudaMalloc((void**)&A_d, N*sizeof(float));
    cudaMalloc((void**)&B_d, N*N*sizeof(float));
    cudaMalloc((void**)&C_d, N*sizeof(float));
    cudaMemcpy(A_d,A,N*sizeof(float),cudaMemcpyHostToDevice);
    cudaMemcpy(B_d,B,N*N*sizeof(float),cudaMemcpyHostToDevice);
    cudaMemcpy(C_d,C,N*sizeof(float),cudaMemcpyHostToDevice);
    matrix_vector_multi_gpu_1_1<<<blocks,threads>>>(A_d,B_d,C_d);
    cudaMemcpy(A,A_d,N*sizeof(float),cudaMemcpyDeviceToDevice);
    for(j=0;j<N;j++){
        printf("A[ %d ]=%f n",j,A[j]);
    }
    getchar();
    cudaFree(A_d);
    cudaFree(B_d);
    cudaFree(C_d);
    return 0;
}

发生地

你至少应该从

cudaMemcpy(A,A_d,N*sizeof(float),cudaMemcpyDeviceToDevice);

自

cudaMemcpy(A,A_d,N*sizeof(float),cudaMemcpyDeviceToHost);

更多建议

运行一些 CUDA 示例代码以查看您是否正确设置 CUDA。
确保源代码文件具有外部名称.cu

解决cudaMemcpyDeviceToDevice问题后，我可以编译并运行您的代码。结果得到了纠正。您的代码应该没有阻止编译的问题。

正如我在上面的评论中指出的那样，这是一个智能感知问题。在 Visual Studio 2010 CUDA 项目上启用智能感知支持的步骤总结在

为 Visual Studio 2010 CUDA 项目设置 Intellisense 支持