NVCC编译后的分段错误

Segmentation fault after compiled by nvcc

本文关键字:分段 错误 编译 NVCC      更新时间:2023-10-16

我用NVIDIA的nvcc编译器测试了以下简单的代码。当我尝试运行程序时,如果N的值小于或等于512,则运行正常。但是当我尝试将 N 设置为大于 512 并运行时,它会给出分段错误。这是什么原因呢?

#define N 1024 //changing value
int main(int argc, char *argv[]) {
    float hA[N][N], hB[N][N], hC[N][N];
    for (int i = 0; i < N; i++) {
        for (int j = 0; j < N; j++) {
            hA[i][j] = 1;
            hB[i][j] = 1;
        }
    }
}

基本上有两种方法可以分配矩阵,最常见的是使用指针到指针到浮点数,然后先分配外部维度,然后在循环中分配内部维度:

float** hA = new float*[N];
for (size_t i = 0; i < N; ++i)
    hA[i] = new float[N];

第二种方法是有一个指向数组的指针,并分配它:

float (*hA)[N] = new (float[N])[N];

但所有这些都没有实际意义,因为您不妨改用std::vector

std::vector<std::vector<float>> hA(N);
for (size_t i = 0; i < N; ++i)
    hA[i].push_back(std::vector<float>(N));