CUDAMemcpy对我来说毫无意义…为什么要在普通c++中指定设备内存?
CUDAMemcpy Makes no sense to me... Why do I specify device memory in normal C++?
编辑:我可能已经找到了一个更好的方法,使用CUDAMalloc();我想这是一个糟糕的问题,但我会尝试Malloc,如果这似乎更合乎逻辑,那么我将关闭这个。
所以我能够在CUDA C/c++中写一点,但我正在看CUDAMemcpy语法,我看到它复制到指定的设备。但是为什么我在函数调用中指定主机上的两块内存,就像这个写得很糟糕的例子(我知道它没有初始化值…),我告诉它将h_array1/h_array2复制到各自的设备数组。为什么有必要在主机内存中创建d_Array ?
代码如下:
#include <cuda.h>
#include <iostream>
using std::cout;
unsigned long int arraysize = 20;
__global__ void CUDAAddArray(float* arrayfloat, float* arrayfloat2){
int idx = blockIdx.x * blockDim.x + threadIdx.x;
arrayfloat[idx] += arrayfloat2[idx];
//end cuda kernel __global__ void CUDAAddArray();
}
int main() {
float* h_array1 = new float[arraysize];
float* h_array2 = new float[arraysize];
float* d_array1 = new float[arraysize];
float* d_array2 = new float[arraysize];
cudaMemcpy(d_array1, h_array1, sizeof(float)*arraysize, cudaMemcpyHostToDevice);
cudaMemcpy(d_array2, h_array2, sizeof(float)*arraysize, cudaMemcpyHostToDevice);
CUDAAddArray<<<(arraysize%256)+1, 100>>> (d_array1, d_array2);
cudaMemcpy(h_array1, d_array1, sizeof(float)*arraysize, cudaMemcpyDeviceToHost);
cudaMemcpy(h_array2, d_array2, sizeof(float)*arraysize, cudaMemcpyDeviceToHost);
for(int i = 0; i < arraysize; i++){
cout << h_array1[i];
cout << "n";
}
cout << std::endl;
return NULL;
}
谢谢,CUDA新手。
由于没有初始化内存,因此无法知道程序是否实际工作。事实上,它不工作,但失败是隐藏的,因为你没有检查你的CUDA调用和内核调用是否成功。
正如您所猜测的,您的d_arrays应该使用cudaMalloc()
从设备内存中分配。然后,事情就有意义了,因为cudaMemcpy()
调用将从cpu复制缓冲区到设备内存进行处理,然后将结果复制回来。当然,d_array2
不需要复制回来,因为它没有被内核修改。
相关文章:
- 将字符串存储在c++中的稳定内存中
- C++ 指针的内存地址和指向数组的内存地址如何相同?
- Win32编译器选项和内存分配
- 当vector是tje全局变量时,c++中vector的内存管理
- 带内存和隔离功能的SQLite
- 是否可以通过C++扩展强制多个python进程共享同一内存
- 迭代时从向量和内存中删除对象
- 在C++中打印指向不同基元数据类型的指针的内存地址
- 这个指针和内存代码打印是什么?我不知道是打印垃圾还是如何打印我需要的值
- 多个文件的内存分配错误"在抛出 'std :: bad_alloc' what (): std :: bad_alloc 的实例后终止调用" [C++]
- 为什么示例代码访问IUnknown中已删除的内存
- 如何在C++类内存结构中创建"spacer"?
- 从构造函数抛出异常时如何克服内存泄漏
- malloc() 可能出现内存泄漏
- 如何理解将半精度指针转换为无符号长指针和相关的内存对齐
- 在调用FreeLibrary后,释放动态链接到具有相同版本的CRT堆的DLL的内存
- 如何针对特定情况调试和修复此双自由内存损坏问题
- 类型总是使用其大小存储在内存中吗
- 有没有一种方法可以测量c++程序的运行时内存使用情况
- 有没有一种方法可以使用placement new将堆叠对象分配给分配的内存