CUDA矩阵类的运算符()重载
Overload of operator() for a CUDA matrix class
我有CPU和GPU(CUDA)矩阵类,我想重载operator()
,这样我就可以读取或写入矩阵的各个元素。
对于CPU矩阵类,我可以通过做到这一点
OutType & operator()(const int i) { return data_[i]; }
(读取)和
OutType operator()(const int i) const { return data_[i]; }
(书写)。对于GPU矩阵类,我能够过载operator()
以供读取
__host__ OutType operator()(const int i) const { OutType d; CudaSafeCall(cudaMemcpy(&d,data_+i,sizeof(OutType),cudaMemcpyDeviceToHost)); return d; }
但我无法在写作上做到这一点。有人能提供任何线索来解决这个问题吗?
CPU的写入情况返回data_[i]
的引用,因此分配作业由内置的C++operator=
执行。我不知道我怎么能利用CUDA的同样机制。
谢谢。
您可以创建一个单独的类,该类具有重载的赋值运算符和类型转换运算符,并模拟引用行为:
class DeviceReferenceWrapper
{
public:
explicit DeviceReferenceWrapper(void* ptr) : ptr_(ptr) {}
DeviceReferenceWrapper& operator =(int val)
{
cudaMemcpy(ptr_, &val, sizeof(int), cudaMemcpyHostToDevice);
return *this;
}
operator int() const
{
int val;
cudaMemcpy(&val, ptr_, sizeof(int), cudaMemcpyDeviceToHost);
return val;
}
private:
void* ptr_;
};
并将其用于矩阵类
class Matrix
{
DeviceReferenceWrapper operator ()(int i)
{
return DeviceReferenceWrapper(data + i);
}
};
相关文章:
- 为什么Mat类的两个对象可以在不重载运算符+的情况下添加
- 重载运算符new[]的行为取决于析构函数
- 为什么将值返回函数传递给重载=运算符对运算符函数有效,而对其他运算符无效
- 在 myVector 类中重载运算符 + 时出错
- 为什么常量词在重载运算符中不与 ostream 对象一起使用<<?
- 如何在 cpp 中重载运算符 +=?
- C++ 如何重载 [] 运算符并进行函数调用
- 重载运算符的范围是什么?它是否会影响作为类成员的集合的插入函数?
- 为什么我可以在不重载 "=" 运算符的情况下将一个对象分配给另一个对象?
- 重载运算符有地址吗?
- 如何迭代重载运算符 [] 的类?
- 重载运算符与添加问题
- 模板基类中的重载运算符
- 如何调用用于重载运算符"<<"的 friend 函数?
- 在 C++17 中的命名空间和子命名空间中重载运算符是不明确的
- 重载运算符<<采用谷歌 C++ 风格
- C++ 如何正确重载 + 运算符
- cout (<<) 重载运算符不打印减去的矩阵
- 如何在 c++ 中重载运算符 + 以便能够 whrite c_str = "smth" + c_str;
- 重载运算符*以获取对另一个类的实例的引用