在Mac OS X上使用CUDA 5.5时出现内核失败错误

Kernel failed error while using CUDA 5.5 on Mac OS X

本文关键字：5时内核错误失败 CUDA OS Mac 更新时间：2023-10-16

我正在编写一个CUDA光线跟踪器，似乎遇到了一个奇怪的问题。我在Mac OS X上使用CUDA 5.5和GCC4.2.1，并使用GLM 0.9.4.4。每当我调用raycastFromCameraKernel函数时，我都会收到以下错误：

Cuda错误：内核失败！：操作系统调用失败或此操作系统不支持操作。

经过一些调试，我想我已经将问题缩小到glm::normalize(temp)函数。如果我通过编写自己的normalize函数来代替它，那么代码运行良好。有趣的是，当我使用glm:：normalize编写一个示例程序以查看它是否工作时，它编译并运行正常！

以下是出现问题的函数的代码：

__host__ __device__ ray raycastFromCameraKernel(glm::vec2 resolution, float time, int x, int y, glm::vec3 eye, glm::vec3 view, glm::vec3 up, glm::vec2 fov)
{
glm::vec3 eyePoint = eye;
glm::vec3 V = up;
glm::vec3 W = view;
glm::vec3 U = glm::cross(V,W); // Perter Sherley page 74 (Creating orthonormal vectors)
float fovY = fov.y;
//d is the near clip plane
float distance = (resolution.y / 2.0f) / tan(fovY);
float left = -resolution.x/2;
float right = resolution.x/2;
float top = resolution.y/2;
float bottom = -resolution.y/2;
float u = left + (right - left)*(x + 0.5)/resolution.x;
float v = bottom + (top - bottom)*(y + 0.5)/resolution.y;
ray r;
r.origin = eyePoint;
glm::vec3 temp = -1*distance*W + u*U + v*V;
r.direction = glm::normalize(temp);
return r;
}

有人能帮忙吗？

所以问题是，对于距离、u和V的特定值，由于温度值非常小（接近零），我出现了被零除的错误，这导致了glm:：normalize中的被零除错误。我通过在标准化温度之前检查温度的值来解决这个问题，并且只有在温度高于给定阈值时才进行标准化。这解决了问题。