双模板化函数实例化失败

Double-templated function instantiation fails

本文关键字:实例化 失败 函数      更新时间:2023-10-16

以下代码:

template<typename T, MyEnum K> __global__ void myKernel(const T a[]);
template<typename T> __global__ void myKernel<T,SomeValueOfMyEnum>(const T a[]) {
    // implementation
}

触发以下错误消息:

错误:此声明中不允许显式模板参数列表

为什么?

笔记:

  • 我很确定这与 CUDA 无关,只是一个C++问题。
  • 关于部分专业化有很多问题,但我无法弄清楚我的问题是否是其中任何一个的骗子。

你不能对模板函数进行部分专用化,因为C++没有定义这样的事情。你只需要做一个模板部分特化 [§14.5.5/temp.class.spec]

类部分专业化 - 有点丑陋,但也许它可以帮助你。

enum MyEnum
{
    E1, E2
};
template<typename T, MyEnum K>
struct MyKernel
{
    void operator()(const T a[])
    {
        // ...
    }
};
template<typename T>
struct MyKernel<T, E1>
{
    void operator()(const T a[])
    {
        // ...
    }
};
int main()
{
    MyKernel<int, E1>()( ... ); // <--- To call
} 
您可以使用

enable_if来实现目标。

//template<typename T, MyEnum K> __global__ void myKernel(const T a[]);
template<typename T, MyEnum K>
typename std::enable_if<std::is_same<K, SomeValueOfMyEnum>::value, __global__ void>::type
myKernel<T,SomeValueOfMyEnum>(const T a[]) 
{
     // implementation
}
template<typename T, MyEnum K>
typename std::enable_if<!std::is_same<K, SomeValueOfMyEnum>::value, __global__ void>::type
myKernel<T,SomeValueOfMyEnum>(const T a[]) 
{
     // implementation
}