模板参数作为函数说明符和编译器优化

Template parameter as function specifier and compiler optimization

本文关键字：说明符编译器优化函数参数更新时间：2023-10-16

我发现这篇文章非常有用，我想澄清一些关于编译器优化的事情。假设我们有这个函数(与原始帖子相同):

template<int action>
__global__ void kernel()
{
    switch(action) {
       case 1:
       // First code
       break;
       case 2:
       // Second code
       break;
    }
}

编译器是否会在消除不可达代码的意义上进行优化，即使我在编译时调用模板变量未知的函数-例如创建两个单独的函数?例如:

kernel<argv[1][0]>();

简短的回答:no.

模板是在编译时实例化和生成的，所以你不能使用argv中的值，因为它们在编译时是未知的。

让我想知道为什么你不试一试，把代码扔给编译器——它会告诉你模板参数必须是编译时间常数。

更新:既然你在评论中告诉我们，这主要不是关于性能，而是关于可读性，我建议使用switch/case:

template <char c> void kernel() {
  //...
  switch(c) { /* ... */ }
}
switch (argv[1][0]) {
  case 'a': 
    kernel<'a'>();
    break;
  case 'b': 
    kernel<'b'>();
    break;
  //...
}

由于您必须做出决策的值(即argv[1][0])仅在运行时已知，因此您必须使用运行时决策机制。其中，switch/case是最快的，特别是如果没有太多不同的案例(但多于两个)，特别是如果案例之间没有间隔(即。'a'， 'b'， 'c'，而不是1,55,2048)。然后编译器可以生成非常快的跳表。

作为模板的新手，我必须研究一些基本的问题。最后我想出了解决问题的办法。如果我想根据命令行参数调用带有模板形参的函数，我应该这样做:

if(argv[1][0] == '1')
    kernel<1><<< ... >>>();
if(argv[1][0] == '2')
    kernel<2><<< ... >>>();

我还检查了该程序的ptx文件，发现编译器在这种情况下进行了优化，产生了两个不同的内核函数，没有switch语句。