extern template是否阻止函数内联?
Does extern template prevent inlining of functions?
我不完全清楚新的extern template
功能是如何在c++ 11中工作的。我知道它的目的是帮助加快编译时间,并简化与共享库的链接问题。这是否意味着编译器甚至不解析函数体,从而强制进行非内联调用?或者它只是指示编译器在进行非内联调用时不生成实际的方法体?显然,链接时间代码生成无法承受。
作为一个具体的例子,考虑一个操作不完全类型的函数。
//Common header
template<typename T>
void DeleteMe(T* t) {
delete t;
}
struct Incomplete;
extern template void DeleteMe(Incomplete*);
//Implementation file 1
#include common_header
struct Incomplete { };
template void DeleteMe(Incomplete*);
//Implementation file 2
#include common_header
int main() {
Incomplete* p = factory_function_not_shown();
DeleteMe(p);
}
在"实现文件2"中,delete
指向Incomplete
是不安全的。因此,DeleteMe
的内联版本将失败。但是如果它是一个实际的函数调用,并且函数本身是在"实现文件1"中生成的,那么一切都会正常工作。
作为推论,对于具有类似extern template class
声明的模板化类的成员函数,规则是否相同?
出于实验目的,MSVC对上述代码产生正确的输出,但如果删除extern
行,则生成关于删除不完整类型的警告。然而,这是他们多年前引入的一个非标准扩展的残余,所以我不确定我能在多大程度上信任这种行为。我没有访问任何其他构建环境来进行实验[save ideone等,但在这种情况下,被限制在一个翻译单元是相当有限的]。
外部模板背后的思想是使显式模板实例化更有用。
如您所知,在c++ 03中,您可以使用以下语法显式地实例化模板:
template class SomeTemplateClass<int>;
template void foo<bool>();
告诉编译器在当前翻译单元中实例化模板。然而,这并不能阻止隐式实例化的发生:编译器仍然需要执行所有隐式实例化,然后在链接期间将它们合并在一起。
的例子:
// a.h
template <typename> void foo() { /* ... */ }
// a.cpp
#include "a.h"
template void foo<int>();
// b.cpp
#include "a.h"
int main()
{
foo<int>();
return 0;
}
这里,a.cpp
显式地实例化了foo<int>()
,但是一旦我们去编译b.cpp
,它将再次实例化它,因为b.cpp
不知道a.cpp
无论如何都会实例化它。对于具有许多不同翻译单元进行隐式实例化的大型函数,这可能会大大增加编译和链接时间。它还可能导致函数不必要地内联,从而导致严重的代码膨胀。
使用外部模板,您可以让其他源文件知道您计划显式地实例化模板:
// a.h
template <typename> void foo() { /* ... */ }
extern template void foo<int>();
这样,b.cpp
就不会引起foo<int>()
的实例化。该函数将在a.cpp
中实例化,并将像任何普通函数一样进行链接。它也不太可能被内联。
注意,这并不能阻止内联——函数仍然可以在链接时被内联,就像普通的非内联函数一样。
编辑:对于那些好奇的人,我刚刚做了一个快速测试,看看g++实例化模板花费了多少时间。我尝试在不同数量的翻译单元中实例化std::sort<int*>
,无论实例化是否被抑制。结果是确凿的:每次实例化std::sort 30ms。
使用extern template class
似乎并不能阻止内联。我将通过一个例子来说明这一点,它有点复杂,但这是我能想到的最简单的例子。
在文件a.h中定义模板类CFoo
,
#ifndef A_H
#define A_H
#include <iostream>
template <typename T> class CFoo{
public: CFoo(){
std::cout << "CFoo Constructor, edit 0" << std::endl;
}
};
extern template class CFoo<int>;
#endif
在a.h的末尾,我们使用extern template class CFoo<int>
来指示任何带有#include a.h
的翻译单元,它不需要为CFoo生成任何代码。这是我们做出的承诺,所有的东西都将顺利连接。
在c.cpp文件中我们有
#include "a.h"
void run(){
CFoo<int> cf;
}
由于extern template class
promise' at the end of a.h, the translation unit of c.cpp does not
需要为CFoo类生成任何代码。
void run();
int main(){
run();
return 0;
}
在b.cp中没有什么特别的,我们简单地声明void run()
,它将在链接时链接到翻译单元b.cp的实现。为了完整起见,这里有一个makefile
cflags = -std=c++11 -O1
b : b.o a.o c.o
g++ ${cflags} b.o a.o c.o -o b
b.o : b.cpp
g++ ${cflags} -c b.cpp -o b.o
c.o : c.cpp
g++ ${cflags} -c c.cpp -o c.o
a.o : a.cpp a.h
g++ ${cflags} -c a.cpp -o a.o
clean:
rm -rf a.o b.o c.o b
使用此makefile编译并链接可执行文件a,该文件在运行时输出'' CFoo Constructor, edit 0''。但是请注意!在上面的例子中,我们似乎没有在任何地方声明CFoo<int>
: CFoo<int>
肯定没有在翻译单元b.cpp上声明,因为头文件没有出现在翻译单元b.cpp上,并且翻译单元c.cpp被告知它不需要实现CFoo。那么这是怎么回事呢?
对makefile做一个修改:用- 0替换- 01,并清空Make
现在,链接调用导致错误(使用gcc 4.8.4)
c.o: In function `run()':
c.cpp:(.text+0x10): undefined reference to `CFoo<int>::CFoo()'
如果一开始就没有内联,这是我们所期望的错误。至少这是我得出的结论,欢迎提出进一步的意见。
要获得与- 01的链接,我们需要遵守我们的承诺并提供CFoo的实现,我们在文件a.cpp
中提供了这一点#include "a.h"
template void foo<int>();
我们现在可以保证CFoo出现在a.p的翻译单元上,并且我们的承诺将被遵守。顺便说一句,请注意a.p中的template void foo<int>()
通过包含a.h在extern template void foo<int>()
之前,这是没有问题的。
最后,我发现这种不可预测的优化依赖行为令人讨厌,因为这意味着如果没有内联,对a.h的修改和a.p的重新编译可能不会像预期的那样反映在run()
中(尝试改变Foo构造函数的标准输出和重制)。
下面是一个有趣的例子:
#include <algorithm>
#include <string>
extern template class std::basic_string<char>;
int foo(std::string s)
{
int res = s.length();
res += s.find("some substring");
return res;
}
当使用g++-7.2在-O3下编译时,会产生对string::find的非内联调用,但会产生对string::size的内联调用。
虽然没有外部模板,但所有内容都是内联的。Clang有相同的行为,MSVC几乎无法在任何情况下内联任何东西。
所以答案是:视情况而定,编译器可能对此有特殊的启发。
- 在template中使用std::variant的template函数
- 在"template"和函数声明之间使用:template<typename trait> using tr = base_trait<trait> void fn(tr::t
- 模板函数参数到模板函数的"candidate template ignored: could not match ..."
- 为什么在template函数广播中把两个extensor表达式加在一起不正确
- 具有模板成员函数的 C++ 模板专用化<template>
- 为什么在auto和template函数的情况下,类型都没有推导为"const"类型
- 如何在varadic/template类构造函数中正确使用std::forward
- 如何在返回类型函数模板的专用化中使用派生类型?( "couldn't infer template argument" )
- 如何使函数像运算符<template>()形式<functional>
- 为什么std::vector::template在没有调用任何复制构造函数的情况下调用析构函数
- 带有Template参数的Template函数
- Template()的参数转发使构造函数参数变为常量
- 使用template函数可以安全地在多个类类型之间进行强制转换
- 模板化typedef上的Template函数
- 使用template-template参数作为类函数的返回类型
- 私有构造函数禁止使用template[_back]()来避免移动
- 具有Non-type template Parameter成员函数的template类
- 如何将绑定的templatefriend函数专门化为template类
- 使用for_each()AND lambda函数打印C样式数组的Template函数
- C++-专门化Template类的成员函数