为什么 VC++ 无法优化整数包装器
Why is VC++ unable to optimize an integer wrapper?
在C++中,我正在尝试在64位整数周围编写包装器。我的期望是,如果编写正确并且所有方法都是内联的,这样的包装器应该与实际类型一样具有性能。对SO这个问题的回答似乎与我的期望一致。
我写了这段代码来测试我的期望:
class B
{
private:
uint64_t _v;
public:
inline B() {};
inline B(uint64_t v) : _v(v) {};
inline B& operator=(B rhs) { _v = rhs._v; return *this; };
inline B& operator+=(B rhs) { _v += rhs._v; return *this; };
inline operator uint64_t() const { return _v; };
};
int main(int argc, char* argv[])
{
typedef uint64_t;
//typedef B T;
const unsigned int x = 100000000;
Utils::CTimer timer;
timer.start();
T sum = 0;
for (unsigned int i = 0; i < 100; ++i)
{
for (uint64_t f = 0; f < x; ++f)
{
sum += f;
}
}
float time = timer.GetSeconds();
cout << sum << endl
<< time << " seconds" << endl;
return 0;
}
当我用typedef B T
运行它时;而不是typedef uint64_t T
,当用VC++编译时,报告的时间总是慢10%。使用 g++,如果我是否使用包装器,性能是相同的。
由于 g++ 这样做,我想没有技术原因说明 VC++ 不能正确优化这一点。我可以做些什么来优化它吗?
我已经尝试使用优化标志但没有成功
为了记录,这就是 g++ 和 clang++ 在 -O2
处生成的程序集转换为(在包装器和非包装器情况下),对计时部分进行模数:
sum = 499999995000000000;
cout << sum << endl;
换句话说,它完全优化了循环。无论您尝试如何努力矢量化循环,都很难击败完全不循环:)
使用 /O2
(最大化速度),这两种替代方法都使用 Visual Studio 2012 生成完全相同的程序集。这是您的代码,减去计时和输出:
00FB1000 push ebp
00FB1001 mov ebp,esp
00FB1003 and esp,0FFFFFFF8h
00FB1006 sub esp,8
00FB1009 mov edx,64h
00FB100E mov edi,edi
00FB1010 xorps xmm0,xmm0
00FB1013 movlpd qword ptr [esp],xmm0
00FB1018 mov ecx,dword ptr [esp+4]
00FB101C mov eax,dword ptr [esp]
00FB101F nop
00FB1020 add eax,1
00FB1023 adc ecx,0
00FB1026 jne main+2Fh (0FB102Fh)
00FB1028 cmp eax,5F5E100h
00FB102D jb main+20h (0FB1020h)
00FB102F dec edx
00FB1030 jne main+10h (0FB1010h)
00FB1032 xor eax,eax
我认为测量的时间会波动或并不总是正确的。
相关文章:
- 如何反转整数参数包
- enum是C++中的宏变量还是整数变量
- 努力将整数转换为链表。不知道我在这里做错了什么
- 整数不会重复超过随机数
- 在C++中手动调整数组大小
- 检查输入是否不是整数或数字
- C++使用整数的压缩数组初始化对象
- 在C++中,将大的无符号浮点数四舍五入为整数的最佳方法是什么
- 如何在c++17中制作一个模板包装器/装饰器
- 将"打开的CV图像"中的"颜色"转换为整数格式
- std::vector的包装器,使数组的结构看起来像结构的数组
- 通过套接字[TCP]传输数据 如何在C / C ++中打包多个整数并使用send() recv()传输数据
- 如何在c++迭代器类型中包装std::chrono
- 如何只允许用户输入正整数
- 如何在c++中从文本文件中逐行读取整数
- std::带有颜色和标题的 clog 包装器无法正确打印整数
- SSE2包装的8位整数签名乘数(高半):将M128i(16x8位)分解为两个M128i(每个8x16),然后重新包装
- 为什么 VC++ 无法优化整数包装器
- 整数类包装器性能
- 在c++中使用包装的整数作为索引