为什么 VC++ 无法优化整数包装器

Why is VC++ unable to optimize an integer wrapper?

本文关键字:整数 包装 优化 VC++ 为什么      更新时间:2023-10-16

在C++中,我正在尝试在64位整数周围编写包装器。我的期望是,如果编写正确并且所有方法都是内联的,这样的包装器应该与实际类型一样具有性能。对SO这个问题的回答似乎与我的期望一致。

写了这段代码来测试我的期望:

class B
{
private:
   uint64_t _v;
public:
   inline B() {};
   inline B(uint64_t v) : _v(v) {};
   inline B& operator=(B rhs) { _v = rhs._v; return *this; };
   inline B& operator+=(B rhs) { _v += rhs._v; return *this; };
   inline operator uint64_t() const { return _v; };
};
int main(int argc, char* argv[])
{
   typedef uint64_t;
   //typedef B T;
   const unsigned int x = 100000000;
   Utils::CTimer timer;
   timer.start();
   T sum = 0;
   for (unsigned int i = 0; i < 100; ++i)
   {
      for (uint64_t f = 0; f < x; ++f)
      {
         sum += f;
      }
   }
   float time = timer.GetSeconds();
   cout << sum << endl
        << time << " seconds" << endl;
   return 0;
}

当我用typedef B T运行它时;而不是typedef uint64_t T,当用VC++编译时,报告的时间总是慢10%。使用 g++,如果我是否使用包装器,性能是相同的。

由于 g++ 这样做,我想没有技术原因说明 VC++ 不能正确优化这一点。我可以做些什么来优化它吗?

我已经尝试使用优化标志但没有成功

为了记录,这就是 g++ 和 clang++ 在 -O2 处生成的程序集转换为(在包装器和非包装器情况下),对计时部分进行模数:

sum = 499999995000000000;
cout << sum << endl;

换句话说,它完全优化了循环。无论您尝试如何努力矢量化循环,都很难击败完全不循环:)

使用 /O2(最大化速度),这两种替代方法都使用 Visual Studio 2012 生成完全相同的程序集。这是您的代码,减去计时和输出:

00FB1000  push        ebp  
00FB1001  mov         ebp,esp  
00FB1003  and         esp,0FFFFFFF8h  
00FB1006  sub         esp,8  
00FB1009  mov         edx,64h  
00FB100E  mov         edi,edi  
00FB1010  xorps       xmm0,xmm0  
00FB1013  movlpd      qword ptr [esp],xmm0  
00FB1018  mov         ecx,dword ptr [esp+4]  
00FB101C  mov         eax,dword ptr [esp]  
00FB101F  nop  
00FB1020  add         eax,1  
00FB1023  adc         ecx,0  
00FB1026  jne         main+2Fh (0FB102Fh)  
00FB1028  cmp         eax,5F5E100h  
00FB102D  jb          main+20h (0FB1020h)  
00FB102F  dec         edx  
00FB1030  jne         main+10h (0FB1010h)  
00FB1032  xor         eax,eax

我认为测量的时间会波动或并不总是正确的。