变量优化为零

Variable optimized to zero

本文关键字:优化 变量      更新时间:2023-10-16

在下面的程序中,如果在O1以上进行优化编译,则out变量始终打印为0。如果我取消digitTruncate函数中的cout行注释,那么out变量在任何优化级别下都可以正确打印。

我正在做的事情是"未定义",还是这是一个编译器问题?

#include <iostream>
#include "mytime.hpp"
#include <stdint.h>
template <class IN>
int32_t
digitTruncate (IN data_in, uint32_t digits, uint64_t* data_out,
               int32_t bits = -1, bool safe = false)
{
  if (bits == -1)
    bits = (digits / 0.3010299957) + 1;
  if (!safe) 
  {
    if (bits > (int32_t)sizeof(data_in) * 8)
      return -1;
  }
  *data_out = (data_in & (0xffffffffffffffff >> (64 - bits)));
  //std::cout << *data_out << std::endl;
  return (bits / 8) + 1;
}
int
main()
{
  uint64_t cycles1, cycles2;
  uint32_t out;
  char* block = new char[8];
  cycles1 = mytime::cycles();
  for (int i = 0; i < 10000; i++)
  {
    uint32_t init = (uint32_t)mytime::cycles();
    digitTruncate(init, 5, ((uint64_t*)block), 17, true);
    out = *((uint32_t*)block);
  }
  cycles2 = mytime::cycles();
  std::cout << cycles2 - cycles1 << std::endl;
  std::cout << "results: " << out << std::endl;
  return 0;
}

通过访问block作为指向uint64_tuint32_t的指针,您违反了严格的别名规则。编译器可以假设一个特定的地址只被char*和另一种类型访问(别名)。您正在使用两种非char*类型,因此所有的赌注都是关于编译器的优化器将做什么。

由于循环中的out的值是死的,除了最后一次迭代之外,并且该函数除了设置block(以及out)之外没有任何副作用,编译器可以自由地消除循环,只计算最后一次迭代。最后一次迭代的大部分代码也可以被固定地折叠起来。

所以你最终只连续两次调用mytime::cycles(),这可能有0的差异…

编译器可能首先将调用内联,然后将其简化为什么都不做,而不是注意到它实际上什么都不做,但总体效果是一样的。