在线组装;浮点数上的按位运算;这里出了什么问题?

Inline assembly; Bitwise operation on float; What's going awry here?

本文关键字:这里 什么 问题 运算 浮点数 在线      更新时间:2023-10-16

这段简单的代码就是我的问题:

扩展asm(gcc(;英特尔语法(-masm=英特尔(;平台-x86

它应该做的是:返回一个长度为1、符号(+-(与x相同的浮点值。

    float signf(float x)
    {
      float r = 1;
      asm volatile (
            "and %1,0x80000000;"
            "or %0,%1;"
            :"=r"(r):"r"(x));
      return r;
    }

用公平掷骰子选择的任意随机数调用它可以得到:

    signf of -1352353.3253: -5.60519e-045

内联asm的实际问题是您仅将r声明为输出,因此编译器将优化初始化。您应该使用"+r"约束而不是"=r"约束,它应该可以工作。

一个更好的优化版本可能看起来像:

float signf(float x)
{
    float r;
    __asm__  __volatile__ (
            "and %0, 0x80000000;"
            "or %0, 0x3f800000;"
            :"=r"(r):"0"(x));
    return r;
}

请注意,此函数涉及float->int->float转换(通过内存(,这可能会影响性能。

上述代码的C版本是:

float signf(float x)
{
    union { float f; int i; } tmp, res;
    tmp.f = x;
    res.f = 1;
    res.i |= tmp.i & 0x80000000;
    return res.f;
}

这为我生成了相同的代码(使用gcc 4.4.5(

简单的C方法return x < 0 ? -1 : 1;生成完整的FPU代码,无需转换或内存访问(加载操作数除外(,因此可能会执行得更好。如果可用,它还使用fcmov来避免分支。需要一些基准测试。

在C++11中有两个C++函数:

bool std::signbit (x);

http://en.cppreference.com/w/cpp/numeric/math/signbit

或者,

float f = std::copysign (1.0f, x);

http://en.cppreference.com/w/cpp/numeric/math/copysign

这似乎工作得很好(AT&T语法(:

float signf(float x)
{
  float r = 1;
  asm ("andl $0x80000000, %1n"
       "torl %1, %0n"
       :"+r"(r):"r"(x));
  return r;
}

TBH,我会按照其他人的建议使用copysignf()。您尝试执行的操作是不可移植的,因为它仅与能够执行此asm()语句的IA-32平台和C++编译器绑定。

编辑1

顺便说一句,下面的版本工作原理相同(生成的指令与上面的asm()语句几乎相同(,并且没有不可移植的东西和类型别名问题(与其他人建议的基于union或基于reinterpret_cast<>的版本不同(。

float signf3(float x)
{
  unsigned u;
  std::memcpy(&u, &x, sizeof (u)) ;
  float r = 1.f;
  unsigned uone;
  std::memcpy(&uone, &r, sizeof (uone));
  uone |= u & 0x80000000;
  std::memcpy(&r, &uone, sizeof (r));
  return r;
}

这个问题被标记为C++,所以我将提供两个C++建议,您可以让编译器优化:

  • return x < 0.0f ? -1.0f : 1.0f;
  • return x / std::abs(x); // I believe self-division shouldn't cause 'almost 1.0' numbers to be genereated

您不需要为此使用asm。下面是你试图做的事情(甚至是-0.0f的正确结果(

float signf(float x) {
    bool sign=(0!=(*(reinterpret_cast<uint32_t *>(&x)) & 0x80000000));
    return sign? -1.0f : 1.0f;
}