gnu内置功能如何在此代码段中使用`___builtin_unreach`工作

How the GNU builtin function `__builtin_unreachable ` works in this code snippet?

本文关键字:builtin 工作 unreach 段中使 代码 功能 内置 gnu      更新时间:2023-10-16

我的项目中有一个代码片段,其中使用了__builtin_unreachable函数,但我不知道为什么在这里需要它。

我从gnu __builtin_unreachable中读到,看来__builtin_unreachable功能用于通知编译器,在CPU运行时间内将永远无法达到这一行,因此可以预先防止许多编译的抱怨。但是我不明白为什么在此代码段中需要此功能,删除__builtin_unreachable似乎不会发生任何事情。

# define ATHCONTAINERS_ASSUME(x) do { if (!(x)) __builtin_unreachable(); } while(0)

inline
void*
AuxVectorData::Cache::getDataArray (SG::auxid_t auxid,
                                    AuxVectorData& parent)
{
  // This function is important for performance.
  // Be careful when changing it.
  void* ptr = cachePtr (auxid);
  if (ATHCONTAINERS_UNLIKELY (ptr == 0)) {
    // We don't have the variable cached.
    // Call the out-of-line routine to get it cached.
    ptr = parent.getDataOol (auxid, false);
    // These inform the compiler of what the previous call did.
    // They tell the optimizer that it can now assume that this cache
    // entry is valid.
    ATHCONTAINERS_ASSUME (ptr != 0); 
    ATHCONTAINERS_ASSUME (cachePtr (auxid) != 0); 
    ATHCONTAINERS_ASSUME (cachePtr (auxid) == ptr);
  }
  return ptr;
}

ATHCONTAINERS_ASSUME告诉编译器其参数x不能是false。这使编译器不必生成任何代码以适应x是错误的可能性。例如,当编译器看到ATHCONTAINERS_ASSUME (ptr != 0)时,它可以假设ptr不是null,并且任何与假设相矛盾的代码都可以优化,因为它将是未定义的行为。

例如,由于getDataArray()inline,因此编译器可以在每个呼叫站点中知道返回的指针永远不会为null。因此,如果呼叫者这样做:

if (void* p = cache.getDataArray(aux, parent))
    memcpy(p, "OK", 2);

编译器可以生成直接写入"确定"而无需执行空检查的代码。

正如代码注释所示,它向优化器讲述了故事。

这说明的第一件事是,编译器可以假定返回值不是零指针。如果使用另一个GCC扩展名,则可能会提高代码的可读性,即 __attribute__((__returns_nonnull__))。将其添加到getDataArray的接口中也可以保证该属性,即使编译器决定出于何种原因决定他不能嵌入式属性。

,但它不止于此。它还告诉(或试图告诉)以相同参数对cachePtr的未来电话将返回相同的结果。

通过删除未使用的parent参数(以避免混杂分析),并通过将__attribute__((__const__))添加到getDataArray

,可以更好地保证所有这些属性。

这很有趣,对我来说是新的。

我最好的理解,从您链接到的文档中说:

如果控制流达到__builtin_unreachable()的点,则该程序是未定义的。

基本上,如果条件是错误的,则宏将达到不确定的行为。因此,假定编译器能够根据没有发生的假设,即条件不是错误的。

我有兴趣将构建代码的结果和没有这些宏的构建结果进行比较,以进一步了解其实际差异。

依靠它来使某种优化对我来说似乎是"脆弱的",因为它假设了编译器的内部功能。