无符号算术和整数溢出

Unsigned arithmetic and integer overflow

本文关键字：整数溢出无符号更新时间：2023-10-16

我试图理解算术溢出。假设我有以下内容

unsigned long long x;
unsigned int y, z;
x = y*z;

y*z可能导致整数溢出。将其中一个操作数转换为unsigned long long是否可以缓解此问题?64位操作数与32位操作数相乘的预期结果是什么?

您显然假设unsigned int是32位而unsigned long long是64位。它们不必是，让我们这样假设。

由32位操作数转换而来的64位操作数仍然适合32位。因此，在y*(unsigned long long)z中，每个操作数首先被提升到unsigned long long，结果被计算为unsigned long long并且不会"溢出"，因为它是两个量值的乘法，每个量值都适合32位。

(同样，在C标准的词汇表中，无符号操作不会"溢出"。溢出是在目标类型边界之外产生结果的未定义行为。无符号操作所做的是"绕行")。

unsigned long long x;
unsigned int y, z;
x = y*z;

表达式y*z的求值不受其出现的上下文的影响。它将两个unsigned int值相乘，得到unsigned int结果。如果数学结果不能表示为unsigned int值，则结果将绕行。然后，赋值操作隐式地将(可能被截断的)结果从unsigned int转换为unsigned long long。

如果您想要一个产生unsigned long long结果的乘法，您需要显式地转换一个或两个操作数:

x = (unsigned long long)y * z;

或者更明确的:

x = (unsigned long long)y * (unsigned long long)z;

C的*乘法运算符仅对两个相同类型的操作数应用。正因为如此，当你给它不同类型的操作数时，它们会在执行乘法运算之前被转换成某种通用类型。当您混合使用有符号和无符号类型时，规则可能有点复杂，但在这种情况下，如果将unsigned long long与unsigned int相乘，unsigned int操作数将提升为unsigned long long。

如果 unsigned long long的宽度至少是unsigned int的两倍，那么结果既不会溢出也不会绕行，因为，例如，64位的unsigned long long可以保存任意两个32位unsigned int值相乘的结果。但是如果你在一个系统上，例如，int和long long都是64位宽的，你仍然可以使用溢出环绕，给你x的结果不等于y和z的数学乘积。

如果一个操作数比另一个更宽，编译器应该(或表现得好像是)将两个操作数转换为相同的大小，因此将其中一个转换为更大的大小将产生正确的行为。

在C和c++标准中指定。c++ 11标准(n3337草案)在第五章声明9中是这样说的:

…如果两个操作数都是有符号整数类型或都是无符号的整数类型，将操作数与该类型的较小整数转换
将Rank转换为Rank更高的操作数的类型。

有几个页面描述了所有的转换和东西，但这是定义这个特定表达式的行为。