为什么string::compare返回int类型?

Why does string::compare return an int?

本文关键字:类型 int compare string 为什么 返回      更新时间:2023-10-16

为什么string::compare返回int而不是shortchar这样的较小类型?我的理解是,这个方法只返回- 1,0或1。

第二部分,如果我要设计一个比较方法,比较两个类型为Foo的对象,我只想返回- 1,0或1,使用shortchar通常是一个好主意吗?

编辑:我已经更正了,string::compare不返回- 1,0或1,它实际上返回一个值>0,<0或0。谢谢你们让我守规矩。

答案似乎大致是,没有理由返回小于int的类型,因为返回值是"右值",而这些"右值"不会从小于int类型(4字节)中受益。此外,许多人指出,大多数系统的寄存器的大小可能都是int,因为无论您给它们1、2或4字节的值,这些寄存器都将被填满,返回更小的值并没有真正的好处。

编辑2:事实上,当使用较小的数据类型(如对齐、屏蔽等)时,看起来可能会有额外的处理开销。一般的共识是,较小的数据类型是为了在处理大量数据(如数组)时节省内存而存在的。今天学到了一些东西,再次感谢大家!

首先,规范规定它将返回一个值大于、等于或大于0,不一定是-11。其次,返回值是右值,服从整型促销,所以返回更小的值没有意义。

在c++中(和C一样),每个表达式要么是右值,要么是右值左值。从历史上看,这些术语指的是左值出现在赋值操作的左侧,其中的右值只能出现在右边。今天,一个简单的近似非类类型是左值在内存中有一个地址右值没有。因此,不能取右值的地址,cv限定符(限定"访问")不适用。在在c++术语中,没有类类型的右值是纯右值值,而不是对象。函数的返回值是一个右值,除非它具有引用类型。(非类类型which在寄存器中匹配几乎总是在寄存器中返回,例如,而不是在内存中)

对于类类型,由于可以对右值调用成员函数。这意味着右值实际上必须有地址,对于this指针,并且可以是cv限定的,因为cv限定在重载解析中起作用。最后介绍c++ 11几个新的区别,为了支持右值引用;这些也主要适用于类类型。

积分提升是指当积分类型小于int的值在表达式中用作右值在大多数情况下,他们将被提升到int。所以即使我有一个变量声明为short a, b;,在表达式a + b中,ab在添加之前都被提升为int发生。类似地,如果我写a < 0,比较就完成了将"a"的值转换为"int"。实际上,有在很少的情况下,至少在某些情况下,这是有区别的吗2的补码机,其中整数运算包装(即:几乎都是舶来品,今天我想是Unisys大型机是唯一的例外)。尽管如此,即使在更常用的机器:

short a = 1;
std::cout << sizeof( a ) << std::endl;
std::cout << sizeof( a + 0 ) << std::endl;

应该给出不同的结果:第一个等价于sizeof( short ),第二个sizeof( int )(因为积分促销)。

这两个问题在形式上是正交的;右值和左值与积分推广无关。除了<<em>/em>……积分提升只适用于右值,大多数(但不适用)所有使用右值的情况都会导致积分促销。因为这个原因,真的没有理由返回一个小于int的数值。甚至有很好的理由不把它作为字符类型。像<<这样的重载操作符通常表现为字符类型不同,所以你只想返回字符作为字符类型。(你可以比较一下区别:

char f() { return 'a'; }
std::cout << f() << std::endl;      //  displays "a"
std::cout << f() + 0 << std::endl;  //  displays "97" on my machine

的区别在于,在第二种情况下,加法有造成积分提升的发生,从而产生不同的结果<<的过载选择。

不返回-1、0或1是故意的。

它允许(注意这不是针对字符串,但它同样适用于字符串)

int compare(int *a, int *b)
{
   return *a - *b;
}

简单多了
int compare(int *a, int *b)
{
   if (*a == *b) return 0;
   if (*a > *b) return 1;
   return -1;
}

,如果你必须返回- 1,0或1,这就是你必须做的[或沿着这些行]。

它也适用于更复杂的类型:

class Date
{
    int year;
    int month;
    int day;
}
int compare(const Date &a, const Date &b)
{
   if (a.year != b.year) return a.year - b.year;
   if (a.month != b.month) return a.month - b.month;
   return a.day - b.day;
}

对于字符串,我们可以这样做:

int compare(const std::string& a, const std::string& b)
{
   int len = min(a.length(), b.length());
   for(int i = 0; i < len; i++)
   {
      if (a[i] != b[i]) return a[i] - b[i];
   }
   // We only get here if the string is equal all the way to one of them
   // ends. If the length isn't equal, "longest" wins. 
   return a.length() - b.length();
}

int 通常(在大多数现代硬件上的意思)是与系统总线和/或CPU寄存器相同大小的整数,即所谓的机器字。因此,int通常比较小的类型传递得更快,因为它不需要对齐、屏蔽和其他操作。

较小的类型的存在主要是为了优化数组和结构体的内存使用。在大多数情况下,它们会用一些CPU周期(以对齐操作的形式)来换取更好的RAM使用。

除非您需要强制您的返回值是特定大小(char, short…)的有符号或无符号数,否则您最好使用int,这就是标准库这样做的原因。

C-ism。

当C语言需要compare类型的函数时,它们总是返回一个int。c++只是把它发扬光大了(很不幸)。

然而,返回int实际上可能是最快的方法,因为它通常是正在使用的系统的寄存器的大小。(故意模糊)

该方法实际上并不返回集合{ -1, 0, 1 }中的整数;它可以是任意整数值

为什么?我能想到的主要原因是int应该是建筑的"自然大小"值;对这种大小的值的操作通常至少与对较小或较大值的操作一样快(在许多情况下更快)。所以这是一个允许实现足够宽松的例子,可以使用最快的方法。

如果我要设计一个比较方法来比较两个类型为Foo的对象,而我只想返回- 1,0或1,使用short或char通常是一个好主意吗?

这是个好主意。更好的方法是返回bool(如果只想比较是否相等)或enum(了解更多信息):

enum class MyResult
{
  EQUAL,
  LESS,
  GREATER
};
MyResult AreEqual( const Foo &foo1, const Foo & foo2 )
{
  // calculate and return result
}

假设有人正在将代码从C更改为c++。他们决定将strcmp替换为string::compare

因为strcmp返回int,所以string::compare更容易返回int作为礼物。

可能是为了使它更像strcmp,也有这组返回值。如果你想移植代码,使用尽可能接近的替换代码可能会更直观。

同样,返回值不只是-1, 01,而是<0, 0>0

同样,正如前面提到的,由于返回值服从积分提升,因此使其更小是没有意义的。

因为布尔返回值只能是两个可能的值(true, false),而比较函数可以返回三个可能的值(小于,等于,大于)。

虽然可以返回带符号的短值,但如果真的想要实现自己的比较函数,则可以返回带有两个布尔值的nibble或struct值。