为什么std::Hash对于不同的字符串是相等的

Why std::Hash equal for differen strings?

本文关键字:字符串 于不同 std Hash 为什么      更新时间:2023-10-16

为什么std::Hash对不同的字符串有相同的结果?我使用msvc2010sp1,当看到这个结果时我很惊讶:

int _tmain(int argc, _TCHAR* argv[])
  {
  std::string sUniqId ("IndexBuf");
  std::stringstream sStream;
  sStream << 10;
  std::string sUniqId10 (sUniqId);
  sUniqId10.append (sStream.str());
  size_t uHashStr = std::hash<std::string>()(sUniqId10);
  sStream.str("");
  sStream << 11;
  std::string sUniqId11 (sUniqId);
  sUniqId11.append(sStream.str());
  size_t uHashStr1 = std::hash<std::string>()(sUniqId11);
  sStream.str("");
  sStream << 12;
  std::string sUniqId12 (sUniqId);
  sUniqId12.append(sStream.str());
  size_t uHashStr2 = std::hash<std::string>()(sUniqId12);
  cout <<"str:  " << sUniqId10.c_str() << "t" << "Hash1: " << uHashStr  << endl; 
  cout <<"str2: " << sUniqId11.c_str() << "t" << "Hash2: " << uHashStr1 << endl;
  cout <<"str3: " << sUniqId12.c_str() << "t" << "Hash3: " << uHashStr2 << endl;
  return 0;
  }
输出:

str:  IndexBuf10        Hash1: 1286096800
str2: IndexBuf11        Hash2: 1286096800
str3: IndexBuf12        Hash3: 1286096800

有人知道为什么会这样吗?

注。此示例在msvc2013 update1

下正常工作

哈希值不需要唯一。例如,许多算法首先散列选择一个"桶",这是一个实际项目的链表。很可能哈希算法在不同版本之间发生了变化

哈希函数不必是bijective(域中的每个元素唯一映射到上域中的元素的一对一对应)。它们应该是surjective(上域中的每个元素在域中都有相应的元素),但它们不一定是injective,就像您暗示的那样。