STOD 在 boost::locale 中无法正常工作

stod does not work correctly with boost::locale

本文关键字:常工作 工作 boost locale STOD      更新时间:2023-10-16

我正在尝试在逗号是小数分隔符的德语区域设置中一起使用boost::locale和std::stod。请考虑以下代码:

boost::locale::generator gen;
std::locale loc("");  // (1)
//std::locale  loc = gen("");  // (2)
std::locale::global(loc);
std::cout.imbue(loc);
std::string s = "1,1";  //float string in german locale!
double d1 = std::stod(s);
std::cout << "d1: " << d1 << std::endl;
double d2 = 2.2;
std::cout << "d2: " << d2 << std::endl;

std::locale loc("( 创建正确的语言环境,输出为

d1: 1,1
d2: 2,2

正如我所料。当我注释掉行 (1( 和取消注释行 (2( 时,输出为

d1: 1
d2: 2.2

d2 的结果是意料之中的。据我了解 boost::locale 希望我明确指定 d2 应该格式化为数字并做

std::cout << "d2: " << boost::locale::as::number << d2 << std::endl;

再次将输出固定为 2,2。问题是 std::stod 不再将 1,1 视为有效的浮点数,并将其截断为 1。

我的问题是:为什么当我使用 boost::locale 生成我的语言环境时,std::stod 停止工作?

其他信息:我正在使用VC++2015,Boost 1.60,无ICU,Windows 10

更新:

我注意到当我设置全局语言环境两次时,问题得到了解决,首先使用 std::locale("( 然后使用 boost:

std::locale::global(std::locale(""));
bl::generator gen;
std::locale::global(gen(""));

不过,我不知道为什么它会这样!

长话短说:boost::locale只更改全局 c++ 语言环境对象,而不更改 C 语言环境。 stod使用 C 语言环境,而不是全局 C++ 区域设置对象。 std::locale同时更改:全局 C++ 区域设置对象和 C 区域设置。


整个故事:std::locale是一个微妙的东西,负责大量的调试!

让我们从 c++ 类 std::locale 开始:

  std::locale loc("de_DE.utf8");  
  std::cout<<loc.name()<<"nnn";

创建德语区域设置(如果它在计算机上可用,否则会引发(,这会导致控制台de_DE.utf8

但是,它不会更改全局 c++ 语言环境对象,该对象是在程序启动时创建的,并且是经典的 ("C"(。不带参数的std::locale的构造函数返回全局状态的副本:

...
  std::locale loc2;
  std::cout<<loc2.name()<<"nnn";

现在你应该看到C如果之前没有弄乱你的语言环境。 std::locale("( 会做一些魔术,找出用户的偏好并将其作为对象返回,而不改变全局状态。

您可以使用std::local::global更改本地状态:

  std::locale::global(loc);
  std::locale loc3;
  std::cout<<loc3.name()<<"nnn";

默认构造函数这次的结果是控制台上的de_DE.utf8。我们可以通过调用以下命令将全局状态恢复到经典状态:

  std::locale::global(std::locale::classic());
  std::locale loc4;
  std::cout<<loc4.name()<<"nnn";

这应该会让你再次C

现在,当创建 std::cout 时,它会从全局 c++ 状态克隆其语言环境(这里我们使用字符串流执行此操作,但它是一样的(。全局状态的后续更改不会影响流:

 //classical formating
  std::stringstream c_stream;
 //german formating:
  std::locale::global(std::locale("de_DE.utf8"));
  std::stringstream de_stream;
  //same global locale, different results:
  c_stream<<1.1;
  de_stream<<1.1;
  std::cout<<c_stream.str()<<" vs. "<<de_stream.str()<<"n";

给你1.1 vs. 1,1 - 第一个是古典的第二个德语

你可以用不言而喻imbue(std::locale::classic())更改流的本地区域设置对象,这不会改变全局状态:

  de_stream.imbue(std::locale::classic());
  de_stream<<" vs. "<<1.1;
  std::cout<<de_stream.str()<<"n";
  std::cout<<"global c++ state: "<<std::locale().name()<<"n";

你看:

1,1 vs. 1.1
global c++ state: de_DE.utf8

现在我们来到std::stod.可以想象,它使用全局 c++ 语言环境(不完全正确,请耐心等待(状态,而不是 cout -stream 的(私有(状态:

std::cout<<std::stod("1.1")<<" vs. "<<std::stod("1,1")<<"n";

给你1 vs. 1.1,因为全局状态仍然是"de_DE.utf8"的,所以第一次解析在'.'停止,但std::cout的本地状态仍然是"C"。恢复全局状态后,我们得到经典行为:

  std::locale::global(std::locale::classic());
  std::cout<<std::stod("1.1")<<" vs. "<<std::stod("1,1")<<"n";

现在德语"1,1"没有正确解析:1.1 vs. 1

现在你可能认为我们已经完成了,但还有更多 - 我答应告诉你关于std::stod.

在全局 c++ 语言环境旁边,还有所谓的(全局(C 语言环境(来自 C 语言,不要与经典的"C"语言环境混淆(。每次我们更改全局 c++ 语言环境时,C 语言环境也会更改。

C 语言环境的获取/设置可以使用 std::setlocale(...) 完成。要查询当前值,请运行:

std::cout<<"(global) C locale is "<<std::setlocale(LC_ALL,NULL)<<"n";

看看(global) C locale is C.要设置 C 语言环境运行,请执行以下操作:

  assert(std::setlocale(LC_ALL,"de_DE.utf8")!=NULL);
  std::cout<<"(global) C locale is "<<std::setlocale(LC_ALL,NULL)<<"n";

这会产生(global) C locale is de_DE.utf8.但是现在的全局 c++ 语言环境是什么?

std::cout<<"global c++ state: "<<std::locale().name()<<"n";

正如你所料,C 对 c++ 全局语言环境一无所知,并且保持不变:global c++ state: C

现在我们不再在堪萨斯州了!旧的 c 函数将使用 C 语言环境,新的 c++ 函数将使用全局 c++。为有趣的调试做好准备!

你会期待什么

std::cout<<"C: "<<std::stod("1.1")<<" vs. DE :"<<std::stod("1,1")<<"n";

怎么办? 毕竟std::stod是一个全新的 C++11 函数,它应该使用全局 C++ 语言环境!再想一想...:

1 vs. 1.1

它使德语格式正确,因为 C 语言环境设置为"de_DE.utf8",并且在引擎盖下使用旧的 C 样式函数。

为了完整起见,std::streams使用全局 c++ 区域设置:

  std::stringstream stream;//creating with global c++ locale
  stream<<1.1;
  std::cout<<"I'm still in 'C' format: "<<stream.str()<<"n";

给你:I'm still in 'C' format: 1.1

编辑:一种解析字符串而不会弄乱全局语言环境或受到其干扰的替代方法:

bool s2d(const std::string &str, double  &val, const std::locale &loc=std::locale::classic()){
  std::stringstream ss(str);
  ss.imbue(loc);
  ss>>val;
  return ss.eof() && //all characters interpreted
         !ss.fail(); //nothing went wrong
}

以下测试显示:

  double d=0;
  std::cout<<"1,1 parsed with German locale successfully :"<<s2d("1,1", d, std::locale("de_DE.utf8"))<<"n";
  std::cout<<"value retrieved: "<<d<<"nn";
  d=0;
  std::cout<<"1,1 parsed with Classical locale successfully :"<<s2d("1,1", d, std::locale::classic())<<"n";
  std::cout<<"value retrieved: "<<d<<"nn";
  d=0;
  std::cout<<"1.1 parsed with German locale successfully :"<<s2d("1.1", d, std::locale("de_DE.utf8"))<<"n";
  std::cout<<"value retrieved: "<<d<<"nn";
  d=0;
  std::cout<<"1.1 parsed with Classical locale successfully :"<<s2d("1.1", d, std::locale::classic())<<"n";
  std::cout<<"value retrieved: "<<d<<"nn";

只有第一次和最后一次转换是成功的:

1,1 parsed with German locale successfully :1
value retrieved: 1.1
1,1 parsed with Classical locale successfully :0
value retrieved: 1
1.1 parsed with German locale successfully :0
value retrieved: 11
1.1 parsed with Classical locale successfully :1
value retrieved: 1.1

std::stringstream可能不是最快的,但有其优点...