Std::string::empty() const()不抛出的分段错误

std::string::empty() const () segfault without throwing

本文关键字:分段 错误 const string empty Std      更新时间:2023-10-16

我遇到了一个奇怪的问题,我不知道怎么解决。

  for ( const auto & p : _patterns )
  {
     auto it = std::find_if( p->Tokens().begin(),p->Tokens().end(),
                             [&]( const Token & lhs )
                             {
                               return ( lhs == query );
                             });
    if ( it != p->Tokens().end() )
      d_freq++;
  }

标记:

std::vector<Token>

和std::find_if lambda内部的实际操作符,定义和实现为:

bool Token::operator== ( const Token & rhs  ) const
{
  if ( !this->_value.empty() && !rhs._value.empty() )
  {
    return boost::iequals( this->_value, rhs._value );
  }
  else
    throw 
      std::runtime_error ( "[Token::operator==] empty string" );
}

运行我的调试版本只是崩溃与SEGFAULT。

只有当我运行gdb,然后反向跟踪,我得到:

Program received signal SIGSEGV, Segmentation fault.
0x00007ffff721b173 in std::string::empty() const () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
(gdb) backtrace 
#0  0x00007ffff721b173 in std::string::empty() const () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
#1  0x00000000005b082d in Token::operator== (this=0xc35818, rhs=...) at /Token/Token.cpp:37
#2  0x00000000005ee12a in TFIDF::Calculate(std::vector<Token, std::allocator<Token> >, Token)::{lambda(Token const&)#1}::operator()(Token const&) const (__closure=0x7fffffffd840, lhs=...)

我觉得这很奇怪,因为,如果我理解正确的话,它应该抛出一个漂亮的异常,但它没有。

更有趣的是,就在我调用导致它崩溃的方法(TFIDF::Calculate)之前,我使用相同的令牌、相同的std::find_if和完全相同的lambda进行了非常相似的搜索,它没有崩溃!

我显然遗漏了一些东西,所以有人可以帮助吗?

如注释中所述,Tokens()按值返回std::vector<Token> 。这意味着下面的代码将比较两个不同的vectorbeginend迭代器,这是未定义的行为。

auto it = std::find_if( p->Tokens().begin(),p->Tokens().end(),
                        [&]( const Token & lhs )
                        {
                          return ( lhs == query );
                        });

要解决这个问题,可以修改Tokens(),使其通过引用返回std::vector ,或者将返回值存储在变量中。

auto tokens = p->Tokens();
auto it = std::find_if( tokens.begin(), tokens.end(),
                        [&]( const Token & lhs )
                        {
                          return ( lhs == query );
                        });

正如@WhozCraig所建议的,这可以进一步简化为

auto tokens = p->Tokens();
auto it = std::find(tokens.begin(), tokens.end(), query);
if ( it != tokens.end() ) // don't use p->Tokens() here either!! :)
  d_freq++;