解析字符串(带空格），但忽略(Spirit）末尾的空格

Parsing a string (with spaces) but ignoring the spaces at the end of the (Spirit)

本文关键字：空格 Spirit 字符串更新时间：2023-10-16

我有一个输入字符串要解析。它可能看起来像两者中的任何一个：

sys(error1, 2.3%)
sys(error2 , 2.4%)
sys(this error , 3%)

注意逗号前的空格。在我的grammer（boost spirit库）中，我想分别捕获"error1"、"error2"answers"this error"。

以下是我必须捕捉的原始语法，它吸收了名称末尾的空间：

name_string %= lexeme[+(char_ - ',' - '"')];
name_string.name("Systematic Error Name");
start = (lit("sys")|lit("usys")) > '('
  > name_string[boost::phoenix::bind(&ErrorValue::SetName, _val, _1)] > ','
  > errParser[boost::phoenix::bind(&ErrorValue::CopyErrorAndRelative, _val, _1)]
  > ')';

我首先尝试解决这个问题：

name_string %= lexeme[*(char_ - ',' - '"') > (char_ - ',' - '"' - ' ')];

然而，这完全失败了。看起来它无法解析在中间有空格的任何内容。

我对Spirit相当陌生，所以也许我错过了一些简单的东西。看起来lexeme在领先的时候不跳了——我需要一些在领先和落后的时候跳的东西。

提前感谢您的帮助！

多亏了下面的psur，我才有了答案。它并不完美（见下文），但我想我会更新帖子，让每个人都能在上下文中看到它，并且格式很好：

qi::rule<Iterator, std::string(), ascii::space_type> name_word;
qi::rule<Iterator, std::string(), ascii::space_type> name_string;
ErrorValueParser<Iterator> errParser;
name_word %= +(qi::char_("_a-zA-Z0-9+"));
//name_string %= lexeme[name_word >> *(qi::hold[+(qi::char_(' ')) >> name_word])];
name_string %= lexeme[+(qi::char_("-_a-zA-Z0-9+")) >> *(qi::hold[+(qi::char_(' ')) >> +(qi::char_("-_a-zA-Z0-9+"))])];
start = (
         lit("sys")[bind(&ErrorValue::MakeCorrelated, _val)]
         |lit("usys")[bind(&ErrorValue::MakeUncorrelated, _val)]
         )
  >> '('
  >> name_string[bind(&ErrorValue::SetName, _val, _1)] >> *qi::lit(' ')
  >> ','
  >> errParser[bind(&ErrorValue::CopyErrorAndRelative, _val, _1)]
  >> ')';

这很管用！它们的关键是name_string，其中的qi：：hold，一个我以前不熟悉的运算符。这几乎就像一个子规则：qi：：hold[…]中的所有内容都必须成功解析才能继续。所以，上面，如果后面有另一个单词，它只允许在一个单词后面有一个空格。结果是，如果一个单词序列以空格结尾，那么最后的空格将不会被解析！它们可以被后面的*qi:：lit（''）吸收（参见开始规则）。

有两件事我想弄清楚如何在这里改进：

将实际的字符串解析放入name_word中会很好。问题是name_word的声明——当它被放在name_string定义中的适当位置时，它会失败。
如果name_string可以包括对尾部空格的解析，那就更好了，尽管它的返回值没有。我想我知道怎么做。。。

当/如果我弄清楚这些，我会更新这篇文章。谢谢你的帮助！

以下规则应该适用于您：

name_word %= +(qi::char_("_a-zA-Z0-9"));
start %= qi::lit("sys(")
  >> qi::lexeme[ name_word >> *(qi::hold[ +(qi::char_(' ')) >> name_word ]) ]
  >> *qi::lit(' ')
  >> qi::lit(',')
  // ...

name_word只解析名称中的一个单词；我假设它只包含字母、数字和下划线。

在start规则中，qi::hold是重要的。只有当next是name_word时，它才会解析空间。在其他情况下，解析器将回滚并移动到*qi::lit(' ')，然后移动到逗号。