regex_token_iterator和regex_迭代器有什么区别

What is the difference between regex_token_iterator and regex_iterator?

本文关键字:regex 什么 区别 token iterator 迭代器      更新时间:2023-10-16

regex_token_iterator和regex_迭代器之间有什么区别吗?

他们似乎都在做同样的工作,但不确定哪一个表现更好?

如果我们看一下cppreference,它描述std::regex_iterator如下:

std::regex_iterator是一个只读的ForwardIterator,它访问底层字符序列中正则表达式的各个匹配项。

std::regex_token_iterator为:

std::regex_token_iterator是一个只读的ForwardIterator,它访问底层字符序列中正则表达式的每个匹配的各个子匹配。它还可以用于访问序列中与给定正则表达式不匹配的部分(例如,作为标记器)。

因此,std::regex_token_iterator还允许您匹配未匹配的令牌或n-th子表达式。

我上面链接的std::regex_token_iterator的cppreference部分描述了一个典型的实现,如下所示:

std::regex_token_iterator的典型实现包含底层std::regex_iterator,的容器(例如std::vector)请求的子匹配索引,内部计数器等于子匹配的索引,指向std::sub_match的指针,指向当前匹配的current子匹配,以及std::match_results对象包含最后一个不匹配的字符序列(在tokenizer中使用模式)。

《C++标准库》一书在14.4Regex令牌迭代程序中解释如下:

正则表达式迭代器有助于对匹配的子序列进行迭代。然而有时,您还需要处理匹配之间的所有内容表达式。[…]此外,您还可以指定一个积分列表值,表示"标记化"的元素:

  • -1表示您对匹配的正则表达式(标记分隔符)之间的所有子序列感兴趣
  • 0表示您对所有匹配的正则表达式(标记分隔符)感兴趣
  • 任何其他值n都表示您对正则表达式中匹配的第n个子表达式感兴趣

图书网站提供了sregex_token_iterator和sregex_迭代器的示例代码,这也应该很有用。