如何仅获取给定捕获的组<regex>c ++
How to get only given captured group <regex> c++
我想提取标签的内部内容。从以下字符串:
<tag1 val=123>Hello</tag1>
我只想得到
Hello
我做什么:
string s = "<tag1 val=123>Hello</tag1>";
regex re("<tag1.*>(.*)</tag1>");
smatch matches;
bool b = regex_match(s, matches, re);
但它返回两个匹配项:
<tag1 val=123>Hello</tag1>
Hello
当我尝试像这样只获得第一个捕获的组时:
"<tag1.*>(.*)</tag1>1"
我得到零匹配。
请指教。
regex_match
仅返回一个匹配项,其中包含所有捕获组子匹配项(其数量取决于模式中有多少组(。
在这里,您只能获得包含两个子匹配项的 1 个匹配项:1( 整个匹配项,2( 捕获组 1 值。
若要获取捕获组的内容,需要访问smatches
对象第二个元素,matches[1].str()
或matches.str(1)
请注意,当您编写 "<tag1.*>(.*)</tag1>1"
时,1
不会解析为反向引用,而是解析为八进制代码为 1 的字符。即使您定义了反向引用(如"<tag1.*>(.*)</tag1>\1"
(,您也需要在</tag1>
后重复使用捕获组 1 捕获的整个文本 - 这绝对不是您想要的。实际上,我怀疑这个正则表达式有什么好处,至少,你需要用"[\s\S]*?"
替换".*"
,但它仍然是一种用正则表达式解析 HTML 的脆弱方法。
相关文章:
- 请解释这句话(cout<<1+int((a<b)^((b-a)&1) )<<endl
- 呼叫运营商<<临时
- 此模式的C++RegEx
- 如何防止clang格式在流运算符调用之间添加换行符<<
- <<操作员在下面的行中工作
- C++ std::regex 使用前瞻失败
- std::regex:匹配由数字和空格组成的字符串,并提取数字.如何?
- 使用 boost::regex 从目录中获取带有一些正则表达式的文件名称时出现意外输出
- 你能防止 std::regex 在无效表达式上抛出异常吗?
- 使用Regex解析cpp中的字符串并创建映射
- C++:如何用split查找单词?Regex
- 在VC2015U3上,std::regex比boost::regex慢得多
- 是否有更有效的方法来生成日期的REGEX字符串
- 如何显式调用运算符<<
- 在C++中使用带有regex的捕获组
- 将std::regex设置为静态的好主意吗
- 为什么Regex(c++)需要指数时间
- std::regex and dual ABI
- C++11 std::regex后备选项
- 以不同的方式替换每一项,regex c++