如何使用FSCANF提取HTML
How can I extract html with fscanf
我有一个文件,每行持有a。
<div style="random properties" id="keyword1:string id:int">text</div>
<div style="random properties" id="keyword1:string id:int">text</div>
<div style="random properties" id="keyword2:string id:int">text</div>
<div style="random properties" id="keyword2:string id:int">text</div>
我可以使用fscanf返回匹配的keyword1和keyword2的文本和ID列表?
您可以简单地使用Regex读取它:
std::string s;
std::regex r( "<div style="[^"]*" id=".*(\d+)">((?:(?!</div>).)*)</div>" );
while( std::getline(in, s) ) {
std::smatch m;
if( std::regex_match(s, m, r) ) {
std::cout << "id = " << m.str(1) << ", text = " << m.str(2) << std::endl;
} else {
std::cout << "invalid pattern" << std::endl;
}
}
但是,如果您想了解更多有关regex
的信息
相关文章:
- 从包含m行的文件中提取n行,必要时(惰性地)重复该文件
- 如何从 std::atomic 中提取指针 T<T>?
- 为什么istream不支持右值提取
- 如何设置一个范围来提取我想要获得的信息
- 视觉工作室项目.提取源文件夹名称
- C++17 - 使用自定义分配器的节点提取/重新插入 - 适用于 clang++/libc++,但不适用于 libstd
- 从字符串中提取整数并形成一个数组
- C ++中的StringStream有助于使用向量从字符串中提取逗号分隔的整数,而不是空格分隔的整数,为什么?
- asn1c 不会从 asn.1 模块中提取八位字节字符串的默认值
- 从 std::vector<无符号字符>切片中提取 int?
- 使用 C++ std::sregex_token_iterator 提取 HTML 注释
- C :如何将多个URL从网站HTML提取到向量
- 如何使用FSCANF提取HTML
- 使用 c++/boost::regex 提取 HTML 文件的特定部分
- 是否有用于从HTML页面中提取数据的库
- 使用Boost.从HTML中提取某些标签/属性
- 在c++/ c++中提取HTML文件的外链
- linux下从HTML到c++的关键字提取
- 用C++提取HTML标记
- 用c/c++编程从html文件中提取表