c++ Xerces解析器加载HTML并搜索HTML元素
C++ Xerces Parser Load HTML and Search for HTML Elements
我试图加载HTML与Xerces DOMDocument c++解析器和搜索特定的HTML元素。我很难找到如何做到这一点的好例子。我所发现的似乎只是解析XML。有人能帮忙吗?谢谢。
看看这个:http://xerces.apache.org/xerces-c/program-dom-3.html
也有一个关于DOMDocument的例子:
////创建一个小文档树//
{
XMLCh tempStr[100];
XMLString::transcode("Range", tempStr, 99);
DOMImplementation* impl = DOMImplementationRegistry::getDOMImplementation(tempStr, 0);
XMLString::transcode("root", tempStr, 99);
DOMDocument* doc = impl->createDocument(0, tempStr, 0);
DOMElement* root = doc->getDocumentElement();
XMLString::transcode("FirstElement", tempStr, 99);
DOMElement* e1 = doc->createElement(tempStr);
root->appendChild(e1);
XMLString::transcode("SecondElement", tempStr, 99);
DOMElement* e2 = doc->createElement(tempStr);
root->appendChild(e2);
XMLString::transcode("aTextNode", tempStr, 99);
DOMText* textNode = doc->createTextNode(tempStr);
e1->appendChild(textNode);
// optionally, call release() to release the resource associated with the range after done
DOMRange* range = doc->createRange();
range->release();
// removedElement is an orphaned node, optionally call release() to release associated resource
DOMElement* removedElement = root->removeChild(e2);
removedElement->release();
// no need to release this returned object which is owned by implementation
XMLString::transcode("*", tempStr, 99);
DOMNodeList* nodeList = doc->getElementsByTagName(tempStr);
// done with the document, must call release() to release the entire document resources
doc->release();
};
…再见。
编辑:但是我如何将HTML加载到DOMDocument中并对HTML元素进行搜索?这就是我想弄明白的。
XercesDOMParser解析器;
parser.loadGrammar("语法。dtd",语法::DTDGrammarType);
parser.setValidationScheme (XercesDOMParser:: Val_Always);
处理程序处理程序;
解析器。
parser.parse("xmlfile.xml");
相关文章:
- 有根的二进制搜索树.保留与其父级的链接
- 在C++中搜索嵌套多映射值
- cpp二进制搜索问题,计算给定数组中输入元素的出现次数
- 二进制搜索树叶数问题
- 为什么二进制搜索在我的测试中不起作用
- 正在尝试重载二进制搜索树分配运算符
- c++binary_search函数排序数组(流行名称搜索)出现问题
- 向量上的线性搜索
- 如何在动态数组上使用搜索函数
- 对于MacOS上的G++,如何添加默认的include目录/usr/local/include和默认的库搜索路径/usr
- cmake:添加要搜索头文件的目录
- 使用C++创建特殊的二叉搜索树
- 在C++的字符串中搜索和删除某些字符
- std::unordered_map 搜索算法是如何实现的?
- 使用不变量来确定二分搜索中的边界条件
- 二叉搜索如何比线性搜索更快?
- 按边长度递归搜索图中所有可行路径
- C++:如何递归/迭代搜索HTML文件(使用Boost C++)
- 如何使用Qt的QHelpSearchEngine搜索非html文件
- c++ Xerces解析器加载HTML并搜索HTML元素