C++ libxml xmlNode->kids

C++ libxml xmlNode->children

本文关键字:kids gt libxml xmlNode- C++      更新时间:2023-10-16

好的,我一直在一个类迭代通过html文档中的所有节点,并返回我需要的数据。这很简单,我已经在Bash中实现了这一点,但现在我正试图将其移植到c++中。

我从libxml网站上的例子开始,但是我已经一步一步地通过这个函数节点,我不能理解它是如何工作的。

函数如下:

    static void
print_element_names(xmlNode * a_node)
{
    xmlNode *cur_node = NULL;
    for (cur_node = a_node; cur_node; cur_node = cur_node->next) {
        if (cur_node->type == XML_ELEMENT_NODE) {
            printf("node type: Element, name: %sn", cur_node->name);
        }
        print_element_names(cur_node->children);
    }
}

基本上,这个函数接受一个节点给它赋值给一个指针,并开始遍历所有兄弟节点,但如果当前节点有子节点,它调用这个函数并从子节点开始。这完全可以理解。

它驱动文档结构向下,但是它如何导航到结构上呢?

xmlNode->子节点返回下一个父节点时发现NULL?据我所知,这不是真的,但我就是不明白这是如何工作的。

我成功地创建了一个类来做我想做的事情,但它比这复杂得多,大约有10行长。我需要检查下一个节点是否为空如果它有子节点,就向下导航如果没有,就向上导航到下一个节点。

这个例子更简单,我想了解如何使我的代码更好。

  1. 所以它驱动文档结构向下,但是它如何导航回结构呢?
    你写的是递归函数。从你的问题的性质来看,我假设你不太了解递归是什么/它是如何工作的。在谷歌上快速搜索一下,你会得到一些很好的信息/例子。

  2. xmlNode->子节点返回下一个父节点时,它被发现为NULL?
    我假设xmlNode->children返回一个指向包含当前节点所有子节点的链表的指针。如果当前节点没有子节点,则可能返回NULL。

  3. 这个例子要简单得多,我想了解如何使我的代码更好。我假设你写的类是纯迭代的。递归函数可以极大地简化代码,但在性能方面,它们可能会在较大的数据集上导致问题。我强烈建议大家仔细阅读;他们可以很有趣。

迭代地解决问题本质上是一个树遍历。您将需要一个堆栈来完成此操作。栈可能最容易实现为单链表。

// interface to be implemented
typedef void* Stack;
Stack stack_new();  // creates a new stack
void stack_add(Stack stack, xmlNode *element); // adds an element to the stack
int stack_size(); // returns the number of elements currently in the stack
xmlNode* stack_remove(Stack stack); // pops an element from the stack
void stack_free(Stack stack); // frees up resources used by the stack
// printing code
static void print_element_names(xmlNode *a_node)
{
    Stack stack = stack_new();
    stack_add(stack, a_node);
    while(stack_size(stack))
    {
            xmlNode *cur_node = stack_remove(stack);
            if(cur_node->children) stack_add(cur_node->children);
            xmlNode *iter_node = NULL;
            for (iter_node = cur_node; iter_node; iter_node = iter_node->next)
            {
                if (iter_node->type == XML_ELEMENT_NODE) 
                    printf("node type: Element, name: %sn", iter_node->name);
            }
    }
    stack_free(stack);
}