有没有一种方法可以让QXmlStreamReader处理格式错误的XML
Is there a way to get QXmlStreamReader to cope with malformed XML?
我正在尝试解析网站中的一些值。为了实现这一点,我使用QXmlStreamReader
。开始解析后,我收到XML错误:"预期为'=',但得到'>'。"。它破坏了这个格式错误的元素:
<tbody pageStartAt >
我想这是因为标准表示,标签的主要名称之后的所有内容都应该有一些值,如下所示:
<tbody pageStartAt="2" > - this is working.
我的问题是,有什么办法可以防止这种情况发生吗?我只想忽略没有值的子标记。我宁愿避免使用QWebKit——我认为这太过分了。
我发现的最简单的方法是使用HTMLTidy(感谢@MrEricSir的建议)它可以修复损坏的XML。一个降级是它添加了不必要的标签,如/body/等。
相关文章:
- 警告处理为错误这里有什么问题
- 在C#中处理C++指针而不使用unsafe的最佳方法
- 处理多个异常集合的C++方法
- 找不到成员对象:没有名为get_event()的成员,也处理多态性和向量
- 使用流处理接收到的数据
- 获取日期异步信号安全吗?如果在信号处理程序中使用,它会导致死锁吗
- 处理小于cpu数据总线的数据类型.(c++转换为机器代码)
- 基于多个条件处理地图中的所有元素
- 如何用数字处理log(0)
- SSL上的`curl_easy_send`和`curl_asy_recv`:如何处理`CURLE_AGAIN`
- 错误处理.将系统错误代码映射到泛型
- 从文本文件中读取时钟时间和事件时间并进行处理
- 在运行时处理类型擦除的数据-如何不重新发明轮子
- 在for循环中使用auto vs decltype(vec.size())来处理字符串的向量
- 用于矢量处理的多个线程
- 对字符串进行排序时,在c++中处理sort()
- 如何处理linux终端中带有负号(-)的C++中的命令行参数
- 处理除以零会导致<csignal>意外行为
- 是否可以在c++中处理字符串流中的各个元素
- 在多个核心中处理一个HTTP请求