Qt 5在Android上解析HTML

Qt 5 parsing HTML on Android

本文关键字:HTML Android Qt      更新时间:2023-10-16

我正在开发Qt 5.3.1的跨平台移动应用程序。我需要加载各种HTML页面并从中解析DOM元素值。目前,我已经成功地加载了一个页面与QNetworkAccessManager,并将其存储在QByteArray,但我撞墙试图解析出有价值的数据。几个点:

  • 我不能使用QWebkit,因为它不支持Android上的Qt 5
  • HTML不能被认为是严格的标记,例如Qt的XML阅读器或DOM解析器不会在他们自己的工作
  • 我只是从页面解析文本。信息是我所需要的,而不是视觉风格

我有什么选择?WebKit是实现这一目标的唯一方法,这听起来有点愚蠢,因为我不需要显示任何来自网页的图形数据。为HTML编写自己的DOM解析器是可行的方法吗?

http://qt-project.org/wiki/Handling_HTML

有一个很好的html解析器列表。

有时候一个好的正则表达式可以捕获你需要的东西,但是它不如一个好的HTML解析器健壮。

页面上的第一个链接看起来很有希望:

http://tidy.sourceforge.net/libintro.html

我不知道为Qt Android构建库有多困难,但它看起来是可行的,并且可以使用标准工具。

希望对你有帮助。