Web数据提取和表单填写

Web Data Extraction and Form filling

本文关键字:表单 数据 提取 Web      更新时间:2023-10-16

我目前正在开始开发一个来自web平台的(UI?)备份。这不是我们的平台,我也无法接触到消息来源。

我只有输入元素的Form-Data的html呈现视图。

所以任务是浏览到HTML,存储数据(XML/JSON),然后登录到网站再次填写表单,重新提交数据…

此刻我是原型与c++ QtWebEngine。

做这个任务最好的方法是什么?什么是"浏览"网页和分析HTML的好框架?

优先考虑c++/java/javascript(或firefox插件?)的解决方案。

谢谢你的帮助!

与DSL语言解释器一样使用"Document Object Model (DOM)"我的建议:c# webform应用程序和浏览器控件:

  • webbrowser.navigate ([url])
  • web浏览器。li> web浏览器。文档(阅读有关"System.Windows.Forms. net"的文档和帮助。HtmlDocument")
  • 也许需要在中注入一些java脚本。

/*请不要使用此信息的黑客和攻击*/

你绝对可以使用Firefox的插件SDK来做这样的事情。特别是你应该看看PageWorker模块,它允许你在不显示页面的情况下加载和运行JS代码——一切都发生在后台。