c++程序从网页中读取表格

c++ program to read a table from a web page

本文关键字:读取 表格 网页 程序 c++      更新时间:2023-10-16

我需要写一个c++程序,从网页获取数据(我有url到那)。基本上,网页包含一个巨大的表格,分布在多个页面上(尽管有"下一步"按钮)。

我需要得到这整个表,然后采取每一行并解析它(表有大约10列)。经过一些小的处理后,每一个都必须以类似的数据格式放入csv文件中。

谁能建议最好的方法来做这件事?我需要在c++中做到这一点,我想知道我应该使用什么库。需要在windows中完成,但我不介意使用平台独立/依赖的东西。

让libcurl为您下载。它很快,你不需要直接处理HTTP。

在c++中有许多库用于解析XML。看到这个。

帮大家一个忙,不要试图用regexp解析HTML。你将召唤克苏鲁。

我知道这可能不是你正在寻找的确切答案,但既然它是一个选项…

您可以使用原始套接字生成基本的HTTP GET,然后您将以HTML格式接收您的表。然后,您只需解析它(使用XML解析器或手动查找表或特定ID)并获得结果。

我知道这不是最好的和"随时可用"的解决方案,但它仍然可以工作。