c++程序从网页中读取表格
c++ program to read a table from a web page
我需要写一个c++程序,从网页获取数据(我有url到那)。基本上,网页包含一个巨大的表格,分布在多个页面上(尽管有"下一步"按钮)。
我需要得到这整个表,然后采取每一行并解析它(表有大约10列)。经过一些小的处理后,每一个都必须以类似的数据格式放入csv文件中。
谁能建议最好的方法来做这件事?我需要在c++中做到这一点,我想知道我应该使用什么库。需要在windows中完成,但我不介意使用平台独立/依赖的东西。让libcurl为您下载。它很快,你不需要直接处理HTTP。
在c++中有许多库用于解析XML。看到这个。
帮大家一个忙,不要试图用regexp解析HTML。你将召唤克苏鲁。
我知道这可能不是你正在寻找的确切答案,但既然它是一个选项…
您可以使用原始套接字生成基本的HTTP GET,然后您将以HTML格式接收您的表。然后,您只需解析它(使用XML解析器或手动查找表或特定ID)并获得结果。
我知道这不是最好的和"随时可用"的解决方案,但它仍然可以工作。
相关文章:
- 理解boost::asio-async_read在无需读取内容时的行为
- 使用新行和不使用新行读取文件
- 读取文件并输入到矢量中
- 用c++从输入文件中读取另一行
- 读取文件的最后一行并输入到链接列表时出错
- 在进程中对同一管道进行读取和写入时C++管道出现问题
- 无法找到/读取配置文件.conf-FileIOException
- 如何使用Luacneneneba API正确读取字符串和表参数
- C++将文本文件中的数据读取到结构数组中
- 正在将csv文件读取为双精度矢量
- 为什么 sscanf 无法从一个字符串中读取uint64_t和字符?
- 为什么在读取文件大小时文件IO速度会发生变化
- 正在读取二进制文件(is_open)
- 如何在c++中从文本文件中逐行读取整数
- SSH通过/sbin/SSH无法读取RSA密钥文件(从控制台运行)
- 独立读取-修改-写入顺序
- 从文本文件中读取尺寸和表格内容后显示表格
- 如何将表格从.txt文件读取到C++
- 用C++读取表格中的数字数据,代码行数最少
- c++程序从网页中读取表格