使用C++阅读HTML文本
Reading HTML text using C++
我现在正在读Allex Allain的书,有一个练习问题:在此处输入图像描述
我不知道如何思考这个问题,不知怎么的,我被卡住了,我应该先找到每个标签并将其保存到数组或向量中吗?然后将向量中的标签与原始字符串进行比较?并制定som条件?我不想从你那里寻找代码,我想自己解决它,我只是在寻找灵感或一些想法,或一些有用的方法。非常感谢。
您应该制作一个Parser。
阅读每个单词,如果找到标签,则找到下一个<tag>
。如果这是相反的标记</tag>
,那么您可以从该标记创建对象。
所提出的解决方案意味着创建名为tag的接口和名为<html>
、<head>
的派生类。
因此,在最终版本中,您将拥有一个电机(解析器),它接收文本并生成对象。
是的,就像@MSD561一样,他可以编写解析器。要么从头开始重新发明轮子,或者使用图书馆。
XML库可以用来实现第二个,并更好地理解结构:
我应该在C++中使用什么XML解析器?
它还将为您提供标签等的所有条目,您只需要通过xml树进行解析。
using namespace std;
void main ()
{
ifstream x;
string name,head="<html><head></head><body><table>", tail="</table></body></html>", bodystart="<tr><td>",bodyclose="</td></tr>";
ofstream y;
x.open("example.txt");
y.open("myhtmlfile.html");
y<<head;
while(!x.eof())
{
x>>name;
y<<bodystart<<name<<bodyclose;
}
y<<tail;
x.close();
cout<<"nn";
}
相关文章:
- 文本文件中的单词链表
- 从命令行c++发送文本文件名
- 在C++程序中输入的文本文件将不起作用,除非文本被复制和粘贴
- 2D数组来自文本输入,中间有空格
- 如何将内容数组写入文本文件?
- 无法通过空白将文本文件行分隔为矢量
- 我正在使用嵌套的while循环来解析具有多行的文本文件,但由于某种原因,它只通过第一行,我不知道为什么
- C++将文本文件中的数据读取到结构数组中
- 是否有提供可调整 dpi、可选文本和 CSS 支持的 HTML 到 PDF 渲染器?
- 编写一个 C++ 程序以将文本文件转换为 HTML 文件
- 我无法更改 html 文本字体大小Fl_Help_View
- 为什么它只打印文本文件的一个单词,而不是将整个文本文件打印到html文件中
- 将文本映射到 Doxygen 中的 HTML 实体
- Qt:如何以纯文本形式打开Html文件
- 如何将 HTML 文本框值从一个域复制到另一个域的文本框?
- 使用C++阅读HTML文本
- 用C++解析文本文件(其中包含HTML)
- 如何在两个HTML标签之间获得特定的文本
- Html文本作为工具提示,向右对齐
- 如何在VC++中将HTML Unicode文本设置为剪贴板