如何使用 c++ 中的文件读取和写入文档、pdf 文件

How to read and write doc, pdf files using files in c++

本文关键字:文件 文档 pdf 读取 何使用 c++      更新时间:2023-10-16

我正在使用文件编写C ++程序,我需要从现有文件(如文档文件和pdf文件)中获取输入。 如何用C ++编程?获得输入后,如何将这些详细信息写入新的文档或 pdf 文件?谁能用一个例子来解释我?

C++作为一种

语言并不能为您提供"写入DOC文件"或"从PDF文件读取"等功能。程序员唯一可用的工作人员是原始的逐字节读取或写入。为了使您的新品牌文件与PDF/DOC/etc兼容,您必须符合所选的文件格式。阅读也是如此 - 您应该了解原始字节数组的哪些部分负责什么。

通常,此任务命名为"解析"或"序列化"。最好将现有的解析器之一用于特定文件格式,而不是重新发明轮子。此外,某些文件格式可能正在申请专利,因此未经许可证购买,您可能不被允许处理它。

到目前为止的一些线索:

  • PDF 解析 C++ (PoDoFo)
  • Microsoft "C"中的单词文本解析器

现在网络上有一些可用的库(问题是从 2013 年开始的,也许那个时候并不多)。

除了所选答案中的链接外,您还可以尝试PDFTron。它还支持新功能,例如。线性化。

这是他们的样本之一是 ->https://www.pdftron.com/documentation/samples/cpp/TextExtractTest

(该程序本身包含 4 个 if 块,库/SDK 的功能略有不同,可以尝试)

应该还有更多,在网上搜索PDF解析库。