在C/ c++中读取OpenOffice文件
Reading an OpenOffice file in C/C++
我很好奇我如何能够使用我的编译器打开OpenOffice文档。我知道我可能会将其转换为文本文件或rtf,但我想知道是否有可能直接从。odt中读取。我想做的是简单地一行一行地读,就像一个。txt文件一样。任何想法都会很好,如果有帮助的话,我正在使用DevC。
根据维基百科,.odt文件只是一个标准的ZIP归档文件,包含以下内容:
- XML文件:
-
- xml
- xml
- settings.xml
- styles.xml
其他文件 - :
- <
- mimetype/gh>
- 目录
- meta - inf/:
- manifest.xml
- 缩略图/:
- thumbnail.png
Content.xml将包含该文件的内容(有关其他文件的信息,请参阅上面的Wikipedia链接)。您可以使用任何XML库来解析该XML文件(以及其他文件)以读取数据。程序所需要做的就是解压缩.odt文件,然后将要解析的XML文件传递给XML库。
你可以使用的XML库的例子在这个StackOverflow回答中提到。
对于解压缩.odt文件,您有一些不错的选项:- libzip作为这个StackOverflow答案的建议。
- 7 zip
必须是C/c++吗?Linux Journal做了一篇很好的关于用Python解析ODT文件的文章。
http://www.linuxjournal.com/article/9347思路是一样的,只是用不同的库来完成繁重的工作。
相关文章:
- 理解boost::asio-async_read在无需读取内容时的行为
- 使用新行和不使用新行读取文件
- 读取文件并输入到矢量中
- 用c++从输入文件中读取另一行
- 读取文件的最后一行并输入到链接列表时出错
- 在进程中对同一管道进行读取和写入时C++管道出现问题
- 无法找到/读取配置文件.conf-FileIOException
- 如何使用Luacneneneba API正确读取字符串和表参数
- C++将文本文件中的数据读取到结构数组中
- 正在将csv文件读取为双精度矢量
- 为什么 sscanf 无法从一个字符串中读取uint64_t和字符?
- 为什么在读取文件大小时文件IO速度会发生变化
- 正在读取二进制文件(is_open)
- 如何在c++中从文本文件中逐行读取整数
- SSH通过/sbin/SSH无法读取RSA密钥文件(从控制台运行)
- 独立读取-修改-写入顺序
- 从文本文件中读取时钟时间和事件时间并进行处理
- 如何从文本文件中读取值和数组
- 为什么文件名被设置为一个点,而不是在读取矢量中的文件名时
- 在C/ c++中读取OpenOffice文件