如何有效地解压缩霍夫曼编码的文件
How to efficiently decompress huffman coded file
我发现了很多问题,但有些解释很难理解,我无法完全理解如何有效地解压缩文件的概念。我发现了以下相关问题:带查找表的霍夫曼代码如何快速解码霍夫曼代码?
但是我不明白这个解释。我知道如何定期对霍夫曼树进行编码和解码。现在,在我的压缩程序中,我可以将以下任何信息写入文件象征哈夫曼码(无符号长码)哈夫曼码长度
我计划做的是获得一个文本文件,将其分离成小文本文件,并分别压缩每个文件,然后通过将所有小压缩文件及其各自的查找表(不知道如何完成这一部分)发送到Nvidia GPU来解压缩该文件,试着使用某种查找表并行解压缩该文件。
我有3个问题:我应该在头中的文件中写入哪些信息来构建查找表?如何从文件中重新创建此表?如何使用它快速解码huffman编码的文件?
不要麻烦自己写,除非这是一个说教练习。使用zlib、lz4或其他几个免费的压缩/解压缩库中的任何一个,这些库的测试效果都比你所能做的要好得多
您只是在谈论霍夫曼编码,这表明您只能获得可用压缩的一小部分。提到的库中的大多数压缩都来自于匹配的字符串。查找"LZ77"。
至于高效的霍夫曼解码,你可以看看zlib的膨胀是如何做到的。它为代码中最有效的九位创建了一个查找表。表中的每个条目都有该代码的符号和位数(小于或等于9),或者如果提供的9位是较长代码的前缀,则该条目有一个指向另一个表的指针,以解析代码的其余部分和该辅助表所需的位数。(有几个辅助表。)如果代码长度小于9,则同一符号有多个条目。事实上,对于一个n位代码,29-n有多个条目。
因此,要进行解码,您可以从输入中获得9位,并从表中获得条目。如果它是一个符号,那么您可以从流中删除为代码指示的位数,并发出该符号。如果它是一个指向辅助表的指针,那么您可以从流中删除九个位,获得表指示的位数,然后在那里查找。现在,您肯定会得到一个要发射的符号,以及要从流中删除的剩余比特数。
- 如何确定我已使用非编码文件到达 EOF?
- 如何将不同的可执行文件合并到一个窗口框架中进行编码?像浏览器一样
- 使用文件内容作为硬编码字符串
- C++和带有国家符号的文件路径(也许用 UTF8 编码)
- 当我在 CLion 中读取数组中的 txt 文件时C++编码问题
- 从文件中读取文本时出现编码问题
- 编码大于原始文本:如何获取零和一的字符串并将它们作为实际字节写入文件
- 如何使jse文件执行编码.exe并静默添加启动?Javascript将文件添加到启动?
- 这些PGM文件是如何编码的?
- 算术编码FPAQ0(一个简单的订单-0算术文件压缩机)
- 将 JPG 编码数组从 ROS sensor_msgs/压缩图像保存到 roscpp 中的文件
- 为什么我在有关文件编码格式的QT代码中获得了混乱的代码
- BASE64图像文件用C 编码
- 从编码域中的 MPEG 文件中读取元数据
- C 在使用UCS-2 LE编码的文件中搜索短语
- 如何使用Imebra库将压缩像素(用我自己的编码器压缩)回到DICOM图像文件中
- 管理代码中的硬编码文件路径/名称
- 需要说明如何使用 C++ 在 Linux 上创建 utf-8 编码文件
- 使用ICU(ICU4C)读取UTF-8编码文件的缓冲区大小
- 编译eAccelerator解码PHP编码文件