如何有效地解压缩霍夫曼编码的文件

How to efficiently decompress huffman coded file

本文关键字:编码 文件 霍夫曼 解压缩 有效地      更新时间:2023-10-16

我发现了很多问题,但有些解释很难理解,我无法完全理解如何有效地解压缩文件的概念。我发现了以下相关问题:带查找表的霍夫曼代码如何快速解码霍夫曼代码?

但是我不明白这个解释。我知道如何定期对霍夫曼树进行编码和解码。现在,在我的压缩程序中,我可以将以下任何信息写入文件象征哈夫曼码(无符号长码)哈夫曼码长度

我计划做的是获得一个文本文件,将其分离成小文本文件,并分别压缩每个文件,然后通过将所有小压缩文件及其各自的查找表(不知道如何完成这一部分)发送到Nvidia GPU来解压缩该文件,试着使用某种查找表并行解压缩该文件。

我有3个问题:我应该在头中的文件中写入哪些信息来构建查找表?如何从文件中重新创建此表?如何使用它快速解码huffman编码的文件?

不要麻烦自己写,除非这是一个说教练习。使用zlib、lz4或其他几个免费的压缩/解压缩库中的任何一个,这些库的测试效果都比你所能做的要好得多

您只是在谈论霍夫曼编码,这表明您只能获得可用压缩的一小部分。提到的库中的大多数压缩都来自于匹配的字符串。查找"LZ77"。

至于高效的霍夫曼解码,你可以看看zlib的膨胀是如何做到的。它为代码中最有效的九位创建了一个查找表。表中的每个条目都有该代码的符号和位数(小于或等于9),或者如果提供的9位是较长代码的前缀,则该条目有一个指向另一个表的指针,以解析代码的其余部分和该辅助表所需的位数。(有几个辅助表。)如果代码长度小于9,则同一符号有多个条目。事实上,对于一个n位代码,29-n有多个条目。

因此,要进行解码,您可以从输入中获得9位,并从表中获得条目。如果它是一个符号,那么您可以从流中删除为代码指示的位数,并发出该符号。如果它是一个指向辅助表的指针,那么您可以从流中删除九个位,获得表指示的位数,然后在那里查找。现在,您肯定会得到一个要发射的符号,以及要从流中删除的剩余比特数。