在这种情况下,我能让压缩比小于6.25%吗?

Can I have compression ratio less than 6.25% in this situation?

本文关键字:小于 压缩比 这种情况下      更新时间:2023-10-16

我有一个文本文件,其中只有两个字符的组合组成的长文本。

有什么方法可以压缩它们,压缩比小于6.25%。

我不想使用任何库或函数,但
我希望有一些公式或算法来完成这项工作。
一个想法是对我的问题最好的回答。

p。S:其实我也想自己造一个,但是我对这个东西一无所知。不管是什么,我坐在那里,拿着笔和笔记本,试着自己做这些事情。

压缩比直接由文件的内容决定。例如,一个只包含0N次的文件可以使用log_2(N)位进行压缩(您只需指定它包含多少个零)。从技术上讲,压缩比最多等于源的香农熵,因为你可能认为你的文件包含一些随机源产生的符号。

因此,除非您知道文件的结构并可以使用一些附加信息,否则不可能保证压缩比低于某个阈值。如果你不知道这个结构,你的文件只包含随机的0和1,那么就没有办法压缩它(在这种情况下熵就是1)。

参见这个链接了解更多细节。你一定要读一些介绍性的信息理论,否则重新发明轮子会很乏味。

除非您的数据中有其他冗余,否则不会。最好是12.5%,即1/8,因为您可以将每个字符编码为1位。