2016 - 2024

感恩一路有你

snappy什么意思中文 hbase压缩lzo和snappy的区别?

浏览量:2691 时间:2021-03-12 12:19:30 作者:admin

hbase压缩lzo和snappy的区别?

LZO是一个压缩文件。Linux下的压缩一般是流压缩,即只能压缩一个文件。无法查看此类文件的内容,因此只能直接对其进行解压缩。双击图形界面。

怎么样把两个压缩文件压到一起?

在设计软件时要考虑很多问题。

1. 算法的局限性。如常用的LZ77、gzip和snappy等,在匹配同一字符串时受历史缓冲区大小和最大匹配长度的限制。以你提到的例子为例。当你遇到第二个100米的时候,你需要找到100米的位置来找到匹配,但是匹配100米需要一个成本(包括消耗100米内存和匹配100米长度所需的时间)。这将使压缩过程非常缓慢!二是最大匹配长度问题。同样,你也不能在有限的时间内要求更长的匹配时间。有一个门槛。一般情况下,匹配窗口的大小通常为几KB到几MB(snappy为64KB),最大匹配长度较小。基于词典的系统如LZ78和LZW也存在词典大小和最大匹配长度的问题,这些问题不会重复。

2. 压缩率和压缩速度之间的折衷。总之,压缩比越大,压缩速度越快,反之亦然。这主要取决于平衡。即使我们一味追求压缩率,使用一种算法100米的压缩代价仍然很高。最好使用多层压缩。例如,gzip使用了Huffman和LZ77的组合。当然,也可以使用文件对文件的重复检查算法(从云端一秒钟上传电影的各种例子),但这种方法只适用于云备份,不适合多文件(太小,不实用,浪费资源)的压缩和打包。

3. 多文件压缩倾向于单独压缩每个文件,这主要取决于性能。例如,您有16个文件要压缩。如果一开始单独压缩,可以调动16个线程一起压缩,时间会缩短16倍。然后花一点时间将压缩文件粘在一起并添加元数据。如果压缩在一起,因为压缩算法很难并行,基本上是线程工作(很多多线程也会先把文件切成多个副本,原理同上),速度会慢很多。减压也是一样的。单独压缩的文件可以由多个线程同时解压。另外,在解压缩时,如果我只需要其中一个文件,这种压缩方法有更多的优点。我只需要读取元数据并解压缩我需要的部分文件,而不是解压缩所有文件。

如何在Hive中进行数据压缩以实现高效存储?

常用压缩算法:

压缩算法的工作原理?

压缩算法是一种非常简单的无损压缩算法。它使用重复字节的简单描述和替换重复字节的次数。虽然对于普通压缩来说简单且效率低下,但它有时非常有用。

snappy什么意思中文 lz4和zstd压缩算法对比 snappy压缩率

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。