hbase和hadoop的关系 HBase合并storefile的原因是什么?在合并的过程中会做什么操作?
浏览量:2629
时间:2021-03-16 08:51:38
作者:admin
HBase合并storefile的原因是什么?在合并的过程中会做什么操作?
合并存储文件的过程称为比较过程。主要过程是合并memstore的flush操作生成的部分或全部storefile。主要功能如下:
1)合并文件。因为flush的触发器是针对所有memstore的,所以缓存一些memstore flush(记录很少)的结果是大量的小文件。压缩操作可以合并这些小文件,以降低storefile的维护成本。
2)清除数据的已删除、过期和冗余版本。由于HBase中写入的所有数据都不能修改,所以数据的修改操作是添加一条新记录,原始数据仍然保存在storefile中;而删除操作是添加一个删除标识符。紧凑的操作可以整合这些信息,减少磁盘空间的占用。
3)提高读写数据的效率。
hbase和hadoop的关系 hbase框架中使用了哪些概念 在hbase中常用的RDD有哪些
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。