2016 - 2024

感恩一路有你

hbase四个组件 spark读hbaseparquet哪个快?

浏览量:1654 时间:2021-03-12 04:43:17 作者:admin

spark读hbaseparquet哪个快?

spark读取HBase时,生成的任务数受查询表的区域数限制。例如,如果查询40g数据,10g数据是一个区域,则可能有4-6个区域。最初的任务数量只有大约4-6个。RDD可以在以后按分区设置任务数。spark读取parquet时,根据默认的bolck数生成任务数,例如128M bolck,几乎是300多个任务。另外,HBase还需要与区域服务器交互,将数据传输到spark的内存中,这也消耗时间。一般来说,阅读拼花更快

~],等等

hbase四个组件 hbase查询语句 时间序列分析

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。