2016 - 2024

感恩一路有你

hadoop完全分布式搭建 hadoop完全分布式和伪分布式有什么不同?

浏览量:2340 时间:2021-03-16 07:52:57 作者:admin

hadoop完全分布式和伪分布式有什么不同?

首先回答您的问题:

Hadoop完全分布式:由三个或更多物理或虚拟机组件组成的集群。

Hadoop pseudo-distributed:a node

看了以上两点,相信大家已经明白了“在VM中安装更多unbuntu配置完全分布式,然后做实验”是完全可行的。事实上,我们通常也是这样做的。当然,我们可能需要您的计算机CPU和内存来支持您的计划。

一个建议:如果你想开发基于Hadoop的分布式程序,那么伪分布式就足够了。如果你想做很多其他的事情,比如玩cm、oozie和HBase,建议你安装多个虚拟机。

如何为Hadoop集群选择正确的硬件?

Hadoop是一个运行在集群环境中的大数据框架,包括分布式存储和分布式计算。

Hadoop流行的一个重要原因是它不需要很高的硬件,通常超过8g的内存可以运行Hadoop。许多研究Hadoop的程序员从部署伪集群开始,这表明Hadoop对硬件的要求非常低。但要想顺利运行Hadoop,其中一个关键点是增加内存和使用超过i5cpu。

Hadoop对内存和CPU的要求非常敏感。如果使用spark,建议内存大于32g,否则处理速度会受到很大影响,因为spark是基于内存的。

Hadoop是学习阶段的选择。商业大数据平台一般会在Hadoop的基础上进行打包,或者选择成熟的商业大数据平台。由于Hadoop的部署和操作维护比较麻烦,商业平台通常比较完善,使用起来也比较方便。

hadoop完全分布式搭建 hadoop分布式是什么 hadoop伪分布式和完全分布式

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。