2016 - 2024

感恩一路有你

hadoop集群搭建完整教程 如何为Hadoop集群选择正确的硬件?

浏览量:1728 时间:2021-03-11 15:17:41 作者:admin

如何为Hadoop集群选择正确的硬件?

Hadoop是一个运行在集群环境中的大数据框架,包括分布式存储和分布式计算。

Hadoop流行的一个重要原因是它不需要很高的硬件,通常超过8g的内存可以运行Hadoop。许多研究Hadoop的程序员从部署伪集群开始,这表明Hadoop对硬件的要求非常低。但要想顺利运行Hadoop,其中一个关键点是增加内存和使用超过i5cpu。

Hadoop对内存和CPU的要求非常敏感。如果使用spark,建议内存大于32g,否则处理速度会受到很大影响,因为spark是基于内存的。

Hadoop是学习阶段的选择。商业大数据平台一般会在Hadoop的基础上进行打包,或者选择成熟的商业大数据平台。由于Hadoop的部署和操作维护比较麻烦,商业平台通常比较完善,使用起来也比较方便。

docker怎样部署hadoop集群?

Docker提供了隔离和打包Hadoop相关应用程序的完美方法。

该公司还研究了slider框架和docker如何协同工作以简化此类部署。目前,hortonworks的一个客户正在考虑在自己的数据平台上使用HDP来支持docker的方法。他们使用cloudbreak在云中的docker容器中部署Hadoop,并计划将自己的数据应用程序制作成docker映像,在yarn上运行。此外,由于其灵活性和兼容性,许多用户使用它在未知环境中进行部署。

hadoop集群搭建完整教程 hadoop3集群安装 搭建hadoop集群的步骤

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。