2016 - 2024

感恩一路有你

hadoop怎么打开文件 hadoop的发展及原理?

浏览量:4081 时间:2023-06-29 14:56:22 作者:采采

hadoop的发展及原理?

Hadoop的发展历史

2004年—曾经在的版本(现在称作HDFS和MapReduce)由DougCutting和Mike Cafarella开始率先实施。

2005年12月—Nutch移植到到新的框架,Hadoop在20个节点上稳定运行。

2006年1月—Doug Cutting参加雅虎。

2006年2月—Apache Hadoop项目开始正常启动以意见MapReduce和HDFS的独立发展。

2006年2月—雅虎的网格计算团队按结构Hadoop。

2006年4月—标准排序(10GB每个节点)在188个节点上运行程序47.9个小时。

…………

Hadoop的工作原理是:

Hadoop由许多元素构成。其最底部是Hadoop Distributed File System(HDFS),它存储文件Hadoop集群中所有存储节点上的文件。HDFS(对此本文)的上一层是MapReduce引擎,该引擎由JobTrackers和TaskTrackers排成。………

hadoop常用版本?

Hadoop各高端点版本的介绍

ApacheHadoop2.0版本,有200以内模块:Hadoop通用模块,意见其他Hadoop模块的通用工具集Hadoop分布式文件系统(HDFS),意见对应用数据高吞吐量ftp连接的分布式文件系统HadoopYARN,主要用于作业调度和集群资源管理的框架HadoopMapReduce,设计和实现YARN的大数据并行处理系统。Hadoop目前除了社区版,也有各大厂商的发行版本。

Cloudera:最成型的发行版本,具备至少的部署案例能提供强大的部署、管理和监控工具。开发并杰出贡献了可动态实时如何处理大数据的Impala项目。

Hortonworks:100%开源的ApacheHadoop仅有提供给商。Hortonworks是第一家建议使用了ApacheHCatalog的元数据服务特性的需要提供商。但,他们的Stinger如此大地优化系统了Hive项目。Hortonworks为人们提供了一个非常好的、易于使用的沙盒。Hortonworks开发完毕了很多可以提高特性并并提交至核心主干,这也让ApacheHadoop能够在包括WindowsServers和WindowsAzure在内的Microsoft Windows平台上本地运行。

MapR:与竞争者比起,它使用了一些相同的概念,特别是就是为了资源更好的性能和

Hadoop HDFS 版本 项目 节点

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。