hadoop自学要多久 hadoop与spark的区别是什么？

浏览量：1256 时间：2021-03-13 22:57:36 作者：admin

hadoop与spark的区别是什么？

谢谢你的邀请

！请看下面的图片：

狭义的Hadoop，也就是原始版本：只有HDFS map reduce

未来会出现很多存储、计算和管理框架。

如果我们比较它们，我们可以比较Hadoop map reduce和spark，因为它们是用于大数据分析的计算框架。

Spark有许多线路组件，它们更强大、更快。

浅谈Spark和Hadoop作业之间的区别？

我认为您所说的Hadoop是map/reduce。主要区别如下：

1。Mr-Jobs的资源控制是通过yarn实现的。Spark是否可以通过纱线控制资源。但是，如果将多个组件设置在一起（例如，群集中同时存在spark计划和HBase查询），建议使用yarn；

2。Spark基于内存计算。计算的中间结果存储在内存中，可以访问行迭代计算；而Mr计算的中间结果是放到磁盘上，所以一个作业会涉及到对磁盘的重复读写，这也是性能不如spark的主要原因；

3。Mr的任务对应于一个容器，每次都需要花费大量的时间来启动。一些Hadoop版本（如华为oceaninsight）性能不同，Hadoop实现了容器预热（重用）功能，可能消耗较少，而spark是基于线程池的，因此资源分配会更快。

mesos、k8s和spark之间的联系和区别是什么？

mesos和k8s之间存在一种关系。简而言之，它们之间存在一种竞争关系。它们用于容器编排，是容器技术的关键组件。Mesos比k8s更早问世，曾在市场上大受欢迎。不过，在谷歌的支持下，k8s很快超越了mesos，击败了docker自己的swarm。如今，k8s已成为集装箱布局的事实标准。

Spark是大数据领域的软件。它最初是作为Hadoop的竞争对手出现的，现在已经与Hadoop集成。它与mesos和k8s没有直接关系，如果你不得不说是的话，它们都是开源软件。

hadoop和大数据的关系？和spark的关系？

大数据实际上是一个比较庞大和广泛的概念，Hadoop是一个比较完整的大数据处理批量数据存储、计算和分析框架。Spark可以理解为一个内存计算框架。现在很多主流的大数据平台都是在Hadoop的基础上进行优化和再开发的，spark一般都会集成到Hadoop中进行流式数据处理，一般来说会用到主流行业的大数据技术Hadoop和spark。学习时，两个系统都会学习，先学习Hadoop，再学习spark。

Apache开源组织的分布式基础设施提供了分布式文件系统（HDFS）、分布式计算（MapReduce）和统一资源管理框架（yarn）的软件体系结构。用户可以在不了解分布式系统的基本细节的情况下开发分布式程序。

为大规模数据处理设计的快速通用计算引擎。用于构建大型、低延迟的数据分析应用程序。它可以用来完成各种操作，包括SQL查询、文本处理、机器学习等。

https://www.toutiao.com/i654015696262573648397/

hadoop自学要多久 hadoop与spark的区别与联系 hadoop到底能干什么

上一篇 linux中suid权限 linux中修改权限怎么计算的

下一篇 js或且非 js拖拽排序实现思路

hadoop自学要多久 hadoop与spark的区别是什么？

hadoop与spark的区别是什么？

浅谈Spark和Hadoop作业之间的区别？

mesos、k8s和spark之间的联系和区别是什么？

hadoop和大数据的关系？和spark的关系？

猜你喜欢

最新资讯

资讯排行

资讯分类

微信公众号

微信小程序