2016 - 2024

感恩一路有你

大数据实时计算框架 实时数据仓库如何做?

浏览量:1437 时间:2021-03-13 07:12:43 作者:admin

实时数据仓库如何做?

虽然我做报表和Bi,但是报表和Bi的效果比较好,底层的数据非常重要,数据架构也非常重要,这就必然涉及到数据仓库。

让我们先放一些图片:

如果你想建立一个实时数据仓库,你必须知道:

1。什么是数据仓库

2。实时数据仓库和数据库有什么区别。实时数据仓库和传统数据仓库有什么区别

4。什么是实时数据仓库的体系结构

5。怎么做

这些问题在上图中都是抽象的。解释哪些问题需要弄清楚需要花很长时间,我在以前的文章中已经写过了。你可以去看看。

如何基于Spark Streaming构建实时计算平台?

Spark streaming是一个基于Spark的实时计算框架,它扩展了Spark处理大规模流数据的能力。spark流的优点是它可以在1000个节点上以秒延迟运行。

采用基于内存的spark作为执行引擎,具有高效、容错的特点。

可以集成批量处理和spark的交互式查询。

它提供了一个简单的界面,类似于复杂算法的批处理。

正是由于这个原因,spark-streaming受到了很多企业的追捧,在生产项目中得到了广泛的应用,但在使用过程中也存在一些热点问题。

原文的详细解释:https://blog.csdn.net/GitChat/article/details/78050311

大数据实时计算框架 实时流计算框架 大数据flink实时计算方案

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。