大数据实时计算框架实时数据仓库如何做？

浏览量：1437 时间：2021-03-13 07:12:43 作者：admin

实时数据仓库如何做？

虽然我做报表和Bi，但是报表和Bi的效果比较好，底层的数据非常重要，数据架构也非常重要，这就必然涉及到数据仓库。

让我们先放一些图片：

如果你想建立一个实时数据仓库，你必须知道：

1。什么是数据仓库

2。实时数据仓库和数据库有什么区别。实时数据仓库和传统数据仓库有什么区别

4。什么是实时数据仓库的体系结构

5。怎么做

这些问题在上图中都是抽象的。解释哪些问题需要弄清楚需要花很长时间，我在以前的文章中已经写过了。你可以去看看。

Spark streaming是一个基于Spark的实时计算框架，它扩展了Spark处理大规模流数据的能力。spark流的优点是它可以在1000个节点上以秒延迟运行。

采用基于内存的spark作为执行引擎，具有高效、容错的特点。

可以集成批量处理和spark的交互式查询。

它提供了一个简单的界面，类似于复杂算法的批处理。

正是由于这个原因，spark-streaming受到了很多企业的追捧，在生产项目中得到了广泛的应用，但在使用过程中也存在一些热点问题。

原文的详细解释：https://blog.csdn.net/GitChat/article/details/78050311

上一篇 html网页制作模板代码学生个人网页制作html

下一篇 HTML怎么分页 html如何实现分页功能