大数据实时计算框架 实时数据仓库如何做?
实时数据仓库如何做?
虽然我做报表和Bi,但是报表和Bi的效果比较好,底层的数据非常重要,数据架构也非常重要,这就必然涉及到数据仓库。
让我们先放一些图片:
如果你想建立一个实时数据仓库,你必须知道:
1。什么是数据仓库
2。实时数据仓库和数据库有什么区别。实时数据仓库和传统数据仓库有什么区别
4。什么是实时数据仓库的体系结构
5。怎么做
这些问题在上图中都是抽象的。解释哪些问题需要弄清楚需要花很长时间,我在以前的文章中已经写过了。你可以去看看。
如何基于Spark Streaming构建实时计算平台?
Spark streaming是一个基于Spark的实时计算框架,它扩展了Spark处理大规模流数据的能力。spark流的优点是它可以在1000个节点上以秒延迟运行。
采用基于内存的spark作为执行引擎,具有高效、容错的特点。
可以集成批量处理和spark的交互式查询。
它提供了一个简单的界面,类似于复杂算法的批处理。
正是由于这个原因,spark-streaming受到了很多企业的追捧,在生产项目中得到了广泛的应用,但在使用过程中也存在一些热点问题。
原文的详细解释:https://blog.csdn.net/GitChat/article/details/78050311
大数据实时计算框架 实时流计算框架 大数据flink实时计算方案
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。