2016 - 2024

感恩一路有你

kafka多个生产者同时生产 日志采集系统flume和kafka有什么区别及联系?

浏览量:1991 时间:2021-03-16 16:22:38 作者:admin

日志采集系统flume和kafka有什么区别及联系?

Flume和Kafka有一部分功能是相同的,但是整体来看,两者的差别还是很大的;它们使用的场景有所不同,但是可以相互配合使用。


Flume

简单的说,Flume是分布式日志收集系统,它把各个服务器上的日志收集起来,传送到制定的地方,比如传送到HDFS中。

Kafka

Kafka的定位是分布式消息中间件,自带存储,提供push和pull存取数据功能。


使用场景

在实际应用中,系统实时产生的日志需要最后进入HDFS,但是生产上的日志数量会有波动,比如由于访问量的增加,导致突然之间产生大量的日志,这时候可能会导致日志写入HDFS失败,所以这时候可以先把日志数据写入到Kafka中,再由Kafka导入到HDFS中。

总结:在日志采集系统中,把Kafka当做日志缓存更加合适,Flume做数据采集,因为它可以定制很多数据源,减少开发量,所以Flume和Kafka可以配合起来一起工作。

整体的流程是这样的:

服务器上的日志<--Flume-->Kafka-->HDFS-->离线计算

服务器上的日志<--Flume-->Kafka-->Storm


希望我的回答能够帮助到你!

kafka基本概念介绍?

消息中间件,主要是起到一个缓冲承接数据并且保证数据不丢的作用,在实时计算中一般会用到,安装了kafka的程序可以叫broker,kafka的重要角色生产者和消费者,kafka中如果分区数量大于1,分区中角色又分leader和follwer,leader负责读写,follwer负责同步数据,面试中经常会被问到kafka为什么吞吐量这么大,一是多个分区并行执行,二是顺序写磁盘,三是操作系统级别的缓存

如何搭建kafka?该如何学习kafka?

百度 一大堆

kafka多个生产者同时生产 kafka消费者 poll阻塞 kafka生产者消息确认

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。