kafka生产数据命令日志采集系统flume和kafka有什么区别及联系？

浏览量：2702 时间：2021-03-13 05:16:07 作者：admin

日志采集系统flume和kafka有什么区别及联系？

flume和Kafka的一些功能是相同的，但总的来说，它们是完全不同的；它们的场景是不同的，但它们可以一起使用。

简而言之，flume是一个分布式日志收集系统，它从各种服务器收集日志并将其传输到指定的位置，如HDFS。

Kafka是一个分布式消息中间件，有自己的存储，提供推拉数据访问功能。

整个过程如下：

登录服务器<--flume-->kafka-->hdfs-->离线计算

登录服务器<--flume-->kafka-->storm

希望我的回答能对您有所帮助

基于接收器的实现将使用kakfa的高级消费API。与所有其他接收器一样，接收到的数据将保存到执行器，然后sparkstreaming将启动作业来处理数据。

在默认配置中，如果出现故障，此方法将丢失数据。为了确保零数据丢失，我们需要启用wal（writeaheadlogs）。它将接收到的数据同步保存到分布式文件系统，如HDFS。因此，在发生错误时可以恢复数据。

使用两个步骤：1。添加依赖项：Spark streaming Kafka 2.10-1.3.0

2导入器g.apache.spark. 卡夫卡._

上一篇 unitygradle插件 unity打包安卓卡在gradle

下一篇打印机页眉页脚设置怎么打印每页都有页眉