Flume三种组件的选择对比

Flume三种组件的选择对比

news2025/2/21 19:40:01

文章目录

- 1.source
- 2.channel
- 3.sink

1.source

Source: 数据源:通过source组件可以指定让Flume读取哪里的数据，然后将数据传递给后面的 channel
Flume内置支持读取很多种数据源，基于文件、基于目录、基于TCP\UDP端口、基于HTTP、Kafka的等等、当然了，如果这里面没有你喜欢的，他也是支持自定义的

1.taildir source： 实时读取文件数据，并且支持断点续传

2.avro source: Flume之间互相进行数据传输一般配合avro sink使用

3.nc source: 接收网络端口的

4.exec source: 监控文件，不支持断点续传

5.spooling source: 监控文件夹，支持断点续传，传输进去一个写好的文件，丢进来是什么样就传输出去（时效性差）

6.kafka source: 读取kafka中的数据

2.channel

接受Source发出的数据，可以把channel理解为一个临时存储数据的管道
Channel的类型有很多:内存、文件，内存+文件、JDBC等

1.file channel：

慢，基于磁盘，但可以优化，有一个索引（在内存中）机制，从随机读写，到指定位置读写，索引也会备份到磁盘中，也可以进行二次备份

2.memory channel：

优点是效率高，因为就不涉及磁盘IO
缺点有两个
1:可能会丢数据，如果Flume的agent挂了，那么channel中的数据就丢失了。
2:内存是有限的，会存在内存不够用的情况

3.kafka channel: 数据存储在kafka集群

将数据发送到kafka消息队列中，这个也是比较常见的，主要针对实时计算场景，数据不落盘，实时传输，最后使用实时计算框架直接处理。

①结合source和sink使用

②结合source 和拦截器直接将数据写入到kafka中

③直接使用kafka channel结合sink使用

3.sink

从Channel中读取数据并存储到指定目的地
Sink的表现形式有很多:打印到控制台、HDFS、Kafka等，

1.hdfs sink

将数据传输到HDFS中，这个是比较常见的，主要针对离线计算的场景

2.kafka sink

将数据发送到kafka消息队列中，这个也是比较常见的，主要针对实时计算场景，数据不落盘，实时传输，最后使用实时计算框架直接处理。

3.avro sink

用于多个flume之间的信息传递

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/372350.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于Windows下离线安装当前最新Arduino ESP32 SDK（2.0.7）固件开发包

基于Windows下离线安装当前最新Arduino ESP32 SDK（2.0.7）固件开发包

基于Windows下离线安装当前最新Arduino ESP32 SDK（2.0.7）固件开发包✨写这篇的文章的初衷，是由于在前几天想通过离线一键安装包方式实现升级安装，结果发现解压后，可以找到开发板，但是无法上传代码&#xff…

阅读更多...

JavaSe第3次笔记

JavaSe第3次笔记

1.String str "hello";字符串类型。 2.两个字符串类型相加意思是拼接，类似于c语言里面的strcat函数。 3.整型变成字符串类型: int a 10; String str String. valueOf(a); 4.当字符串和其他类型进行相加的时候，结果就是字符串。(不完全…

阅读更多...

imporve-3

imporve-3

JSX语法糖本质 JSX是语法糖，通过babel转成React.createElement函数，在babel官网上可以在线把JSX转成React的JS语法首先解析出来的话，就是一个createElement函数然后这个函数执行完后，会返回一个vnode通过vdom的patch或者是其他的…

阅读更多...

Java基础--IO操作

Java基础--IO操作

一、IO原理及分类一、IO原理 1、I/O是Input/Output的缩写，I/O技术是非常实用的技术，用于处理设备之间的数据传输，如读写文件，网络通信等。 2、java程序中对于数据的输入/输出操作一般都是以流的方式进行 3、java.io包下提供各…

阅读更多...

【LeetCode】剑指 Offer（9）

【LeetCode】剑指 Offer（9）

目录题目：剑指 Offer 25. 合并两个排序的链表 - 力扣（Leetcode） 题目的接口： 解题思路： 代码： 过啦！！！ 题目：剑指 Offer 26. 树的子结构 - 力扣&#…

阅读更多...

阿里测试经验7年，从功能测试到自动化测试，我整理的超全学习指南

阿里测试经验7年，从功能测试到自动化测试，我整理的超全学习指南

做测试七年多，有不少人问过我下面问题： 现在的手工测试真的不行了吗？ 测试工程师，三年多快四年的经验，入门自动化测试需要多久？ 自学自动化测试到底需要学哪些东西？ 不得不说，随着…

阅读更多...

TCKGE: Transformers with contrastive learning for knowledge graph embedding

TCKGE: Transformers with contrastive learning for knowledge graph embedding

概述： 以前的一些知识图谱嵌入方法由于其浅层的网络结构，不能解决复杂的多关系知识图谱。因此文中针对此种现象，提出了TCKGE——针对于学习多关系知识图谱中复杂的语义信息。TCKGE能够有效的捕获知识图谱中丰富的语义信息，其利用了…

阅读更多...

论文阅读_DALLE-2的unCLIP模型

论文阅读_DALLE-2的unCLIP模型

论文信息 name_en: Hierarchical Text-Conditional Image Generation with CLIP Latents name_ch: 利用CLIP的层次化文本条件图像生成 paper_addr: http://arxiv.org/abs/2204.06125 doi: 10.48550/arXiv.2204.06125 date_read: 2023-02-12 date_publish: 2022-04-12 tags: [‘…

阅读更多...

【CSS】CSS 层叠样式表 ③ ( CSS 引入方式 - 外链式 | CSS 样式规则 )

【CSS】CSS 层叠样式表 ③ ( CSS 引入方式 - 外链式 | CSS 样式规则 )

文章目录一、CSS 引入方式 - 外链式1、外链式 CSS 语法2、CSS 代码3、HTML 代码二、CSS 样式规则一、CSS 引入方式 - 外链式 1、外链式 CSS 语法将 CSS 代码写在外部的 xxx.css 外部样式表文件中 , 然后在 HTML 的 head 标签中 , 使用 <head> <link rel"sty…

阅读更多...

JavaSE学习笔记day15

JavaSE学习笔记day15

零、复习昨日 HashSet 不允许重复元素,无序 HashSet去重原理: 先比较hashcode,如果hashcode不一致,直接存储如果hashcode值一样,再比较equals如果equals值为true,则认为完全一样,不存储即去重否则存储如果使用的是空参构造创建出的TreeSet集合,那么它底层使用的就是自然排序,…

阅读更多...

_improve-1

_improve-1

类型及检测方式 1. JS内置类型 JavaScript 的数据类型有下图所示其中，前 7 种类型为基础类型，最后 1 种（Object）为引用类型，也是你需要重点关注的，因为它在日常工作中是使用得最频繁，也是需要…

阅读更多...

C/C++每日一练(20230226)

C/C++每日一练(20230226)

目录 17. 电话号码的字母组合 37. 解数独 51. N 皇后 52. N皇后 II 89. 格雷编码 90. 子集 II 17. 电话号码的字母组合给定一个仅包含数字 2-9 的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电…

阅读更多...

java spring AOP 完全注解开发

java spring AOP 完全注解开发

我们先创建一个项目然后引入java spring aop的依赖然后在src下创建目录我这里直接就叫 Aop了下面创建一个User类参考代码如下 package Aop;import org.springframework.stereotype.Component;Component public class User {public void add(){System.out.println(&qu…

阅读更多...

Allegro如何锁定报表界面操作指导

Allegro如何锁定报表界面操作指导

Allegro如何锁定报表界面操作指导用Allegro做PCB设计的时候，进行测量的时候，比如测量器件两个PIN中间的间距，如下图，会有一个报表显示但是当运行下一个命令的时候，报表会被自动关闭掉。但是有时我们需要报表界面仍被保留下面介绍如何将报表界面进行锁定，不受下一个…

阅读更多...

新氧2023年财务业绩预测：退市风险大幅降低，收入增长将放缓

新氧2023年财务业绩预测：退市风险大幅降低，收入增长将放缓

来源：猛兽财经作者：猛兽财经公司进展与新氧（SY）有关的两个重要积极进展值得一提。第一个积极进展是新氧的退市风险已在很大程度上降低。 2023年1月6日，新氧披露，它已经“重新符合纳斯达克规定的股价每…

阅读更多...

AIR32F103(九) CAN总线的通信和ID过滤机制及实例

AIR32F103(九) CAN总线的通信和ID过滤机制及实例

目录 AIR32F103(一) 合宙AIR32F103CBT6开发板上手报告AIR32F103(二) Linux环境和LibOpenCM3项目模板AIR32F103(三) Linux环境基于标准外设库的项目模板AIR32F103(四) 27倍频216MHz,CoreMark跑分测试AIR32F103(五) FreeRTOSv202112核心库的集成和示例代码AIR32F103(六) ADC,I2S…

阅读更多...

Zookeeper完全分布式集群服务

Zookeeper完全分布式集群服务

准备好3台服务器:[x]A-> centos7s:192.168.19.1[x]B-> centos7_1:192.168.19.2[x]C-> centos7_2:192.168.19.3配置Zookeeper安装目录在3台宿主机配置zookeeper安装目录：/docker/develop/zookeeper并且在文件夹创建 data 和logs 目录：mkdir -p /…

阅读更多...

STM32Cube串口USART发送接收数据

STM32Cube串口USART发送接收数据

本文代码使用 HAL 库。文章目录前言一、USART 同步/异步串行接收/发送器二、USART 原理图三、CubeMX 创建工程四、usart.c 文件解析五，设计实验：在串口输入字符点亮led实验现象：总结前言这篇文章介绍实现 USART 异步模式下通过串口助手…

阅读更多...

去了字节跳动，才知道年薪40W的测试居然有这么多？

去了字节跳动，才知道年薪40W的测试居然有这么多？

今年大环境不好，内卷的厉害，薪资待遇好的工作机会更是难得。最近脉脉职言区有一条讨论火了： 哪家互联网公司薪资最‘厉害’？ 下面的评论多为字节跳动，还炸出了很多年薪40W的测试工程师我只想问一句，现在的…

阅读更多...

【设计模式】观察者模式介绍及C代码实现

【设计模式】观察者模式介绍及C代码实现

【设计模式】观察者模式介绍及C代码实现背景在软件构建过程中，我们需要为某些对象建立一种“通知依赖关系”，即一个对象（目标对象）的状态发生改变，所有的依赖对象（观察者对象）都将得到通知。…

阅读更多...

推荐文章

最新文章