如何利用flume进行日志采集

news2024/11/23 7:13:04

介绍    

    Apache Flume 是一个分布式、可靠、高可用的日志收集、聚合和传输系统。它常用于将大量日志数据从不同的源(如Web服务器、应用程序、传感器等)收集到中心化的存储或数据处理系统中。

基本概念

  • Agent(代理): Flume 中的基本工作单元,用于数据的采集、传输和处理。
  • Source(数据源): 代理中的组件,负责接收和发送数据到 Flume。
  • Channel(通道): 用于临时存储数据的缓冲区,用于在 Source 和 Sink 之间传输数据。
  • Sink(数据目的地): 代理中的组件,负责将数据传送到指定的目的地,如 HDFS、Kafka es等。

安装步骤

安装和配置 Flume

下载并安装 Apache Flume。从 Apache Flume 官网 下载适用于你环境的版本,并按照官方文档进行安装和配置。

我下载的是flume-v1.11.0版本,下载地址:Apache Download Mirrors

下载完成后上传到服务器的/opt/software目录

1.将 apache-flume-1.11.0-bin.tar.gz 上传到 linux 的/opt/software 目录下

2.解压 apache-flume-1.11.0-bin.tar.gz 
tar -zxf apache-flume-1.11.0-bin.tar.gz

3.修改 apache-flume-1.11.0-bin 的名称为 flume
mv apache-flume-1.11.0-bin flume

4.将 flume/conf 下的 flume-env.sh.template 文件重命名为 flume-env.sh,并配置 flumeenv.sh 文件
mv flume-env.sh.template flume-env.sh

vi flume-env.sh
# 添加java环境变量
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

配置环境变量

vim /etc/profile

#FLUME
export FLUME_HOME=/opt/software/flume
export PATH=$PATH:$FLUME_HOME/bin

source /etc/profile

查看版本:flume-ng version

定义数据流

        创建 Flume 配置文件,定义数据流。这个配置文件描述了数据流的来源、通道和目的地。一个基本的 Flume 配置文件可能包含以下几个关键组件:

  • Source(数据源):定义数据的来源,如日志文件、网络端口、Kafka 等。
  • Channel(通道):定义数据在 Flume 内部的缓冲区,暂存数据,确保可靠地传输。
  • Sink(数据目的地):定义数据的最终目的地,可以是 HDFS、HBase、Kafka 等。
  1. 配置 Source、Channel 和 Sink:

    • 在 Flume 配置文件中配置 Source、Channel 和 Sink。你需要根据你的数据来源和目的地的不同选择合适的 Source、Channel 和 Sink,并配置相关参数。
  2. 启动 Flume Agent:

    • 运行 Flume Agent,并指定 Flume 配置文件。例如:flume-ng agent -n agent_name -c conf -f conf/flume-conf.properties
  3. 监控和管理:

    • 使用 Flume 的监控和管理工具来跟踪数据流、监控性能,并对 Flume 进行管理。
  4. 测试和优化:

    • 测试数据流,确保数据能够按预期采集、传输和存储。根据需要进行优化配置,以提高性能和稳定性。

示例配置文件

   以下是一个简单的 Flume 配置文件示例:

  1. 创建一个flume-agent-conf.yml并写入以下内容

# 定义 agent 名称
agent1.sources = source1
agent1.channels = channel1
agent1.sinks = sink1

# 配置数据源
agent1.sources.source1.type = exec
agent1.sources.source1.command = tail -F /opt/test.log
agent1.sources.source1.channels = channel1

# 配置通道
agent1.channels.channel1.type = memory
agent1.channels.channel1.capacity = 1000
agent1.channels.channel1.transactionCapacity = 100

# 配置数据目的地
agent1.sinks.sink1.type = logger
agent1.sinks.sink1.channel = channel1

上述配置文件定义了一个名叫agent1的实例,数据来源为tail -F /opt/test.log,收集test.log的内容,并且通过sink配置输出到控制台

2.通过命令启动agent

flume-ng agent -n agent1 -c conf -f conf/flume-agent-conf.properties

3.往test.log里写入内容,vi test.log

4.查看agent日志,tail -f flume.log,能够看到以下内容输出,表示log采集成功。

         上面是一个很简单的flume采集示例,其实flume 可以将收集的日志输出到指定的目的地(如 HDFS、HBase、Kafka 等)。要查看已收集的日志,需要前往 Flume 配置文件中指定的输出目的地(sink),并使用相应的工具或方式来访问这些日志。

        例如,如果 Flume 配置将日志输出到 HDFS 中,可以使用 Hadoop 命令来查看或下载这些日志。如果将日志发送到 Kafka,则可以使用 Kafka 相关的命令或工具来消费这些消息。

   根据你的具体需求和环境配置更复杂的 Flume 配置文件,并确保理解每个组件的作用和配置参数的含义。 Flume 提供了丰富的 Source、Channel 和 Sink 类型以及各种配置选项,可以根据实际场景选择适合的组件和配置。

Flume 的常用组件

  • Avro Source: 从 Avro 格式数据源接收数据。
  • File Source: 从文件系统中的文件接收数据。
  • Memory Channel: 在内存中存储事件的通道。
  • HDFS Sink: 将数据写入 HDFS 目标的 Sink。

注意事项

  • 通道容量和事务容量的调整:根据需要调整 Flume 通道的容量和事务容量,确保适应大型数据的传输。
  • 合理配置 Source 和 Sink:根据实际情况选择合适的 Source 和 Sink 类型。
  • 数据格式正确性:确保发送到 Flume 的数据符合所需的格式,以避免消息被截断。

结语

        Apache Flume 是一个强大的数据收集和传输工具,可以轻松地处理大量的数据流。使用本文提供的示例和概念,可以开始使用 Flume 并适应不同的数据采集和传输需求。本篇文章就介绍到这里,感兴趣的同学可以自己去深入研究,使用flume完成日志采集、关键字告警等一整套的业务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1333501.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【JAVA面试题】什么是引用传递?什么是值传递?

🍎个人博客:个人主页 🏆个人专栏: JAVA ⛳️ 功不唐捐,玉汝于成 前言 博客的正文部分可以详细介绍Java中参数传递的机制,强调Java是按值传递的,并解释了基本数据类型和对象引用在这种传…

【FPGA】分享一些FPGA视频图像处理相关的书籍

在做FPGA工程师的这些年,买过好多书,也看过好多书,分享一下。 后续会慢慢的补充书评。 【FPGA】分享一些FPGA入门学习的书籍【FPGA】分享一些FPGA协同MATLAB开发的书籍 【FPGA】分享一些FPGA视频图像处理相关的书籍 【FPGA】分享一些FPGA高速…

每次maven刷新jdk都要重新设置

pom.xml <java.version>17</java.version> 改为<java.version>1.8</java.version>

【BBuf的CUDA笔记】十,Linear Attention的cuda kernel实现解析

欢迎来 https://github.com/BBuf/how-to-optim-algorithm-in-cuda 踩一踩。 0x0. 问题引入 Linear Attention的论文如下&#xff1a; Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention&#xff1a;https://arxiv.org/pdf/2006.16236.pdf 。官方…

WPF中DataContext的绑定技巧-粉丝专栏

&#xff08;关注博主后&#xff0c;在“粉丝专栏”&#xff0c;可免费阅读此文&#xff09; 先看效果&#xff1a; 上面的绑定值都是我们自定义的属性&#xff0c;有了以上的提示&#xff0c;那么我们可以轻松绑定字段&#xff0c;再也不用担心错误了。附带源码。 …

Python学习路线 - Python语言基础入门 - Python基础综合案例 - 数据可视化 - 地图可视化

Python学习路线 - Python语言基础入门 - Python基础综合案例 - 数据可视化 - 地图可视化 基础地图使用基础地图演示基础地图演示 - 视觉映射器 疫情地图-国内疫情地图案例效果数据整理 疫情地图-省级疫情地图省疫情地图 基础地图使用 基础地图演示 代码示例&#xff1a; &quo…

【c++、数据结构课设】哈夫曼树

时间过的真快&#xff0c;转眼之间一个学期即将结束&#xff0c;想必这个时候大家都在准备各科的课设作业&#xff0c;本期内容是我的数据结构课设&#xff0c;希望能给大家带来帮助&#xff0c;如果有任何不足或需要改进的地方&#xff0c;欢迎各位提出宝贵的意见。 屏幕录制2…

2023年12月24日学习总结

今日to do list&#xff1a; 做kaggle上面的流量预测项目☠️ 学习时不刷手机&#x1f921; okkkkkkkkkkkkkk 开始&#x1f44d;&#x1f34e; 0、我在干什么&#xff1f; 我在预测一个名字叫做elborn基站的下行链路流量&#xff0c;用过去29天的数据预测未来10天的数据 1、…

Json和Xml

一、前言 学习心得&#xff1a;C# 入门经典第8版书中的第21章《Json和Xml》 二、Xml的介绍 Xml的含义&#xff1a; 可标记性语言&#xff0c;它将数据以一种特别简单文本格式储存。让所有人和几乎所有的计算机都能理解。 XML文件示例&#xff1a; <?xml version"1.…

HarmonyOS - 基础组件绘制

文章目录 所有组件开发 tipsBlankTextImageTextInputButtonLoadingProgress 本文改编自&#xff1a;<HarmonyOS第一课>从简单的页面开始 https://developer.huawei.com/consumer/cn/training/course/slightMooc/C101667360160710997 所有组件 在 macOS 上&#xff0c;组…

原来电脑并不需要重装系统才能恢复出厂设置,这个操作学起来!

前言 小伙伴们应该都知道手机上有恢复出厂设置的功能&#xff0c;如果想要把手机送给朋友或者卖给别人&#xff0c;就会先恢复出厂设置。 但换到Windows电脑上之后&#xff0c;如果出现同样的情况&#xff0c;就会第一时间想到重装系统。就好像Windows电脑上不存在恢复出厂设…

顶级旗舰ET9出道,蔚来还是那个「最不计成本」的中国车品牌

作者 |张祥威 编辑 |德新 2008年&#xff0c;李斌和新浪的曹国伟几人一起喝酒&#xff0c;发了第一条微博&#xff0c;「天冷带围巾&#xff0c;心冷发微博」&#xff0c;一晚上涨了2000多个粉丝&#xff0c;他偶尔还会针砭时事&#xff0c;很快积累了最早一波粉丝。 创立蔚来…

[Linux] Mysql数据库中的用户管理与授权

一、登录用户的管理 1.1 查看用户密码的信息 用户信息存放在 mysql 数据库下的 user 表&#xff08;MySQL 服务下存在一个系统自带的 mysql 数据库&#xff09;。 use mysql ; show tables; desc user; 查看密码信息的命令&#xff1a; 能看到密码信息&#xff1a;是经过加…

Python入门学习篇(七)——列表切片字符串切片

1 列表切片 1.1 语法结构 列表的变量名[start:end:step] """ start表示截取的开始位置(下标从0 开始)&#xff0c;不填是默认是0 end截取的最后一个元素位置1, 不填是截取到最后一个元素 step 每隔几个(step-1)去获取值,默认没填时,step值为1 因而 取值范围为…

ROS2 学习09--ros 中的通信接口的定义以及如何创建自定义msg、srv和action文件

在ROS系统中&#xff0c;无论话题还是服务&#xff0c;或者我们后续将要学习的动作&#xff0c;都会用到一个重要的概念——通信接口。 通信并不是一个人自言自语&#xff0c;而是两个甚至更多个人&#xff0c;你来我往的交流&#xff0c;交流的内容是什么呢&#xff1f;为了让…

PCIe surprise down异常与DPC功能分析-part1

在PCIe系统中&#xff0c;多个设备通过PCIe链路连接在一起&#xff0c;形成一个复杂的互连网络。这些设备可能包括CPU、GPU、网卡、存储控制器等。由于PCIe是一种高速、低延迟的总线标准&#xff0c;任何设备故障或错误都可能迅速传播到整个系统&#xff0c;导致数据损坏、系统…

基于Java (spring-boot)的仓库管理系统

一、项目介绍 本系统的使用者一共有系统管理员、仓库管理员和普通用户这3种角色: 1.系统管理员&#xff1a;通过登录系统后&#xff0c;可以进行管理员和用户信息的管理、仓库和物品分类的管理&#xff0c;以及操作日志的查询&#xff0c;具有全面的系统管理权限。 2.仓库管理…

labelme标注的json文件数据转成coco数据集格式(可处理目标框和实例分割)

这里主要是搬运一下能找到的 labelme标注的json文件数据转成coco数据集格式&#xff08;可处理目标框和实例分割&#xff09;的代码&#xff0c;以供需要时参考和提供相关帮助。 1、官方labelme实现 如下是labelme官方网址&#xff0c;提供了源代码&#xff0c;以及相关使用方…

【数据保护】数据匿名的自定义NLP方法

自我介绍 做一个简单介绍&#xff0c;酒架年近48 &#xff0c;有20多年IT工作经历&#xff0c;目前在一家500强做企业架构&#xff0e;因为工作需要&#xff0c;另外也因为兴趣涉猎比较广&#xff0c;为了自己学习建立了三个博客&#xff0c;分别是【全球IT瞭望】&#xff0c;【…

Android画布Canvas裁剪clipRect,Kotlin

Android画布Canvas裁剪clipRect&#xff0c;Kotlin private fun mydraw() {val originBmp BitmapFactory.decodeResource(resources, R.mipmap.pic).copy(Bitmap.Config.ARGB_8888, true)val newBmp Bitmap.createBitmap(originBmp.width, originBmp.height, Bitmap.Config.A…