Linux的tail,grep,sed命令总结,以使用上述三种命令获取日志信息为例

news2024/9/17 7:40:58

目录

  • tail命令
    • 语法说明
    • 基本参数
    • 命令举例
  • grep命令
    • 语法说明
    • 匹配模式选择
    • 杂项
    • 输入控制
    • 文件控制
  • sed命令
    • 语法格式
    • 举例
  • 使用命令组合查询日志信息

业务需求需要对软件日志进行查询和呈现,查询的条件是时间区间和关键词,系统运行在linux环境下,为此对tail、grep、sed命令进行了基本的学习,现做一个总结。

tail命令

语法说明

Usage: tail [OPTION]... [FILE]...
Print the last 10 lines of each FILE to standard output.
With more than one FILE, precede each with a header giving the file name.
With no FILE, or when FILE is -, read standard input.

上述语法说明是通过tail --help输出的内容,解释起来是默认输出10文件末尾或者标准输入的末尾10行内容。如果有多个文件,请在每个文件之前加一个提供文件名的标头。,如果没有文件或者文件为-那么久会读取标准输入。

基本参数

-c, --bytes=K            output the last K bytes; or use -c +K to output
                         bytes starting with the Kth of each file
                         # 从读取文件或者标准输入的末尾k字节,或者使用-c +k
          				 # 的形式读取第k字节处的数据    
-f, --follow[={name|descriptor}]
                         output appended data as the file grows;
                         an absent option argument means 'descriptor'
                         #等同于--follow=descriptor
                         #该参数会实时读取文件状态,输入crtl + c退出,默认实时读取
                         #末尾10行,当文件删除时停止读取
-F                       same as --follow=name --retry
						 #等同于--follow=name --retry,该参数会实时读取指定文件,默认
						 #10行,当文件删除时不会停止,直到文件重新创建时重新继续读取。
-n, --lines=K            output the last K lines, instead of the last 10;
                         or use -n +K to output starting with the Kth
                         # -n k 参数表示输出文件末尾k行数据,如果使用+k则从头开始输出k行
    --max-unchanged-stats=N
                           with --follow=name, reopen a FILE which has not
                           changed size after N (default 5) iterations
                           to see if it has been unlinked or renamed
                           (this is the usual case of rotated log files);
                           with inotify, this option is rarely useful
                           #这个参数大概意思应该是,配合-f使用,然后默认会迭代5次,也就是
                           #查询5次文件的更新情况。
    --pid=PID            with -f, terminate after process ID, PID dies
    					#当指定的进程号终止后,进程结束,配合f使用,我的理解是当用tail -f
    					#实时读取文件数据时,指定了pid,如果该pid对应进程终止了,则读取结束。
-q, --quiet, --silent    never output headers giving file names
						#当有多个文件参数时,不输出各个文件名
    --retry              keep trying to open a file if it is inaccessible
    					#当tail打开命令文件时,文件不可修改和访问,与-f结合使用
-s, --sleep-interval=N   with -f, sleep for approximately N seconds
                         (default 1.0) between iterations;
                         with inotify and --pid=P, check process P at
                         least once every N seconds
                         #和-f一起使用时,睡眠大约N秒(默认值为1.0);
                         #在inotify和--pid=P的情况下,检查进程P至少每N秒一次
-v, --verbose            always output headers giving file names
						 # 总是输出文件的文件名
    --help     display this help and exit
    --version  output version information and exit

命令举例

这里举例使用mysql的日志文件mysqld.log为例
默认读取文件或者标准输入末尾10行或任意行数

tail 10 mysqld.log 或 tail -n 10 mysqld.log

直接不输入数字和其他参数,则默认查询文件的末尾10行,同样也可以使用参数-n,数字选择10或者其他数字,查询文件末尾行数,命令如下,我查询时结合grep -n '' mysql.log来输出文件行号,让大家更直观的看到查询的行号。grep中的--color=always会将查询到的且匹配的结果高亮显示。关于grep下面的内容会写。
在这里插入图片描述
实时读取文件数据

tail -f mysqld.log

该参数可以实时查询文件,默认查询末尾10行,可以组合使用-n k来实时查询文件末尾行数,当文件被删除时停止。如下图所示。
在这里插入图片描述

tail -F mysqld.log

该参数可以实时查询文件,默认查询末尾10行,可以组合使用-n k来实时查询文件末尾行数,当文件被删除时不会停止,直至文件被重新创建后继续读取,crtl+c停止读取。如下图所示。
在这里插入图片描述
输出时总是输出文件的标头(文件名)

tail -v test.log

在这里插入图片描述

grep命令

grep命令是linux中一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
grep的命令是做文本匹配的,不会影响源文件的内容。多用于组合查询。

语法说明

Usage: grep [OPTION]... PATTERN [FILE]...
Search for PATTERN in each FILE or standard input.
PATTERN is, by default, a basic regular expression (BRE).
Example: grep -i 'hello world' menu.h main.c

上面的语法说明是使用grep --help打印出来的。其实就是在每个文件和标准输入找查找与pattern相匹配的内容,pattern默认是一个基本的正则表达式。例如grep -i 'hello world' menu.h main.c命令将会在menu.h和main.c两个文件中查找和hello world匹配的行并输出,-i表示不区分大小写,即HELLO world也是符合查询结果的。

匹配模式选择

 -E, --extended-regexp     扩展正则表达式egrep
 -F, --fixed-strings       一个换行符分隔的字符串的集合fgrep
 -G, --basic-regexp        基本正则
 -P, --perl-regexp         调用的perl正则
 -e, --regexp=PATTERN      后面根正则模式,默认无
 -f, --file=FILE           从文件中获得匹配模式
 **-i, --ignore-case         不区分大小写**
 -w, --word-regexp         匹配整个单词
 -x, --line-regexp         匹配整行
 -z, --null-data           一个 0 字节的数据行,但不是空行

上面的匹配模式种,比较重要和常用的是-i,命令为grep -i pattern filepath,该命令能够不区分匹配的大小写
在这里插入图片描述
我这里日志文件内容太多,所以使用了一个grep进行匹配后再使用一个grep进行查询演示,减少输出数量。

杂项

 -s, --no-messages         不显示错误信息
 **-v, --invert-match        显示不匹配的行**
 -V, --version             显示版本号
 --help                    显示帮助信息
 --mmap                use memory-mapped input if possible

杂项中比较常用的是-v,使用命令 grep -v pattern filepath,能够将不匹配的行输出
在这里插入图片描述

输入控制

 -m, --max-count=NUM       匹配的最大数
 -b, --byte-offset         打印匹配行前面打印该行所在的块号码。
 **-n, --line-number         显示的加上匹配所在的行号**
 --line-buffered           刷新输出每一行
 -H, --with-filename       当搜索多个文件时,显示匹配文件名前缀
 -h, --no-filename         当搜索多个文件时,不显示匹配文件名前缀
 --label=LABEL            print LABEL as filename for standard input
 **-o, --only-matching       只显示一行中匹配PATTERN 的部分**
 -q, --quiet, --silent      不显示任何东西
 --binary-files=TYPE   假定二进制文件的TYPE 类型;
                                      TYPE 可以是`binary', `text', 或`without-match'
 -a, --text                匹配二进制的东西
 -I                        不匹配二进制的东西
 -d, --directories=ACTION  目录操作,读取,递归,跳过
 -D, --devices=ACTION      设置对设备,FIFO,管道的操作,读取,跳过
 **-R, -r, --recursive       递归调用**
 --include=PATTERN     只查找匹配FILE_PATTERN 的文件
 --exclude=PATTERN     跳过匹配FILE_PATTERN 的文件和目录
 --exclude-from=FILE   跳过所有除FILE 以外的文件
 -L, --files-without-match 匹配多个文件时,显示不匹配的文件名
 **-l, --files-with-matches  匹配多个文件时,显示匹配的文件名**
 **-c, --count               显示匹配的行数**
 -Z, --null                在FILE 文件最后打印空字符

其中重要的分别是:
-n, --line-number 显示的加上匹配所在的行号
-o, --only-matching 只显示一行中匹配PATTERN 的部分
-R, -r, --recursive 递归调用
-l, --files-with-matches 匹配多个文件时,显示匹配的文件名
-c, --count 显示匹配的行数

  1. grep -o pattern filename 能够获取与pattern相匹配的内容,一般与正则表达式一起用。只输出匹配成功的内容。如图所示的比对情况。
    在这里插入图片描述
  2. grep -r pattern foldername 当查询的是目录时,就必须带入-r或者-R,用于目录的递归查询。如果不带r就无法递归查询。
    在这里插入图片描述
  3. grep -l pattern [filename1 filename2] 当要查询多个文件,或者递归查询的时候,可以用-l来找到与字符相匹配的文件名,如下
    在这里插入图片描述
  4. grep -c pattern filename 使用-c会返回与pattern相匹配的文本行数
    在这里插入图片描述
  5. grep -n pattern filename 返回匹配的行时也会返回其对应的行号
    在这里插入图片描述

文件控制

 -B, --before-context=NUM  打印匹配本身以及前面的几个行由NUM控制
 -A, --after-context=NUM   打印匹配本身以及随后的几个行由NUM控制
 -C, --context=NUM         打印匹配本身以及随后,前面的几个行由NUM控制
 -NUM                      根-C的用法一样的
 --color[=WHEN],
 --colour[=WHEN]       使用标志高亮匹配字串;

 -U, --binary               使用标志高亮匹配字串;
 -u, --unix-byte-offsets   当CR 字符不存在,报告字节偏移(MSDOS 模式)
  1. grep -B1 pattern filename
    表示查询到与pattern的行后再打印匹配行的前面若干行,这里写1则表示输入前1行。
    在这里插入图片描述
    如上图可以看到输出了匹配行的前3行,同理,-A命令就是输出匹配行的后面若干行,-C就是输入匹配行的前后各若干行。
  2. grep --color=[always,auto,nerver] pattern filename
    表示对匹配到的行的匹配文本是否高亮显示,有三种选择,大致如下
    在这里插入图片描述

综上差不多是grep基本的使用方法,grep很灵活,一般都是与其他查询组合使用,这里如果单独使用grep进行日志查询的,我建议查询的匹配条件是到日期过,因为没法查询区间,所以很难匹配到想要的结果,只能按照日期来找到当天或者某一天的结果,然后查询日志。

grep -n '2023-05-18' logs.log

也可以查询到当前日期的日志信息后,再结合关键词查询相应日志信息

grep -n '2023-05-18' logs.log | grep -i '关键词'

sed命令

语法格式

Usage: sed [OPTION]... {script-only-if-no-other-script} [input-file]...

上面的语法格式是使用sed --help输出来的。sed [选项] '[动作]' 文件名

-n, --quiet, --silent
                 suppress automatic printing of pattern space
                 #使用-n会只返回匹配的行或者说只返回符合匹配条件的行
-e script, --expression=script
                 add the script to the commands to be executed
                 #使用-e可以执行多个动作,但是每个动作之间要用;分割
-f script-file, --file=script-file
                 add the contents of script-file to the commands to be executed
                 #从 sed 脚本中读入 sed 操作
--follow-symlinks
                 follow symlinks when processing in place
-i[SUFFIX], --in-place[=SUFFIX]
                 edit files in place (makes backup if SUFFIX supplied)
                 #在文件中进行编辑,编辑时将命令放在插入字符串开头。
                 #常用命令:   
    			#a:追加  向匹配行后面插入内容
    			#c:更改  更改匹配行的内容
    			#i:插入  向匹配行前插入内容
    			#d:删除  删除匹配的内容
    			#s:替换  替换掉匹配的内容
    			#p:打印  打印出匹配的内容,通常与-n选项和用
    		 #例如:sed -i 'atest' test.log 表示在匹配行后追加一test
-c, --copy
                 use copy instead of rename when shuffling files in -i mode
                 #不直接改写文件,复制的模式
-b, --binary
                 does nothing; for compatibility with WIN32/CYGWIN/MSDOS/EMX (
                 open files in binary mode (CR+LFs are not treated specially))
                 #匹配二进制
-l N, --line-length=N
                 specify the desired line-wrap length for the `l' command
--posix
                 disable all GNU extensions.
-r, --regexp-extended
                 use extended regular expressions in the script.
                 #使用正则表达式
-s, --separate
                 consider files as separate rather than as a single continuous
                 long stream.
-u, --unbuffered
                 load minimal amounts of data from the input files and flush
                 the output buffers more often
-z, --null-data
                 separate lines by NUL characters
--help
                 display this help and exit
--version
                 output version information and exit

举例

输出匹配的行

sed -n '/第一次/p' test.log

使用-n参数只会返回匹配到的行,如果不加-n则会返回所有行,因为sed是会将整个数据读到缓存里去比对的,所以其实它吧所有数据都比对过了,不加-n也就吧所有比对过的数据都输出。还有就是/表示数据未完结,/p表示数据结束,上面的代码语句查询文本中包含‘第一次’的记录,命令使用如下图
在这里插入图片描述

sed -n '2p' test.log

输出第二行匹配的内容
在这里插入图片描述

sed -n '1,3p' test.log #输出1~3行数据
sed -n '1,8{1~3p}' test.log #花括号里的1表示在后面3行里面的第几行,输出1~8行中,3行为1块,每1块中的第1行
sed -n '1,8{1~2p}' test.log #1~8行中切块,每块2行,输出每行中的第1行,即输出奇数,其他的举一反三

在这里插入图片描述

sed -n '3,+5p' test.log #从第3行开始输出,输出5行
sed -n '3,$p' test.log #从第3行开始输出,直到文件结尾。

在这里插入图片描述
执行多个动作脚本

sed -e '/第一次/p;/第三次/p' test.log

使用-e时,有多个动作脚本就要冒号分开。
在这里插入图片描述

这篇博客写的比较详细:https://blog.csdn.net/a1158321146/article/details/123532275

使用命令组合查询日志信息

首先要查询日志信息,想grep和sed都能查询日志,可以有以下几种方式
mysqld.log日志格式
在这里插入图片描述
假设需求要查某一天的日志,可以有如下方法

grep -n --color=auto '2023-05-06T' mysqld.log #查询2023-05-06日的全天日志
grep -n --color=auto '2023-05-06T0[5-9]' mysqld.log #查询05点到09点的日志
sed -n '/2023-05-06T/p' mysqld.log #查询2023-05-06日的全天日志
sed -en '/2023-05-05T/p,/2023-05-06T/p' mysqld.log #查询05-05和05-06之间的数据。

其实综上,主要是对一个文本匹配的处理,真正想要实现日志的具体时间段读取,还是要通过后端代码的处理,而且不同软件日志格式不一样,可以用python的循环和文本匹配之类的操作对读出来的大概范围内的日志进行处理,比对时间大小,然后返回给客户端。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/544377.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

阿里巴巴“高并发”核心笔记!《基础+实战+源码+面试+架构》

前言 作为一个普普通通的程序员,如何才能提升自己的能力,在职场上拥有一技之长,这也成为普通的你我,迫切的需求。 拥有什么样的能力才能不被淘汰?答案是:高并发,它几乎成为了每个程序员都想要…

ATTCK v13版本战术介绍——防御规避(六)

一、引言 在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化、提权战术理论知识及实战研究、部分防御规避战术,本期我们为大家介绍ATT&CK 14项战术中防御规避战术第31-36种子技术,后续会介绍防御规避其他子技术&#xf…

还只是停留在听过KMP算法?保姆式分析让你吃透KMP算法

💕成功不是将来才有的,而是从决定去做的那一刻起,持续积累而成。💕 🐼作者:不能再留遗憾了🐼 🎆专栏:Java学习🎆 🚗本文章主要内容:深…

腾讯云,物联网开发平台产品,动态注册步骤

1. 下载后解压,qcloud_iot_mqtt_sign-master.zip GitHub - tencentyun/qcloud_iot_mqtt_signContribute to tencentyun/qcloud_iot_mqtt_sign development by creating an account on GitHub.https://github.com/tencentyun/qcloud_iot_mqtt_sign 2. 按照readme文…

图像噪声类型:椒盐噪声,随机噪声,高斯噪声,泊松噪声,异方差高斯噪声模型和参数估计

文章目录 noise type1. 高斯噪声和泊松噪声2. 高斯分布和泊松分布的差异:3. 异方差高斯 噪声模型(泊松和高斯噪声混合)4. 几种噪声模型5. 信噪比 SNR的计算方法是6. Practical Poissonian-Gaussian noise modeling and fitting for single-im…

【嵌入式烧录刷写文件】-2.4-移动Intel Hex中指定地址范围内的数据

案例背景(共5页精讲): 有如下一段Hex文件,将源地址范围0x9100-0x9104中数据,移动至一个“空的,未填充的”目标地址范围0xA000-0xA004。 :2091000058595A5B5C5D5E5F606162636465666768696A6B6C6D6E6F70717…

Cube Map 系列之:手把手教你 实现天空盒(Sky Box)

什么是天空盒 An skybox is a box with textures on it to look like the sky in all directions or rather to look like what is very far away including the horizon.天空盒是一个使用纹理贴图构建的盒子,人在其中朝任何一个方向看去,其纹理彷佛天空…

Java版本企业工程管理系统软件源码 自主研发,工程行业适用

Java版工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离 功能清单如下: 首页 工作台:待办工作、消息通知、预警信息,点击可进入相应的列表 项目进度图表:选择(总体或单个)项目显示…

Linux【工具 02】OpenStreetMap数据处理工具OSMCTools下载安装使用举例(osmconvert命令说明)

OSMCTools安装使用实例 1.Tools2.官网安装步骤3.实际安装步骤3.1 环境3.2 步骤 4.工具使用实例 OpenStreetMap的下载地址:Geofabrik Download Server。 OSMCTools的GitHub地址:https://github.com/ramunasd/osmctools Windows操作系统,可以…

MyBatis之注解开发

除了XML映射方式,MyBatis还支持注解方式实现POJO对象和数据表之间的关联映射,使用注解的方式一般将SQL语句直接写到接口上。与XML的映射方式相比,基于注解的映射方式相对简单。Mybatis提供的注解有: 1.环境准备 1.1 数据库准备…

C语言函数大全-- _w 开头的函数(3)

C语言函数大全 本篇介绍C语言函数大全-- _w 开头的函数 1. _wmkdir 1.1 函数说明 函数声明函数功能int _wmkdir(const wchar_t* dirname);用于创建指定路径名的新目录 参数: dirname : 指向以 null 结尾的宽字符数组,该数组包含要创建的目…

客户管理系统软件怎么用?

阅读本文您将了解:1.客户管理系统的作用;2.客户管理系统软件怎么用;3.客户管理的注意事项。 一、客户管理系统的作用 客户是企业的重要财富,因此客户管理是企业发展过程中至关重要的一部分,那么客户管理怎么做&#…

《编码——隐匿在计算机软硬件背后的语言》精炼——第17章收尾

古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。——苏轼 文章目录 数字计算机硬件软件 数字计算机 数字计算机分为硬件和软件两部分,硬件是组成计算机的设备,软件是输入计算机的指令和数值。之所以将它们区分,是因为相对于硬件而言&…

照片从安卓手机中消失了?让他们恢复回来的几个方法请收好

“我安卓上的所有照片都消失了,我的照片去哪儿了” “我安卓上的所有照片都不见了” “下载的图片从安卓上消失了” …… 您是否遇到类似的问题?导致Android手机照片丢失的原因有很多,例如软件更新、误删、误操作、系统崩溃、应用程序崩溃、…

【算法】——动态规划题目讲解

本期继续为大家带来的是关于动态规划类题目的讲解,对于这类题目大家一定要多加练习,争取掌握。 (一)不同路径 链接如下:62. 不同路径 题目如下: 算法思路: 1. 状态表⽰: 对于这种「…

【FMC200】基于FMC标准的1路CameraLink Full 输出子卡模块

产品概述 FMC200是一款CameraLink发送FMC子卡模块,该模块支持2路CameraLink Base模式或者1路CameraLink Full模式的图像信号输出。板卡具有2个CameraLink端口(SDR26),可以作为模拟相机的输出。 技术指标 图像接口性能&#xff1a…

202305-第二周资讯

山川软件愿为您提供最优质的服务。 您的每一个疑问都会被认真对待,您的每一个建议都将都会仔细思考。 我们希望人人都能分析大数据,人人都能搭建应用。 因此我们将不断完善DEMO、文档、以及视频,期望能在最大程度上快速帮助用户快速解决问…

高效易懂,打造维护性好的Web自动化测试框架PO模式精讲

目录 前言: 一、 PO概述 二、PO何实现于Web框架素自动化测试重中之重。 1.为了保证易维护性和易读性,我们可以在项目中定义一个统一的库,用来存放所有的定位器类。 2.定义一个基础的类,该类用于针对PO的元素定位进行封装。 3…

Visual Studio 2022 17.7 发布首个预览版

Visual Studio 2022 17.7 已发布首个预览版,这个版本有大量社区贡献的新改进,主要改动如下: 生产效率 文件对比功能,可以在 Solution Explorer 中对比不同的文件差异。在资源管理器中右键单击一个文件,然后使用上下文…

Java 中 Token 是什么,有哪些用途

简介 Token 是一种身份验证机制,通常由服务器生成并返回给客户端,客户端在后续的请求中携带 Token,以证明自己的身份。在 Java 中,Token 的应用场景非常广泛,例如用户登录、API 认证、OAuth 授权等等。 在用户登录的…