Linux三剑客与正则

news2024/9/24 19:18:08

目录

正则表达式

text测试文件

正则符号分类

基础正则符号

正则表达式的贪婪性

扩展正则符号

linux三剑客

三剑客特点及应用场景

grep

sed

sed命令执行过程

sed查找script

sed删除script

sed增加script

具体功能

具体script

sed替换script

后向引用

awk

awk执行过程

awk的行与列

awk的内置变量

取行script

取列script

awk取行取列

BEGIN{}与END{}

awk数组

作用

使用案例

批量输出数组内容

awk的for循环

awk的if判断

正则表达式

text测试文件

[root@CentOS7-1 ~]# cat test
hello : orange : bird : cat : 21
Apple : cow : cup : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8

含义:用于匹配有规律的东西的表达式

正则符号分类

基础正则符号

^:以……开头的行

test文件执行命令:grep '^deep' test

[root@CentOS7-1 ~]# grep '^deep' test
deep : dog : app : country : 11

$:以……结尾的行

test文件执行命令:grep '11$' test

[root@CentOS7-1 ~]# grep '11$' test
deep : dog : app : country : 11

注意:^$表示空行(这一行中没有任何东西)

.(点):表示任意一个字符

注意:点不匹配空行

test文件执行命令:grep '.' test

\:转义字符

需求:匹配出文件中以点结尾的行

对于app文件

[root@CentOS7-1 ~]# cat app
i am a dog.
no no no
I said this without thinking about it.

执行:grep '\.$' app

[root@CentOS7-1 ~]# grep '\.$' app
i am a dog.
I said this without thinking about it.

*:前一个字符出现了0次或以上

注意:所有内容都会显示出来——因为可以当作出现0次

test文件执行命令:grep 'a*' test

注意:

  • .*表示所有内容
  • .*表示所有,或*连续出现时,表现出尽可能的贪婪(匹配的更多)

正则表达式的贪婪性

对于test文件执行:grep '^.*o' test

结论:由此观之,总是直接匹配到最后一个o,贪婪 

[]:匹配任何一个字符(只能算一个)

如:[a,b,c]相当于a或b或c

注意:

  • [a-z]:匹配小写字母任意一个
  • [0-9]:匹配数字任意一个
  • [a-Z]:匹配大小写字母任意一个([a-zA-Z]也可)
  • [a-z | A-Z | 0-9]:匹配字母和数字和|([]里的内容去掉特殊含义)
  • [^abc]:匹配除了a,b,c之外的任意一个字符(^在中括号里表示取反)

对于test文件执行:grep '[a,b]' test

扩展正则符号

前言:grep只支持基础正则,扩展正则使用egrep或-E

+:前一个字符出现了一次或多次以上

注意:[0-9]+:匹配连续出现的数字(一次或多次)

对于test文件执行:egrep 'p+' test

|:或者

对于test文件执行:egrep 'a|b' test

[]与|的区别

  • []一次匹配一个字符
  • |匹配一个或多个字符

():被括起来的内容表示一个整体

需求:我要选择oldboy或oldbey

对于person文件

[root@CentOS7-1 ~]# cat person
haha oldboy hello
beautiful oldbey hi
in the park

执行:egrep '(oldboy|oldbey)' person

{}:表示连续出现

理解:

  • o{n,m}表示o至少出现了n次,至多出现m次
  • o{n}表示o连续出现n次(超过也可)
  • o{n,}表示o至少出现n次,多了不限
  • o{,m}表示o最多出现m次,少了不管

对于test文件执行:egrep 'p{2,3}' test

?:表示字符出现了0次或1次

对于test文件执行:egrep 'de?s?' test

linux三剑客

三剑客特点及应用场景

命令特点场景
grep过滤grep命令过滤速度最快
sed替换,修改文件内容,取行替换/修改文件内容,取出某个范围内的内容
awk取列,统计计算取列,对比,比较,统计,计算

grep

作用:对文本进行搜索

语法:grep [options] 搜索内容 具体路径的文件名1 具体路径的文件名2

options

  • -n:显示行号
  • -w:精确匹配(匹配正正好好的数据)
  • -v:显示不匹配的行
  • -i:忽略大小写
  • -o:显示匹配过程
  • -c:统计匹配好的出现了多少行
  • -E:使用扩展正则表达式匹配(相当于egrep)
  • -A n:匹配你要的内容显示接下来的n行
  • -B n:匹配你要的内容显示上面的n行
  • -C n:匹配你想要的内容显示上下n行

注意:可以同时搜索多个文件

对于test文件执行:grep -ni app test

[root@CentOS7-1 ~]# grep -ni app test
2:Apple : cow : cup : desk : 12
3:deep : dog : app : country : 11

app文件内(验证精确匹配)

[root@CentOS7-1 ~]# cat app
i am a dog.
no no not
I said this without thinking about it.

执行:egrep -w 'no' app

sed

特点:stream editor流编辑器,sed把处理的内容(文件)当作是水,源源不断的进行处理,直到文件末尾

理解:sed是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓
冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理
完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件
内容并没有改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件;简化
对文件的反复操作

sed功能:增删改查

语法:sed [options] script 文件名 

options

  • -n:不输出现有的内容到屏幕,即不自动打印
  • -r:支持使用扩展正则表达式
  • -i:直接修改文本文件(若不加该参数不会修改文件)

sed命令执行过程

命令含义:显示文件的第三行

过程:首先在sed执行时会把文件的内容的第一行读取到内存空间,然后看该行是否是我想要的,若是自己想要的,则直接将他打印到屏幕,若不是则看看有没有-n参数,若有则不将其打印到屏幕上,没有则将其打印到屏幕上。继续处理下一行以此类推,直到结束。

sed查找script

查找格式含义
'np'查找第n行
'n,mp'查找第n-m行
'/hello/p'类似grep过滤(查找hello所在行),//里面可以写正则
'/10:00/,/11:00/p'查找10点开始到11点结束这段时间内的日志
'n,/hello/p'混合查找(查找第n行到有hello的行)

test文件

[root@CentOS7-1 ~]# cat test
hello : orange : bird : cat : 21
Apple : cow : cup : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8

执行:sed -n /cou/p test

[root@CentOS7-1 ~]# sed -n /cou/p test
deep : dog : app : country : 11

sed删除script

删除格式含义
'nd'删除第n行
'n,md'删除第n-m行
'/hello/d'类似grep过滤(删除hello所在行),//里面可以写正则
'/10:00/,/11:00/d'删除10点开始到11点结束这段时间内的日志
'n,/hello/d'混合删除(删除第n行到有hello的行)

test文件

[root@CentOS7-1 ~]# cat test
hello : orange : bird : cat : 21
Apple : cow : cup : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8

执行:sed /app/d test

[root@CentOS7-1 ~]# sed /app/d test
hello : orange : bird : cat : 21
Apple : cow : cup : desk : 12
computer : phone : bag : paper : 8

sed增加script

具体功能

功能含义
creplace替代这行的内容
aappend追加,向指定行或某一行后面追加内容
iinsert插入,向指定行或每一行前面插入内容

具体script

命令含义
'na 要加的内容'在n行后面添加要添加的内容(添加行)
'ni 要加的内容'在n行前面添加要添加的内容(添加行)
'nc 要替换的内容'将n行内容删除后换上新内容
'n,ma hello'在n行到m行之后均添加hello这一行
'/hello/a hi'在hello行的后面添加hi这一行
'n,/hello/a hello'在n行和有hello的行之后添加hello这一行

注意:格式也支持上述格式

对于test文件

[root@CentOS7-1 ~]# cat test
hello : orange : bird : cat : 21
Apple : cow : cup : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8

执行:sed '2,4i hello' test

[root@CentOS7-1 ~]# sed '2,4i hello' test
hello : orange : bird : cat : 21
hello
Apple : cow : cup : desk : 12
hello
deep : dog : app : country : 11
hello
computer : phone : bag : paper : 8

sed替换script

命令含义
's/数据1/数据2/g'全局将数据1替换成数据2
's/数据1/数据2/'将每行的第一个数据1替换成数据2

注意:g为global全局替换,sed默认只替换每行第一个匹配的内容

test文件

[root@CentOS7-1 ~]# cat test
hello : orange : bird : cat : 21
Apple : cow : cup : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8
cup app cup puc

执行:sed s/cup/haha/g test

[root@CentOS7-1 ~]# sed s/cup/haha/g test
hello : orange : bird : cat : 21
Apple : cow : haha : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8
haha app haha puc

后向引用

使用方法:先保护,再引用

需求:将oldboy_lidao改成lidao_oldboy

执行:echo oldboy_lidao | sed -r 's/(^.*)_(.*$)/\2_\1/g'

[root@CentOS7-1 ~]# echo oldboy_lidao | sed -r 's/(^.*)_(.*$)/\2_\1/g'
lidao_oldboy

解释:先将要用的内容用小括号保护起来,后面的\n就为前面第n个小括号内的引用。

awk

前言:awk是一门语言,主要用来统计、过滤和计算

awk执行过程

案例:awk -F, 'BEGIN{print "name"}{print $2}END{print "end of file"}' oldboy.txt

理解:awk读取文件之前,先看看命令行里有什么参数并处理begin{}的代码,awk读取文件时先从文件读取一行放到内存中,看该行是否满足条件,满足条件则执行对应的动作,不满足条件看是不是最后一行,若是直接就执行end{}里的代码,不是则从文件中取出另外一行依此类推直到文件结束后执行end{}的代码

注意:awk读取文件之前就可以执行命令行的参数或者begin{}

语法:awk [options] script 文件名

options

  • -F 分隔符:指定分隔符,指定每一列结束标记(默认空格/制表符)
  • -v val=val在执行处理过程之前,设置一个变量var,并给其设备的初始值为val。

awk的行与列

名词awk中的叫法一些说明
记录(record)每一行默认通过回车分割的
字段(field)每一行默认通过空格分割的

awk的内置变量

内置变量说明
NRNumber of Record(记录号,行号)
NFNumber of Field(每行有多少字段,$NF为最后一列)
FSField Separator字段分隔符,每个字段的结束标记
OFSOutput Field Separator,输出字段分隔符(awk显示每列的时候,每列之间用什么分割,默认空格)

取行script

命令说明
’NR==1'(这里的符号是灵活的)取出第一行
'NR>=1&&NR<=5'取出1到5行
'/hello/'取出hello所在的行
'/2/,/4/'取出2行到4行

符号:>,<,>=,<=,==,!=

test文件

[root@CentOS7-1 ~]# cat test
hello : orange : bird : cat : 21
Apple : cow : haha : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8

执行:awk NR==1 test

[root@CentOS7-1 ~]# awk NR==1 test
hello : orange : bird : cat : 21

执行:awk /cow/ test

[root@CentOS7-1 ~]# awk /cow/ test
Apple : cow : haha : desk : 12

取列script

命令说明
'{print $n}'取出第n列
'{print $n,$m}'取出第n列和第m列
'{print $NF}'取出最后一列
'{print $n"cjc"$m}'取出第n列和第m列,并在之间写上cjc
'$2~/g/'确定第二列中包含g的行

注意:

  • 在awk中"$n"代表取出第n列
  • 通常情况下,取列与-F参数一同使用
  • 正则表达式中~表示包含,!~表示不包含

test文件

[root@CentOS7-1 ~]# cat test
hello : orange : bird : cat : 21
Apple : cow : haha : desk : 12
deep : dog : app : country : 11
computer : phone : bag : paper : 8

执行:awk -F : '{print $2,$5}' test

[root@CentOS7-1 ~]# awk -F : '{print $2,$5}' test
 orange   21
 cow   12
 dog   11
 phone   8

(OFS相关)执行:awk -F: -v OFS=? '{print $2,$4}' test

[root@CentOS7-1 ~]# awk -F: -v OFS=? '{print $2,$4}' test
 orange ? cat 
 cow ? desk 
 dog ? country 
 phone ? paper 

awk取行取列

test文件取3行2列:awk -F: 'NR==3{print $2}' test

[root@CentOS7-1 ~]# awk -F: 'NR==3{print $2}' test
 dog 

BEGIN{}与END{}

模式含义应用场景
BEGIN{}里面的内容会在awk读取文件之前进行

1进行简单统计,不涉及读取文件

2用于在处理文件之前添加个表头

3用于定于awk变量

END{}里面的内容会在awk读取文件之后进行

1awk进行统计,一般过程:先进行计算,最后在END里面输出结果

2awk使用数组,用来输出数组的结果

需求:计算从1加到100 

执行:seq 100 | awk 'BEGIN{print "start"}{sum=sum+$1}END{print sum}'

[root@CentOS7-1 ~]# seq 100 | awk 'BEGIN{print "start"}{sum=sum+$1}END{print sum}'
start
5050

awk数组

作用

  • 统计次数:类似于统计每个ip出现次数、统计每种状态码出现的次数、统计系统中每个用户被攻击的次数,统计攻击者ip出现的次数
  • 累计求和:统计每个ip消耗的流量

使用案例

执行:awk 'BEGIN{a[0]=12306;a[1]="hello"; print a[0],a[1]}'

[root@CentOS7-1 ~]# awk 'BEGIN{a[0]=12306;a[1]="hello"; print a[0],a[1]}'
12306 hello

注意:awk字母会被识别为变量,若只想使用字符串,则需要将该字母引起来

批量输出数组内容

语法:for(i in array) print array[i]

执行:awk 'BEGIN{a[0]=12306;a[1]="hello"; for(i in a) print i,a[i]}'

[root@CentOS7-1 ~]# awk 'BEGIN{a[0]=12306;a[1]="hello"; for(i in a) print i,a[i]}'
0 12306
1 hello

awk的for循环

前言:awk的for循环一般用来循环每个字段的

for(i=1;i<=10;i++)
print i

awk的if判断

if(条件) 
    print("success")
else
    print("fail")

案例:统计这段语句中,单词字符数小于6的单词,并显示出来

语句:echo I am oldboy teacher welcome to oldboy training class.

执行:echo I am oldboy teacher welcome to oldboy training class.|awk -F"[ .]" '{for(i=1;i<=NF;i++) if(length($i)<6) print $i}'

[root@CentOS7-1 ~]# echo I am oldboy teacher welcome to oldboy training class.|awk -F"[ .]" '{for(i=1;i<=NF;i++) if(length($i)<6) print $i}'
I
am
to
class

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/798278.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

虹科新闻 | 虹科与Berghof正式建立合作伙伴关系

近日&#xff0c;虹科与德国Berghof公司达成战略合作&#xff0c;虹科正式成为Berghof Automation在大中华区的认证授权代理商。未来&#xff0c;虹科将携手Berghof一同为机器制造商、系统集成商和工业设备制造商提供先进的解决方案&#xff0c;从而在最小的空间内实现最高的性…

vue项目:SyntaxError: Unexpected token ‘:‘

运行项目时出现了如下问题&#xff1a; 经过排查&#xff0c;是因为代码中使用了ts&#xff08;TypeScript&#xff09;的写法&#xff1a; 解决办法&#xff1a;在script标签加上 lang“ts” 即可

软件设计师学习第一章

计算机组成与体系结构&#xff08;6分&#xff09; 内容概述 数据的表示 进制转换 R 进制转十进制使用按权展开法&#xff0c;其具体操作方式为&#xff1a;将 R 进制数的每一位数值用 Rk 形示&#xff0c;即幂的底数是 R &#xff0c;指数为 k &#xff0c; k 与该位和小数点…

uniapp 选择城市定位 根据城市首字母分类排序

获取城市首字母排序&#xff0c;按字母顺序排序 <template><view class"address-wrap" id"address"><!-- 搜索输入框-end --><template v-if"!isSearch"><!-- 城市列表-start --><view class"address-sc…

DevOps-Git

DevOps-Git 版本控制软件提供完备的版本管理功能&#xff0c;用于存储&#xff0c;追踪目录&#xff08;文件夹&#xff09;和文件的修改历史。版本控制软件的最高目标是支持公司的配置管理活动&#xff0c;最终多个版本的开发和维护活动&#xff0c;即使发布软件。 git安装 h…

Python获取天气数据 并做可视化解读气象魅力

前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 前几天的长沙&#xff0c;白天大太阳&#xff0c;晚上下暴雨 一点也琢磨不透天气老人家它的想法 顺便哔哔一点生活小插曲&#xff1a; 前几天的时候&#xff0c;我出门&#xff0c;家里的几扇窗户开着在透气 等我十一点回…

了解Unity编辑器之组件篇Layout(八)

Layout&#xff1a;用于管理和控制UI元素的排列和自动调整一、Aspect Ratio Fitter&#xff1a;用于根据宽高比自动调整UI元素的大小 Aspect Mode&#xff1a;用于定义纵横比适配的行为方式。Aspect Mode属性有以下几种选项&#xff1a; &#xff08;1&#xff09;None&#xf…

开源预训练框架 MMPRETRAIN现有的推理模型(三)

推理器类型&#xff1a; &#xff08;1&#xff09;ImageClassificationInferencer&#xff1a;对给定图像进行图像分类。 &#xff08;2&#xff09;ImageRetrievalInferencer&#xff1a;从给定图像集上的给定图像执行图像到图像检索。 &#xff08;3&#xff09;ImageCapti…

FS32K144用官方Bootloader为底层用RAppIDL BL Tool工具下载升级程序

​​​​​​​ ​​​​​​​ ​​​​​​​ ​​​​​​​ ​​​​​​​ 一、工具问题 1、可以在NXP的官网上找到这个软件&#xff0c;也可以加载完成NXP的官方库后找到它&#xff08;自动安装的&#xff09;&#xff0c;也可我…

【接口测试】Postman--变量与集合

目录 变量与集合 一、变量 1、环境变量&#xff08;1&#xff09;创建环境变量&#xff08;2&#xff09;管理环境变量&#xff08;3&#xff09;选择与编辑环境变量2、全局变量&#xff08;1&#xff09;管理全局变量二、集合 1、创建集合2、保存请求到集合3、分享集合三、集…

链表是否有环、环长度、环起点

问题引入 如何检测一个链表是否有环&#xff0c;如果有&#xff0c;那么如何确定环的长度及起点。 引自博客&#xff1a;上述问题是一个经典问题&#xff0c;经常会在面试中被问到。我之前在杭州一家网络公司的电话面试中就很不巧的问到&#xff0c;当时是第一次遇到那个问题&…

【数据结构】实验一:绪论

实验一 绪论 一、实验目的与要求 1&#xff09;熟悉C/C语言&#xff08;或其他编程语言&#xff09;的集成开发环境&#xff1b; 2&#xff09;通过本实验加深对算法时间复杂度的理解&#xff1b; 3&#xff09;结合具体的问题分析算法时间复杂度。 二、实验内容 设计程…

C# PaddleDetection 目标检测 ( yolov3_darknet)

效果 项目 VS2022.net4.8OpenCvSharp4Sdcb.PaddleDetection 代码 using OpenCvSharp; using OpenCvSharp.Extensions; using Sdcb.PaddleDetection; using Sdcb.PaddleInference; using System; using System.Drawing; using System.Windows.Forms; using YamlDotNet;namespa…

vue实现循环数据动态添加标签以及单独控制显示隐藏

效果图&#xff1a; html: <table class"tag-table"><tbody><tr v-for"(item, index) in form.tagList" :key"index"><td>333</td><td><divclass"tag-box"v-for"(item1, index1) in it…

推荐用于学习RN原生模块开发的开源库—react-native-ble-manager

如题RN的原生模块/Native Modules的开发是一项很重要的技能&#xff0c;但RN官网的示例又比较简单&#xff0c;然后最近我接触与使用、还有阅读了react-native-ble-manager的部份源码&#xff0c;发现里边完全包含了一个Native Modules所涉及的知识点/技术点&#xff0c;故特推…

【SAM MaskDecoder 图】SAM(segment anything) 中MaskDecoder过程图示

SAM(segment anything) 中MaskDecoder过程图示 本人根据代码画的&#xff0c;如有出入&#xff0c;欢迎留言反馈更正。

算法之归并排序算法

归并&#xff08;Merge&#xff09;排序法是将两个&#xff08;或两个以上&#xff09;有序表合并成一个新的有序表&#xff0c;即把待排序序列 分为若干个子序列&#xff0c;每个子序列是有序的。然后再把有序子序列合并为整体有序序列。 public class MergeSortTest {public …

简单上手FineBI

简介 安装下载 下载的是V6.0.11版本 设置管理员账号 账号admin 密码123456 新建分析主题 添加数据 选择本地数据上传 选择示例数据上传 打开效果如下&#xff0c;点击“确定”&#xff0c;这样就将示例数据上传到分析主题中 分析数据——编辑数据 如果数据质量好&#xf…

用OpenCV图像处理技巧之白平衡算法(二)

1. 引言 在上一节中我们介绍了白平衡算法的原理&#xff0c;并详细实现了基于白色补丁算法的白平衡实现&#xff0c;本文继续就白平衡的其他算法实现进行展开。 闲话少说&#xff0c;我们直接开始吧&#xff01; 2. Gray-world Algorithm 灰色世界算法&#xff08;Gray-wor…

protobuf安装教程

protobuf安装 一&#xff0c;Windows下安装下载protobuf配置环境变量检查是否安装成功 二&#xff0c;Linux下安装下载protobuf安装protobuf检查是否安装成功 一&#xff0c;Windows下安装 下载protobuf 下载地址 本次下载以v21.11为例&#xff0c;根据自己需求下载即可。 配…