Shell系统编程三剑客之----AWK

news2025/4/7 4:26:50

目录

1.AWK工具简介

2.AWK的基本格式

3.AWK工作原理

4.常见的内建变量（可直接用）

二： AWK实例

1.按行输出文本

2.按字段输出文本

3.通过管道、双引号调用 Shell 命令

4.date命令输出时间

5. 查看内存使用占比

6.查看cpu使用占比

7.获取奇数偶数行

8.OFS 输出分割符

9.数组

10.查重

11.过滤密码失败

1.AWK工具简介

●AWK 是一种处理文本文件的语言，它是一个强大的文本分析工具，它是专门为文本处理设计的编程语言，也是行处理软件，通常用于扫描、过滤、统计汇总工作。

●可以在无交互的模式下实现复杂的文本操作；数据可以来自标准输入也可以是管道或文件

●相较于sed常作用于一整个行的处理，awk则比较倾向于一行当中分成数个字段来处理，因为awk相当适合小型的文本数据。

2.AWK的基本格式

1.awk [选项] ‘模式条件{操作}’ 文件1 文件2…
2.awk -f 脚本文件 文件1 文件2…
格式：awk关键字 选项 命令部分 ‘{xxx}’ 文件名

3.AWK工作原理

● 前面提到sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个"字段"然后再进行处理，且默认情况下字段的分隔符为空格或tab键。awk 执行结果可以通过print的功能将字段数据打印显示。

●在使用awk命令的过程中，可以使用逻辑操作符"&&“表示"与”、"||“表示"或”、"!“表示"非”;还可以进行简单的数学运算，如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。

●awk后面接两个单引号并加上大括号{ }来设置想要对数据进行的处理操作，awk可以处理后续接的文件，也可以读取来自前个命令的标准输。

4.常见的内建变量（可直接用）

变量	含义
FS	`列分割符`。指定每行文本的字段分隔符，默认为`空格或制表位`。与"-F"作用相同
NF	当前处理的`行的字段个数`。
NR	当前处理的`行的行号（序数）`。
$0	当前处理的`行的整行内容`。
$1	代表`第一列的内容`
$2	代表第二列的内容
$n	代表第二列的内容
FILENAME	被处理的文件名。
RS	行分隔符

注：awk从文件上读取资料时，将根据RS的定义把资料切割成许多条记录，而awk一次仅读入一条记录，以进行处理。预设值是’\n’
简说：数据记录分隔，默认为\n,即每行为一条记录。

二： AWK实例

1.按行输出文本

#输出所有内容
[root@localhost ~]# awk '{print}' a
[root@localhost ~]# awk '{print $0}' a

#输出1-3行的内容
[root@localhost ~]# awk 'NR==1,NR==3{print}' a
[root@localhost ~]# awk '(NR>=1)&&(NR<=3){print}' a

#输出第一行或第三行
[root@localhost ~]# awk 'NR==1||NR==3{print}' a

#输出4-8行，或10行
[root@localhost ~]# awk '(NR>=4&&NR<=8)||NR==10 {print $0}' a
four
five
six
seven
eight
ten

[root@localhost ~]# awk '(NR%2)==1{print}' a    #输出所有奇数行
[root@localhost ~]# awk '(NR%2)==0{print}' a    #输出所有偶数行

#配合正则表达式使用输出
[root@localhost ~]# awk '/^root/{print}' /etc/passwd        #输出以root开头的行
[root@localhost ~]# awk '/nologin$/{print}' /etc/passwd     #输出以 nologin 结尾的行
[root@localhost ~]# awk 'NR!=10 {print $0}' a               #输出不是第10行的所有行

#统计以nologin为结尾的行数
[root@localhost ~]# grep -c "nologin$" /etc/passwd
[root@localhost ~]# awk '/nologin$/ {print $0}' /etc/passwd | wc -l
[root@localhost ~]# awk 'BEGIN {x=0}; /nologin$/ {x++}; END {print x}' /etc/passwd
[root@localhost ~]# awk 'BEGIN {x=0}; /nologin$/ {x++; print x, $0}; END {print x}' /etc/passwd

注：BEGIN模式表示，在处理指定的文本之前，需要先执行BEGIN模式中指定的动作；awk再处理指定的文本，之后再执行END模式中指定的动作，END{}语句块中，往往会放入打印结果等语句

2.按字段输出文本

#输出以root开头的行的第一部分
[root@localhost ~]# awk -F: '/^root/ {print $1}' /etc/passwd

#输出以root开头的行的第一部分和第三部分
[root@localhost ~]# awk -F: '/^root/ {print $1,$3}' /etc/passwd

#输出以root开头的行的第一部分和第三部分，最后一部分
[root@localhost ~]# awk -F: '/^root/ {print $1,$3,$NF}' /etc/passwd

#输出第三部分不小于200的行
[root@localhost ~]# awk -F ":" '!($3<200){print}' /etc/passwd 

#以冒号为分隔符，第三部分大于等于1000。先处理完BEGIN的内容，再打印文本里面的内容
[root@localhost ~]# awk 'BEGIN {FS=":"};{if($3>=1000){print}}' /etc/passwd

#！表示为取反
[root@localhost ~]# awk -F: '!($3>8) {print $3,$1}' /etc/passwd
[root@localhost ~]# awk -F: 'BENGIN {FS=":"}; !($3>8) {print $3,$1}' /etc/passwd

#($3>$4)?$3:$4;三元运算符，如果第3个字段的值大于等于第4个字段的值，则把第3个字段的值赋给max，否则第4个字段的值赋给max
[root@localhost ~]# awk 'BEGIN {FS=":"};{if($3>=1000){print}}' /etc/passwd

#输出以冒号分隔且第7个字段中包含/bash的行的第1个字段，~意思为包含
[root@localhost ~]# awk -F ":" '$7~"/bash"{print $1}' /etc/passwd

#输出第1个字段中包含root且有7个字段的行的第1、2个字段
[root@localhost ~]# awk -F ":" '($1~"root")&&(NF==7){print $1,$2}' /etc/passwd

#输出第7个字段既不为/bin/bash，也不为/sbin/nologin的所有行
[root@localhost ~]# awk -F ":" '($7!="/bin/bash")&&($7!="/sbin/nologin"){print}' /etc/passwd

3.通过管道、双引号调用 Shell 命令

#输出行号和内容
[root@localhost ~]# awk '{print NR,$0}' a

#输出行号和内容
[root@localhost ~]# awk '{print NR,$0};END{print NR}' a

#以冒号为分隔符，输出内容和行号
[root@localhost ~]# echo $PATH | awk 'BEGIN{RS=":"}; {print NR,$0}'

#调用w命令,并用来统计在线用户数
[root@localhost ~]# awk 'BEGIN {n=0 ; while ("w" | getline) n++ ; {print n-2}}'

#查询用户名
[root@localhost ~]# awk 'BEGIN {"hostname" | getline ; {print $0}}'

4.date命令输出时间

[root@localhost ~]# date -d "1 month" +"%Y/%m/%d"          #下个月的今天
[root@localhost ~]# date -d "1 month" +"%Y/%m/01"          #下个月第一天
[root@localhost ~]# date +"%Y/%m/01"                       #当月第一天
[root@localhost ~]# date -d "1 month ago" +"%Y/%m/%d"      #一个月前的今天
[root@localhost ~]# date -d "1 day ago" +"%Y/%m/%d"        #1天前
[root@localhost ~]# date -d "-1 day " +"%Y/%m/%d"          #1天前
[root@localhost ~]# date -d "$(date +%Y%m01) -1 day" +%Y/%m/%d    #上个月的最后一天
[root@localhost ~]# date -d "$(date -d "1 month" +%Y%m01) -1 day" +%Y/%m/%d  #当月最后一天

[root@localhost ~]# date -d "$(cat /proc/uptime | awk -F. '{print $1}') second ago" +"%Y%m%d %H:%M:%S"         
#显示上次系统重启时间，等同于uptime；second ago为显示多少秒前的时间，+"%F %H:%M:%S"等同于+"%Y-%m-%d %H:%M:%S"的时间格式
/proc/uptime 第一列输出的是，系统启动到现在的时间（以秒为单位）；第二列输出的是，系统空闲的时间（以秒为单位）
date -d "$(date -d"1 month" +"%Y%m01") -3 day" +"%Y%m%d"  当月倒数第三天
date +"%Y%m01"        当月第一天

5. 查看内存使用占比

#内存使用率占比
[root@localhost ~]# free -m | awk '/Mem/ {print $3/$2 * 100"%"}

#内存空闲率占比
[root@localhost ~]# free -m | awk '/Mem/ {print ($2-$3)/$2 * 100"%"}'

6.查看cpu使用占比

#cpu使用率占比
[root@localhost ~]# top -b -n1 | awk -F, '/%Cpu/ {print $4}' | awk '{print 100-$1"%"}'

7.获取奇数偶数行

[root@localhost ~]# seq 10 | awk '{getline; print $0}'    #获取偶数行
[root@localhost ~]# seq 10 | awk '{print $0; getline}'    #获取奇数行
当getline左右无重定向符“<”或“|”时，awk首先读取到了第一行，就是1，然后getline，就得到了1下面的第二行，就是2，因为getline之后，awk会改变对应的NF，NR，FNR和$0等内部变量，所以此时的$0的值就不再是1，而是2了，然后将它打印出来。
当getline左右有重定向符“<”或“|”时，getline则作用于定向输入文件，由于该文件是刚打开，并没有被awk读入一行，只是getline读入，那么getline返回的是该文件的第一行，而不是隔行。

8.OFS 输出分割符

#OFS为指定分隔符
[root@localhost ~]# echo "A B C D" | awk '{OFS="|";print $0;$1=$1;print $0}'               
#以|为分隔符输出
[root@localhost ~]# echo "A B C D" | awk '{OFS="/";print $0;$1=$1;print $0}'
#以/为分隔符输出

9.数组

#输出数组的下标位为1的数值
[root@localhost ~]# awk 'BEGIN{a[0]=1; a[1]=2; a[2]=3; print a[1]}' 
2
#输出数组的下标位为0的数值
[root@localhost ~]# awk 'BEGIN{a[0]=1; a[1]=2; a[2]=3; print a[0]}'
1
#也可以用字符串定义数组
[root@localhost ~]# awk 'BEGIN{a["abc"]=1; a["def"]=2; a["xyz"]=3; print a["abc"]}'
1
[root@localhost ~]# awk 'BEGIN{a["abc"]=1; a["def"]=2; a["xyz"]=3; print a["xyz"]}'
3
#输出数值和下标位
[root@localhost ~]# awk 'BEGIN{a[0]=1; a[1]=2; a[2]=3; for(i in a){print i,a[i]}}'
0 1
1 2
2 3

10.查重

#查询各种数值的重复次数
[root@localhost ~]# cat test.txt | awk '{a[$1]++};END{for(i in a){print i,a[i]}}'

11.过滤密码失败

awk '/Failed password/{ip[$11]++}END{for(i in ip){print i","ip[i],i}}' /var/log/secure | awk '$1>3{print $2}'
awk '/Invalid user/{print $10}' /var/log/secure | awk '{ip[$1]++}END{for(i in ip){print ip[i],i}}' | awk '$1>3{print $2}'

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/529327.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【linux】shell编程—快捷命令

【linux】shell编程—快捷命令

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、快捷排序 - sort二、快捷去重 - uniq三、快捷替换 - tr四、快速裁剪 - cut五、文件拆分 - split六、文件合并 - paste七、变量扫描器 - eval 一、快捷排序 - so…

阅读更多...

5个良心好用的Windows神级软件，让你打开新世界的大门

5个良心好用的Windows神级软件，让你打开新世界的大门

今天再次推荐5个良心好用的Windows神级软件，每一个都是完全免费，堪称神器，让你打开新世界的大门。 1.PPT插件——OneKeyTools OK插件是一款免费的PPT插件，让你的PPT制作有无限可能！它的功能，太多了&#…

阅读更多...

CoCo数据集-目标检测指标MAP

CoCo数据集-目标检测指标MAP

文章目录一、前言二、评价指标的一些概念2.1.一些概念2.2.概念介绍2.3.MAP求解三、理解CoCo的评价指标四、总结五、学习视频、Coco官方地址一、前言前面学习了coco数据集但是不知道它的评价指标，所以写下来作为自己的笔记，以后还是直接在这写好再保…

阅读更多...

算法设计期末考试

算法设计期末考试

算法设计期末考试 1.分治法3选11.1全排列1.2二分法--金块问题1.3子数组换位问题 2.贪心选2题2.1 活动安排2.2 活动安排（改）2.3 最优装载2.4 多机调度2.5 最优服务次序问题2.6 多处最优服务次序问题 3.动态规划选1-2题3.1最长公共子序列3.2最大子段和3.3 …

阅读更多...

这个原因，让你自动化测试年薪30W+也不能躺平

这个原因，让你自动化测试年薪30W+也不能躺平

其实这个问题，我们遇到到很多次： “自动化就可以满足我现在的公司需求，为什么不躺平，还要继续学测开？” 每次遇到这个问题后，立马就会有一个“涨薪效应”：收到粉丝们的高薪offer 其实&#x…

阅读更多...

星河案例ㅣ中国电信 X 冲量在线：基于智算中心的隐私计算应用实践

星河案例ㅣ中国电信 X 冲量在线：基于智算中心的隐私计算应用实践

▏摘要中国电信是中国三大运营商之一，为响应国家“东数西算”工程的全新数据中心形态，中国电信引入隐私计算平台，对内实现数据确权跟踪、对外实现数据共享交易，盘活中国电信分布在全国不同区域的数据资源和算力资源，…

阅读更多...

软件测试行业对新人友好吗？为什么？

随着信息技术的迅猛发展，软件测试行业成为了一个备受青睐的职业领域，但是对于没有经验和专业背景的新人来说，进入这个行业是否容易，是否有足够的发展空间呢？接下来从多个方面分析和介绍。如果你想学习软件测试&#…

阅读更多...

踩坑：MapperScannerConfigurer导致@PropertySource中@Value无效

踩坑：MapperScannerConfigurer导致@PropertySource中@Value无效

问题描述问题描述：在配置类中使用PropertySource引入了.properties文件，但是使用Value注入时，结果竟然null。郁闷了一上午。在Spring与MyBatis整合时，需要注入MyBatis的自动扫描配置类MapperScannerConfigurer的Bean 我用的是…

阅读更多...

[Orillusion]-使用 -windwos-4行命令

[Orillusion]-使用 -windwos-4行命令

前两天看了webgpu的开源库Orillusion | 专业 WebGPU 引擎 Orillusion感觉很不错的样子，准备试一下。因为都是做OpenGL和windows桌面端。 web有点小陌生，记录一下。准备： Google Chrome Canary 最新版，老版本有问题 nodejs 版…

阅读更多...

ChatGPT商业源码授权

ChatGPT商业源码授权

ChatGPT商业源码是由OpenAI公司开发并拥有版权的，未经授权擅自使用、复制、分发或修改可能涉及侵犯知识产权等法律问题，并可能会受到相应的法律惩罚。如果您需要使用ChatGPT商业版，可以考虑通过OpenAI官方渠道进行授权购买。此外&#x…

阅读更多...

ENSP网络综合实验（WALN+隧道+NAT）

ENSP网络综合实验（WALN+隧道+NAT）

实验拓扑 https://wwa.lanzoub.com/ivTyH0w8vz6d 设备接入、汇聚交换机（S3700、S5700）、路由器（AR3200）为例。接入层：用户角色包括员工（接入方式包括有线和无线）和访客（仅能通过无…

阅读更多...

深入了解ribbon源码

深入了解ribbon源码

ribbon源码解析自动装配依赖  <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-netflix-ribbon</artifactId></dependency>spring-cloud-starter-netflix-…

阅读更多...

skywalking agent使用kafka数据传输

skywalking agent使用kafka数据传输

安装Zookeeper 下载相应版本的zookeeper 解压文件 tar -vxzf apache-zookeeper-3.8.0-bin.tar.gz进入conf目录下，复制zoo_sample.cfg文件，这个是官方提供的配置样例，我们修改复制的文件名称未zoo.cfg。进入bin目录，启动zookeep…

阅读更多...

医院三级质控信息化支撑工具之一

医院三级质控信息化支撑工具之一

建立组织,完善管理制度新华社北京3月23日电近日，中共中央办公厅、国务院办公厅印发了《关于进一步完善医疗卫生服务体系的意见》，并发出通知，要求各地区各部门结合实际认真贯彻落实。(原文地址:中共中央办公厅国务院办公厅印发《关于进一步…

阅读更多...

【读论文】Seeing Beyond the Brain：MinD-Vis

【读论文】Seeing Beyond the Brain：MinD-Vis

Seeing Beyond the Brain: Conditional Diffusion Model with Sparse Masked Modeling for Vision Decoding CVPR 2023 基于稀疏掩膜的条件扩散模型视觉解码背景了解大脑活动并恢复编码信息是认知神经科学的关键目标，但由于脑信号的复杂潜在表征以及相关数据&a…

阅读更多...

Nginx 配置安全认证反向代理 HDFS web 页面

Nginx 配置安全认证反向代理 HDFS web 页面

Nginx 配置安全认证反向代理 HDFS web 页面这样做的目的是：相对安全一些，之前都是直接“裸奔”经常被攻击很讨厌文章目录 1、下载 NGINX2、解压 NGINX3、编译 NGINX4、编译后，确认 NGINX 安装目录5、配置 NGINX 为系统服务6、安装密码生…

阅读更多...

企业直播时摄像机拍摄参考与取景框裁切参考（组图）

企业直播时摄像机拍摄参考与取景框裁切参考（组图）

看了《2023中国企业直播应用标准》之后，内容摘要： 企业品质直播标准要素：直播视觉、直播运营、演播厅管理、直播合规以及主播能力。直播视觉：影响用户的品牌的认知度和好感度直播视觉是直播的第一印象，也是传达企业…

阅读更多...

热图 -- pheatmap or ggplot2

热图 -- pheatmap or ggplot2

文章目录 brief数据准备 pheatmap实例最朴素的方式数据缩放取消聚类更改每个小方格的大小聚类以及聚类方式和参数修改热图呈现的颜色修改legend ggplot2实例ggplot2实例变式添加 group bar做成dotplot pheatmap 多图组合问题 brief 这里主要记录了pheatmap 以及 ggplot2实现热…

阅读更多...

shell脚本5数组

shell脚本5数组

文章目录数组1 数组定义方法2 获取数组长度2.1 读取数组值2.2 数组切片2.3 数组替换2.4 数组删除2.5 追加数组元素 3 实验3.1 冒泡法3.2 直接选择法3.3 反排序法数组 1 数组定义方法数组名(value0 valuel value2 …) 数组名( [0]value [1]value [2]value …) 列表名“val…

阅读更多...

秒杀的异步优化

秒杀的异步优化

在jvm以外的服务，不受jvm内存的限制不仅仅做数据的存储，还保证了数据的安全，持久化 1.基于List结构模拟消息队列优点： 利用Redis存储，不受JVM内存限制基于Redis的持久化机制，数据安全性有保证可以满…

阅读更多...

推荐文章

最新文章