linux中awk，sed， grep使用

news2026/2/14 6:50:26

《linux私房菜》这本书中将sed和awk一同归为行的修改这一点，虽然对，但不利于实际处理问题时的思考。因为这样的话，当我们实际处理问题时，遇到比如说统计文本打印内容时，我们选择sed还是awk进行处理呢？
也因此

grep更适合单纯的查找或匹配文本，sed更适合编辑匹配到的文本，awk更适合格式化文本，对文本进行较复杂格式处理。

这样的思路更便于我们处理问题时的思路。
比如我们的变量应用文本，需要根据环境进行编辑时，这时候使用sed来编辑脚本便是我们第一时间能想到的了。

awk

awk命令正如上面所说，可以格式化文本
体现就在于它的分隔符上，默认是空格。
修改方式有两种

awk -F":" aa.txt
awk '{FS=":"}' aa.txt

第二种会导致第一行不适用，需要在BEGIN中编写，因此直接用第一种。

awk根据分隔符可以将行内容分为多段，每段按照从左到右的顺序，用$1，$2, $3…来输出。$0输出整行。

基础使用可以输出指定列

比如说这个问题
在这里插入图片描述
计算内存和。

a=0
b=$(cat nowcoder.txt|sed '1d'|awk -F" " '{print $4}')
echo $b
for i in $b
    do
        a=$(echo "$a+$i"|bc)
    done
echo $a

此外awk的内容是可以包含三部分的，除了必须的逐行处理的内容，还可以包含BEGIN和END的内容。BEGIN表示逐行处理前，END表示逐行处理结束后。

也即如下

awk 'BEGIN{FS=":"} {print $3} END{print "aaa"}' aaa.txt

aaa.txt如下

a:b:c

输出如下
在这里插入图片描述
END可以获取到在逐行处理中的变量，下面有示例可以看到。

awk功能光如此也不足道，强的地方还在于它的逻辑处理。
我们可以在文本内部写java语法的循环判断，而不用遵守shell的循环判断语法格式

如下面这个问题，
在这里插入图片描述

awk '{num[$2] += 1} END{for(a in num) if(num[a] >= 2) print num[a] a}' nowcoder.txt|sort -n 
#除了内部循环以外也使用了一维数组。shell中变量在赋值时就会完成初始化，这种东西见仁见智吧，我不觉得有啥好用的。

shell的变量没有定义都是字符串，自然数组的指针也能是字符串。

可以看到，awk确实可以进行相对复杂的格式化处理。

又因为shell中数组指针是字符串，我们可以用此来定义多维数组，如何理解？也就是说我们可以定义一个类似于这样的数组

num[1,2]=xxxxx
num[1,3]=yyyyy

其中的"1,2"就是这个指针的字符串。
当我们想取时可以用循环遍历来取。
上面说的这些都是在awk块内部建立的，其余地方使用会报错的

你可能会想行数和列数怎么确定呢，事实上不存在给你一个已生成的数组，数组的初始化一般都是你自己建立的。所以行数和列数你是已知的。实在不知道，那就只能for a in 数组来遍历打印看看了。

如下面这个问题用到了二维数组

在这里插入图片描述
使用二维数组编写如下

awk '{for(i=1;i<=NF;i++){num[NR,i]=$i}} END{for(j=1;j<=(i-1);j++) {
    for(k=1;k<=NR;k++){
        printf num[k,j]"\t"
    }
    printf "\n"
}}' nowcoder.txt

END代码块中，NR最后保存为行数， i-1为列数。

awk使用能熟练到这个程度就差不多够了。

sed

grep更适合单纯的查找或匹配文本，sed更适合编辑匹配到的文本，awk更适合格式化文本，对文本进行较复杂格式处理。

还是这个思路，那么当我们遇到单纯编辑文本时，就可以直接考虑用sed

sed命令还是很强大的，
在我工作过程中，关于nginx配置文件的编辑，环境变量配置文件根据环境进行的修改来写脚本文件时，都会用到这个命令。

sed简单使用时，可以在指定的行下添加新行，删除该行，根据正则替换行内匹配到的内容。

如下面这个问题。
在这里插入图片描述

sed '/^.*[bB].*$/d' nowcoder.txt

sed使用并不复杂，因此用来处理的问题也不算复杂，但是该用的时候还是很好用的。
上面是匹配到对应行就删除该行，格式为

sed '/正则/d' 文件名

另一个比较常用的是替换
格式为

sed 's/正则/替换的内容/g' 文件名

没找到相关例题，但是我们可以举个实际场景，某个应用的开放端口发生了改动（比如说增加了ssl访问端口）或者访问上下文发生了改动，此时线上环境还是用的旧的端口号，旧的上下文，那么我们更新版本的时候就需要脚本去改变我们nginx转发时候访问的端口号。那么改动端口号的时候我们就会用到sed。

sed -i 's/localhost:8080/localhost:8081/g' nginx.conf  #-i表示不输出到界面直接修改源文件

界定符也不一定是‘/’,也可以是’@‘,’#'.可以用来解决替换内容内部含有‘/’的情况。

grep

grep更适合单纯的查找或匹配文本，sed更适合编辑匹配到的文本，awk更适合格式化文本，对文本进行较复杂格式处理。

因此按这个思路，grep应该是运维最常用到的命令了，无论是检查当前服务器是否开启某个端口，还是搜索报错日志具体ERROR信息时这些十分常见的场景都是会用到的。

比如在应用日志中搜索error级别的日志信息

cat 日志文件 |grep -i error #-i参数不区分大小写

如果更具体需要用到正则,，比如搜索以ERROR开头日志则只需如此使用

cat 日志文件 |grep -i '^error'

除了-i之外常用的参数有

-v 显示不含有该搜索字段的行
-c 代替显示行信息，显示含有该搜索信息的行数
-n 显示行号

grep简单实用，也因此常用到。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1893615.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

linux中awk，sed， grep使用

awk

sed

grep

相关文章

论文解读——掌纹生成网络 RPG-Palm

React、JSX简介、渲染列表、基础和复杂的条件渲染

视图库对接系列(GA-T 1400)七、视图库对接系列(本级)校时

2024亚太赛（中文赛）数学建模竞赛选题建议+初步分析

IT服务管理的最佳实践：光大银行案例分析

MATLAB贝叶斯线性回归模型案例

7.基于SpringBoot的SSMP整合案例-表现层开发

tampermonkey插件下载国家标准文件

Vue2-Vue Router前端路由实现思路

Linux：网络配置命令

EtherCAT通讯介绍

JAVA数字化产科管理平台源码：涵盖了孕妇从建档、产检、保健、随访、分娩到产后42天全流程的信息化管理

CSS 背景效果

【刷题汇总--Fibonacci数列、单词搜索、杨辉三角】

使用 pyecharts 渲染成图片程序报错： echarts is not defined问题处理

EDUSRC-我与xx职院的爱恨情仇（教育漏洞挖掘）

揭秘Stable Diffusion做AI绘图赚钱秘诀：从零开始月入过万

苹果公司的Wifi定位服务(WPS)存在被滥用的风险

为什么要卸载手机上面的抖音？

恭喜！H医生一个月内荣获美国芝加哥大学访问学者邀请函