shell 中的grep sed awk命令

一、grep命令

1.基本格式

2.常用命令

3. sort 命令

3.1 格式

3.2 常用选项

4. uniq 快捷去重

4.1 格式

5. tr 命令

5.1 格式

5.2 常用选项

练习：

二、sed 命令

1. sed基本概念

2. 基本操作格式

3. 常用选项

4. 应用

5. 文本模式过滤行内容

6. sed 的删除操作

7.sed 命令替换

7.1 格式

7.2 标记说明

7.3 示例

总结：

三、awk 命令

1.awk 命令基本概念

2. 基本结构

3.工作过程

4.工作原理

5.常用选项

6.内置变量

7. 示例

一、grep命令

1.基本格式

grep [选项]… 查找条件目标文件

2.常用命令

选项	功能
-m [ x ]	匹配x次后停止,x为具体数字
-v	取反
-i	忽略字符大小写
-n	显示匹配的行号
-c	统计匹配的行数
-o	仅显示匹配到的字符串
-q	静默模式，不输出任何信息
-A # after	匹配内容的后#行
-B # before	前#行
-C # context	前后各#行
-e	实现多个选项间的逻辑or关系
-w	匹配整个单词
-E	使用扩展正则表达式，相当于egrep
-F	不支持正则表达式，相当于fgrep
-r	递归目录，但不处理软链接
-R	递归目录，但处理软链接
-f file	file 根据模式文件，处理两个文件相同内容把第一个文件作为匹配条件
-color=auto	对匹配到的文本着色显示

#grep -m ：匹配多少次后结束
grep -m 1 root /etc/passwd
root:x:0:0:root:/root:/bin/bash


# grep -E 拓展正则 
grep -Ev '^[[:space:]]*#|^$' /etc/fstab
# ^:行的开始
# [[:space:]]*: 匹配任意数量的空白字符  * 表示前面的元素可以出现零次或多次。
# #: 紧接着空白字符之后，匹配注释符号 
# ^$: 匹配完全空白的行
UUID=9f85ffd8-d116-4d93-b305-98254c7fb344 /        xfs     defaults        0 0
UUID=b5f61360-55f4-4f26-bbb7-3dbacfebc1f1 /boot    xfs     defaults        0 0
UUID=ed944890-6c21-44ac-8f62-22cfc3cda1a9 /home    xfs     defaults        0 0
UUID=8d6683ac-4d68-40b6-83b2-1ee1a2e0dc14 swap     swap    defaults        0 0

cat 123.txt |grep -v '^$' >test.txt  #将非空行写入到test.txt文件
grep "^b" 123.txt                    #过滤已b开头
grep '/$'  123.txt                   #过滤已/结尾

3. sort 命令

以行为单位对文件内容进行排序，可以根据不同的数据类型来排序【就是一个排序命令】

3.1 格式

sort 选项参数
cat file | sort 选项

3.2 常用选项

选项	说明
-f	忽略大小写，默认会大写字母排在前面
-b	忽略每行前面的空格
-n	按照数字进行排序
-r	反向排序
-u	等同uniq，表示相同的数据仅显示一行，去重
-t	指定字段分隔符，默认使用tab键分隔
-k	指定排序字段
-o<输出文件>	将排序后的结果转存至指定文件

sort -n test.txt        #按数字大小进行排序
sort -n -r test.txt     #按数字大小倒叙排列
sort -u test.txt        #重复的数据只展示一次，相当于去重

4. uniq 快捷去重

uniq命令用于报告或者忽略文件中连续的重复行，常与sort命令结合使用。

4.1 格式

uniq [选项] 参数
cat 文件| uniq 选项

选项	说明
-c	统计连续重复的行的次数，并且合并重复的行
-u	显示仅出现一次的行（包括不连续的重复行）
-d	仅显示重复出现的行（必须是连续的重复行）

uniq -u test.txt              #只显示出现一次的行
uniq -d test.txt              #只显示连续重复的行
sort -n test.txt | uniq -c    #对重复的数据行计数，并且去重输出
sort -n test.txt | uniq -u    #只展示不重复的数据行
sort -n test.txt | uniq -d    #只展示重复的数据行

5. tr 命令

常用于对来自标准输入的字符进行替换、压缩和删除

5.1 格式

tr 选项参数

5.2 常用选项

选项	说明
-c	保留字符集1的字符，其他的字符（包括换行符\n）用字符集2替换
-d	删除所有属于字符集1的字符
-s	将重复出现的字符串压缩为一个字符串，用字符集2 替换字符集1
-t	字符集2 替换字符集1，不加也行

echo 192.168.233.22 | tr '.' ' '         #把"." ,替换成空格
echo ABC | tr "A-Z" "a-z"                #大写替换成小写
echo abc | tr -c 'ab' 'a'                #保留了ab，替换了c,输出aa
echo abc | tr -d 'ab'                    #删除ab，打印c

练习：

1.使用grep和正则表达式，查找以“a”开头，以“z”结尾，且中间包含任意字符（包括0个字符）的行。

2.假设你有一个包含学生分数的文件，每行记录包含学生姓名和分数。请使用命令组合，找出分数最高的学生姓名和分数。

3.编写一个管道命令序列，首先使用grep查找包含特定模式的行，然后使用tr进行大小写转换，接着使用sort进行排序，最后使用uniq去除重复行。