🍓 简介:java系列技术分享(👉持续更新中…🔥)
🍓 初衷:一起学习、一起进步、坚持不懈
🍓 如果文章内容有误与您的想法不一致,欢迎大家在评论区指正🙏
🍓 希望这篇文章对你有所帮助,欢迎点赞 👍 收藏 ⭐留言 📝🍓 更多文章请点击
上篇
请阅读:Linux Shell编程入门到实战(五)
文章目录
- 一、 cut工具
- 1. 示例:切割提取指定列数据
- 1.1 提取文件中第一列数据
- 1.2 提取文件中第一列,第三列, 枚举查找
- 1.3 提取文件中第二列,第三列,第四列, 范围查找
- 1.4 提取文件中第一列后面所有列的数据
- 1.5 提起文件中结束列前面所有列的数据
- 2 示例: 切割提取指定字符数据
- 2.1提取每行前3个字符
- 2.2 提取每行第4个字符以后的数据
- 2.3 提取每行第3个字符前面所有字符
- 3 示例:切割提取指定字节数据
- 3.1 提取字符串"abc我在哪里" 前3个字节
- 3.2 提取字符串"abc我在哪里" 前4个字节
- 3.3 提取字符串"abc我在哪里" 前6个字节
- 3.4 提取字符串"abc我在哪里" 前4个字节, 就可以将汉字 "我"输出,
- 4 示例:切割提取指定单词数据
- 5 示例:切割提取bash进程的PID号
- 6 示例:切割提取IP地址
- 7 小结
- 二、Shell好用的工具:sed
- 1. sed处理数据原理
- 2. 数据准备
- 3. 示例:向文件中添加数据
- 3.1 演示1: 指定行号的前或后面添加数据
- 3.2 演示2: 指定内容前或后面添加数据
- 3.3 演示3: 在最后一行前或后添加hello
- 3.4 演示4: 在最后一行前面添加hello
- 4. 示例: 删除文件中的数据
- 4.1 删除第2行
- 4.2 删除第1行,第4行数据
- 4.3 删除奇数行
- 4.4 删除指定范围的多行数据
- 4.5 删除指定范围取反的多行数据
- 4.6 删除最后一行
- 4.7 删除匹配xiaoming的行
- 4.8 删除匹配行到最后一行
- 4.9 删除匹配行及其后面一行
- 4.10 删除不匹配的行
- 5. 更改文件中的数据
- 5.1 演示1:将文件的第一行修改为hello
- 5.2 演示2 将包含xiaoming的行修改为hello
- 5.3 演示3 将最后一行修改为hello
- 5.4 演示4: 将文件中的lisi替换为hello
- 5.5 演示5 将文本中所有的lisi都替换为hello, 全局替换
- 5.6 演示6: 将每行中第二个匹配替换
- 5.7 演示7: 替换后的内容写入文件
- 5.8 演示8: 正则表达式匹配替换
- 5.9 演示9: 每行行首添加注释 `#`
- 6. 查询文件或管道中的数据
- 6.1 需求1: 查询含有 `xiaoming` 的行数据
- 6.2 需求2: 管道过滤查询
- 7. 多个sed程序命令执行
- 8. sed高级用法: 缓存区数据交换
- 8.1 模式空间与暂存空间介绍
- 8.2 关于缓存区sed程度命令
- 8.3 示例: 缓存空间数据交换
- 8.3.1 演示1: 第一行粘贴到最后1行
- 8.3.2 演示2: 第一行删除后粘贴到最后1行
- 8.3.3 演示3: 第一行数据复制粘贴替换其他行数据
- 8.3.4 演示4: 将前3行数据数据复制粘贴到最后一行
- 8.3.5 示例: 给每一行添加空行
- 8.3.6 示例: 删除所有的空行
- 三、 Shell好用的工具:awk
- 1. 介绍
- 2. 示例 : 默认每行空格切割数据
- 3. 示例: 打印含有匹配信息的行
- 4. 示例: 打印匹配行中第7列数据
- 5. 示例: 打印文件每行属性信息
- 6.示例: 打印第二行信息
- 7. 示例: 查找以c开头的资源
- 8. 示例: 打印第一列
- 9. 示例: 打印最后1列
- 10. 示例: 打印倒数第二列
- 11. 示例: 打印10到20行的第一列
- 12. 示例: 多分隔符使用
- 13. 示例: 添加开始与结束内容
- 14. 示例 : 使用循环拼接分割后的字符串
- 15. 示例: 操作指定数字运算
- 16. 示例: 切割ip
- 18. 示例: 显示空行行号
- 19. 小结
- 四、Shell好用的工具:sort
- 语法
- 数据准备
- 1. 示例1: 数字升序
- 2. 示例2: 数字升序去重
- 3. 示例3: 数字升序去重结果保存到文件
- 4. 示例4: 数字降序去重
- 5. 示例5: 多列排序
- 6. 小结
一、 cut工具
cut
译为“剪切, 切割” , 是一个强大文本处理工具,它可以将文本按列进行划分的文本处理。cut命令逐行读入文本,然后按列划分字段并进行提取、输出等操作。
cut [options] filename
options参数说明
选项参数 | 功能 |
---|---|
-f 提取范围 | 列号,获取第几列 |
-d 自定义分隔符 | 自定义分隔符,默认为制表符。 |
-c 提取范围 | 以字符为单位进行分割 |
-b 提取范围 | 以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。 |
-n | 与“-b”选项连用,不分割多字节字符; |
提取范围说明
提取范围 | 说明 |
---|---|
n- | 提取指定第n列或字符或字节后面所有数据 |
n-m | 提取指定第n列或字符或字节到第m列或字符或字节中间的所有数据 |
-m | 提取指定第m列或字符或字节前面所有数据 |
n1,n2,… | 提前指定枚举列的所有数据 |
1. 示例:切割提取指定列数据
cut1.txt文件数据准备
touch cut1.txt
编辑文件添加内容
AA zhangsan11 XX
BB lisi22 XXX
CC Shell 33 XXXX
DD it 44 XXXXXXX
1.1 提取文件中第一列数据
cut cut1.txt -d " " -f 1
1.2 提取文件中第一列,第三列, 枚举查找
cut cut1.txt -d " " -f 1,3
1.3 提取文件中第二列,第三列,第四列, 范围查找
1.4 提取文件中第一列后面所有列的数据
cut cut1.txt -d " " -f 2-
1.5 提起文件中结束列前面所有列的数据
cut -d " " -f -3 cut1.txt
# -2 提取指定列前面所有列数据
运行效果
2 示例: 切割提取指定字符数据
2.1提取每行前3个字符
cut cut1.txt -c1-3
运行效果
2.2 提取每行第4个字符以后的数据
cut cut1.txt -c 4-
运行效果
2.3 提取每行第3个字符前面所有字符
cut cut1.txt -c -3
运行效果
3 示例:切割提取指定字节数据
3.1 提取字符串"abc我在哪里" 前3个字节
echo "abc我在哪里" | cut -b -3
运行效果
3.2 提取字符串"abc我在哪里" 前4个字节
由于linux系统默认utf-8码表, 所以一个汉字占3个字节
echo "abc我在哪里" | cut -b -4
运行效果
3.3 提取字符串"abc我在哪里" 前6个字节
echo "abc我在哪里" | cut -b -6
运行效果
3.4 提取字符串"abc我在哪里" 前4个字节, 就可以将汉字 "我"输出,
-n 取消多字节字符分割直接输出
echo "abc我在哪里" | cut -nb -4
#
运行效果
4 示例:切割提取指定单词数据
在cut1.txt文件中切割出"zhangsan"
cat cut1.txt | grep zhangsan| cut -d " " -f 2
5 示例:切割提取bash进程的PID号
命令
ps -aux | grep 'bash' | head -n 1 | cut -d " " -f 6
运行效果
6 示例:切割提取IP地址
ifconfig | grep broadcast | cut -d " " -f 10
7 小结
cut的作用
- 一个强大文本处理工具,它可以将文本按列进行划分的文本处理。
- cut命令逐行读入文本,然后按列划分字段并进行提取、输出等操作。
cut切割提取列
cut 文件或数据 -d 分隔符切割 -f 提取第X列
cut切割提取字符
cut 文件或数据 -c 提取字符范围
cut切割提取字节
cut 文件或数据 -nb 提取直接范围
二、Shell好用的工具:sed
sed (stream editor, 流编辑器)
是Linux下一款功能强大的非交互流式文本编辑器(vim是交互式文本编辑器),可以对文本文件的每一行数据匹配查询之后进行增、删、改、查等操作,支持按行、按字段、按正则匹配文本内容,灵活方便,特别适合于大文件的编辑.
sed是一种流编辑器,它一次处理一行内容, 将这行放入缓存(存区空间称为:模式空间
),然后才对这行进行处理,处理完后,将缓存区的内容发送到终端。
1. sed处理数据原理
语法
sed [选项参数] [模式匹配/sed程序命令] [文件名]
- 模式匹配,sed会读取每一行数据到模式空间中, 之后判断当前行是否符合模式匹配要求,符合要求就会 执行sed程序命令, 否则不会执行sed程序命令;如果不写匹配模式,那么每一行都会执行sex程序命令
选项参数说明
选项参数 | 功能 |
---|---|
-e | 直接在指令列模式上进行sed的动作编辑。它告诉sed将下一个参数解释为一个sed指令,只有当命令行上给出多个sed指令时才需要使用-e选项;一行命令语句可以执行多条sed命令 |
-i | 直接对内容进行修改,不加-i时默认只是预览,不会对文件做实际修改 |
-f | 后跟保存了sed指令的文件 |
-n | 取消默认输出,sed默认会输出所有文本内容,使用-n参数后只显示处理过的行 |
-r ruguler | 使用扩展正则表达式,默认情况sed只识别基本正则表达式 * |
sed程序命令功能描述
命令 | 功能描述 |
---|---|
a | add新增,a的后面可以接字串,在下一行出现 |
c | change更改, 更改匹配行的内容 |
d | delete删除, 删除匹配的内容 |
i | insert插入, 向匹配行前插入内容 |
p | print打印, 打印出匹配的内容,通常与-n选项和用 |
s | substitute替换, 替换掉匹配的内容 |
= | 用来打印被匹配的行的行号 |
n | 读取下一行,遇到n时会自动跳入下一行 |
特殊符号
命令 | 功能描述 |
---|---|
! | 就像一个sed命令,放在限制条件后面, 对指定行以外的所有行应用命令(取反) |
{sed命令1;sed命令2} | 多个命令操作同一个的行 |
2. 数据准备
sed.txt文件内容
ABC
lisi lisi
xiaoming
123
xiaoming
3. 示例:向文件中添加数据
3.1 演示1: 指定行号的前或后面添加数据
向第三行后面添加hello
sed '3ahello' sed.txt
3 , 代表第三行
a, 代表在后面添加, 出现在下一行
注意这里没有修改源文件
运行效果
向第三行前面添加hello
sed '3ihello' sed.txt
3 , 代表第三行
i, 代表在前面添加, 出现在上一行
注意这里没有修改源文件
运行效果
3.2 演示2: 指定内容前或后面添加数据
向内容 xiaoming
后面添加 hello
,如果文件中有多行包括 ``xiaoming
,则每一行后面都会添加
sed '/xiaoming/ahello' sed.txt
运行效果
向内容 xiaoming
前面添加 hello
,如果文件中有多行包括 ``xiaoming
,则每一行前面都会添加
sed '/xiaoming/ihello' sed.txt
运行效果
3.3 演示3: 在最后一行前或后添加hello
在最后一行后面添加hello
sed '$ahello' sed.txt
$a: 最后一行后面添加
运行效果
3.4 演示4: 在最后一行前面添加hello
sed '$ihello' sed.txt
$i: 最后一行前面添加
运行效果
4. 示例: 删除文件中的数据
4.1 删除第2行
命令
sed '2d' sed.txt
# d 用于删除
# 2d 删除第2行
运行效果
4.2 删除第1行,第4行数据
sed '1d;4d' sed.txt
运行效果
4.3 删除奇数行
从第一行开始删除,每隔2行就删掉一行
sed '1~2d' sed.txt
# 1~2 从第1行开始, 每隔2行
运行效果
4.4 删除指定范围的多行数据
删除从第1行到第3行的数据
sed '1,3d' sed.txt
# 1,3 从指定第1行开始到第3行结束
运行效果
4.5 删除指定范围取反的多行数据
删除从第1行到第3行取反的数据
sed '1,3!d' sed.txt
# 1,3! 从指定第1行开始到第3行结束取反, 就是不在这个范围的行
运行效果
4.6 删除最后一行
命令
sed '$d' sed.txt
运行效果
4.7 删除匹配xiaoming的行
命令
sed '/xiaoming/d' sed.txt
运行效果
4.8 删除匹配行到最后一行
删除匹配xiaoming行到最后一行 , 命令
sed '/xiaoming/,$d' sed.txt
# , 代表范围匹配
运行效果
4.9 删除匹配行及其后面一行
删除匹配xiaoming行及其后面一行
sed '/xiaoming/,+1d' sed.txt
运行效果
4.10 删除不匹配的行
删除不匹配 xiaoming
或 lisi
的行
sed '/xiaoming\|lisi/!d' sed.txt
# \| 是正则表达式的或者 这里|需要转义, 所以为\|
# ! 取反
运行效果
5. 更改文件中的数据
5.1 演示1:将文件的第一行修改为hello
命令
sed '1chello' sed.txt
运行效果
5.2 演示2 将包含xiaoming的行修改为hello
命令
sed '/xiaoming/chello' sed.txt
运行效果
5.3 演示3 将最后一行修改为hello
命令
sed '$chello' sed.txt
运行效果
5.4 演示4: 将文件中的lisi替换为hello
将文件中的lisi替换为hello,默认只替换每行第一个lisi
sed 's/lisi/hello/' sed.txt
运行效果
注意
's/lisi/hello/'
最后一个/
不可少
5.5 演示5 将文本中所有的lisi都替换为hello, 全局替换
sed 's/lisi/hello/g' sed.txt
# g 代表匹配全局所有符合的字符
5.6 演示6: 将每行中第二个匹配替换
将每行中第二个匹配的lisi替换为hello 命令
sed 's/lisi/hello/2' sed.txt
运行效果
5.7 演示7: 替换后的内容写入文件
将每行中第二个匹配的lisi替换为hello , 将替换后的内容写入到sed2.txt文件中
# 第一种方式
sed -n 's/lisi/hello/2pw sed2.txt' sed.txt
# w写入
# p打印, -n只是获取
# 第二种方式
sed -n 's/lisi/hello/2p ' sed.txt > sed2.txt
运行效果
5.8 演示8: 正则表达式匹配替换
匹配有 i
的行,替换匹配行中 s
后的所有内容为空
sed '/i/s/s.*//g' sed.txt
# /t.*/ 表示逗号后的所又内容
运行效果
5.9 演示9: 每行行首添加注释 #
命令
sed 's/^/#/' sed.txt
运行效果
6. 查询文件或管道中的数据
6.1 需求1: 查询含有 xiaoming
的行数据
命令
sed -n '/xiaoming/p' sed.txt
运行效果
6.2 需求2: 管道过滤查询
管道查询所有进程中含有sshd的进程信息命令
ps -aux | sed -n '/bash/p'
运行效果
7. 多个sed程序命令执行
将sed.txt文件中的第1行删除并将 lisi
替换为 zhangsan
# 第一种方式, 多个sed程序命令 在每个命令之前使用 -e 参数
sed -e '1d' -e 's/lisi/zhangsan/g' sed.txt
# 第二种方式
sed '1d;s/lisi/zhangsan/g' sed.txt
运行效果
8. sed高级用法: 缓存区数据交换
8.1 模式空间与暂存空间介绍
-
首先需要明白,
sed处理文件是逐行处理的, 即**读取一行处理一行,输出一行**
; -
sed把文件读出来每一行存放的空间叫模式空间, 会在该空间中对读到的内容做相应处理;
-
此外sed还有一个额外的空间即暂存空间,
暂存空间刚开始里边只有个空行, 记住这一点
; -
sed可使用相应的命令从模式空间往暂存空间放入内容或从暂存空间取内容放入模式空间;
2个缓存空间传输数据的目的是为了更好的处理数据, 一会参考案例学习
8.2 关于缓存区sed程度命令
命令 | 含义 |
---|---|
h | 将模式空间里面的内容复制到暂存空间缓存区(覆盖方式) |
H | 将模式空间里面的内容复制到暂存空间缓存区(追加方式) |
g | 将暂存空间里面的内容复制到模式空间缓存区(覆盖方式) |
G | 将暂存空间里面的内容复制到模式空间缓存区(追加方式) |
x | 交换2个空间的内容 |
8.3 示例: 缓存空间数据交换
8.3.1 演示1: 第一行粘贴到最后1行
将模式空间第一行复制到暂存空间(覆盖方式),并将暂存空间的内容复制到模式空间中的最后一行(追加方式)
sed '1h;$G' sed.txt
1h 从模式空间中将第一行数据复制到暂存空间(覆盖方式)
$G 将暂存空间中的内容复制到模式空间中最后一行(追加方式)
运行效果
8.3.2 演示2: 第一行删除后粘贴到最后1行
将模式空间第一行复制到暂存空间(覆盖方式)并删除, 最后将暂存空间的内容复制到模式空间中的最后一行(追加方式)
sed '1{h;d};$G' sed.txt
# 1{h;d}对模式空间中的第一行数据同时进行复制到暂存空间(覆盖方式)和删除模式空间中的第一行数据
运行效果
8.3.3 演示3: 第一行数据复制粘贴替换其他行数据
将模式空间第一行复制到暂存空间(覆盖方式), 最后将暂存空间的内容复制到模式空间中替换从第2行开始到最后一行的每一行数据(覆盖方式)
sed '1h;2,$g' sed.txt
运行命令
8.3.4 演示4: 将前3行数据数据复制粘贴到最后一行
将前3行数据复制到暂存空间(追加方式), 之后将暂存空间的所有内容复制粘贴到模式空间最后一行(追加方式)
sed '1,3H;$G' sed.txt
运行效果
8.3.5 示例: 给每一行添加空行
插入空行
sed G -i sed.txt
# G 每行后面添加一个空行
# -i 修改源文件
运行效果
8.3.6 示例: 删除所有的空行
命令
sed -i '/^$/d' sed.txt
运行效果
三、 Shell好用的工具:awk
1. 介绍
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理, 因为切开的部分使用awk可以定义变量,运算符, 使用流程控制语句进行深度加工与分析。
创始人 Alfred V. Aho、Peter J. Weinberger和Brian W. Kernighan awk由来是姓氏的首字母
语法
awk [options] 'pattern{action}' {filenames}
pattern:表示AWK在数据中查找的内容,就是匹配模式
action:在找到匹配内容时所执行的一系列命令
选项参数说明
选项参数 | 功能 |
---|---|
-F | 指定输入文件拆分分隔符 |
-v | 赋值一个用户定义变量 |
awk内置变量
内置变量 | 含义 |
---|---|
ARGC | 命令行参数个数 |
ARGV | 命令行参数排列 |
ENVIRON | 支持队列中系统环境变量的使用 |
FILENAME | awk浏览的文件名 |
FNR | 浏览文件的记录数 |
FS | 设置输入域分隔符,等价于命令行 -F选项 |
NF | 浏览记录的域的个数, 根据分隔符分割后的列数 |
NR | 已读的记录数, 也是行号 |
OFS | 输出域分隔符 |
ORS | 输出记录分隔符 |
RS | 控制记录分隔符 |
$n | $0 变量是指整条记录。$1 表示当前行的第一个域,$2 表示当前行的第二个域,…以此类推。 |
$NF | $NF是number finally,表示最后一列的信息,跟变量NF是有区别的,变量NF统计的是每行列的总数 |
数据准备
cp /etc/passwd ./
2. 示例 : 默认每行空格切割数据
命令
echo "abc 123 456" | awk '{print $1"&"$2"&"$3}'
运行效果
3. 示例: 打印含有匹配信息的行
搜索passwd文件有root关键字的所有行
awk '/root/' passwd
# '/root/' 是查找匹配模式, 没有action命令, 默认输出所有符合的行数据
运行效果
4. 示例: 打印匹配行中第7列数据
搜索passwd文件有root关键字的所有行, 然后以":"拆分并打印输出第7列
awk -F: '/root/{print $7}' passwd
# -F: 以':'分隔符拆分每一个列(域)数据
运行效果
5. 示例: 打印文件每行属性信息
统计passwd: 文件名,每行的行号,每行的列数,对应的完整行内容:
awk -F ':' '{print "文件名:" FILENAME ",行号:" NR ",列数:" NF ",内容:" $0}' passwd
# "文件名:" 用于拼接字符串
运行效果
使用printf替代print,可以让代码阅读型更好
awk -F ':' '{printf("文件名:%5s,行号:%2s, 列数:%1s, 内容:%2s\n",FILENAME,NR,NF,$O)}' passwd
# printf(格式字符串,变量1,变量2,...)
# 格式字符串: %ns 输出字符串,n 是数字,指代输出几个字符, n不指定自动占长度
# 格式字符串: %ni 输出整数,n 是数字,指代输出几个数字
# 格式字符串: %m.nf 输出浮点数,m 和 n 是数字,指代输出的整数位数和小数位数。如 %8.2f 代表共输出 8 位数,其中 2 位是小数,6 位是整数;
运行效果
6.示例: 打印第二行信息
打印/etc/passwd/的第二行信息
awk -F ':' 'NR==2{printf("filename:%s,%s\n",FILENAME,$0)}' passwd
运行效果
7. 示例: 查找以c开头的资源
awk过滤的使用, 查找当前目录下文件名以c开头的文件列表
ls -a | awk '/^c/'
运行效果
8. 示例: 打印第一列
按照":" 分割查询第一列打印输出
awk -F ':' '{print $1}' passwd
运行效果
9. 示例: 打印最后1列
按照":" 分割查询最后一列打印输出
awk -F: '{print $NF}' passwd
运行效果
10. 示例: 打印倒数第二列
按照":" 分割查询倒数第二列打印输出
awk -F: '{print $(NF-1)}' passwd
# $(NF-N) N是几, 就是倒数第几列
运行效果
11. 示例: 打印10到20行的第一列
获取第10到20行的第一列的信息
awk -F: '{if(NR>=10 && NR<=20) print $1}' passwd
运行效果
12. 示例: 多分隔符使用
“one:two/three"字符串按照多个分隔符”:“或者”/" 分割, 并打印分割后每个列数据
echo "one:two/three" | awk -F '[:/]' '{printf("%s\n%s\n%s\n%s\n",$0,$1,$2,$3)}'
运行效果
13. 示例: 添加开始与结束内容
给数据添加开始与结束
echo -e "abc\nabc" | awk 'BEGIN{print "开始..."} {print $0} END{print "结束..."}'
# BEGIN 在所有数据读取行之前执行;END 在所有数据执行之后执行。
运行效果
14. 示例 : 使用循环拼接分割后的字符串
“abc zhangsan lisi 32” 使用空格分割后, 通过循环拼接在一起
echo "abc zhangsan lisi 32" | awk -v str="" -F '[ ]+' '{for(n=1;n<=NF;n++){ str=str$n} print str }'
# -v 定义变量
运行效果
15. 示例: 操作指定数字运算
将passwd文件中的用户id增加数值1并输出
echo "2.1" | awk -v i=1 '{print $0+i}'
运行效果
16. 示例: 切割ip
切割IP
ifconfig | awk '/broadcast/{print}' | awk -F " " '{print $2}'
运行效果
18. 示例: 显示空行行号
查询sed.txt中空行所在的行号
sed 'G' sed.txt | awk '/^$/{print NR}'
运行效果
19. 小结
grep , sed ,awk , cut 文本字符串操作四剑客的区别
grep:用于查找匹配的行
cut: 截取数据. 截取某个文件中的列, 重点是按照列分割, 这个命令不适合截取文件中有多个空白字符的字段
sed: 增删改查数据. sed用于在文件中以行来截取数据进行增\删\改\查
awk:截取分析数据. 可以在某个文件中是以竖列来截取分析数据, 如果字段之间含有很多空白字符也可以获取需要的数据, awk是一种语言,可以深入分析文件数据
四、Shell好用的工具:sort
sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出或重定向输出到指定文件。
语法
sort (options) 参数
选项 | 说明 |
---|---|
-n | number,依照数值的大小排序 |
-r | reverse, 以相反的顺序来排序 |
-t 分隔字符 | 设置排序时所用的分隔字符, 默认空格是分隔符 |
-k | 指定需要排序的列 |
-d | 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。 |
-f | 排序时,将小写字母视为大写字母 |
-b | 忽略每行前面开始出的空格字符 |
-o 输出文件 | 将排序后的结果存入指定的文件 |
-u | 意味着是唯一的(unique),输出的结果是去完重了的 |
-m | 将几个排序好的文件进行合并 |
参数:指定待排序的文件列表
数据准备
sort.txt文本文件代码
张三 30
李四 95
播仔 85
播仔 85
播仔 86
AA 85
小明 100
1. 示例1: 数字升序
按照“ ”空格分割后的第2列数字升序排序。
sort -t " " -k2n,2 sort.txt
# -t " " 代表使用空格分隔符拆分列
# -k 2n,2 代表根据从第2列开始到第2列结束进行数字升序, 仅对第2列排序
运行效果
2. 示例2: 数字升序去重
先按照“ ”空格分割后的, 然后,按照第2列数字升序排序, 最后对所有列去重
sort -t " " -k2n,2 -uk1,2 sort.txt
运行效果
注意: 先排序再去重
3. 示例3: 数字升序去重结果保存到文件
命令
sort -t " " -k2n,2 -uk1,2 -o sort2.txt sort.txt
运行效果
4. 示例4: 数字降序去重
先按照“ ”空格分割后的, 然后,按照第2列数字降序排序, 最后对所有列去重
sort -t " " -k2nr,2 -uk1,2 sort.txt
运行效果
5. 示例5: 多列排序
数据准备sort3.txt
公司A,部门A,3
公司A,部门B,0
公司A,部门C,10
公司A,部门D,9
公司B,部门A,30
公司B,部门B,40
公司B,部门C,43
公司B,部门D,1
公司C,部门A,30
公司C,部门B,9
公司C,部门C,100
公司C,部门D,80
公司C,部门E,60
要求: 以","分割先对第一列字符串升序, 再对第3列数字降序
sort -t "," -k1,1 -k3nr,3 sort3.txt
运行效果
6. 小结
能够使用sort对字符串升序或降序排序
字符串升序:
sort -kstart,end 文件
字符串降序:
sort -kstartr,end 文件
能够使用sort 对数字升序或降序
数字升序:
sort -kstartn,end 文件
数字降序:
sort -kstartnr,end 文件
能够使用sort 对多列进行排序
sort -kstart[nr],end -kstart[nr],end ... 文件