《Linux Shell脚本攻略》学习笔记-第四章

news2025/1/12 18:04:17

4.1  简介

本章主要介绍sed、awk、grep、cut等命令,这些工具可以相互结合以满足文本处理需求。

正则表达式是一种基础的模式匹配技术。

4.2 使用正则表达式

正则表达式是由字面文本和具有特殊意义的符号组成的。

1)位置标记

位置标记锚点是标识字符串位置的正则表达式。

正则表达式

描述

示例

^

指定了匹配正则表达式的文本必须起始于字符串的首部

^tux能够匹配以tux起始的行

$

指定了匹配正则表达式的文本必须结束语目标字符串的尾部

tux$能够匹配以tux结尾的行

2)标识符

标识符是正则表达式的基础组成部分。

正则表达式

描述

A

正则表达式必须匹配该字符

.

匹配任意一个字符

[]

匹配括号中的任意一个字符

[^]

匹配不在括号中的任意一个字符

3)数量修饰符

一个标识符可以出现一次、多次或者不出现,数量修饰符定义了模式可以出现的次数。

正则表达式

描述

匹配之前的项1次或者0次

+

匹配之前的项1次或者多次

*

匹配之前的项0次或者多次

{n}

匹配之前的项n次

{n,}

之前的项至少需要匹配n次

{n,m}

之前的项所匹配的最小次数和最多次数

4)其他

正则表达式

描述

()

将括号中的内容视为一个整体

|

选择结构,可以匹配|两边的任意一项

\

转义字符

5)示例

4.3 使用grep在文件中搜索文本

1)grep的用法

2)递归搜索多个文件

3)忽略模式中的大小写

4)使用grep匹配多个模式

5)在grep搜索中指定或者排除文件

6)使用0值字节后缀的xargs和grep

-l告诉grep只输出有匹配出现的文件名;-Z使得grep使用0值字节作为文件的终结符

7)grep的静默输出

在静默模式中,grep命令不会输出任何内容。它仅是运行命令,然后根据命令执行成功与否返回退出状态。

8)打印出匹配文本之前或之后的行

-A可以打印出匹配结果之后的行,-B可以打印出匹配结果之前的行,-A-B可以结合使用,等价于-C

4.4 使用cut按列切分文件

cut命令可以按列,而不是按行来切分文件。

1)

2)cut命令可以根据字节或者字符来指定选择范围

N-

从第N个字节、字符或字段开始到行尾

N-M

从第N个字节、字符或字段开始到第M个(包括第M个在内)字节、字符或字段

-M

从第1个字节、字符或字段开始到第M个(包括第M个在内)字节、字符或字段

-b表示字节,-c表示字符,-f用于定义字段

4.5 使用sed替换文本

sed最常见的用法就是进行文本替换。

1)

2)之前的例子中只替换了每行中模式首次匹配的内容,g标记可以使sed执行全局替换

/#g标记可以使sed替换第#次出现的匹配

3)sed命令会将s之后的字符视为命令分隔读。这允许我们更改默认的分隔符/

     如果分隔符的字符出现在模式中,必须使用\对其进行转义。

4)移除空行

5)直接在文本中替换 sed -i\b表示单词边界。

6)已匹配字符串标记&

可以用&指代模式所匹配到的字符串,\w\+匹配每一个单词

7)子串匹配标记

可以使用\#来指代出现在括号中的部分正则表达式所匹配到的内容。

8)组合多个表达式

可以利用管道组合多个sed命令,多个模式之间可以用分号分隔,或者使用-e。

9)引用

必须是双引号

4.6 使用awk进行高级文本处理

awk命令可以处理数据流。它支持关联数组、递归函数、条件语句等功能。

awk以逐行的形式处理文件。BEGIN之后的命令会先于公共语句块执行。对于匹配PATTERN的行,awk会对其执行PATTERN之后的命令。最后,在处理完整个文件之后,awk会执行END之后的命令。

1)输出文件行数

2)最重要的部分就是和pattern关联的语句块。这个语句是可选的,如果不提供,则默认执行{print},即打印所读取到的每一行。

当使用不带参数的print时,他会打印出当前行。print能够接受参数,这些参数以逗号分隔,在打印参数时则以空格作为参数之间的分隔符。在awk的print语句中,双引号被当做拼接操作符使用。

3)awk命令是一个解释器,它能够解释并执行程序,和shell一样,它也包括了一些特殊变量。

特殊变量

含义

NR

记录编号

NF

字段数量

$0

该变量包含了当前记录的文本内容

$1

该变量包含了第一个字段的文本内容

$2

该变量包含了第二个字段的文本内容

4)借助外部变量值传递给awk

5)从getline读取行

awk默认读取文件中的所有行。如果只想读取某一行,可以使用getline函数。

该函数的语法为:getline var。变量var包含了特定行。

6)使用过滤模式对awk处理的行进行过滤

7)设置字段分隔符

8)在awk中使用循环

4.7 统计特定文件中的词频

4.8 压缩和解压缩JavaScript

4.9 按列合并多个文件

4.10 打印文件或行中的第n个单词或列

4.11 打印指定行或者模式之间的文本

4.12 以逆序形式打印行

最简单的形式就是使用tac命令,当然也可以用awk来搞定。

1)tac

tac默认使用\n作为分隔符,但是我们也可以使用选项-s指定其他分隔符

2)awk

4.13 解析文本中的电子邮件地址和URL

1)能够匹配邮件地址的正则表达式:

2)匹配HTTP URL的正则表达式:

4.14 删除文件中包含特定单词的句子

sed是进行文本替换的不二之选,我们可以利用sed将匹配的句子替换成空白。

4.15 对目录中的所有文件进行文本替换

4.16 文件切片与参数操作

1)替换变量内容中的部分文本

2)我们可以通过指定字符串的起始位置和长度来生成子串

${var:M:N}:从第M+1个字符开始,打印N个字符

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/166667.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Anaconda安装、opencv环境配置、jupyter notebook使用虚拟环境

目录一、Anaconda 的安装二、opencv 3.4.1.15版本安装三、jupyter notebook使用虚拟环境四、运行报错-缺库一、Anaconda 的安装 Anaconda官网:Anaconda Installers Anaconda历史版本:Anaconda Index of 这边建议和我装一样anaconda3 python3.7&#xf…

opencv的图像基本操作(基于jupyter Notebook)

opencv的基本操作cv2是opencv在python中的缩写,函数开头用cv2cv2.imread(cat.jpg) #读入图片cat.jpgcv2.imwrite(mycat.png,img) #图片img保存为mycat.pngcv2.imshow(image,img) #创建窗口,显示图像cv2.waitKey(10000) #等待时间,以 毫秒为单…

整数分解

问题描述 将 3 分解成两个正整数的和, 有两种分解方法, 分别是 312312 和 321321 。注意顺序不同算不同的方法。 将 5 分解成三个正整数的和, 有 6 种分解方法, 它们是 113122113122 131212221311131212221311 。 请问, 将 2021 分解成五个正整数的和, 有多少种分解方法? …

Android大厂面试100题,涵盖测试技术、环境搭建、人力资源

测试技术面试题 1、什么是兼容性测试?兼容性测试侧重哪些方面? 2、我现在有个程序,发现在Windows上运行得很慢,怎么判别是程序存在问题还是软硬件系统存在问题? 3、测试的策略有哪些? 4、正交表测试用例…

Sinutrain下载安装与开启OPC UA---kalrry

Sinumerik下载安装与开启OPC UA---kalrry前言一、安装前准备二、Win7安装1、软件安装2、开启授权3、文件配置4、客户端连接三、Win10/11安装四、启动后使用前言 本教程只适用于 Sinutrain-v4.7 版本,其他版本配置目录有所改变建议安装到默认路径,否则后…

【云原生】k8s安全机制

内容预知 前言 1. 认证(Authentication) 1.1 k8s集群内的三种认证方式 1.2 k8s集群内的认证说明 (1)需要被认证的访问类型 (2)安全性说明 (3)证书颁发的方式 (4&a…

Qt中使用qt自带的函数实现各种进制间的相互转换,easy.

文章目录一.十进制转各种进制第一种:使用QString的静态函数number第二种:使用QString的拼接函数arg二.各种进制相互转换一.十进制转各种进制 第一种:使用QString的静态函数number ①使用QString的静态函数number即可,如我把字符…

嵌入式linux-进程状态与进程关系

1. 进程状态 1.1什么是进程状态 Linux 系统下进程通常存在 6 种不同的状态,分为:就绪态、运行态、僵尸态、可中断睡眠状态(浅度 睡眠)、不可中断睡眠状态(深度睡眠)以及暂停态。 下面我们来一一总结一下&…

数据湖之Hudi基础:入门介绍和编译部署

主要记录下Hudi的概述和打包编译等内容,方便参考 文章目录简介官网发展历史Hudi特性使用场景安装部署编译环境准备编译hudi1.源码包上传到服务器2.修改pom文件3.修改源码兼容hadoop34.手动安装kafka依赖(非必须)5.解决spark模块依赖冲突6.执行…

【基础篇】4 # 链表(上):如何实现LRU缓存淘汰算法?

说明 【数据结构与算法之美】专栏学习笔记 链表结构 数组需要一块连续的内存空间来存储,对内存的要求比较高, 而链表并不需要一块连续的内存空间,它通过指针将一组零散的内存块串联起来使用。 结点:指的是内存块后继指针 next…

Postgresql源码(98)lex与yacc的定制交互方式

1 背景知识一:LEX %option prefix Postgresql中使用%option prefix"core_yy",影响范围:yy_create_buffer,yy_delete_buffer,yy_flex_debug,yy_init_buffer,yy_flush_buffer,yy_load_buffer_state,yy_switch_to_buffer,yyin,yyleng…

【并发编程十一】c++线程同步——future

【并发编程十一】c线程同步——future一、互斥二、条件变量三、future1、promise1.1、子线程设值,主线程获取1.2、主线程设置值,子线程获取1.3、shared_future2、async2.1、不开新线程的async2.2、开新线程的async3、packaged_task3.1、不使用bind3.2、提…

Kafka-概述

一、Kafka是什么 1.定义 Apache Kafka 是一款开源的消息引擎系统。 消息引擎系统是一组规范。企业利用这组规范在不同系统之间传递语义准确的消息,实现松耦合的异步式数据传递。 二、消息队列的使用场景 传统消息队列的应用场景包括 缓存/削峰、解耦、异步通信 …

vue(透传属性,$attrs)

官方文档 https://cn.vuejs.org/guide/components/attrs.html 案例 <FirstLevel class"attr-test-class" name"zs" age"18"></FirstLevel>FirstLevel组件没有用props去申明name和age&#xff0c;所以这两个属性会透视传递。 <…

RT-Thread系列--组件初始化

一、目的RT-Thread里面有个特别有意思的软件设计叫做组件自动初始化。有些小伙伴可能是第一次听说&#xff0c;所以这边我解释一下&#xff0c;请看下面的代码片段static void clock_init() {// 时钟初始化 } static void uart_init() {// 串口初始化 } static void i2c_init()…

SpringBoot自定义拦截器

&#x1f341;博客主页&#xff1a;&#x1f449;不会压弯的小飞侠 ✨欢迎关注&#xff1a;&#x1f449;点赞&#x1f44d;收藏⭐留言✒ ✨系列专栏&#xff1a;&#x1f449;SpringBoot专栏 &#x1f525;欢迎大佬指正&#xff0c;一起学习&#xff01;一起加油&#xff01; …

JavaScript 浏览器的重排和重绘

文章目录JavaScript 浏览器的重排和重绘概述浏览器解析过程重排重绘优化将多次改变样式的属性操作合并为一次需要多次重排的元素设置为绝对定位减少DOM操作复杂元素处理先设置display为none处理完后再显示缓存频繁操作的属性减少使用table布局使用事件委托绑定事件处理程序利用…

上海亚商投顾:沪指重返3200点 牛市旗手回归!

上海亚商投顾前言&#xff1a;无惧大盘涨跌&#xff0c;解密龙虎榜资金&#xff0c;跟踪一线游资和机构资金动向&#xff0c;识别短期热点和强势个股。市场情绪三大指数今日继续走强&#xff0c;沪指重返3200点上方&#xff0c;创业板指午后一度涨近3%&#xff0c;随后涨幅有所…

2023.1. Stimulsoft 报告和仪表板的新版本:Crack

2023.1. Stimulsoft 报告和仪表板的新版本。 发布时间&#xff1a;2022 年 12 月 9 日 我们很高兴地宣布发布 Stimulsoft Reports and Dashboards 2023.1 版&#xff01;我们为 .NET Core 组件添加了对Razor Pages的支持&#xff0c;为PHP和Blazor平台更新了组件。此外&#x…

【Linux】基础:进程间通信

【Linux】基础&#xff1a;进程间通信 摘要&#xff1a;本文主要介绍进程间通信的基础知识&#xff0c;首先将会对进程间通信进行简单概述&#xff0c;其中包括本质目的和方法分类。再介绍对于方法的实现过程&#xff0c;其中有三大类方法&#xff08;管道、System V、POSIX&am…