Shell 脚本应用(四)

news2024/11/21 2:32:34

正则表达式概述

        正则表达式又称正规表达式,常规表达式。在代码中常简写为regex,regexp 或RE.正则表达式 是使用单个字符串来描述,匹配一系列符合某个句法规则的字符串,简单来说,是一种匹配字符串 的方法,通过一些特殊符号,实现快速查找,删除、替换某个特定字符串。 正则表达式是由普通字符与元字符组成的文字模式。模式用于描述在搜索文本时要匹配的一 个或多个字符串,正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。其中 普通字符包括大小写字母,数字,标点符号及一些其他符号,元字符则是指那些在正则表达式中 具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中 的出现模式.

 

基础正则表达式

        正则表达式的字符串表达方法根据不同的严谨程度与功能分为基本正则表达式与扩展正则表达 式,基础正则表达式是常用的正则表达式的最基础的部分,在Linux系统中常见的文件处理工具中 grep 与sed支持基础正则表达式,而egrep与awk支持扩展正则表达式。掌握基础正则表达式的使用 方法,首先必须了解基本正则表达式所包含的元字符的含义,下面通过grep命令以举例的方式逐个介绍。

1.基础正则表达式示例

下面的操作需要提前准备一个名为test.txt的测试文件,文件具体内容如下所示.

76aa11725e444f9a8424195552af0b19.png

 (1)查找特定字符

        查找特定字符非常简单,如执行以下命令即可从test.txt文件中查找出特定字符“the"所在位置. 其中“-n”表示显示行号,“-i”表示不区分大小写,命令执行后,符合匹配标准的字符,字体颜色 会变为红色(本章中全部通过加粗显示代替)

[root@lgcllc ~]# grep -n 'the' test.txt 

[root@lgcllc ~]# grep -in 'the' test.txt 

65abd08048d24753bd6bb806f1d94706.png

 

若反向选择,如查找不包含“the”字符的行,则需要通过grep命令的‘-vn”选项实现.

[root@lgcllc ~]# grep -vn 'the' test.txt 

575f784d7329497bb8e6adeef0bf8e0d.png 

(2)利用中括号“[ ]”来查找集合字符

                想要查找“shirt”与“short”这两个字符串时,可以发现这两个字符串均包含“sh与rt".此 时执行以下命令即可同时查找到“shirt与“short”这两个字符串.“I”中无论有几个字符,都仅代表一个字符,也就是说“[io]”表示匹配"i”或者“o”.

[root@lgcllc ~]# grep -n 'sh[io]rt' test.txt 

7aa301530cd74404b8c99da8f3b627dd.png

 若要查找包含重复单个字符‘oo”时,只需要执行以下命令即可。

[root@lgcllc ~]# grep -n 'oo' test.txt 

5d2c1fa7d0344f6a9c81a4595bb415bd.png

 若查找‘oo”前面不是‘w”的字符串,只需要通过集合字符的反向选择“[]”来实现该目的, 如执行“grep -n“[^w]oo'test.txt”命令表示在test.txt文本中查找“oo”前面不是“w”的字符串。

[root@lgcllc ~]# grep -n '[^w]oo' test.txt

7ce7b30e5e0d40d0b8bf837630332ae3.png

 (3)查找行首“^” 与行尾字符“$” 

查询the字符串时出现了很多包含“the”的行,如果想要查询以“the”字符串为行首的行,则可以通过 ' ^'元字符来实现。

[root@lgcllc ~]# grep -n '^the' test.txt 

d224886f4391484a8f8e8924648f4a8b.png

 

查询以小写字母开头的行可以通过“[a-z]”规则来过滤,查询大写字母开头的行则使用“[A-Z]” 规则,若查询不以字母开头的行则使用“[^a-zA-Z]”规则。

[root@lgcllc ~]# grep -n '^the' test.txt

[root@lgcllc ~]# grep -n '^[A-Z]' test.txt 
[root@lgcllc ~]# grep -n '^[^a-zA-Z]' test.txt 

3a29b3454e9444aba559fc4b46303df6.png 

当查询空白行时.执行“grep-n““s'test.txt”命令即可。

 [root@lgcllc ~]# grep -n '^$' test.txt 

 (4)查找任意一个字符”.”与重复字符”*”

        在正则表达式中小数点(.)也是一个元字符,代表任意一个字符。例如,执行以下 命令就可以查找“w??d”的字符串,即共有四个字符,以w开头d结尾.

[root@lgcllc ~]# grep -n 'w..d' test.txt

64a233232d69466db96d97a4746fb8fd.png 

若查询包含至少两个o以上的字符串,可执行以下语句

[root@lgcllc ~]# grep -n 'ooo*' test.txt 

425b4be8a43943c9b5357219806eed30.png 

(5)查找连续字符范围“{ }”

        在上面的示例中,我们使用“.”与“*”来设定零个到无限多个重复的字符,如果想要限制一 个范围内的重复的字符串该如何实现呢?例如,查找三到五个o的连续字符,这个时候就需要使用基础正则表达式中的限定范围的字符“{ }”.因为“{ }”在Shell中具有特殊意义,所以在使用“{}” 字符时,需要利用转义字符“\”,将“{ }”字符转换成普通字符。“{}”字符的使用方法如下所示。 

        查询两个o的字符。

[root@lgcllc ~]# grep -n 'o\{2\}' test.txt 

6f2bb5db85204a4abc9d4153cf0f3f73.png 

         查询以w开头以d结尾,中间包含2~5个o的字符串。 

[root@lgcllc ~]# grep -n 'wo\{2,5\}d' test.txt 

256acc4cfa0d4bbe8abc4727a805da13.png 

        查询以w开头以d结尾,中间包含2以上o的字符串。 

[root@lgcllc ~]# grep -n 'wo\{2,\}d' test.txt 

b61a0506599d4b40b9d0e8b9773fc42b.png 

2.元字符总结 

05d6adbc767e4d12bf3cd5c1ea83c371.png

 

文本处理器 

        在Linux/UNX系统中包含很多种文本处理器或文本编辑器,其中包括我们之前学习过的VM编辑器 与grep等。而 grep,sed,awk 更是shell编程中经常用到的文本处理工具,被称之为Shell编程三剑客。

sed工具

        通常情况下调用sed命令有两种格式,如下所示,其中,“参数”是指操作的目标文件,当存在 多个操作对象时用,文件之间用逗号””分隔:而scriptfile表示脚本文件,需要用“-f”选项指定. 当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。      

a96a8729ec424e4580985c4b9599b833.png  7a497d585325459c81a30d57275742b0.png

d987ebbf1d374a868e581b6eb00cc927.png

awk工具 

        通常情况下awk所使用的命令格式如下所示,其中,单引号加上大括号“{ }”用于设置对数据 进行的处理动作。awk可以直接处理目标文件,也可以通过“-f ”读取脚本对目标文件进行处理。

fb22e9be1a954ae8b8e962229dfaa51a.png

        默认情况下字段的分隔符为空格或者tab键。awk执行结果可以通过 print的功能将字段数 据打印显示。在使用awk命令的过程中,可以使用逻辑操作符“&&”,表示“与”,“II”表示“或”, “!”表示“非”:还可以进行简单的数学运算,如+,一、*./.%、“分别表示加、减、乘、除、取余和乘方。

72da6a30cfb8478b92cadc1aa1467ee5.png 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1337551.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

矩估计定义及例题

一、总体、样本、统计量 总体:在一个统计问题中,我们把研究对象的全体称为总体,构成总体的每个成员称为个体。 样本:在总体中抽取样本的过程称之为抽样,得到样本。 统计量: 二、矩估计 1.矩估计原理 估…

IRIS、Cache系统类汉化

文章目录 系统类汉化简介标签说明汉化系统包说明效果展示类分类%Library包下的类重点类非重点类弃用类数据类型类工具类 使用说明 系统类汉化 简介 帮助小伙伴更加容易理解后台系统程序方法使用,降低代码的难度。符合本土化中文环境的开发和维护,有助于…

浅析兼容性测试主要过程

兼容性测试是软件开发的重要环节,旨在验证软件在不同操作系统、浏览器、设备以及其他相关组件之间的兼容性和互操作性。下面是兼容性测试的主要过程: 1. 确定测试对象:需要确定要进行兼容性测试的软件或应用程序。这可以是一个网站、移动应用…

Android画布Canvas绘制手指MotionEvent.ACTION_MOVE 事件矩形方框,Kotlin

Android画布Canvas绘制手指MotionEvent.ACTION_MOVE 事件矩形方框,Kotlin import android.content.Context import android.graphics.Canvas import android.graphics.Color import android.graphics.Paint import android.graphics.Rect import android.os.Bundle …

Auto Image Attributes Pro v4.4 已注册– WordPress 插件

Auto Image Attributes Pro v4.4 已注册– WordPress 插件 Auto Image Attributes Pro v4.4:优化图片SEO,解锁Google图片流量 一、插件概述 在数字时代,图像已成为网站内容不可或缺的一部分。然而,仅仅上传图像并不足以吸引搜索引…

简析SoBit 跨链桥图文教程

从BTC网络到Solana网络桥接BRC20 1.打开SoBit平台:在您的网络浏览器中启动SoBit Bridge应用程序。 2.连接您的钱包: 选择SoBit界面右上角的比特币网络来连接您的数字钱包。 3.选择源链、目标链和您想桥接的代币: 从下拉菜单中选择’BTC’作为…

centos 安装oracle 11.2.04 并配置数据库自启动操作记录,一次完成

环境: centos版本7.3,安装的有图形化界面 Oracle11.2.04,之所以选择这个版本是因为网上有人说11其他版本的在安装的过程中会出现这样或那样的问题,下载地址放到文章下面 步骤,按顺序: 1、创建安装Oracle…

linux(centos)相关

文件架构: 用户组 查看用户组中的用户! 用户 切换用户:su 提高用户权限命令:sudo 进程状态命令:top 杀死进程:kill 关机命令:shutdown 重启命令:reboot 时间同步 目录命令 ls pwd rm mv …

用友U8CRM系统help2 任意文件读取漏洞复现

用友U8CRM系统的help2文件中接口存在任意文件读取漏洞,攻击者在未登录情况下即可进行漏洞利用。 1.1 漏洞级别 高危 1.2 快速检索 fofa语法: title"用友U8CRM"1.3 漏洞复现 该漏洞利用非常简单,只需构造get请求 访问该地址即可…

与供应商合作:成功供应商管理的六种最佳实践

许多企业低估了他们对外部供应商的依赖程度,也小看了这些供应商关系所涉及的风险。本文将探索企业与外部供应商合作的六种最佳实践,利用它们创建有效的供应商管理流程,从而降低成本和风险,并提高盈利能力。 供应商管理为何重要&a…

mac电脑系统性能检测:Geekbench 6最新 for mac

Geekbench 6是一款跨平台的性能测试软件,旨在全面衡量电脑在不同任务和应用程序中的性能。它适用于Windows、macOS、Linux等操作系统,以及移动设备如Android和iOS。 Geekbench 6主要特点包括: 全面覆盖各种性能测试领域,包括CPU…

基础数论一:判定质数和求约数相关

1.试除法求质数 质数就是大于1的整数中除了1和自身没有其他因数的数 1.1暴力求解 暴力求解的思路就是从2遍历到自身判断是否有被整除的数&#xff0c;时间复杂度为O(n)的 bool is_prime(int x) {if(x<2)return false;for(int i2;i<x;i){if(x%i0){return false;}}return…

day42 1226

作业1&#xff1a; #include <iostream>using namespace std;namespace myspace {string str; }int length(string str) {//char *p &str.at(0);const char *p str.data();int count 0;while (*p ! 0) {p;count;}return count; } int main() {getline(cin,myspac…

javaweb--实验十 --期末复盘

实验十 JDBC连接MySQL 本次实验没有代码补全&#xff0c;以下都是完整过程&#xff0c;详细关注连接过程的问题 一、实验目的&#xff1a; 1、掌握JDBC连接数据库的一般操作。 2、理解JavaBean的基本作用。 3、理解分层设计的思想。 二、 实验内容&#xff1a; 实现学生信…

黑马头条-day10-xxl-job热点文章计算

目录 一.需求分析 实现思路 定时计算 定时任务框架-xxljob 二. 学习目录 分布式任务调度 1 xxl-Job简介 2 XXL-Job-环境搭建 2.1调度中心环境要求 2.2源码仓库地址 2.3 初始化“调度数据库” 2.4配置部署“调度中心” 3.配置部署调度中心-docker安装 4.简单实例 创建…

SpringBoot - Maven 打包合并一个胖 JAR 以及主项目 JAR 依赖 JAR 分离打包解决方案

问题描述 <plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId><version>2.1.18.RELEASE</version><configuration><!--<classifier>exec</classifier>--…

2023上海国际计算生物学创新大赛——药物筛选AI算法“凌越”挑战赛,等你来战!

作为一门新兴的交叉学科&#xff0c;计算生物学具有巨大的应用潜力和市场价值。近年来&#xff0c;各国高度重视计算生物学的发展&#xff0c;尝试利用计算生物学的方法和技术破解生物医药行业的难题。 为进一步推动计算生物学发展&#xff0c;落实 《上海市计算生物学创新发展…

磷酸除杂,t-42离子交换树脂的应用

随着工业的发展&#xff0c;磷酸作为一种重要的化工原料&#xff0c;被广泛应用于肥料、饲料、洗涤剂、食品添加剂等领域。然而&#xff0c;磷酸中常常含有杂质&#xff0c;如钠离子、铁离子等&#xff0c;这些杂质会影响磷酸的使用效果&#xff0c;甚至对人体健康造成危害。因…

SpringSecurity6 | 退出登录后的跳转

✅作者简介:大家好,我是Leo,热爱Java后端开发者,一个想要与大家共同进步的男人😉😉 🍎个人主页:Leo的博客 💞当前专栏: 循序渐进学SpringSecurity6 ✨特色专栏: MySQL学习 🥭本文内容: SpringSecurity6 | 登录失败后的JSON处理 📚个人知识库: Leo知识库,…

upload-labs Pass-03(黑名单验证,特殊后缀)问题纠正

php任何后缀名解析 背景&#xff1a;为了验证php解析不依靠后缀名&#xff0c;可以是任何后缀名&#xff0c;纠正upload-labs Pass-03&#xff08;黑名单验证&#xff0c;特殊后缀&#xff09;里所说的几个固定的后缀名理论是错误的。1 部署1.1 环境准备1.1.1 系统、内核&#…