正则表达式(5):常用符号

news2025/1/24 17:55:29

正则表达式(5):常用符号

      • 小结

本博文转载自

在本博客中,”正则表达式”为一系列文章,如果你想要从头学习怎样在Linux中使用正则,可以参考此系列文章,直达链接如下:

在Linux中使用正则表达式

“正则”系列的每篇文章都建立在前文的基础之上,所以,请按照顺序阅读这些文章,否则有可能在阅读中遇到障碍。

之前已经总结了怎样利用正则表达式去”匹配位置”或者”匹配连续次数”,此处,我们来总结一下正则中其他的一些常用符号。

在开始学习新知识之前,我们先回顾一下之前使用过的一个符号,它就是”.”

之前说过,在正则表达式中,”.”表示匹配任意单个字符(换行符除外),示例如下。

在这里插入图片描述
示例中的正则表示,只要a字母后面跟随任意3个字符,即可被正则表达式匹配到。

正如上图所示,字母a后面跟随的3个字符可以是”数字”,或者是”字母”,再或者是”符号”,都可以,因为”.”表示任意单个字符,”任意”就体现在这里了。

如果我们想要更加”细致”一些呢?

比如,我们仍然想要从文本中找出a字母后面跟随3个字符的字符串,但是,我们对后面跟随的3个字符有要求,并不能是任意3个字符,而必须是三个字母,我们该怎么做呢?

没错,这个问题会引出我们将要认识的新符号,它就是 “[[:alpha:]]”

在正则表达式中,[[:alpha:]] 表示”任意字母”(不区分大小写)

[[:alpha:]] 这个符号看上去略微有点复杂,但是不要害怕,习惯了就好,其实,”[[:alpha:]]” 可以拆开成几部分去理解,我们后面再聊。

我们先来实验一下,示例如下。

在这里插入图片描述

上例中,”[[:alpha:]]{3}”表示3个连续的任意字母,此处结合了之前的知识,其中”{3}” 表示其前面的字符连续出现3次(如果你没有看懂,请回顾前文),所以,上述正则表达式整体的含义就是, 只有a字母后面跟随了3个字母的字符串才会被匹配到,如果a字母后面跟随的3个字符中包含非字母(数字或符号),就不会被匹配到,正如上图所示。

所以,使用[[:alpha:]]可以匹配到不区分大小写的字母,没错,alpha的读音你应该很熟悉了,就是”阿尔法狗”的”阿尔法”。

那么,我们再”细化”一点,我们不仅要字母a后面跟随的3个字符是字母,我们还要求,这3个字符必须是小写字母,我们该怎么办呢?

我们可以使用另外一个符号,它就是”[[:lower:]]”

[[:lower:]]表示任意小写字母,我们来试试。

在这里插入图片描述

可以看到,只有当a后面的3个字符均为小写字母时,才会被匹配到。

我们已经学会了怎样表示”不区分大小写的字母”和”小写字母”,那么怎样表示”大写字母”呢?

我们可以使用[[:upper:]]表示任意大写字母,示例如下。

在这里插入图片描述
聪明如你,一定已经发现了一些规律,规律就是,我们替换”[[: :]]”中的单词,即可表示不同的含义。

那么我们来看看一些常用的符号都表示什么含义。

[[:alpha:]] 表示任意大小写字母

[[:lower:]] 表示任意小写字母

[[:upper:]] 表示任意大写字母

[[:digit:]] 表示0到9之间的任意单个数字(包括0和9)

[[:alnum:]] 表示任意数字或字母

[[:space:]] 表示任意空白字符,包括”空格”、”tab键”等。

[[:punct:]] 表示任意标点符号

好了,了解了上述符号的含义后,你可以自己创建一个测试文件,进行测试,快点动手试试吧,我相信亲自实验获得的理解肯定更加深刻。

之前,我们使用”[[:lower:]]”表示任意一个小写字母,其实,还有另外一种方法,也能够表示”任意单个小写字母”。

除了”[[:lower:]]”,”[a-z]”也能表示任意一个小写字母,你一定猜出来了,没错,”[a-z]”所表示的意思就是,从a到z的26个小写英文字母中的任意一个。

所以,[a-z]与[[:lower:]]是等价的。

同理,[A-Z]也能表示任意一个大写字母,[A-Z]与[[:upper:]]是等价的,示例如下。

在这里插入图片描述

有了之前的基础,你猜猜,”[a-zA-Z]”表示什么意思?

没错,”[a-zA-Z]”表示任意字母,不区分大小写。

[a-zA-Z]与[[:alpha:]]等效。

同理,[0-9]与[[:digit:]]等效,都表示0到9之间的任意单个数字,示例如下。

在这里插入图片描述

我们已经了解到,[a-z]表示任意一个小写字母,其实,”[a-z]”外侧的方括号有特殊的含义。

方括号在正则中代表什么意思呢?

“[ ]”表示匹配指定范围内的任意单个字符,这样说可能不容易理解,我们来动手实验一下,就能秒懂,示例如下。

在这里插入图片描述

可以看到,字母b后面跟随字母c、或者跟随字母e、或者跟随字母g,都可以被匹配到,”[ceg]”表示c或者e或者g中的任何一个字母都能被匹配到。

那么活学活用,”[Bd#3]”表示什么意思呢?

[Bd#3]表示字符是大写B、或者是小写d、或者是符号#、再或者是数字3,都可以被匹配到,示例如下

在这里插入图片描述

“[ ]”表示匹配指定范围内的任意单个字符,换句话说,就是字符与方括号”[ ]”内的任意一个字符相同,就可以被匹配到。

我们了解了方括号的含义以后,再回过头看之前的符号,会有新发现。

上文说过,[0-9]表示0到9之间的任意一个数字,其实,[0-9]就相当于[0123456789]

同理,[a-z]表示a到z之间的任意一个字母,其实,[a-z]就相当于[abcdefghijklmnopqrstuvwxyz]

之前说过,[[:alpha:]]代表单个任意的字母,前文也提到过,[[:alpha:]]可以拆开去理解,聪颖如你一定想到了,我们可以把[[:alpha:]]拆成两部分理解。

第一部分:最外层的[ ],表示指定范围内的任意单个字符

第二部分:最内层的[:alpha:],表示不区分大小写的字母

所以,当两部分结合在一起时,就变成了[[:alpha:]],就表示任意单个字母(不区分大小写),[[:digit:]]等其他类似符号也可以这样拆开来理解。

我们已经理解了方括号”[ ]”的含义,我们再来认识一个它的孪生兄弟,它就是 “[^ ]”

“[^ ]”表示匹配指定范围外的任意单个字符,注意,它与”[ ]”的含义正好相反。

“[ ]”表示匹配指定范围内的任意单个字符。

如果你觉得不好理解,可以先看示例,示例如下:

在这里插入图片描述

如上图所示,字母f后面跟随的字母只要不是a、c、e、g中的任何一个,即可被匹配到,相当于排除了a、c、e、g这些字母。

所以,”[^ ]”表示匹配指定范围外的任意单个字符

我们之前说过,”^”符号的含义为锚定行首,但是,当它与”[ ]”结合在一起的时候,则没有锚定行首之意,只能把”[^ ]”当做一个整体去看待,可以把此处的 “^”理解为取反。

既然”[ ]”与”[^ ]”是相对的,那么,能不能把[0-9]改写成[^0-9]呢?必须能啊。

“[^0-9]”表示匹配单个非数字字符,与[0-9]的含义这正好相反,示例如下。

在这里插入图片描述
如上图所示,只要字母e后面跟随的字符不是数字,就可以被匹配到。

同理:

[^a-z]表示非小写字母的单个字符可以被匹配到。

[^A-Z]表示非大写字母的单个字符可以被匹配到。

[^a-zA-Z]表示非字母的单个字符可以被匹配到,比如数字或符号。

[^a-zA-Z0-9]表示非字母、非数字的单个字符可以被匹配到,比如符号。

结合之前的理论,你一定想到了,既然[0-9]与[[:digit:]]等效,那么[^0-9]与[^[:digit:]]等效吗?

试试就知道了,如下图所示,的确是等效的。

在这里插入图片描述

举一反三

[^0-9]与[^[:digit:]]等效

[^a-z]与[^[:lower:]]等效

[^A-Z]与[^[:upper:]]等效

[^a-zA-Z]与[^[:alpha:]]等效

[^a-zA-Z0-9]与[^[:alnum:]]等效

其实,不仅[0-9]与[[:digit:]]能够表示数字,还有一些简写格式的符号也能表示数字,比如”\d”

但是,并不是所有的正则表达式处理器都能够识别这些简写格式

示例如下

在这里插入图片描述

如上图所示,默认情况下,grep就无法识别”\d”这种简短格式,所以上图中,没有匹配到任何结果。

如果我们想要让grep能够识别这种简短格式,可以使用-P选项,表示grep使用兼容perl的正则表达式引擎,示例如下。

在这里插入图片描述

我想,有了前面的基础,再理解这些简写格式,应该相对容易了。

所以,此处直接列出一些常用的简写格式的符号,不再赘述了,大家可以动手实验一下。

\d 表示任意单个0到9的数字

\D 表示任意单个非数字字符

\t 表示匹配单个横向制表符(相当于一个tab键)

\s表示匹配单个空白字符,包括”空格”,”tab制表符”等。

\S表示匹配单个非空白字符

小结

为了方便以后回顾,我们将上述知识点总结一下。

如果你不明白下述描述,请回顾上述示例。

.  表示匹配任意单个字符
* 表示匹配前面的字符任意次,包括0次
[  ] 表示匹配指定范围内的任意单个字符
[^  ] 表示匹配指定范围外的任意单个字符

[[:alpha:]]  表示任意大小写字母
[[:lower:]]  表示任意小写字母
[[:upper:]]  表示任意大写字母
[[:digit:]]  表示0到9之间的任意单个数字(包括0和9)
[[:alnum:]]  表示任意数字或字母
[[:space:]]  表示任意空白字符,包括"空格"、"tab键"等。
[[:punct:]]  表示任意标点符号

[0-9]与[[:digit:]]等效
[a-z]与[[:lower:]]等效
[A-Z]与[[:upper:]]等效
[a-zA-Z]与[[:alpha:]]等效
[a-zA-Z0-9]与[[:alnum:]]等效

[^0-9]与[^[:digit:]]等效
[^a-z]与[^[:lower:]]等效
[^A-Z]与[^[:upper:]]等效
[^a-zA-Z]与[^[:alpha:]]等效
[^a-zA-Z0-9]与[^[:alnum:]]等效

#简短格式并非所有正则表达式解析器都可以识别
\d 表示任意单个0到9的数字
\D 表示任意单个非数字字符
\t 表示匹配单个横向制表符(相当于一个tab键)
\s表示匹配单个空白字符,包括"空格","tab制表符"等
\S表示匹配单个非空白字符

这篇文章就总结到这里,希望能够帮助到你~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1289592.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用Go快速开发TCP公共服务

使用Go快速开发TCP公共服务 文章目录 使用Go快速开发TCP公共服务一、前言二、实现思路三、源码四、测试使用五、最后 一、前言 之前使用的公共TCP服务无法使用了,想了一下整个实现原理不是很复杂,就利用Go快速开发了一个,利用公网服务器可以…

Uncle Maker: (Time)Stamping Out The Competition in Ethereum

目录 笔记后续的研究方向摘要引言贡献攻击的简要概述 Uncle Maker: (Time)Stamping Out The Competition in Ethereum CCS 2023 笔记 本文对以太坊 1 的共识机制进行了攻击,该机制允许矿工获得比诚实同行更高的挖矿奖励。这种名为“Uncle Maker”的攻击操纵区块时间…

CMake编译C++项目并链接动态库

CMake编译C项目并链接动态库 最近遇到一个用CMake来编译的project。需要编译整个项目src code以及字库,并使用。我的项目目录是张这样的。 编译的时候会有两中不同的办法,一种是把库集成到可执行文件中,一种是编译成静态库然后使用。 1. 集…

STM32基础教程 p16 窗口看门狗(WWDG)

1 窗口看门狗工作原理 1.1 简介 WWDG简介 窗口看门狗通常被用来监测,由外部干扰或不可预见的逻辑条件造成的应用程序背离正常的运 行序列而产生的软件故障。除非递减计数器的值在T6位变成0前被刷新,看门狗电路在达到预置 的时间周期时,会产…

IDEA导入JavaWeb项目(Maven)

IDEA导入JavaWeb(Maven)项目教程 运行教程 亲爱的粉丝们,我深知你们对IDEA导入JAVAWeb工程的迫切需求。在这个充满竞争的时代,每一个项目都离不开高效的沟通。过程中需要对应的环境适配和软件安…

开关电源超强总结

什么是Power Supply? 开关电源的元件构成 三种基本的非隔离开关电源 三种基本的隔离开关电源 反激变换器(Flyback)工作原理 (电流连续模式) 反激变换器(Flyback)工作原理 (电流断续模式&#x…

什么因素会影响葡萄酒陈酿的能力?

糖、酸和酚类与水的比例是葡萄酒陈酿程度的关键决定因素,收获前葡萄中的水分越少,产生的葡萄酒就越有可能具有一定的陈酿潜力。那么葡萄品种、气候和葡萄栽培实践的过程就相当重要了,对陈酿的时间发挥了重要的作用。皮较厚的葡萄品种&#xf…

运维之远程桌面连接失败问题排查

背景:同一局域网,可以ping通但是远程连接不上,排查一下问题。 1、被远程计算机是否允许远程连接 2、被远程计算机防火墙是否允许 3、被远程计算机远程桌面服务是否正常 4、查看用户权限

Vue3 Element-Plus 一站式生成动态表单:简化前端开发流程

文章目录 1. 引言2. Vue3 和 Element-Plus 简介2.1 Vue32.2 Element-Plus 3. 动态表单的需求与挑战4. Vue3 和 Element-Plus 动态表单的优势4.1 Vue3的组合式API4.2 Element-Plus的表单组件 5. 一站式生成动态表单的实现5.1 准备工作5.2 创建动态表单组件5.3 使用动态表单组件 …

做亚马逊需要IP代理吗?需要纯净度高的吗?

做亚马逊跨境电商的老玩家都知道,代理IP的作用不容小觑。通过代理IP,跨境电商卖家可以进行深入的市场研究,获取关键的数据分析,助力业务决策。让卖家能够安全轻松管理不同地区的账户,轻松防关联,无缝对接多…

js模块化的应用!!!(前无古人,后无来者)

简介: 在 ES6 前, 实现模块化使用的是 RequireJS 或者 seaJS(分别是基于 AMD 规范的模块化库, 和基于 CMD 规范的模块化库)。 ES6 引入了模块化,其设计思想是在编译时就能确定模块的依赖关系&#xff0c…

【ArcGIS微课1000例】0078:创建点、线、面数据的最小几何边界

本实例为专栏系统文章:讲述在ArcMap10.6中创建点数据最小几何边界(范围),配套案例数据,持续同步更新! 文章目录 一、工具介绍二、实战演练三、注意事项一、工具介绍 创建包含若干面的要素类,用以表示封闭单个输入要素或成组的输入要素指定的最小边界几何。 工具位于:数…

【数据结构】——二叉树简答题模板

目录 一、树和二叉树的概念(一)二叉树的定义和性质(二)树和二叉树的区别 二、完全二叉树和满二叉树三、二叉树的遍历(一)由序列确定二叉树(二)不同遍历序列的关系 四、二叉树的性质&…

气膜厂家怎样确保产品质量和售后服务?

气膜厂家作为一家专业生产气膜产品的企业,确保产品质量和提供良好的售后服务是我们的责任和使命。为了确保产品质量和售后服务的可靠性,我们采取了以下措施。 起初,我们严格按照国家标准和相关行业规范进行生产。气膜产品的质量是产品能否长…

【eNSP实践】eNSP实战篇(3)之路由器、交换机、主机模拟企业网络场景(图文详解)

目录 写在前面涉及知识1、前情提要2、实践操作2.1 eNSP搭建虚拟环境2.2 建立设备连线2.3 统计IP并标注2.4 配置主机IP及启动设备 3、命令行配置3.1 启动所有设备3.2 执行命令添加端口及网关 4、实验总结写在最后 写在前面 其实我之前写了3篇文章都是针对eNSP的基础配置&#x…

深度学习猫狗分类 - python opencv cnn 计算机竞赛

文章目录 0 前言1 课题背景2 使用CNN进行猫狗分类3 数据集处理4 神经网络的编写5 Tensorflow计算图的构建6 模型的训练和测试7 预测效果8 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 **基于深度学习猫狗分类 ** 该项目较为新颖&a…

Notes数据结合报表工具Tableau

大家好,才是真的好。 我希望你看过前面两篇内容《Domino REST API安装和运行》和《Domino REST API安装和运行》,更希望你能看过《Notes数据直接在Excel中统计!》,有了这些内容作为基础,今天的内容就显得特别简单。 …

虹科新闻丨虹科正式加入广州市新联会科创分会

来源:虹科电子科技有限公司 虹科新闻丨虹科正式加入广州市新联会科创分会 11月7日,由广州市委统战部、广州开发区管委会、黄埔区人民政府指导,佳都集团、佳都科技集团、广州开发区投资集团共同主办的未来之城大湾区元宇宙创新示范中心&#…

D. Jumping Through Segments

显然是一个二分答案,关键是怎么搞判断函数? 我们维护合法的降落区间就好了~ // Problem: D. Jumping Through Segments // Contest: Codeforces - Codeforces Round 913 (Div. 3) // URL: https://codeforces.com/contest/1907/problem/D // Memory Li…

2023五岳杯量子计算挑战赛APMCM亚太地区

问题一要求在特定区域内部署两个边缘服务器,以便根据计算需求分布覆盖最大的计算需求。每个边缘服务器都有一个覆盖半径为1。目标是确定两个边缘服务器的位置,以覆盖最大的计算需求。假设边缘服务器的位置位于网格的中心,每个网格内的计算需求…