【Linux命令篇】正则表达式浅析

news2025/1/21 16:42:50

前言

转义字符是将普通字符转化为特殊字符的一种方式。

在正则表达式中,一些字符被定义为特殊字符(也称为元字符),它们具有特殊的含义。这些特殊字符包括:

  • 句点字符 .:可以匹配除了换行符以外的任何单个字符。
  • 星号字符 *:匹配前面的字符零次或多次。
  • 加号字符 +:匹配前面的字符一次或多次。
  • 问号字符 ?:匹配前面的字符零次或一次。
  • 转义字符 "\:用于将特殊字符转义为普通字符。
  • 括号字符 (): 用于捕获子模式或分组元素。
  • 方括号字符 []:用于指定字符集合。

当在正则表达式中使用这些字符时,它们会被视为特殊字符,并具有预定义的含义,而不是作为普通字符来处理。

如果您想要匹配这些字符本身,而不是使用它们的特殊含义,则需要使用转义字符对其进行转义。

例如,在正则表达式a\*b.中,星号和句点字符都被视为特殊字符。

如果您想要匹配真正的星号和句点字符,则需要使用反斜杠字符进行转义,即 a\*b\.


文章目录

  • 前言
  • 1、和2进行比较
  • 2、和1进行比较
  • 3、和4进行比较
  • 4、和3进行比较
  • 5、好复杂的东西
  • 6、\s修饰符
  • 7、\x元字符
  • 8、\\()
  • 9、零宽度断言


花括号、中括号、小括号的区别

  • [] 表示在一个集合中匹配字符,例如 [abc] 表示匹配字符串中的任意一个字符 a、b 或 c。
  • {} 表示要匹配的前面的元素出现的次数,例如 a{2} 表示匹配两个连续的 a,a{3,5} 表示匹配三到五个连续的 a。
  • () 用于分组并应用操作,例如 (ab)+ 表示匹配多个连续的 ab。

使用这些符号可以更加精确地指定要匹配的模式和结构,从而提高正则表达式匹配的有效性和准确性。

1、和2进行比较

^(d{3})

正则表达式 ^(d{3}) 表示匹配以三个字母 “d” 开头的字符串,并将这个部分作为一个分组元素进行捕获。

其中,“^” 表示匹配行的开头或字符串的开头,“(d{3})” 表示匹配由三个字母 “d” 组成的子串,并将其作为一个组进行捕获。因此,在匹配结果中,可以通过访问第一个捕获组来获取匹配到的三个字母 “d”。

例如,在匹配字符串 “dddexample” 时,该正则表达式会匹配前三个字符 “ddd”,并将其作为一个分组进行捕获。在匹配结果中,可以通过访问第一个捕获组来获取 “ddd” 子串。

需要注意的是,如果输入字符串不以三个字母 “d” 开头,则不会发生匹配。

2、和1进行比较

^(\d{3})

正则表达式 ^(\d{3}) 表示匹配以三个数字字符开头的字符串,并将这个部分作为一个分组元素进行捕获。

其中,“^” 表示匹配行的开头或字符串的开头,“(\d{3})” 表示匹配由三个数字字符组成的子串,并将其作为一个组进行捕获。因此,在匹配结果中,可以通过访问第一个捕获组来获取匹配到的三个数字字符。

例如,在匹配字符串 “123example” 时,该正则表达式会匹配前三个字符 “123”,并将其作为一个分组进行捕获。在匹配结果中,可以通过访问第一个捕获组来获取 “123” 子串。

需要注意的是,如果输入字符串不以三个数字字符开头,则不会发生匹配。

3、和4进行比较

^ddd

正则表达式 ^ddd 表示匹配以三个字母 “d” 开头的字符串。

其中,“^” 表示匹配行的开头或字符串的开头,“ddd” 表示匹配由三个字母 “d” 组成的子串。因此,在匹配结果中,只有以三个字母 “d” 开头的字符串会被匹配,例如 “dddexample”。

需要注意的是,如果输入字符串不以三个字母 “d” 开头,则不会发生匹配。

4、和3进行比较

^\d{3}

正则表达式 ^\d{3} 表示匹配以三个数字字符开头的字符串。

其中,“^” 表示匹配行的开头或字符串的开头,“\d” 表示匹配任何数字字符,“{3}” 表示匹配前面的元素三次。因此,在匹配结果中,只有以三个数字字符开头的字符串会被匹配,例如 “123example”。

需要注意的是,如果输入字符串不以三个数字字符开头,则不会发生匹配。

5、好复杂的东西

/\b[\w.%+-]+@[\w.-]+\.[a-zA-Z]{2,6}\b/g

这是一个正则表达式,用于匹配电子邮件地址。它包含以下部分:

  • \b 表示单词边界的开始。
  • \w 匹配任何字母、数字或下划线字符。
  • . 匹配句点。
  • %+- 其他字符。
  • [] 表示字符集,其中列出这些字符,+ 表示匹配前面列出的字符集中的一个或多个字符。因此,[\w.%+-]+ 将匹配一个或多个字母数字字符、点号、百分号、加号和减号。
  • @ 匹配 “@” 字符。
  • [\w.-]+ 匹配电子邮件地址中的域名,可以包括字母数字字符、点号和连字符,且出现一次或多次。
  • \. 匹配一个点号,用于分隔域名和顶级域名。
  • [a-zA-Z]{2,6} 匹配顶级域名,即由 2 到 6 个字母组成的顶级域名。
  • \b 表示单词边界的结束。

然后就匹配上这个绿色的东西。
1

6、\s修饰符

所以\s修饰符就是针对.这个元字符不匹配换行符的缺陷吗?

是的,您说得非常正确。在正则表达式中,点号(.)通常只能匹配除了换行符之外的任何字符,这就是它的缺陷。因此,使用\s修饰符可以解决这个问题,让点号(.)可以匹配包括换行符在内的所有字符。这样,在处理多行文本时就不会遗漏掉换行符等特殊字符了。

7、\x元字符

为什么正则表达式\x30对应ASCLL的48字符?

正则表达式中的\x30表示一个字符,它是由\x和30两个字符组成的转义序列。

在ASCII码中,字符“0”的十进制数值为48,用两位十六进制数表示就是“30”,因此\x30可以被解释为表示ASCII码中字符“0”。

在Unicode编码中,与ASCII码相同的部分使用了相同的编码方案,即在ASCII码的基础上扩展了更多位,使得它可以表示包括汉字在内的更多字符。

在Unicode编码中,“0”的十进制数值也是48,因此在Unicode编码中\x30同样可以被看作表示字符“0”。

8、\()

正则表达式中()代表什么,()又代表什么?

在正则表达式中,圆括号()可以用于分组。括号内的内容作为一个整体单元,可以使用量词符号、字符类和其他操作符等进行相关操作。

例如,在正则表达式\d{3}(\w)\d{3}中,括号内的 \w 代表任意字母、数字和下划线,而括号外的量词 \d{3} 表示匹配连续3个数字。

而反斜杠后面跟着圆括号 () 表示匹配左右括号本身。这是因为在正则表达式中,括号自身有特殊含义,反斜杠表示转义,使得括号变成普通字符,可以与其他字符一起匹配。

例如,正则表达式 /hello\(\)/ 可以匹配字符串 “hello()”,因为括号被转义,被当做了普通字符处理。

9、零宽度断言

当然,以下是一些简单的例子:

噶了的意思:匹配显示出来。

  1. 正向零宽度断言 (?=...)

括号永远在后面,A(?=B|C),去找找哪个A后面跟着B或者C的,拖过来噶了。

就像你做错事,背后还留了一堆证据,迟早被噶。

  • 匹配 email 地址中的用户名部分

    (?<=^[\w.%+-]+@)[\w.-]+(?=\.com$)
    

    该表达式会匹配 “@” 符号前面的所有字符(包括可能出现的特殊字符),但不会匹配后缀名 “.com”。

  • 匹配含有两个及以上元音字母的英文单词

    \b\w*(?<=[aeiouAEIOU].*)[aeiouAEIOU].*\b
    

    表达式会在单词中匹配从最左边开始的第一个元音字母和后面的所有字母,如果单词中至少有两个元音字母,则表达式会返回匹配字符串。使用这种表达式可用于查找潜在元音候选的单词。

  1. 负向零宽度断言 (?!...)

括号永远在后面,A(?!B|C),去找找哪个A后面没有B或者C的,拖过来噶了。

就像你后台不硬的,迟早被噶。

  • 匹配不含有连续的数字字符的字符串

    ^\D*(?:(?!\d{2}).)*$
    

    该正则表达式会在文本开头寻找任意非数字字符,匹配到第一个数字之后,会将它及其后面的数字字符当作匹配失败,所以只要字符串中包含两个及以上相邻的数字,则表达式返回失败。

  • 匹配以".jpg"作为结尾的文件名

    .*[^.]\b(?<!-)\w{1,4}\.jpg$
    

    表达式会匹配包含 “.jpg” 后缀的文件名,但不会匹配以连字符 “-” 结尾的文件名(例如 “my-file-.jpg”),这是因为负向零宽度断言 (?<!-) 会排除带有 “-” 结尾的字符串。

  1. 正向零宽度断言 (?<=...)

括号永远在前面,(?<=B|C)A,去找找哪个A前面有B或者C的,拖过来噶了。

擒贼先擒王,噶了大哥小弟就散了。

  • 匹配文件路径中的文件名

    (?<=/|\\)[^/\\]+$
    

    表达式会从路径中匹配出包含在最后一对斜杠或反斜杠之间的文件名。例如,在 Windows 系统上 “C:\Users\USER\Desktop\example.txt” 这个路径,所匹配到的结果就是 “example.txt”。

  • 匹配内部没有空格字符的标签名

    (?<=<)\w+(?=[^>]*?>)
    

    表达式定义了一个条件,在左括号 “<” 和右括号 “>” 之间查找字符,不管它们是否与其他字符混合,只要它们满足该条件,就会将其作为成功匹配。

  1. 负向零宽度断言 (?<!...):

括号永远在前面,(?<!B|C)A,去找找哪个A前面没有B或者C的,拖过来噶了。

没有防弹衣在前面作掩护,我一枪就把你噶了。

  • 匹配字符串首位不能为连续数字的情况

    (?<!\d)\b\S+\b(?!\d)
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/468919.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaScript经典教程(四)-- JavaScript基础 - BOM、打印、window对象等详解

184&#xff1a;JavaScript基础 - BOM、打印、window对象等详解 185&#xff1a;JavaScript基础 - 数据类型Number及运算符号 1、关键字 &#xff08;3&#xff09;alert - 警告窗 原型&#xff1a;window.alert(); alert实际上是一个函数 注&#xff1a;alert无法弹出部分…

Figma如何导出jpg格式?

在这个追求效率和质量的时代&#xff0c;Figma确实可以加快我们的设计工作&#xff0c;增加效率&#xff0c;功能越来越强大。然而&#xff0c;Figma从未有过中文版本。 但就使用工具而言&#xff0c;一次生两次并不难。设计小白经常卡在最后一步&#xff0c;如何用Figma导出j…

【Paper】2022_基于自适应事件触发控制的一般线性多智能体系统的一致性_田昌源

田昌源. 基于自适应事件触发控制的一般线性多智能体系统的一致性[D].青岛大学,2022.DOI:10.27262/d.cnki.gqdau.2022.002546. 文章目录 第五章 一般线性多智能体系统的自适应事件触发二分一致性5.1 系统模型5.2 自适应事件触发二分一致性5.2.1 无领导一致性5.2.2 领导-跟随一致…

JDK的环境配置(超级详细教程)

JDK的环境配置——超详细教程 一、下载java安装包 我们可以去官网下载java&#xff0c;进入官网页面&#xff0c;然后点击Download Java。 网站&#xff1a;https://developer.oracle.com/languages/java.html 里面有各种版本的jdk可供选择。 二、安装JDK 这里我选择安装…

Android实现一个带清除和提交按钮的清爽圆角搜索框

运行效果&#xff1a; 放入Toolbar的效果 清除按钮有内容才显示&#xff1a; 下面是教程&#xff1a; 实现一个圆角搜索框&#xff0c;可以使用CardView来实现&#xff0c;同时可以添加一个EditText和两个ImageView作为清除和提交按钮。 activity_main <?xml version&quo…

Anaconda3 安装 Tensorflow-gpu

一.准备需要 GPU版本&#xff0c;需要提前下载 cuda 和 cuDNN。&#xff08;可以查看此教程 Anaconda3 安装 Tensorflow-gpu &#xff09; GPU 一般是 nvidia 的 安装前 一定 要查看自己电脑的环境配置&#xff0c;然后查询Tensorflow-gpu、Python、 cuda 、 cuDNN 版本关系&…

嵌入式设备显示屏相关概念汇总

嵌入式设备常用的显示屏接口 LCD 接口&#xff1a;是一种常见的数字电路接口&#xff0c;支持多种显示器件&#xff0c;如字符型液晶显示器和点阵型液晶显示器等。 VGA 接口&#xff1a;是一种视频接口标准&#xff0c;用于连接显示器和计算机。该接口提供模拟 RGB 信号&#…

以太网卡TSO、GSO、LRO、GRO描述及相关配置

以太网卡TSO、GSO、LRO、GRO描述及相关配置 以太网卡的 TSO、GSO、LRO、GRO 是一些传输协议中用于提高网络性能的技术。 硬件包拆分与合并 TSO&#xff08;TCP Segmentation Offload &#xff09; TSO 是一种由网卡卸载 TCP 数据包分段的技术。在传统的方式中&#xff0c;当…

案例01-tlias智能学习辅助系统04-登录认证+全局异常处理

目录 1、基础登录 2、登录校验 2.1、会话跟踪技术&#xff1a; Cookie、Session JWT令牌 2.2、请求过滤 方式一、过滤器&#xff08;Filter&#xff09; 方法二&#xff1a;拦截器&#xff08;interceptor&#xff09; Filter与Interceptor的区别 3、全局异常处理器 1、…

fork函数如何创建进程,exit/_exit函数如何使进程终止的详细分析与代码实现

&#x1f38a;【进程通信与并发】专题正在持续更新中&#xff0c;进程&#xff0c;线程&#xff0c;IPC&#xff0c;线程池等的创建原理与运用✨&#xff0c;欢迎大家前往订阅本专题&#xff0c;获取更多详细信息哦&#x1f38f;&#x1f38f;&#x1f38f; &#x1fa94;本系列…

【Pytorch基础教程38】torchserve模型部署和推理

note torch-model-archiver打包模型&#xff1b;利用torchserve加载前面打包的模型&#xff0c;并以grpc和http等接口往外提供推理服务启动模型的api服务、curl命令发送http post请求&#xff0c;请求模型服务API&#xff1b;流程和TensorFlow serving流程大同小异 文章目录 n…

人工智能之配置环境教程二:在Anaconda中创建虚拟环境并在VsCode中使用

人工智能之配置环境教程二&#xff1a;在Anaconda中创建虚拟环境安装pytorch并在VsCode中使用虚拟环境 作者介绍一. 在Anaconda中创建虚拟环境1. 进入本地终端1.1 键盘使用**winR**快捷键1.2 输入**cmd**点击**确定**进入windows命令行终端 2. 安装镜像源2.1 添加镜像源 3. 创建…

PowerShell install 一键部署http+用户名密码登录实现文件系统

Apache 前言 Apache(音译为阿帕奇)是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上&#xff0c;由于其跨平台和安全性被广泛使用&#xff0c;是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩充&#xff0c;将Perl/Python等…

BUUCTF [第五空间2019 决赛]PWN5

小白垃圾做题笔记而已&#xff0c;不建议阅读。 简书上的大佬有三种解题思路&#xff0c;而我刚开始一种也不会&#xff0c;看了题解后才勉强有了两种。 1.第一种算绕过if吧。 更改dword_804C044中的内容&#xff0c;第二次输出相同的内容&#xff0c;从而绕过if 脚本如下&…

Linux-安装gcc和g++报错降级的解决方法

一、简介 通过sudo apt-get install gcc指令安装g报错。 下列软件包有未满足的依赖关系&#xff1a;gcc : 依赖: gcc-7 (> 7.3.0-12~) 但是它将不会被安装推荐: libc6-dev 但是它将不会被安装 或libc-dev又按照网上的解决办法 &#xff0c;还是报错。 apt-get update apt-g…

ESET NOD32 互联网安全软件和防毒软件 -简单,可靠的防护。

安全防范病毒和间谍软件&#xff0c;银行和网上购物更安全, 网络摄像头和家用路由器使用更安全&#xff0c;阻止黑客访问您的电脑, 让您的孩子网络安全&#xff1b;产品兑换码仅支持中国ip地址兑换&#xff0c;兑换后可全球通用。 简单&#xff0c;可靠的防护 防范黑客&#x…

【C++11】新的类功能、可变参数模板

C11——新的类功能、可变参数模板 文章目录 C11——新的类功能、可变参数模板一、新的类功能1.测试代码2.默认成员函数3.类成员变量初始化4.强制生成默认函数的关键字default5.禁止生成默认函数的关键字delete6.继承和多态中的final与override关键字 二、可变参数模板1.可变参数…

第64章 树型结构数据的前端渲染渲染显示示例

1 \src\views\TreeTestView.vue <template> <div class"wrap"> <!--注意&#xff1a;1、“回到顶部”组件及其回滚内容都必须包含到同1个div容器中。--> <!-- 2、div容器中必须有1个唯1性的样式类&#xff08;例如&#xff1a;wrap&#xff09…

【Kubenetes进阶】Helm3保姆级安装与Chart使用

之前在Centos 7_64位上实现了用kubespray-2.15.0完成kubenetes的部署&#xff0c;对于kubenetes&#xff0c;Helm无疑是一个良好的命令行下的客户端工具。Helm主要用于 Kubernetes 应用程序 Chart 的创建、打包、发布以及创建和管理本地和远程的 Chart 仓库。 需要对helm加深了…