正则表达式(补充)

news2025/1/25 9:01:21

一、常见匹配模式

模式描述
\w匹配字母数字及下划线
\W匹配非字母数字下划线
\s匹配任意空白字符,等价于 [\t\n\r\f].
\S匹配任意非空字符
\d匹配任意数字,等价于 [0-9]
\D匹配任意非数字
\A匹配字符串开始
\Z匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串
\z匹配字符串结束
\G匹配最后匹配完成的位置
\n匹配一个换行符
\t匹配一个制表符
^匹配字符串的开头
$匹配字符串的末尾。
.匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
[...]用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k'
[^...]不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
*匹配0个或多个的表达式。
+匹配1个或多个的表达式。
?匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
{n}精确匹配n个前面表达式。
{n, m}匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a|b匹配a或b
( )匹配括号内的表达式,也表示一个组

二、re.match()方法的使用

re.match() 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None。

1.最常规的匹配

import re #导包

content = 'Hello 123 456789 World_This is a Regex Demo'  # 准备好的待匹配字符串
# 第一种
res = re.match('^Hello\s\d{3}\s\d{6}\s\w{10}.*Demo$',content)
# 第二种
a = re.match('.*Demo',content)
print(a.group())
print(res) # 返回的是一个匹配对象
print(res.group())  # .group()获取匹配内容
print(res.span())  # 查看匹配长度 44个字符

ec7ee20188344e9b9a18e681d48d25f3.png

2.泛匹配

import re
#写的很简洁
content = 'Hello 123 4567 World_Thixs is a Regex'
result = re.match('He.*?Regex',content)#把一整个文本匹配完成 又不想写的复杂,

print(result.group()) # 获取匹配内容
print(result.span()) # 获取匹配长度

b845974515004b7fb458df3106d70edd.png

3.匹配目标--分组匹配

为了匹配字符串中具体的目标,可以使用()进行分组匹配 ()括号里面是你要匹配的表达式

import re

content = 'qwe Hello 1234567 World_This is a Regex Demo'

result = re.match('qwe\s(\w+)\s(\d{7}).*Demo',content)

print(result.group()) # 获取匹配内容
print(result.group(1)) # 提取第一组表达式内匹配到的字符
print(result.group(2)) # 提取第二组表达式内匹配的字符

27486d10bdf241df8dcd2c7a8977145a.png

4.贪婪匹配

尽可能多的去匹配

import re
# 匹配尽可能多的字符
content = 'Hello 1234567 World_This is a Regex Demo'

result = re.match('^He.*(\d+)\s.*Demo$', content)  
print(result)
print(result.group(1)) 

1d5c1bdd3bb541929f0af4bfefa2a54c.png

5.非贪婪匹配

尽可能少的去匹配

import re
# 匹配尽可能少的字符
content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*?(\d+).*Demo$', content)

print(result)
print(result.group())
print(result.group(1))

30fbc42a07934709a99559330d7337e4.png

6.匹配模式(换行)

import re

# re.S :匹配包括换行在内的所有字符
content = '''Hello 1234567 World_This 
is a Regex Demo
'''
result = re.match('^He.*?(\d+).*Demo$', content,re.S)
print(result)
print(result.group(1))

f67f76abea77420c87bd557d984badf4.png

7.转义

import re

# \表示转义,加在特殊字符的前面,表示它不是正则里的匹配符号,而是普通文本
content = 'price is $5.00'
result = re.match('price\sis\s\$5\.00', content)
print(result)
print(result.group())

675c2085deff462bbd426d810050d57c.png

总结:尽量使用泛匹配、使用括号得到匹配目标、尽量使用非贪婪模式、有换行符就用re.S

三、re.search()方法的使用

re.search() 扫描整个字符串并返回第一个成功的匹配值。

import re

content = 'Extroa stings Hello 1234567 World_This is a 66666666 RDemogex Demo Extra stings'

result = re.search('He.*?(\d+).*?Wor.*?s$', content)
print(result)
print(result.group())
print(result.group(1))

874888abcb69452182e0b2ab2c6bddb2.png

四、re.findall()方法的使用

前面的match()以及search()都只能匹配到第一个

html = '''<div id="songs-list">
    <h2 class="title">经典老歌</h2>
    <p class="introduction">
        经典老歌列表
    </p>
    <ul id="list" class="list-group">
         <li data-view="2">一路有你</li>
        <li data-view="7">
            <a href="/2.mp3" singer="任贤齐">沧海一声笑</a>
        </li>
        <li data-view="4" class="active">
            <a href="/3.mp3" singer="齐秦">往事随风</a>
        </li>
        <li data-view="6"><a href="/4.mp3" singer="beyond">光辉岁月</a></li>
        <li data-view="5"><a href="/5.mp3" singer="陈慧琳">记事本</a></li>
        <li data-view="5">
            <a href="/6.mp3" singer="邓丽君"><i class="fa fa-user"></i>但愿人长久</a>
        </li>
    </ul>
</div>'''

# 用正则匹配出 --- 所有的链接,歌手和歌手名
import re
r = re.findall('<a\shref="(.*?)"\ssinger="(.*?)">(.*?)</a>',html,re.S)
print(r)

08ce0185834041b899a37c7c8d2ff448.png

五、re.sub()方法的使用

替换字符串中每一个匹配的字符

import re

content = 'Extra stings Hello 1234567 World_This is a Regex Demo Extra stings'
# 第一个参数 正则表达式
# 第二个参数 :要替换的新字符
# 第三个参数:原字符串
content = re.sub('s', '7', content) 
print(content)

d384282c88c94346b69a211e7e99563c.png

六、匹配演练

html = '''<div id="songs-list">
    <h2 class="title">经典老歌</h2>
    <p class="introduction">
        经典老歌列表
    </p>
    <ul id="list" class="list-group">
        <li data-view="2">一路有你</li>
        <li data-view="7">
            <a href="/2.mp3" singer="任贤齐">沧海一声笑</a>
        </li>

        <li data-view="4" class="active">
            <a href="/3.mp3" singer="齐秦">往事随风</a>
        </li>
        
        <li data-view="6"><a href="/4.mp3" singer="beyond">光辉岁月</a></li>
        
        <li data-view="5"  class='active'><a href="/5.mp3" singer="陈慧琳">记事本</a></li>
        
        <li data-view="5">
            <a href="/6.mp3" singer="邓丽君"><i class="fa fa-user"></i>但愿人长久</a>
        </li>
    </ul>
</div>'''

# 用正则匹配出 --- 齐秦 往事随风  
import re
r = re.search('<li\sdata-view="4".*?singer="(.*?)">(.*?)</a>',html,re.S)
print(r.group(1))
print(r.group(2))

c84430f60165423494ccd13e795c85fd.png

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2184998.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[含文档+PPT+源码等]精品大数据项目-Django基于随机森林实现的空气质量指数预测研究系统

大数据项目-Django基于随机森林实现的空气质量指数预测研究系统的背景可以从以下几个方面进行阐述&#xff1a; 一、环境背景 空气污染问题日益严重&#xff1a; 随着工业化和城市化的快速发展&#xff0c;空气污染问题已成为全球性的挑战。空气中的主要污染物如PM2.5、PM10、…

DC00025【含论文】基于协同过滤推荐算法springboot视频推荐管理系统

1、项目功能演示 DC00025【含文档】基于springboot短视频推荐管理系统协同过滤算法视频推荐系统javaweb开发程序设计vue 2、项目功能描述 短视频推荐系统分为用户和系统管理员两个角色 2.1 用户角色 1、用户登录、用户注册 2、视频中心&#xff1a;信息查看、视频收藏、点赞、…

邂逅温暖,网上寻找通勤搭子曲折之旅,天下没有不散的筵席

在城市的钢铁丛林中&#xff0c;每日的通勤就像是一场孤独的战役。拥挤的地铁、堵塞的道路&#xff0c;让人心生疲惫。于是&#xff0c;我决定在网上寻找一位通勤搭子&#xff0c;希望能为这段枯燥的旅程增添一抹温暖的色彩。 我在各个社交平台上发布了寻找通勤搭子的帖子&…

用ChatGPT一天搞定一周工作,27个技巧你必须知道

在当今数字化时代&#xff0c;自动化工具已成为提升工作效率的关键利器。人工智能技术&#xff0c;尤其是语言模型如ChatGPT&#xff0c;正在彻底改变企业处理日常任务的方式。本文将深入探讨如何利用这些先进的计算机科学成果来优化工作流程&#xff0c;提高生产力&#xff0c…

Ambiguous mapping. Cannot map *** method 报错解决

报错 Ambiguous mapping. Cannot map basicController method There is already helloController bean method 原因 There is already helloController bean method BasicController 里面有一个"hello"重名了 解决 改一下HelloController.java里面的"hello…

【MySQL 06】表的增删查改

目录 1.insert 增添数据 1.1单行数据 全列插入 1.2多行数据 指定列插入 1.3插入否则更新 1.4.插入否则替换 2.select查找 2.1 全列查找 2.2指定列查找 2.3查询字段为表达式 2.4为查询结果指定别名 2.5 结果去重 2.6 where条件查询 2.7结果排序 2.8.筛选分页结果…

jmeter操作数据库

jmeter操作数据库 一、打开数据库 二、jmeter下载驱动&#xff0c;安装jdbc驱动 1、下载好的驱动包 2、将驱动包复制粘贴 存放在包的路径下 &#xff08;1&#xff09;jdk下面 a、路径&#xff1a;jdk1\jre\lib b、jdk1\jre\lib\ext &#xff08;2&#xff09;jmeter下 a、…

8641 冒泡排序

### 思路 冒泡排序是一种简单的排序算法&#xff0c;通过重复地遍历待排序的列表&#xff0c;比较相邻的元素并交换它们的位置来排序列表。每次遍历会将最大的元素“冒泡”到列表的末尾。当在一趟遍历中没有发生任何交换时&#xff0c;排序结束。 ### 伪代码 1. 读取输入的待排…

数据异质性与数据异构性的本质和举例说明

&#x1f349; CSDN 叶庭云&#xff1a;https://yetingyun.blog.csdn.net/ 在现代数据科学与信息技术领域&#xff0c;“数据异质性” 与 “数据异构性” 是两个常见的概念。对于初学者而言&#xff0c;明确这两个概念的本质及其间的差异至关重要。本文旨在以简明易懂的方式&am…

期权卖方如何提高期权策略的胜率——选择卖出虚值期权更稳健

期权卖方如何提高盈利的胜率&#xff1f; 影响期权卖方最重要的因素是权利金&#xff08;期权报价&#xff09;​。权利金越贵&#xff0c;期权卖方的盈亏平衡点越大&#xff0c;就容易盈利。 影响权利金的因素 行权价&#xff08;虚值期权权利金便宜&#xff0c;实值期权权利…

位运算(7)_消失的两个数字

个人主页&#xff1a;C忠实粉丝 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 C忠实粉丝 原创 位运算(7)_消失的两个数字 收录于专栏【经典算法练习】 本专栏旨在分享学习算法的一点学习笔记&#xff0c;欢迎大家在评论区交流讨论&#x1f48c; 目录 温馨提…

Python编程和开发过程中让人编程效率和舒适度很高的工具Anaconda

编程工作为什么需要提高效率&#xff1f; 在日益繁忙的工作环境中&#xff0c;选择合适的编程工具已成为提升开发者工作效率的关键。不同的工具能够帮助我们简化代码编写、自动化任务、提升调试速度&#xff0c;甚至让团队协作更加顺畅。 那么&#xff0c;编写python代码过程中…

HTML+CSS基础用法介绍四

目录&#xff1a; 复合选择器 后代选择器子代选择器并集选择器交集选择器(了解)伪类选择器 CSS的特性 继承性层叠性 快捷键写法背景属性显示模式综合案列1&#xff1a;热词综合案列2&#xff1a;界面 &#x1f40e;正片开始 后代选择器 定义&#xff1a;由两个或多个基础选择…

代码的艺术之路——创建型设计模式

微信公众号&#xff1a;牛奶 Yoka 的小屋 有任何问题。欢迎来撩~ 最近更新&#xff1a;2024/10/02 [大家好&#xff0c;我是牛奶。] 我们所写的每一行代码&#xff0c;说到底其实是对真实世界的每一处细节的映射。而设计模式&#xff0c;就是为了能更好的映射现实世界总结出的…

[C++] 剖析AVL树功能的实现原理

文章目录 引言AVL树的关键性质为什么选择AVL树&#xff1f; AVL树的结构节点对象的类 AVL树的插入检查是否为空树并处理根节点查询插入位置&#xff08;非递归&#xff09;插入节点并连接父节点更新平衡因子&#xff08;在失去平衡的条件下进行旋转&#xff09; 旋转旋转的原则…

Pycharm中文版百度云下载(附详细安装步骤)

很多刚入门Python的小伙伴可能会存在疑惑&#xff0c;PyCharm是什么&#xff1f;或是把Pycharm和Python搞混淆&#xff0c;以为二者是同一个概念。今天就与大家来聊聊PyCharm。 实际上&#xff0c;PyCharm是一款由JetBrains开发的集成开发环境 (IDE)&#xff0c;专门设计用于P…

【cpp/c++ summary 工具】 vld(Visual Leak Detector)windows 内存泄漏检测工具

Visual Leak Detector&#xff0c;这是一个用于检测C/C程序内存泄漏的工具。它可以在开发Windows应用程序时发现并修复内存泄漏的问题。 安装VLD https://kinddragon.github.io/vld/https://github.com/KindDragon/vld 运行程序 在项目中包含头文件 项目中&#xff0c;通…

Host文件及switchhosts for mac下载

一、概念 hosts 是一个文本文件&#xff0c;用来将主机名或域名映射到对应的 IP 地址。 这个文件通常位于 /etc/hosts&#xff08;在 Unix-like 系统上&#xff0c;包括 macOS 和 Linux&#xff09; 可以在终端输入sudo vim /etc/hosts来打开 或 C:\Windows\System32\driver…

Web安全 - 路径穿越(Path Traversal)

文章目录 OWASP 2023 TOP 10导图定义路径穿越的原理常见攻击目标防御措施输入验证和清理避免直接拼接用户输入最小化权限日志监控 ExampleCode漏洞代码&#xff1a;路径穿越攻击案例漏洞说明修复后的安全代码代码分析 其他不同文件系统下的路径穿越特性Windows系统类Unix系统&a…

MDM监管锁系统ABM证书与MDM证书申请与使用

MDM证书与ABM证书申请与维护 基础知识 监管锁系统运行需要两个证书 分别为ABM证书 与 MDM证书,在别人平台购买的监管锁只会让你上传自己的ABM证书而MDM证书则是共用一个平台自己的MDM证书&#xff0c;而MDM证书才是控制手机的关键,如果MDM证书被封禁,那么所有的设备将无法受到…