Python基础教程(十六):正则表达式

news2025/4/7 3:46:28

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快!
💝💝💝如有需要请大家订阅我的专栏【Python系列】哟!我会定期更新相关系列的文章
💝💝💝关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!

文章目录

      • 引言
      • 一、正则表达式基础
      • 二、Python `re` 模块常用方法
      • 三、经典案例展示
        • 案例 1:验证电子邮件地址
        • 案例 2:获取电话号码
        • 案例 3:替换敏感词
      • 四、进阶用法
      • 五、总结
    • 结束语

引言

正则表达式是处理字符串的强大工具,尤其在数据清洗、文本解析和模式匹配等场景中发挥着重要作用。Python 提供了 re 模块来支持正则表达式的使用,本文将带你深入了解 Python 中的正则表达式,从基本语法到高级用法,结合实际案例,让你成为正则表达式的高手。

一、正则表达式基础

正则表达式由普通字符(如字母 a-z)和特殊字符(称为元字符)组成。元字符在正则表达式中具有特殊含义,它们可以表示一个字符集、一个位置等。下面是一些常用的元字符:

.:匹配任意除换行符以外的字符。
*:匹配前面的子表达式零次或多次。
+:匹配前面的子表达式一次或多次。
?:匹配前面的子表达式零次或一次。
^:匹配输入字符串的开始位置。
$:匹配输入字符串的结束位置。
[…]:字符集,匹配方括号中的任意字符。
[^…]:否定字符集,匹配任何不在方括号中的字符。
|:或,匹配 | 左右的表达式任意一个。
(…):分组,将多个字符当做一个整体进行匹配。

  • 元字符:如 . 匹配任意单个字符,* 表示前面的元素可以出现任意次,包括0次。
  • 字符集[abc] 匹配 ‘a’ 或 ‘b’ 或 ‘c’。
  • 位置锚点^ 匹配行的开始,$ 匹配行的结束。

二、Python re 模块常用方法

  1. re.search(pattern, string):扫描整个字符串并返回第一个成功的匹配。
  2. re.match(pattern, string):尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功,则返回 None。
  3. re.findall(pattern, string):查找字符串中所有匹配正则表达式的子串,并返回一个列表。
  4. re.finditer(pattern, string):类似于 findall,但返回的是一个迭代器,每次迭代返回一个 Match 对象。
  5. re.sub(pattern, repl, string):将字符串中所有匹配正则表达式的子串替换为指定字符串。

参数说明:

  • pattern 匹配的正则表达式
  • string 要匹配的字符串。
  • flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。参见:正则表达式修饰符 - 可选标志

三、经典案例展示

案例 1:验证电子邮件地址
import re

email_pattern = r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}"
email = "example@example.com"

if re.match(email_pattern, email):
    print("Valid email")
else:
    print("Invalid email")

此案例中,我们定义了一个电子邮件的正则表达式,然后使用 re.match 方法来验证给定的电子邮件地址是否符合预期的格式。

案例 2:获取电话号码
phone_text = "Call me at 555-1234 or 555-6789."
phone_pattern = r"\d{3}-\d{4}"

matches = re.findall(phone_pattern, phone_text)
for match in matches:
    print(match)

这段代码会输出电话号码列表,即 ['555-1234', '555-6789']

案例 3:替换敏感词
text = "Bad words should be filtered out. Bad!"
bad_word_pattern = r"Bad"

# 使用空字符串替换
clean_text = re.sub(bad_word_pattern, "", text)
print(clean_text)

# 或者替换为其他字符串
clean_text = re.sub(bad_word_pattern, "Good", text)
print(clean_text)

在这个例子中,我们使用 re.sub 方法来替换文本中的敏感词。

四、进阶用法

  • 分组和引用(...) 可以用来捕获括号内的匹配结果,之后可以通过 \1, \2, … 来引用这些组。
  • 贪婪与非贪婪匹配:默认情况下,*, +, {n,m} 是贪婪的,会尽可能多的匹配。添加 ? 变成非贪婪,即尽可能少的匹配。
  • 转义字符:在正则表达式中,某些字符具有特殊含义,如果想将其视为普通字符,需要使用 \ 进行转义。

五、总结

正则表达式是处理文本的强大武器,而 Python 的 re 模块提供了丰富的功能来支持正则表达式的应用。通过本文的学习,你已经掌握了正则表达式的使用方法,以及如何在 Python 中实现文本匹配、提取和替换。继续练习和探索,你将能够更熟练地运用正则表达式解决实际问题。


结束语

喜欢博主的同学,请给博主一丢丢打赏吧↓↓↓您的支持是我不断创作的最大动力哟!感谢您的支持哦😘😘😘
打赏下吧

💝💝💝如有需要请大家订阅我的专栏【Python系列】哟!我会定期更新相关系列的文章
💝💝💝关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!

python相关文章索引文章链接
Python基础语法(一):标识符与保留字部分Python基础语法(一):标识符与保留字部分
Python基础语法(二):数据类型Python基础语法(二):数据类型
Python基础语法(三):运算符Python基础语法(三):运算符
Python基础语法(四):条件控制Python基础语法(四):条件控制
Python基础语法(五):循环语句Python基础语法(五):循环语句
Python基础语法(六):推导式编程Python基础语法(六):推导式编程
Python基础教程(七):函数编程-从基础到进阶Python基础教程(七):函数编程-从基础到进阶
Python基础教程(八):迭代器与生成器编程Python基础教程(八):迭代器与生成器编程
Python基础教程(九):Lambda 函数Python基础教程(九):Lambda 函数
Python基础教程(十):装饰器Python基础教程(十):装饰器
Python基础教程(十一):数据结构汇总梳理Python基础教程(十一):数据结构汇总梳理
Python基础教程(十二):模块Python基础教程(十二):模块
Python基础教程(十三):file文件及相关的函数Python基础教程(十三):file文件及相关的函数
Python基础教程(十四):OS 文件/目录方法Python基础教程(十四):OS 文件/目录方法
Python基础教程(十五):面向对象编程Python基础教程(十五):面向对象编程

❤️❤️❤️觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄
💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍
🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1820592.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业多云策略的优势与实施指南

企业在选择云服务提供商时,常见的选项包括亚马逊AWS、微软Azure、谷歌云GCP、阿里云、腾讯云和华为云。为了避免过度依赖单一供应商,许多企业选择采用多云策略,这样可以充分利用不同云服务的优势,同时避免重复工作和其他额外的工作…

16个不为人知的资源网站,强烈建议收藏!

整理了16个不为人知的资源网站,涵盖了课程学习、办公技能、娱乐休闲、小说音乐等多种资源,强烈建议收藏! #学习网站 1、中国大学MOOC icourse163.org/ 这是一个汇集了国内顶尖大学免费课程资源的平台,众多985工程院校如北京大…

现代易货模式:重塑物品价值,引领交换新潮流

在日益繁荣的现代社会,物品交换文化正逐渐兴起,一种新型的交易模式——现代易货模式,正在成为市场的新宠。它不仅是对传统“以物易物”模式的现代化演绎,更是对物品价值再认识和交换方式创新的体现。 现代易货模式,简言…

人工智能入门学习教程分享

目录 1.首先安装python,官网地址:Download Python | Python.org,进入网址,点击Windows链接 2.下载完成之后,进行傻瓜式安装,如果不选安装路径,默认会安装到C:\Users\Administrator\AppData\Loc…

找不到xinput1_3.dll文件要怎么修复?有哪些有效修复xinput1_3.dll文件的方法

要解决xinput1_3.dll文件缺失的问题,首先我们需要对这个文件有所了解。理解了这个文件的性质和作用后,才能更科学、有效地解决因其丢失而导致的问题。那么接下来,让我们不浪费时间,直接深入研究如何修复xinput1_3.dll文件的最佳方…

三、网络服务协议

目录 一、FTP:文件传输协议 二、Telnet:远程登录协议 三、AAA认证 四、DHCP 五、DNS 六、PPP协议 七、ISIS协议 一、FTP:文件传输协议 C/S架构,现多用于企业内部的资料共享和网络设备的文件传输,企业内部搭建一…

pdf书签怎么做?这三款软件轻松驾驭文档!

在数字化时代,PDF文件已成为我们工作、学习中的重要组成部分。然而,面对海量的PDF内容,如何快速定位关键信息,提高阅读效率呢?答案就是——制作PDF书签。今天,我将为大家介绍三款实用的软件,助你…

人脸匹配——OpenCV

人脸匹配 导入所需的库加载dlib的人脸识别模型和面部检测器读取图片并转换为灰度图比较两张人脸选择图片并显示结果比较图片创建GUI界面运行GUI主循环运行显示全部代码 导入所需的库 cv2:OpenCV库,用于图像处理。 dlib:一个机器学习库&#x…

opencv-python(八)

import cv2 import numpy as npheight 160 width 280 image np.zeros((height, width),np.uint8) cv2.imshow(image,image) cv2.waitKeyEx(0) cv2.destroyAllWindows() 二维数组代表一幅灰度图像。 import cv2 import numpy as npheight 160 width 280 image np.zeros((he…

数据结构习题(快期末了)

一个数据结构是由一个逻辑结构和这个逻辑结构上的一个基本运算集构成的整体。 从逻辑关系上讲,数据结构主要分为线性结构和非线性结构两类。 数据的存储结构是数据的逻辑结构的存储映像。 数据的物理结构是指数据在计算机内实际的存储形式。 算法是对解题方法和…

.NET MAUI Sqlite程序应用-数据库配置(一)

项目名称:Ownership(权籍信息采集) 一、安装 NuGet 包 安装 sqlite-net-pcl 安装 SQLitePCLRawEx.bundle_green 二、创建多个表及相关字段 Models\OwnershipItem.cs using SQLite;namespace Ownership.Models {public class fa_rural_base//基础数据…

springboot和mybatis项目学习

#项目整体样貌 ##bean package com.example.demo.bean;public class informationBean {private int id;private String name;private String password;private String attchfile;public int getId() {return id;}public String getName() {return name;}public String getPas…

独具韵味的移动端 UI 风格

独具韵味的移动端 UI 风格

ACL原理和基础配置

ACL(Access Control List,访问控制列表)是一种用于控制网络设备或操作系统上资源访问权限的方法。ACL能够基于规则和条件来允许或拒绝对资源的访问。 标准ACL(Standard ACL):基于源IP地址来进行流量过滤&a…

改进YOLOv8 | 主干网络篇 | YOLOv8 更换主干网络之 StarNet | 《重写星辰⭐》

本改进已集成到 YOLOv8-Magic 框架。 论文地址:https://arxiv.org/abs/2403.19967 论文代码:https://github.com/ma-xu/Rewrite-the-Stars 最近的研究引起了人们对“星形运算”(按元素乘法)在网络设计中未被充分利用的潜力的关注。虽然直观的解释很多,但其应用的基本原理…

Vue30-自定义指令:对象式

一、需求:创建fbind指定 要用js代码实现自动获取焦点的功能! 二、实现 2-1、步骤一:绑定元素 2-2、步骤二:input元素获取焦点 此时,页面初始化的时候,input元素并没有获取焦点,点击按钮&…

计算机网络 —— 运输层(TCP三次握手)

计算机网络 —— 运输层(TCP三次握手) 三次握手第一次握手第二次握手第三次握手两次握手行不行? 我们今天来学习TCP的三次握手: 三次握手 TCP三次握手是TCP协议中建立连接的过程,旨在确保双方准备好进行可靠的通信。…

一个电话客服系统

简介 这是一个客服系统,使用的是USB电话盒。电话盒接入电话线 ,然后再插在在计算机上。当有电话拨入时,可以在电脑中自动弹出拨入电话号码的相关客户资料,并能够自动录音。 安装 一、运行setup.exe 二、按照提示安装好程序后&am…

Android Jetpack Compose入门教程(二)

一、列表和动画 列表和动画在应用内随处可见。在本课中,您将学习如何利用 Compose 轻松创建列表并添加有趣的动画效果。 1、创建消息列表 只包含一条消息的聊天略显孤单,因此我们将更改对话,使其包含多条消息。您需要创建一个可显示多条消…

openh264 帧内预测编码过程源码分析

函数关系 说明: 可以看到完成帧内预测编码的核心函数就是 WelsMdI16x16、WelsMdI4x4、WelsMdI4x4Fast 、WelsMdIntraChroma 四个函数。 原理 WelsMdI16x16函数 功能:针对16x16像素块的帧内模式决策过程: 局部变量申明;根据宏块…