Python 从入门到实战17(正则表达式操作)

news2024/9/21 2:44:55

        我们的目标是:通过这一套资料学习下来,通过熟练掌握python基础,然后结合经典实例、实践相结合,使我们完全掌握python,并做到独立完成项目开发的能力。

上篇文章我们讨论了正则表达式的语法。今天进一步讨论一下正则表达式的一些操作。也是经常会用到的。

1、匹配字符串-match()方法

在python中match()方法用于从字符串的开始处进行匹配,如果起始位置匹配成功,则返回match对象,否在返回none

语法: re.match(pattern,string,[flags])

说明: pattern  ---模式字符串,有要匹配的正则表达式转换而来

string  ----要匹配的字符串

flags   ----可选参数,表示标志位。用于控制匹配方式,如是否区分字母大小写。

例如写I为不区分大小写。

举例说明:

import re

#匹配字符串是否以www开头的
baidu_add ='www.baidu.com'
baidu_addr = "WWw.baidu.com"
myname = 'Wdevi'
pattern_www = r'WWW.+' #模式字符串
match1 = re.match(pattern_www,baidu_addr,re.I)
print(match1)
match2 = re.match(pattern_www,baidu_add,re.I)
print(match2)
match3 = re.match(pattern_www,myname,re.I)
print(match3)

输出结果:前两个字符串都能匹配,第三个显然不匹配:

2、匹配字符串-search()方法

在python中search()方法用于在整个字符串中搜索第一个要匹配的值,如果起始位置匹配成功,则返回match对象,否则返回none

和match()方法最大不同之处,search()是可以整个字符串中进行匹配的搜索。

语法格式:re.match(pattern,string,[flags])

说明:pattern  ----模式字符串,有要匹配的正则表达式转换而来

string  ----要匹配的字符串

flags   ----可选参数,表示标志位。用于控制匹配方式,如是否区分字母大小写。

例如写I为不区分大小写。

举例说明:

import re
#匹配字符串是否以www开头的
baidu_add ='www.baidu.com'
baidu_addr = "百度网址:WWw.baidu.com"
pattern_www = r'WWW.+' #模式字符串
match1 = re.search(pattern_www,baidu_add,re.I)
print(match1)
match2 = re.search(pattern_www,baidu_addr,re.I)
print(match2)

输出结果:

举例说明,

import re
#搜索广告中敏感词汇,若是有“最好”,“最优秀”,“遥遥领先”,输出有敏感词。否则无敏感词
advertisement_xiaomi= "小米小米,销量天下第一!"
advertisement_huawei= "华为华为,科技遥遥领先,是宇宙中最优秀的手机!"
pattern = r"(最好)|(最优秀)|(遥遥领先)"
search_xiaomi = re.search(pattern,advertisement_xiaomi)
search_huawei = re.search(pattern,advertisement_huawei)
if search_xiaomi is None:
    print(advertisement_xiaomi,"无广告敏感词")
else:
    print(advertisement_xiaomi,"有广告敏感词")
if search_huawei is None:
    print(advertisement_huawei,"无广告敏感词")
else:
    print(advertisement_huawei,"有广告敏感词")

输出结果:很明显,华为中有广告敏感词。

3、匹配字符串-findall()方法

在python中findall()方法用于在整个字符串中搜索所有符合正则表达式的字符串,且以列表的形式返回。如果匹配成功,则返回包含匹配结构的列表。

和match()方法最大不同之处,findall ()是可以整个字符串中进行匹配的搜索,匹配的都取出来放到列表中。

语法格式:re.findall(pattern,string,[flags])

说明:pattern  ----模式字符串,有要匹配的正则表达式转换而来

string  ----要匹配的字符串

flags   ----可选参数,表示标志位。用于控制匹配方式,如是否区分字母大小写。

例如写I为不区分大小写。

举例说明:

#搜索广告中敏感词汇,若是有“最好”,“最优秀”,“遥遥领先”,输出有敏感词。否则无敏感词
#通过列表输出所有的敏感词
advertisement_huawei= "华为华为,科技遥遥领先,是宇宙中最优秀的手机!"
pattern = r"最好|最优秀|遥遥领先"
search_huawei = re.findall(pattern,advertisement_huawei)
print("华为广告语敏感词:",search_huawei)

输出结果:

另外,举个匹配网址的例子:

#如通过指定模式字符串匹配IP地址127.0.0.1
pattern_ip = r'[1-9]{1,3}(\.[0-9]{1,3}){3}'
my_ip = '127.0.0.1 192.168.1.99'
match_all = re.findall(pattern_ip,my_ip)
print(match_all)

输出:

输出的是.1和.99两个元素,因为有括号分组的原因r'[1-9]{1,3}(\.[0-9]{1,3}){3}'

如是想输出完整的IP,需要整个模式字符串作为一组:r'([1-9]{1,3}(\.[0-9]{1,3}){3})'

#如通过指定模式字符串匹配IP地址127.0.0.1
pattern_ip = r'[1-9]{1,3}(\.[0-9]{1,3}){3}'
pattern_ip1 = r'([1-9]{1,3}(\.[0-9]{1,3}){3})'
my_ip = '127.0.0.1 192.168.1.99'
match_all = re.findall(pattern_ip,my_ip)
print(match_all)
match_all1 = re.findall(pattern_ip1,my_ip)
print(match_all1)

输出参考:

可以循环打印出两个完整IP:

for item in match_all1:
    print(item[0])

4、替换字符串-sub()方法

可以通过sub()方法实现字符串的替换。

语法:re.sub(pattern,repl,string,count,flags)

参数说明:

说明:pattern  ----模式字符串,有要匹配的正则表达式转换而来

repl-----表示要替换展示的字符串

string  ----要被查找替换的原始的字符串

count  -----可选参数,表示可以被替换的最大次数。默认值0,表示替换所有匹配

flags   ----可选参数,表示标志位。用于控制匹配方式,如是否区分字母大小写。

例如写I为不区分大小写。

举个例子:

import re
#客户的一些信息,假如要412开头身份证号码(这里不考虑15位或者结尾x的情况)
# 替换为412xxxxxxxxxxxxxxx
pattern = r'412[0-9]{15}'
string_cust = "客户的身份证:412724198901118789"
result = re.sub(pattern,"412xxxxxxxxxxxxxxx",string_cust)
print(result)

输出结果:

5、使用正则表达式分割字符串

可以使用split()方法根据正则表达式来分割字符串,并且以列表的形式返回。

语法: re.split(pattern,string,[maxsplit],[flags])

说明:pattern  ----模式字符串,有要匹配的正则表达式转换而来

string  ----要被匹配的原始的字符串

maxsplit  -----可选参数,表示最大的拆分次数

flags   ----可选参数,表示标志位。用于控制匹配方式,如是否区分字母大小写。

例如写I为不区分大小写。

举例如下:

import re
#举例说明,分割请求接口地址:#http://ws.webxml.com.cn/ /MobileCodeWS.asmx?op=getDatabaseInfo
 

my_ip= 'http://ws.webxml.com.cn/MobileCodeWS.asmx?username="dewi"&pwd="123456"&op=getDatabaseInfo'
pattern = r"[?|&]"#以?或者&来分割字符串
result = re.split(pattern,my_ip)  #按正则表达式分割url
print("url分割后:",result)

输出结果:

今天先写学习到这里了,每天进步一点点。今天也要加油啊!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2135543.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录训练营Day4 | 24. 两两交换链表中的节点 | 19.删除链表的倒数第N个节点 | 面试题 02.07. 链表相交 | 142.环形链表II

今日阅读文档:代码随想录 (programmercarl.com) Leetcode 24. 两两交换链表中的节点 题目描述 给你一个链表,两两交换其中相邻的节点,并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题(即,只…

uview-plus 表单校验 相关字段有数据有值的情况下非空验证失败问题

你们好,我是金金金。 场景 uniapp编写h5及小程序,组件库用的uview-plus,在进行表单校验的过程中,数据回显 数量明明是有值的,还是依旧提示填写数量(重新再次手动输入才能校验通过,明显是存在问题…

Python 课程6-Pandas 和 Matplotlib库

前言 在数据科学和数据分析领域,Pandas 和 Matplotlib 是两个最常用的 Python 库。Pandas 主要用于数据处理和分析,而 Matplotlib 则用于数据的可视化。它们的结合能够帮助我们快速、直观地展示数据的趋势和规律。在这篇详细的教程中,教程中将…

如何对离线数仓和准实时数仓进行精准把控?

数仓是指将企业中各个业务系统产生的数据进行汇总、清洗、转化和整合,以便为企业提供决策支持和数据分析的存储和管理系统。 离线数仓和准实时数仓,这两种数据仓库模式,各有其特点,根据其特点和适用的应用场景选择合适的仓库模式…

Nginx快速使用

如果本系列文章对您有帮助,可以 star 一下我的 limou-learn-note,求求惹(๑> <)☆♡~ 叠甲:以下文章主要是依靠我的实际编码学习中总结出来的经验之谈,求逻辑自洽,不能百分百保证正确&#xff…

2024桥梁科技两江论坛——第二届桥梁工程安全与韧性学术会议

文章目录 一、会议详情二、重要信息三、大会介绍四、出席嘉宾五、征稿主题六、咨询 一、会议详情 二、重要信息 大会官网:https://ais.cn/u/vEbMBz提交检索:EI Compendex、IEEE Xplore、Scopus 三、大会介绍 2024年桥梁科技两江论坛——第二届桥梁工程…

七、结合Landsat、夜光数据建成区提取——K均值聚类和监督分类提取精确的建成区边界

一、前言 前面已经明确K均值聚类确定初步城市边界范围,其实除了使用Arcgis可以实现聚类分析之外,SPSS也可以实现,但是毕竟我们需要在空间层面体现聚类效果,SPSS能实现数据制表的结果,所以还是建议大家采用Arcgis进行聚类分析,前文的聚类分析不是很详细,这里再次详细给大…

刚刚!1区top“灌水”神刊,39天Accepted!真正的沾边可录

01 沾边即录-快刊 1、数据科学类 SCI • 影响因子:2.0-3.0 • 期刊分区:JCR1区,中科院2区-Top • 接收领域:数据科学的进展和应用研究,如:大数据处理和分析、人工智能、物联网、以及数据科学与计算技术的…

uni-app 聊天界面滚动到消息底部

目录 问题 组件 页面 使用的API 总结 问题 当你发一个消息,但是消息却需要你自己向下滑你才能看见,否则一直呗输入框挡住。 组件 scroll-view组件:一般使用scroll-view组件的都采取使用其scroll-into-view或者scroll-to属性。 scroll-…

Spring3-IoC1-IoC容器、基于xml管理bean

目录 IoC容器 概述 依赖注入 IoC容器在Spring中的实现 基于xml管理bean 获取bean 依赖注入 setter注入 构造器注入 特殊值处理 字面量赋值 null值 xml实体 CDATA节 特殊类型属性注入 对象类型属性注入 方式一:引用外部bean 方式二:内部…

设背包密码系统的超递增序列为A=(3,4,9,17,35),乘数t=19,模数k=73,试对good night加密

PS:后续在此基础上更新Java代码 1.超递增序列含义 超递增序列是指一个正整数序列,其中每个元素a[i](i≥2)都大于它前面所有元素之和,即a[i] > (a[1] a[2] ... a[i-1]) 2.加密公式 C( B…

html+css+js网页设计 旅游 大理旅游7个页面

htmlcssjs网页设计 旅游 大理旅游7个页面 网页作品代码简单,可使用任意HTML辑软件(如:Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等操作)。 获取源码 1&#…

信通院发布首个《大模型媒体生产与处理》标准,阿里云智能媒体服务作为业界首家“卓越级”通过

中国信通院近期正式发布《大模型驱动的媒体生产与处理》标准,阿里云智能媒体服务,以“首批首家”通过卓越级评估,并在9大模块50余项测评中表现为“满分”。 当下,AI大模型的快速发展带动了爆发式的海量AI运用,这其中&a…

异构仿真:打造更可靠的综合化航空电子软件

综合化航空电子系统是一类典型的安全关键系统,具有分布式、异构、计算资源和物理资源强耦合等特征。随着IMA(Integrated Modular Avionics,综合模块化航空电子)系统趋于复杂化和智能化,系统的功能越来越多地采用软件来…

权威认可,信源信息再次斩获国家发明专利

近日,郑州信源信息技术股份有限公司(简称“信源信息”)继获得“一种安全认证方法及系统”发明专利后,再次喜获国家知识产权局颁发的发明专利“适用于多环境OFD文档的投标文件处理方法及系统”。本次发明专利的获得,不仅…

华为云ROMA Connect聚焦创新,在Gartner®峰会发布智能集成新视角

9月9日-9月10日,Gartner全球应用创新及商业解决方案峰会在伦敦举行,围绕企业应用策略、智能平台工程和生成式AI,来自全球的1700业内专家共同探讨新趋势带来的机遇和挑战。华为云ROMA Connect发表 “人工智能”主题演讲之一,展现新…

黑龙江等保测评二级系统费用解析:如何合理预算?

在信息安全日益受到重视的今天,等保测评成为企业合规的重要环节。尤其是在黑龙江,随着网络安全法的实施,越来越多的企业开始关注等保测评的相关费用。那么,黑龙江等保测评二级系统的费用是如何计算的呢? 首先&#xf…

linux 定时将固态硬盘数据备份至机械硬盘

需求背景 为了加强公司数据的安全性和可靠性,我们将实施一项数据备份策略。该策略涉及将服务器上的固态硬盘(SSD)中的关键数据定期备份到机械硬盘(HDD)上。这一过程旨在保护数据免受意外删除、硬件故障或其他潜在风险…

【诉讼流程-健身房-违约认定-私教课-诉讼书前提材料整理-民事诉讼-自我学习-铺平通往法律的阶梯-讲解(2)】

【诉讼流程-健身房-违约-私教课-前期法律流程-民事诉讼-自我学习-铺平通往法律的阶梯-讲解(2)】 (1)前言说明1、目的2、一个小测试1、更换原教练2、频繁更换教练3、上课估计拖课,占用上课时间,抽烟等。4、以…

VMware Workstation Pro 17 提供个人版使用

说明 VMware 下载链接已经合并到博通网站,原有网站已停用。 注册 注册并登录博通网站,即可下载软件,不过注册有很多限制 建议使用国外的邮箱。 我是用gmail注册的。 下载 https://support.broadcom.com/group/ecx/productdownloads?subf…