python正则表达(06)

news2025/2/28 12:38:11

python正则表达(06)

文章目录

    • python正则表达(06)
      • 1 正则表达式概念
      • 2 正则的三个基础方法
        • 2.1 match、search、findall三个基础方法
        • 2.2 re.match() 函数
          • 2.2.1 re.match(匹配规则,被匹配字符串)
          • 2.2.2验证是否开头匹配,match是匹配开头,后面的是不匹配
        • 2.3 re.search()
          • 2.3.1 search(匹配规则,被匹配字符串)
          • 2.3.2 search整个字符串都找不到,返回None
        • 2.4 re.findall(匹配规则,被匹配字符串)
          • 2.4.1 匹配到返回值
          • 2.4.2找不到返回空list:[]
      • 3 元字符匹配
      • 3.1 单字符匹配规则:
        • 3.2 匹配示例:
          • 3.2.1 找出全部数字: \d
          • 3.2.2 找出特殊字符: \W
          • 3·找出全部英文字母:[a-zA-Z] 或者字母数字[a-zA-Z0-9]
        • 3.3 数量匹配
        • 3.4 边界匹配
        • 3.5 分组匹配
        • 3.6 匹配规则组合图
        • 3.7 匹配案例
          • 3.7.1 匹配账号,只能由字母和数字组成,长度限制6到10位
          • 3.7.2 配QQ号,要求纯数字,长度5-11,第一位不为0

参考视频: 黑马保姆级视频

**参考API: **菜鸟教程

1 正则表达式概念

正则表达式,又称规则表达式(Regular Expression),是使用单个字符串来描述、匹配某个句法规则的字符
来检索、替换那些符合某个模式(规则)的文本。
简单来说:通过规则去验证字符串是否匹配。

比如,验证一个字符串是否是符合条件的电子邮箱地址,只需要配置好正则规则,即可匹配任意邮箱。
比如通过正则规则: (^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$) 即可匹配一个字符串是否是标准邮箱格式

2 正则的三个基础方法

2.1 match、search、findall三个基础方法

match 是从头匹配,匹配第一个命中项 ,未匹配返None

search全局搜索,匹配第一个命中项, 未匹配返None

findall 全局匹配,匹配全部命中项,未匹配返回值[]列表,如果正则有(),会每个组结果返回结果

Python正则表达式,使用re模块,并基于re模块中三个基础方法来做正则匹配。
分别是:match、search、findall三个基础方法

从被匹配字符串开头进行匹配,匹配成功返回匹配对象(包含匹配的信息),匹配不成功返回空。
2.2 re.match() 函数
2.2.1 re.match(匹配规则,被匹配字符串)

​ 注意:match()尝试从字符串的起始位置匹配一个模式**,如果不是起始位置匹配成功的话**,match() 就返回 none

import re

s = 'python itheima python itheima python itheima'

# 第一个是匹配规则,第二个是被匹配,要筛选的数据,返回匹配的下标span=(0, 6)
result =  re.match("python", s )
print(result)  # 打印结果: <re.Match object; span=(0, 6), match='python'>
print(result.span())  # 打印为 (0,6)
print(result.group()) # python
2.2.2验证是否开头匹配,match是匹配开头,后面的是不匹配
import re
s='1python itheima python itheima python itheima'

result=re.match('python' s)
print(result) # None

match是匹配开头,后面的是不匹配
2.3 re.search()
2.3.1 search(匹配规则,被匹配字符串)

注意:搜索整个字符串,找出匹配的。从前向后,找到第一个后,就停止,不会继续向后

import re
s='1python666itheima666python666'

result=re.search('python',s)
print(result)  # <re.Match object; span=(1, 7), match='python'>

print(result.span()) # (1, 7)
print(result.group()) # python
2.3.2 search整个字符串都找不到,返回None
import re

s='itheima666'
result=re.search('python', s)
print(result)  # None
2.4 re.findall(匹配规则,被匹配字符串)
2.4.1 匹配到返回值

注意:匹配整个字符串,找出全部匹配项

import re
s='1python666itheima666python666'

result = re.findall('python', s)
print(result)  # ['python','python']
2.4.2找不到返回空list:[]
import re
s='1python666itheima666python666'
result =re.findall('itcast', s)
print(result) # []

3 元字符匹配

基础的字符串匹配,正则最强大的功能在于元字符匹配规则

3.1 单字符匹配规则:

字符功能
.点匹配任意1个字符(除了\n),\.匹配点本身
[]匹配[]中列举的字符
\d匹配数字,即0-9
\D匹配非数字
\s匹配空白,即空格、tab键
\S匹配非空白
\w匹配单词字符,即a-z、A-Z、0-9、_
\W匹配非单词字符
3.2 匹配示例:
3.2.1 找出全部数字: \d
import re
s = "itheima1 @@python2 !!666 ##itcast3"

# 字符串前面带上r的标记,表示字符串中转义字符串无效,就是普通字符的意思
result  = re.findall(r'\d', s) 

print(result)   # 打印:['1', '2', '6', '6', '6', '3']
3.2.2 找出特殊字符: \W
import re
s = "itheima1 @@python2 !!666 ##itcast3"

# 字符串前面带上r的标记,表示字符串中转义字符串无效,就是普通字符的意思
result  = re.findall(r'\W', s) 
print(result)  # [' ', '@', '@', ' ', '!', '!', ' ', '#', '#']
3·找出全部英文字母:[a-zA-Z] 或者字母数字[a-zA-Z0-9]
import re
s="itheima1 @@python2 !!666 ##itcast3"

# 字符串前面带上r的标记,表示字符串中转义字符串无效,就是普通字符的意思
result  = re.findall(r'[a-zA-Z]', s) 

print(result)
# 打印:['i', 't', 'h', 'e', 'i', 'm', 'a', 'p', 'y', 't', 'h', 'o', 'n', 'i', 't', 'c', 'a', 's', 't']
3.3 数量匹配
字符功能
*匹配前一个规则的字符出现0至无数次
+匹配前一个规则的字符出现1至无数次
?匹配前一个规则的字符出现0次或1次
{m}匹配前一个规则的字符出现m次
{m,}匹配前一个规则的字符出现最少m次
{m,n}匹配前一个规则的字符出现m到n次
3.4 边界匹配
字符功能
^匹配字符串开头
$匹配字符串结尾
\b匹配一个单词的边界
\B匹配非单词边界
3.5 分组匹配
字符功能
|匹配左右任意一个表达式
()将括号中字符作为一个分组
3.6 匹配规则组合图

在这里插入图片描述

3.7 匹配案例

注意:正则不要随意加空格

3.7.1 匹配账号,只能由字母和数字组成,长度限制6到10位

规则为:^[0-9a-zA-Z]{6,10}$

import re
r = '^[0-9a-zA-Z]{6,10}$'
s = '123456789a'
print(re.findall(r,s)) # 打印:['123456789a']
3.7.2 配QQ号,要求纯数字,长度5-11,第一位不为0

规则 : ^[1-9][0-9]{4,10}&

import re
r = '^[1-9][0-9]{4,10}$'   # 注意:[1-9]匹配第一位,[0-9]匹配后面4到10位
s = '123456789'
print(re.findall(r,s))  #['123456789']

3.7.3 匹配邮箱地址,只允许qq、163、gmail这三种邮箱地址

规则为:^[\w-]+(\.[\w-]+)*@(qq|163|gmail)(\.[\w-]+)+$

import re
r = r'(^[\w-]+(\.[\w-]+)*@(qq|163|gmail)(\.[\w-]+)+$)'  # 技巧使用findall整个整体包起来
s = 'a.b.c.d@qq.com.a.z'
print(re.findall(r, s))

打印结果:[('a.b.c.d@qq.com.a.z', '.d', 'qq', '.z')]

优化:使用match

import re
r = r'^[\w-]+(\.[\w-]+)*@(qq|163|gmail)(\.[\w-]+)+$'
s = 'a.b.c.d@qq.com.a.z'
print(re.match(r, s))

打印结果:<re.Match object; span=(0, 18), match='a.b.c.d@qq.com.a.z'>

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1026947.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ingress Controller

什么是 Ingress Controller &#xff1f; 在云原生生态中&#xff0c;通常来讲&#xff0c;入口控制器( Ingress Controller )是 Kubernetes 中的一个关键组件&#xff0c;用于管理入口资源对象。 Ingress 资源对象用于定义来自外网的 HTTP 和 HTTPS 规则&#xff0c;以控制进…

Ae 效果:CC Ball Action

模拟/CC Ball Action Simulation/CC Ball Action CC Ball Action &#xff08;CC 球体动作&#xff09;基于源图像转换为网格&#xff0c;并基于网格生成一个个继承源图像像素颜色的具有 3D 深度的小球体。 效果名称左侧出现的立方体图标&#xff0c;表示本效果支持 3D 摄像机。…

2023_Spark_实验七:Scala函数式编程部分演示

1、Scala中的函数 在Scala中&#xff0c;函数是“头等公民”&#xff0c;就和数字一样。可以在变量中存放函数&#xff0c;即&#xff1a;将函数作为变量的值&#xff08;值函数&#xff09;。 def myFun1(name:String):String"Hello " nameprintln(myFun1("…

EasyExcel导出转换@ExcelProperty注解中converter不生效,以及EasyExcel导入日期转换失败问题

用EasyExcel做导出&#xff0c;需要用ExcelProperty做格式转换&#xff0c;比如日期转换&#xff0c;枚举类转换 然后新建一个转换类 里面有两个实现方法&#xff0c;converToJavaData是导入时&#xff0c;数据转换定义格式&#xff0c;converToExcelData是导出时做数据转换的。…

Python爬虫基础(三):使用Selenium动态加载网页

文章目录 系列文章索引一、Selenium简介1、什么是selenium&#xff1f;2、为什么使用selenium3、安装selenium&#xff08;1&#xff09;谷歌浏览器驱动下载安装&#xff08;2&#xff09;安装selenium 二、Selenium使用1、简单使用2、元素定位3、获取元素信息4、交互 三、Phan…

3D WEB引擎HOOPS Commuicator助力Naval Architect Jumpstart快速启动船舶信息建模平台开发

行业&#xff1a;造船业 挑战&#xff1a;新公司希望将创新的船舶信息建模产品推向市场-基于浏览器的产品需要支持高级可视化和强大的数据转换&#xff0c;以处理大型、复杂的造船项目-小型开发团队的任务是雄心勃勃的平台发布计划。 解决方案&#xff1a; Tech Soft 3D提供领…

ubuntu x86_64 源码编译 rust 1.48.0

源码地址 GitHub - rust-lang/rust: Empowering everyone to build reliable and efficient software. git clone https://github.com/rust-lang/rust cd rust git checkout 1.48.0 ./configure ./x.py build 安装前执行cargo vendor yeqiangyeqiang-MS-7B23:~/Downloads/sr…

PyTorch框架中torch、torchvision、torchaudio与python之间的版本对应关系(9月最新版)

随着python语言和pytorch框架的更新&#xff0c;torch\torchvision\torchaudio与python之间的版本对应关系也在不断地更新。 最新版本torch与torchvision对应关系如下&#xff1a; 稍旧版本torch与torchvision对应关系如下&#xff1a; 最新版本torch与torchaudio对应关系如下…

js字符串转时间戳

完整代码 <!DOCTYPE html> <html><head><meta charset"utf-8" /><title></title></head><body><script>// 字符串转时间戳const charToTime (dateStr) > {let date dateStr.substring(0, 19);date dat…

ES6之Map和Set有什么不同?

一、Map 1.定义 Map是ES6提供的一种新的数据结构&#xff0c;它是键值对的集合&#xff0c;类似于对象&#xff0c;但是键的范围不限于字符串&#xff0c;各种类型的值都可以当做键。 Object结构是“字符串-值”的对应&#xff0c;Map结构则是“值-值”的对应 2.代码示例 M…

【Linux】Linux环境配置安装

目录 一、双系统&#xff08;特别不推荐&#xff09; 安装双系统的缺点&#xff1a; 安装双系统优点&#xff08;仅限老手&#xff09;&#xff1a; 二、虚拟机centos7镜像&#xff08;较为推荐推荐&#xff09; 虚拟机的优点&#xff1a; 虚拟机的缺点&#xff1a; ​ …

3dsmax模型烘焙光照贴图并导入unity流程详解

目录 前言 软件环境 前置知识储备 一、模型场景搭建 二、模型材质处理 三、vray渲染准备 四、烘焙至贴图 五、unity场景准备 六、贴图与材质 前言 该流程针对某些固定场景&#xff08;模型发布、无法使用实时渲染引擎等&#xff09;情况下的展示&#xff0c;本文记录烘…

高云FPGA系列教程(9):cmd-parser串口命令解析器移植

文章目录 [toc]cmd-parser库简介cmd-parser库源码获取GW1NSR-4C移植cmd-parser实际测试cmd-parse命令解析器优化 本文是高云FPGA系列教程的第9篇文章。 上一篇文章介绍片上ARM Cortex-M3硬核处理器串口外设的使用&#xff0c;演示轮询方式和中断方式接收串口数据&#xff0c;并…

数据导入hudi报错,错将字段写到hdfs路径上

报错信息 Error trying to save partition metadata (this is okay, as long as atleast 1 of these succced), file:/qiche/hudi_table/冬天续航要打个八折的样子&#xff0c;能接受。高速相对市区还要耗电一些。不过这个车最主要是也就是在市区里面跑&#xff0c;而且最多会…

Unity-Input System新输入系统插件学习

1.键盘、鼠标操作 using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEngine.InputSystem; using UnityEngine.UI;public class NewInputSystem : MonoBehaviour {public float SpaceKeyValue;public float RightMouseValue;public…

NExT-GPT: Any-to-Any Multimodal LLM论文笔记

论文https://arxiv.org/pdf/2309.05519.pdf代码https://github.com/NExT-GPT/NExT-GPT/tree/main 1. Motivation 现有的多模态大模型大都只是支持输入端的多模态&#xff08;Text、Image、Video、Audio等&#xff09;&#xff0c;但是输出端都是Text。也有一些现有的输入输出都…

Linux服务器自定义登陆提示信息

背景 最近在搭建zookeeper和应用服务环境&#xff0c;需要配置很多东西&#xff0c;然后不同服务器的文件路径之类的东西可能会有一些不同&#xff0c;比较麻烦&#xff0c;就准备给每个服务器配置一个登陆提示&#xff0c;让每一个登陆的用户能很快了解配置信息和文件路径。 …

Java 调用 GitLabAPI 获取仓库里的文件件 提交记录

1. 需求 项目组 需要做统计&#xff0c;获取每个开发人员的代码提交次数&#xff0c;提交时间&#xff0c;提交人等等&#xff0c;因代码在GitLab上管理&#xff0c;所以需要调用GitLabAPI来获取。 2. 开发 API官网&#xff1a;https://docs.gitlab.com/ee/api/ 2.1 创建自…

centos设置固定ip

ip addr查看是哪张网卡我这里是 编辑 设置

QT 绘画功能的时钟

.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QPaintEvent> #include <QDebug> //信息调试类 #include <QPainter> #include <QPixmap> //图像引擎类 #include <QTime> #include <QTimer> …