人工智能-正则表达式

news2024/11/28 6:48:34

目录

    • 1、正则表达式概述
    • 2、re模块
    • 3、匹配单个字符
    • 4、匹配多个字符
    • 5、匹配开头和结尾
    • 6、匹配分组
    • 7、总结

1、正则表达式概述

在实际开发过程中经常会需要查找某些复杂字符串的格式
正则表达式:记录文本规则的代码

正则表达式特点:

  1. 语法令人头疼,可读性差
  2. 通用性强,能够适用于很多编程语言

2、re模块

流程:导入re模块,match匹配数据,group提取数据

#导入re模块
import re
#match匹配数据
result = match(正则表达式,要匹配的字符串)
#group提取数据
result.group()
import re
result = re.match("it","itsma")
info = result.group() #如果没有匹配到,会报错
print(info) #输出it

3、匹配单个字符

. —匹配任意一个字符(除了\n)
\d —匹配数字0-9
\D —匹配非数字
\s — 匹配空白,空格,tab键
\S ----匹配非空白
\w ----匹配特殊字符,即a-z,A-Z,_,汉字
\W ----匹配非特殊字符

import re
result = re.match("it","itsma")
if result:
	info = result.group() #如果没有匹配到,会报错
	print(info) #输出it
else:
	print('没有匹配到')

result = re.match("it","itsma\t")#\t是指tab键

4、匹配多个字符

  • —匹配前一个字符出现0次或者无限次,可有可无
  • ----匹配前一个字符出现1次或者无限次
    ? ----匹配前一个字符出现1次或者0次
    {m} ----匹配前一个字符出现m次
    {m,n} ----匹配前一个字符出现m次到n次之间的次数

5、匹配开头和结尾

^ 字符串—匹配字符串开头
字符串$ —匹配字符串结尾
[^指定字符] —取反,指定字符串以完的其他

6、匹配分组

| ----匹配左右任意一个表达式
(ab) —括号中的是一个分组
\num —引用分组num匹配到字符串
(?P)—分组起别名
(?P=name)引用别名为name分组匹配到的字符串

需求:
在这里插入图片描述
需求1:

import re
fruit = ['apple','banana','orange','pear'] #匹配apple和pear
for value in fruit:
	result = re.match("apple|pear",value)
	if result:
		info = result.group() #如果没有匹配到,会报错
		print("这是我想吃的水果",info) #输出it
	else:
		print('这个不是我想吃的水果',value)

需求2:

import re
result = re.match("[a-zA-Z0-9]{4,20}@(163|126|qq)\.com","1345ab@qq.com")
print(result)
if result:
	info = result.group()
	print(info) #输出it
else:
	print('没匹配到')

需求3:
默认group(0)代表的是匹配的所有数据, 1:第一组的带括号的数据,2:第二组带括号的数据,

import re
result = re.match("(qq):([1-9]\d{4,11})","qq:123456")
print(result)
if result:
	info = result.group()
	print(info) #输出qq:123456

	type1 = result.group(1)
	print(type1) #输出qq

	num = result.group(2)
	print(num)  #输出123456
else:
	print('没匹配到')

需求4:
\num —引用分组num匹配到字符串,用之前要括号起来

import re
#result = re.match("<[a-zA-Z4-9]{4}>.*</[a-zA-Z4-9]{4}>","<html>hh</html>")
result = re.match("<([a-zA-Z1-6]{4})>.*</\\1>","<html>hh</html>")
print(result)
if result:
	info = result.group()
	print(info)
else:
	print('没匹配到')

需求5:
\num —引用分组num匹配到字符串,用之前要括号起来\2

import re
result = re.match("<([a-zA-Z1-6]{4})><([a-zA-Z1-6]{2})>.*</\\2></\\1>","<html><h1>www.itcast.cn</h1></html>")
print(result)
if result:
	info = result.group()
	print(info)
else:
	print('没匹配到')

需求6:
(?P)—分组起别名
(?P=name)引用别名为name分组匹配到的字符串

import re
result = re.match("<(?P<name1>[a-zA-Z1-6]{4})><(?P<name2>[a-zA-Z1-6]{2})>.*</(?P=name2)></(?P=name1)>","<html><h1>www.itcast.cn</h1></html>")
print(result)
if result:
	info = result.group()
	print(info)
else:
	print('没匹配到')

7、总结

限定符
a? —o次或者1次a
a* ----0次或者多次a
a+ ----1次以上的a
a{6} ----6次出现a
a{2,6} ----6次或者2次出现a
a{2,} ----2次及以上出现a
(ab)+ ----1次以上的ab
(ab)|(cd) — ab或者cd
元字符
\d ----数字字符
\D —非数字字符
\w —单词字符(英文、数字、下划线)
\W —非单词字符
\s —空白字符(换行符、tab)
\S —非空白字符
. —任意字符
\bword\b —\b标注字符的边界
^ — 行首
& — 行尾
<.+> —贪婪匹配
<.+?> — 懒惰匹配

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/153181.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

立创eda专业版学习笔记(4)(隐藏铺铜)

这里的隐藏有两个意思&#xff0c;一个是铺铜过后把铺铜的填充区域隐藏&#xff0c;方便看图&#xff0c;另外一个是隐藏铺铜的轮廓&#xff0c;方便后续改进。 第一种隐藏&#xff0c;隐藏铺铜的填充区域&#xff08;成片的图块&#xff09;&#xff0c;但是保留轮廓线 这是全…

联想LJ2655DN激光打印机清零方法

联想LJ2655DN激光打印机是市面上常见的打印机,为了节约成本,我们一般使用都是代用硒鼓来代替原装硒鼓,但是发现更换完硒鼓以后还是不能打印甚至有的机器能够打印但是打印速度会变慢或很慢,这个时候这就需要我们对打印机进行清零复位操作了,此款机器因用户更换的硒鼓类型不…

C++ 模板进阶

目录 1. 非类型模板参数 2. 模板的特化 2.1 概念 2.2 函数模板特化 2.3 类模板特化 2.3.1 全特化 2.3.2 偏特化 2.3.3 类模板特化应用示例 3. 模板总结 1. 非类型模板参数 我们在C语言中使用数组的时候可以定义静态数组&#xff0c;但是有个缺陷就是编译器在对越界检查…

Java自定义泛型类注意点

目录 自定义泛型类 如果定义了泛型类&#xff0c;实例化没有指明类的泛型&#xff0c;则认为此泛型类型为Object类型 由于子类在继承带泛型的父类时&#xff0c;指明了泛型类型。则实例化子类对象时&#xff0c;不需要指明类型 由于子类在继承带泛型的父类时&#xff0c;没有…

WebDAV之葫芦儿·派盘 + Photosync

PhotoSync 支持WebDAV方式连接葫芦儿派盘。 苹果手机通过无线传输,备份和共享照片/视频到计算机,其他手机,NAS和流行的云和照片服务的最佳解决办法,快来试下PhotoSync同步工具吧。 PhotoSync面向移动设备

安装部署wordpress(Ubuntu)

wordpress是一个目前流行的基于web的内容管理系统软件。它是基于PHP语言和MySQL数据库开发的&#xff0c;用户可以在支持 PHP 和 MySQL数据库的服务器上快速轻松的部署自己的网站&#xff08;博客&#xff0c;外贸网站等等&#xff09;。WordPress有非常多的第三方开发的免费模…

产线工控安全之现状分析及方案应对

产线安全现状 工业控制系统是支撑国民经济的重要设施&#xff0c;是工业领域的神经中枢。现在工业控制系统已经广泛应用于电力、通信、化工、交通、航天等工业领域&#xff0c;支撑起国计民生的关键基础设施。 随着传统的工业转型&#xff0c;数字化、网络化和智能化的工业控…

数学建模---数值微积分

目录 一.引言 二.数值微分 1.数值差分与差商 利用matlab观察差分与差商的区别&#xff1a; 例题&#xff1a; 二.数值积分 1.数值积分基本定理 2.常见的数值积分公式&#xff1a; 积分公式的精度&#xff1a; 3.数值积分的matlab实现 一.引言 在科学研究和工程计算中&…

LINUX提权之环境变量提权篇

前言 上一篇文章给大家介绍了linux中的内核提权的一些知识点不知道大家学的怎么样了&#xff0c;今天给大家带来一个全新的提权方法——“环境变量提权”,本文会介绍关于环境变量提权的基本知识以及利用方法。 环境变量提权 PATH是Linux系统中的环境变量&#xff0c;指定存储…

全球月活用户4年破10亿,TikTok的3大底层逻辑

武汉瑞卡迪电子商务有限公司&#xff1a;在即将过去的2022年&#xff0c;TikTok成为了众多出海品牌想要赢得新生意的重要平台。品牌应该如何看待TikTok&#xff1f;如何利用节点营销抓住机会&#xff1f;那些已经在TikTok上成功的品牌背后&#xff0c;是否有一些定式&#xff0…

centos7安装ansible

在ansible中主控机器必须是linux机器&#xff0c;不可以是windows&#xff0c;但是被控机器可以是windows。 control machine&#xff1a;192.168.184.128 target machine&#xff1a;192.168.184.129(被管理机器上不需要安装什么软件) 1.ansible的安装前提是要有python&…

vue的基础指令演示代码及简单案例

目录 一、内容绑定&#xff0c;事件绑定 v-text v-html v-on 案例&#xff1a;计数器 二、显示切换&#xff0c;属性绑定 v-show v-if v-bind 案例&#xff1a;图片切换 三、列表循环&#xff0c;表单元素绑定 v-for v-on补充 v-model 通过Vue实现常见的网页效果…

QSFP-DD封装小知识,你了解吗?

随着数据中心和高级网络应用中数据流量的上升&#xff0c;光模块市场向更高的速度&#xff0c;更低的功耗和更小的外形或尺寸发展。QSFP-DD封装有什么特征和优势&#xff1f;它与QSFP28/QSFP56模块有什么区别的&#xff1f;本期文章&#xff0c;我们一起了解一下QSFP-DD封装相关…

【Linux篇】之网络文件系统(nfs)配置

nfs : Network File System 网络文件系统 作用&#xff1a;linux内核启动之后&#xff0c;通过网络的方式从ubuntu服务器中挂载根文件系统&#xff0c; 而不需要将根文件系统部署到开发板。 1> 安装nfs服务器端 sudo apt-get install nfs-kernel-server2> 修改nfs服务的…

解读手机拍照的各个参数(AI水印)

AI水印就是在照片里面自动添加一些文字或者符号&#xff0c;里面有一些固定的水印&#xff0c;目前还不了解能不能识别一些不是固定地方的景色。(目前给出来的是黄山、张家界景点&#xff0c;不晓得华山这种能不能自动添加上水印)。

Go 1.19.3 channel原理简析

channel channel和goroutine是Go语言的核心命脉。这篇文章来简单介绍一下Go chan的原理&#xff0c;源码并不好读&#xff0c;应结合gmp调度模型来理解&#xff0c;后续补充吧。 由上图可见&#xff0c;chan的底层结构是一个hchan结构体&#xff0c;其中buf字段指向了一个环形…

网狐大联盟服务端源码分析-服务核心

源码目录结构,如下图,服务工程 cpp文件列表及含义: WHBase64.cpp : base6编码类 WHCommandLine.cpp : 命令行参数操作类 WHDataLocker.cpp : 数据锁类,线程操作数据时用 WHDataQueue.cpp : 数据队列类,异步操作数据用 WHEncrypt.cpp : 加密类 WHIniData.cpp : ini文件操作类 WH…

VGG的成功之处在哪

VGG 网络可以分为两部分&#xff1a;第⼀部分主要由卷积层和汇聚层组成&#xff0c;第⼆部分由全连接层组成VGG与AlexNet相比&#xff0c;VGG采用小的卷积核和池化层&#xff0c;层数更深&#xff0c;通道数更多&#xff0c;其中每个通道代表着一个FeatureMap&#xff0c;更多的…

Tomcat组件生命周期管理:LifeCycle

我们已经知道Catalina初始化了Server(它调用了 Server 类的 init 和 start 方法来启动 Tomcat);你会发现Server是Tomcat的配置文件server.xml的顶层元素,那这个阶段其实我们已经进入到Tomcat内部组件的详解;这时候有一个问题,这么多组件是如何管理它的生命周期的呢? 引…

LabVIEW操控应用程序和VI设置

LabVIEW操控应用程序和VI设置属性是VI、对象或应用程序的特性。方法是在VI、对象或应用程序上进行的操作。用户可通过属性节点和调用节点获取和设置本地或远程应用程序实例、VI和对象上的属性和方法。有些应用程序、VI和对象的设置只能通过属性和方法获取和设置。参考下列使用应…