需求导向的正则表达式

news2024/11/15 8:03:08

目录

re.sub

需求:把 1. 2.这些序号转成(1) (2)

需求:反过来,把(1)->1. ,(2)=》2. 。

需求:把出现的 1 2 3都转成下标

进阶1!只想让化学符号(NH3)有此效果,不能让序号这种数字也转换 

 ——下标很长时,如C_60要怎么办​编辑

再加上正负号的替换=》上标,如铵根离子NH4+

需求:上标替换10^2=>10² 


——————————————————————————————————————

import re

*:(0,)

+:(1,)

re.sub

re.sub(匹配的正则表达式,替换后的正则表达式,待处理的字符串)

即:re.sub(pattern,repl,string,可选参数count是替换最大次数,flags是匹配模式如多行模式/忽略大小写)

需求:把 1. 2.这些序号转成(1) (2)

详细要求:

1. xxx(有个空格)

1.xxx

都要转成(1)

错误0:要把点号和数字放在不同分组,然后只取数字的分组,否则点号会保留

错误1:.未转义

错误2:\d 只是表示一位数字

改正:注意,第二个引号里的\1表示第一个分组,\3是第三个分组,|是或,分组是第几个是算上|也是从左向右数的。

import re
str0="1. 2. (3) 12. 10000000. 123.lalal"
re.sub(r"(\d+)(\. )|(\d+)(\.)",r"(\1\3)",str0)

 

只要写一个替换模式,就会把所有满足这种模式的均替换。 

需求:反过来,把(1)->1. ,(2)=》2. 。

import re
str0="1..2..(3) 12....10000000. 123.lalal (4)(3838339300)(89)"
re.sub(r"\((\d+)\)|((\d+))",r"\1. \2. ",str0)

 

需求:把出现的 1 2 3都转成下标

输入:x2  y3

输出:x²  y³

现在有一个列表,存储了从0-9的下标

lst="₀ ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉".split()

思路:还记得回调函数吗?把函数名作为参数输入。

re.sub(r"待匹配",“待替换——此处可以写一个函数,替换成你想要的”)

粗糙版:

进阶1!只想让化学符号(NH3)有此效果,不能让序号这种数字也转换 

这里就需要让正则表达式前面有东西(字母)

首先测试一下,如果不使用回调函数

两个括号的内容会一起被替换。

如果第二个括号写了组号 

就是把([a-zA-Z]+)(\d)替换成₆+第一个组里的东西,如果想保留某个分组的内容,一定要在第二个括号写明!

你看,这个就被替换没了

初具规模 

 ——下标很长时,如C_60要怎么办

再加上正负号的替换=》上标,如铵根离子NH4+

字母(数字)±  =》字母(数字)⁺ ⁻

 

import re
lst="₀ ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉".split()
str0="1..2..(3) 12....10000000. 123.NH3 H2 o2 NH4+ NO3- K+(Fe3O4)C12 C60000(Rukawa111111)(89)"
def rplc1(a):#a是match对象,要提取字符串,需要使用group  group(0)是全部,group(i)是第i个括号里的
    b=a.group(2)
    numList=list(b)
    ans=a.group(1)
    for i in range(len(numList)):
        ans+=lst[int(numList[i])]
    
    return ans
str1=re.sub(r"([a-zA-Z]+\d*)\+",r"\1⁺",str0)
str1=re.sub(r"([a-zA-Z]+\d*)\-",r"\1⁻",str1)
re.sub(r"([a-zA-Z]+)(\d+)",rplc,str1)

需求:上标替换10^2=>10² 

 和替换下标很类似,不同的是需要去掉^,这个就在连接分组的时候忽略^所在分组即可

数字之间有空格!

因为我给的列表两个上标之间不一定只有一个空格

(并不是,就是编码的问题)

#这里需要re.split

re.split("\s+","⁰ ¹ ² ³       ⁴ ⁵ ⁶ ⁷ ⁸ ⁹")

 

并不用,split已经帮我们做好额

import re

lst2="⁰ ¹ ² ³       ⁴ ⁵ ⁶ ⁷ ⁸ ⁹".split()
str0="1..9^2..(3) 12....3^10000000. 7^1234567890987654321 2^123.NH3 H2 o2 NH4+ NO3- K+(Fe3O4)C12 C60000(Rukawa111111)(89)"
def sb(a):
    b=a.group(2)
    numList=list(b)
    ans=""
    for i in range(len(numList)):
        ans+=lst2[int(numList[i])]
    return ans
re.sub(r"(\^)(\d+)",sb,str0)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2139084.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis入门2

在java中操作Redis Redis的Java客户端 Redis 的 Java 客户端很多,常用的几种: Jedis Lettuce Spring Data Redis Spring Data Redis 是 Spring 的一部分,对 Redis 底层开发包进行了高度封装。 在 Spring 项目中,可以使用Spring Data R…

把项目部署到Linux系统上(如何在阿里云服务器上安装和配置SpringBoot+vue全栈开发环境)

项目部署上线 环境准备下载安装Linux系统和ssh连接工具背景知识安装虚拟机安装Linux系统选择installCentOS7按命令IP addr查看服务器IP地址,ens33网卡中会出现IP地址配置好后就可以查看了一个可远程连接Linux服务器的工具1.(基于finalshell工具&#xff…

小明震惊OpenAI 的新模型 01

在硅谷的中心,繁忙的咖啡馆和创业中心周围,年轻的软件工程师小明坐在他的办公桌前,面露困惑。科技界一直在盛传一项新的AI突破,但他持怀疑态度,不敢抱太大希望。他认为AI泡沫即将破灭,炒作列车即将出轨&…

网络原理 IP协议与以太网协议

博主主页: 码农派大星. 数据结构专栏:Java数据结构 数据库专栏:MySQL数据库 JavaEE专栏:JavaEE 关注博主带你了解更多数据结构知识 目录 1.网络层 IP协议 1.IP协议格式 2.地址管理 2.1 IP地址 2.2 解决IP地址不够用的问题 2.3NAT网络地址转换 2.4网段划分 3.路由选择…

北极星计划的回响:从Leap Motion到Midjourney的AI 3D硬件梦想

在科技的浩瀚星空中,总有一些梦想如同北极星般璀璨,指引着探索者前行。六年前,Leap Motion的CEO David以一篇充满激情的博客文章,向我们揭示了“北极星计划”——一个旨在打破数字与物理界限,创造流畅统一体验的增强现实平台。今天,随着Midjourney在AI文生图领域的全球爆…

2024.9.15周报

一、题目信息 题目:Physics-informed neural networks for solving flow problems modeled by the 2D Shallow Water Equations without labeled data 链接:物理信息神经网络用于解决由二维浅水方程建模的流动问题,无需标记数据- ScienceDi…

【Node.js】初识 RabbitMQ

概述 MQ 顾名思义,是消息队列。 RabbitMQ 是一个消息队列系统,用于实现异步通信。基于 AMQP。AMQP(高级消息队列协议) 实现了对于消息的排序,点对点通讯,和发布订阅,保持可靠性、保证安全性。 在 Node.js 的微服务架…

LAMP+WordPress

一、简介 LAMP: L:linux——操作系统,提供服务器运行的基础环境。A:apache(httpd)——网页服务器软件,负责处理HTTP请求和提供网页内容。M:mysql,mariadb——数据库管理…

PCL 窗口可视化两个点云

目录 一、概述 1.1原理 1.2实现步骤 1.3 应用场景 二、代码实现 2.1关键函数 2.2完整代码 三、实现效果 PCL点云算法汇总及实战案例汇总的目录地址链接: PCL点云算法与项目实战案例汇总(长期更新) 一、概述 本文将介绍如何使用PCL库…

8.4Prewitt算子边缘检测

基本原理 Prewitt算子是一种用于边缘检测的经典算子,它通过计算图像中像素值的(一阶导数)梯度来检测边缘。Prewitt算子通常包括两个3x3的卷积核,一个用于检测水平方向上的边缘,另一个用于检测垂直方向上的边缘。 示例…

【动漫资源管理系统】Java SpringBoot助力,搭建一个高清动漫在线观看网站

🍊作者:计算机毕设匠心工作室 🍊简介:毕业后就一直专业从事计算机软件程序开发,至今也有8年工作经验。擅长Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等。 擅长:按照需求定制化开发项目…

【插件】【干货】用EPPlus在Unity中读写Excel表

EPPlus是什么我就不说了,你都点进来了肯定知道 几个常用的api 1.index下标都是从1开始的 2.可以读取任意单元格上的任意内容,不需要给excel表写规则 但是如果你写了规则,就需要自己用额外的代码 --- 数据结构去实现 3.打开excel表 ExcelP…

[数据集][目标检测]智慧交通铁路异物入侵检测数据集VOC+YOLO格式802张7类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):802 标注数量(xml文件个数):802 标注数量(txt文件个数):802 标注类别…

萤石举办2024清洁机器人新品发布会 多维智能再造行业标杆

导言:作为智慧生活守护者,萤石今日发布了两款清洁机器人,AI扫拖机器人RS20 Pro Ultra 和AI洗地机器人RX30 Max ,标志着萤石在智能清洁领域的全新突破。RS20 Pro Ultra基于CutFree 2.0内切割滚刷专利,有效解决毛发缠绕难…

速通GPT:《Improving Language Understanding by Generative Pre-Training》全文解读

文章目录 速通GPT系列几个重要概念1、微调的具体做法2、任务感知输入变换3、判别式训练模型 Abstract概括分析和观点1. 自然语言理解中的数据问题2. 生成预训练和监督微调的结合3. 任务感知输入变换4. 模型的强大性能 Introduction概括分析和观点1. 自然语言理解的挑战在于对标…

探索Python的HTML处理神器:pyquery的魔力

文章目录 探索Python的HTML处理神器:pyquery的魔力背景:为何选择pyquery?pyquery是什么?安装pyquery五个简单的库函数使用方法1. $:选择元素2. .text():获取文本内容3. .html():获取HTML内容4. …

SSM框架学习(三、MyBatis实践:提高持久层数据处理效率)

目录 一、Mybatis简介 1.简介 2.持久层框架对比 3.快速入门(基于Mybatis3方式) 4.ibatis方式的实现和原理 5.ibatis与mybatis之间的关系 二、Mybatis基本使用 1.向 sql 语句传参 (1)mybatis日志输出配置 (2&…

小程序开发设计-第一个小程序:创建小程序项目④

上一篇文章导航: 小程序开发设计-第一个小程序:安装开发者工具③-CSDN博客https://blog.csdn.net/qq_60872637/article/details/142219152?spm1001.2014.3001.5501 须知:注:不同版本选项有所不同,并无大碍。 一、创…

主播和礼品检测系统源码分享

主播和礼品检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer V…

SSH软链接后门从入门到应急响应

目录 1. 软链接与SSH软链接后门介绍 1.1 软链接介绍 1.2 SSH软连接后门介绍 2. 如何在已拿下控制权限的主机创建后门 2.1 使用root账户并执行ssh软链接后门命令: 2.2 连接软链接后门测试: 2.3 创建其它账户 ssh软连接后门命令 3. 如何进行应急…