正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科 学的一个概念。正则表达式通常被用来检索、替换那些符合某个模 式(规则)的文本
re模块作用
通过使用正则表达式,可以:
测试字符串内的模式。—— 例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式。这称为数据验证。
替换文本。—— 可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它。
基于模式匹配从字符串中提取子字符串。—— 可以查找文档内或输入域内特定的文本
re模块中match、fullmatch、search、findall、sub、split、subn的方法如下:
import re
# match 匹配
print(re.match('w', 'wwww'))
# fullmatch完全匹配
print(re.fullmatch('ww', 'wwww'))
# search 搜索 找到第一个
print(re.search('w', 'wwww'))
# findall 找到所有 返回列表
print(re.findall('w', 'wwww'))
# sub 替换 返回字符串
print(re.sub('w', 'a', 'wwww',count=1))
# split 分割
print(re.split('w', 'wwwaaw'))
# subn 替换 返回元组
print(re.subn('w', 'a', 'wwww'))
返回的结果为