正则表达式可以拥有扩展表达式,大致形式是(?...)
理解:
以(?=)的含义为例子
data = 'a1b2ce3@4.5d_6f'
res = re.findall(r'[a-z]+(?=\d+)', data) # ['a', 'b', 'ce']
# ([a-z]+(?=\d+) 表示的是匹配小写字符一个或多个,但是匹配之后需要满足后续有数字一个或多个(?=\d+)
print(res)
res = re.findall(r'\d+(?=[a-z]+)', data) # ['1', '2', '5', '6']
# \d+(?=[a-z]+)表示的也是匹配数字一个或多个,但是匹配之后需要满足后续有小写字符,res = ['1', '2', '5', '6']并不包括后续的小写字符
print(res)
为什么叫扩展? 我觉得应该叫匹配的『补充』,对于匹配的字符串的其他部分的一个补充,相当于一个and(且)条件。因为满足这个补充条件的字符串部分并不会当做结果的一部分。
eg.
data = 'a1b2ce3@4.5d_6f'
res = re.findall(r'[a-z]+(?=\d+)', data) # ['a', 'b', 'ce']
([a-z]+(?=\d+)
表示的是匹配小写字母一个或多个,(补充条件)and
匹配之后需要满足后续有数字一个或多个(?=\d+)
,结果中并没有包含数字部分