该文章内容为以下视频的学习笔记:
10分钟快速掌握正则表达式_哔哩哔哩_bilibili正则表达式在线测试工具:https://regex101.com/, 视频播放量 441829、弹幕量 1076、点赞数 19330、投硬币枚数 13662、收藏人数 26242、转发人数 2768, 视频作者 奇乐编程学院, 作者简介 ,相关视频:正则表达式30分钟入门40分钟进阶(绝对能学会),【无废话30分钟】Lua快速入门教程 - 4K超清,正则表达式15分钟速成,2022最新 彻底搞懂正则表达式,20分钟学完一遍python基础,一个10分钟的numpy入门教程,15分钟带你快速掌握正则表达式,硬核Python进阶篇 - 一小时掌握正则表达式 【正则表达式,re,Python,正则表达式实例】,Docker 是什么?30秒听懂。,Python小技巧:装饰器(Decorator)https://www.bilibili.com/video/BV1da4y1p7iZ/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=4298755c4e2edc1fe805c41cc2d7379a
1.简介:
正则表达式:匹配指定规则的字符串。
应用:
1️⃣编译器中的词法分析器 使用正则表达式去匹配代码中的关键字
2️⃣网站上的注册表单会用到正则表达式去判断密码的复杂程度
3️⃣爬虫中用正则表达式中提取我们需要的信息
2.限定符(一个字符):
(1)?
作用:? 在正则表达式中是一个特殊的字符——限定符,代表前面这个字符需要出现 0 次或者 1 次
(2)*
作用:去匹配 0 个或[多] 个字符(代表没有或者可以出现多次)
(3)+
作用:匹配 出现[1] 次以上的字符
(4){···}
作用:花括号同时允许我们输入一个范围,精确到匹配次数
3.匹配多个字符的重复
匹配中间多次出现的ab
4.OR Operator “或” 运算
5.Character Classes 字符类
匹配由 abc 这几个字母构成的单词
作用:方括号里的内交代表要求匹配的字符只能取自于它们
此外可以在方括号里指定字符的范围
例:
- [a-z]代表所有的小写英文字符
- [a-zA-Z]代表所有的英文字符
- [a-zA-Z0-9] 代表所有的英文字符和数字
若在方括号前加 脱字符 ^,则代表要求匹配除了尖号后面列出的 [以外] 的字符
6.Mera-characters 元字符
正则表达式中的大多数元字符都以反斜杠开头
例:
(1)\d 代表数字字符 等同于 [0-9]
(2)\w 单词字符(英文、数字及下划线)
(3)\s 空白符(包含Tab和换行符)
(4)\D 非数字字符
(5)\W 非单词字符
(6)\S 非空白字符
(7). 字符
作用:代表任意字符,但不代表换行符
(8)^ 匹配行首 $ 配行尾
正则表达式中的脱字符(^)有两种不同的用法:
- 在字符类([])内部:当脱字符(^)作为字符类的第一个字符时,表示取反操作,即匹配除了指定字符以外的任意字符。例如,正则表达式[^aeiou]匹配任意非元音字母。
- 在模式开头:当脱字符(^)作为正则表达式的开头时,表示匹配字符串的开始位置。例如,正则表达式^abc匹配以"abc"开头的字符串。
7.实操:
(1)匹配里面里面的 HTML标签