提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
目录
文章目录
前言
一,正则表达式是什么?
二,正则表达式符号
三,常用正则表达式组合
四,正则表达式的的效率
五,学会编写正则表达式
匹配单个字符
匹配多个字符 编辑
六,生成正则表达式插件
前言
大家好,我是最爱吃兽奶,今天给大家介绍一下正则表达式,跟着我的脚步一起去看看吧!
一,正则表达式是什么?
正则表达式是一种用来匹配和处理文本的工具,它可以用一些特定的符号和语法来描述一类字符串的模式。在计算机科学和各种编程语言中,正则表达式被广泛应用于文本搜索、替换、过滤、验证等方面。通过正则表达式,我们可以轻松地匹配出符合某种模式的文本,例如匹配电子邮件地址、电话号码、网址等。从而实现各种文本处理的功能。正则表达式可以用于多种编程语言,包括但不限于Java、Python、JavaScript、Perl等,在计算机编程、文本编辑、数据处理等领域有着广泛的应用,是一种强大而灵活的工具。
二,正则表达式符号
1.元字符 元字符是正则表达式中具有特殊含义的字符它们用于匹配特定的字符或字符集合。常见的元字符包括: .:匹配任意字符,除了换行符。 ^:匹配字符串的开头。 $:匹配字符串的结尾。 *:匹配前面的字符零次或多次。 +:匹配前面的字符一次或多次。 ?:匹配前面的字符零次或一次。 {n}:匹配前面的字符恰好n次。 {n,}:匹配前面的字符至少n次。 {n,m}:匹配前面的字符至少n次,但不超过m次。 []:匹配字符集合中的任意一个字符。 |:表示或的关系,匹配两个或多个表达式中的任意一个。 ():用于分组,将多个元素组合成一个整体。 \:用于转义元字符,使其失去特殊含义。 2.转义字符 转义字符用于将元字符转义为普通字符或将普通字符转义为元字符。常见的转义字符包括: \d:匹配数字字符。 \D:匹配非数字字符。 \w:匹配字母、数字或下划线字符。 \W:匹配非字母、数字或下划线字符。 \s:匹配空格、制表符或换行符。 \S:匹配非空格、制表符或换行符字符。 \b:匹配单词边界。 \B:匹配非单词边界。 \\:匹配反斜杠字符本身。 需要注意的是,在Java中使用正则表达式时 需要将反斜杠字符\转义为\\,否则会出现编译错误。 例如,要匹配一个数字字符,可以使用\d,但在Java中需要写成\\d。
三,常用正则表达式组合
下面是常用的
- 匹配电子邮件地址:
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
- 匹配手机号码:
^1[3-9]\d{9}$
- 匹配身份证号码(18位):
^\d{17}[\dXx]$
- 匹配URL:
^(http|https)://[a-zA-Z0-9./?%&=+-_]+$
- 匹配日期(yyyy-mm-dd):
^\d{4}-\d{2}-\d{2}$
- 匹配IP地址:
^(25[0-5]|2[0-4]\d|[01]?\d\d?)\.(25[0-5]|2[0-4]\d|[01]?\d\d?)\.(25[0-5]|2[0-4]\d|[01]?\d\d?)\.(25[0-5]|2[0-4]\d|[01]?\d\d?)$
- 匹配用户名(字母开头,允许字母数字下划线,长度为6-16位):
^[a-zA-Z][a-zA-Z0-9_]{5,15}$
下面基本全部涵盖
- 匹配手机号码:
^1[3-9]\d{9}$
- 匹配身份证号码(15位或18位):
^\d{15}(\d{2}[0-9xX])?$
- 匹配社会信用代码(18位):
^[0-9A-Z]{18}$
- 匹配URL:
^(http|https)://[a-zA-Z0-9./?%&=+-_]+$
- 匹配日期(yyyy-mm-dd):
^\d{4}-\d{2}-\d{2}$
- 匹配IP地址:
^(25[0-5]|2[0-4]\d|[01]?\d\d?)\.(25[0-5]|2[0-4]\d|[01]?\d\d?)\.(25[0-5]|2[0-4]\d|[01]?\d\d?)\.(25[0-5]|2[0-4]\d|[01]?\d\d?)$
- 匹配用户名(字母开头,允许字母数字下划线,长度为6-16位):
^[a-zA-Z][a-zA-Z0-9_]{5,15}$
- 匹配密码(长度为8-16位,必须包含字母和数字):
^(?=.*[A-Za-z])(?=.*\d)[A-Za-z\d]{8,16}$
- 匹配汉字:
^[\u4e00-\u9fa5]{0,}$
- 匹配邮政编码:
^[1-9]\d{5}$
- 匹配MAC地址:
^([0-9a-fA-F]{2}-){5}[0-9a-fA-F]{2}$
- 匹配QQ号码:
^[1-9][0-9]{4,10}$
- 匹配微信号码(允许字母、数字、下划线、中划线,长度为6-20位):
^[a-zA-Z0-9_-]{6,20}$
- 匹配整数:
^-?\d+$
- 匹配浮点数:
^-?\d+\.\d+$
- 匹配非负整数:
^\d+$
- 匹配非负浮点数:
^\d+\.\d+$
- 匹配正整数:
^[1-9]\d*$
- 匹配正浮点数:
^[1-9]\d*\.\d+|0\.\d*[1-9]\d*$
- 匹配非正整数:
^-[1-9]\d*|0$
- 匹配非正浮点数:
^(-([1-9]\d*\.\d+|0\.\d*[1-9]\d*))|0\.{0,1}$
四,正则表达式的的效率
假如现在要求校验一个qq号码是否正确。
规则: 1. 6位及20位之内
2. 0不能在开头
3. 必须全部是数字。
先使用目前所学知识完成校验需求然后体验一下正则表达式检验。
麻烦吗? 不管你觉得麻烦也好,不麻烦也好,反正我是觉得麻烦
why? 因为哥会正则表达式!
来,展示
五,学会编写正则表达式
接下来,我会一点点的教你去写正则表达式,如果你不想写,请跳到插件处即可,当然了,我是推荐大家去了解下的,毕竟没什么坏处不是?那么,来吧!
前言:
matches
是Java中的一个方法,用于判断一个字符串是否符合某个正则表达式的格式。其使用方法如下:String regex = "正则表达式"; String str = "待匹配字符串"; boolean isMatch = str.matches(regex);
匹配单个字符
/*
* 匹配单个字符
* */
// 只能是 a b c 中的一个
System.out.println("a".matches("[abc]"));// true
System.out.println("?".matches("[abc]"));// false
// 不能出现 a b c 中的一个
System.out.println("a".matches("[^abc]"));// true
System.out.println("?".matches("[^abc]"));// false
// a到z和A到Z(包括头尾的范围)
System.out.println("z".matches("[a-zA-z]")); // true
System.out.println("aa".matches("[a-zA-z]"));//false
System.out.println("zz".matches("[a-zA-Z][a-zA-Z]")); //true
// [a-z&&[def]] a-z和def的交集。为:d,e,f
System.out.println("d".matches("[a-z&&[def]]")); //true
System.out.println("0".matches("[a-z&&[def]]")); //false
/*
\表示转义字符
两个\的理解方式:前面的\是一个转义字符,改变了后面\原本的含义,
把他变成一个普普通通的\而已。
*/
// . 表示任意一个字符
System.out.println("你".matches("..")); //false
System.out.println("你".matches(".")); //true
System.out.println("你我".matches(".."));//true
// \\d 表示任意的一个数字
// 简单来记:两个\表示一个\
System.out.println("a".matches("\\d")); // false
System.out.println("3".matches("\\d")); // true
// \\w 只能是一位单词字符[a-zA-Z_0-9]
System.out.println("z".matches("\\w")); // true
System.out.println("2".matches("\\w")); // true
System.out.println("你".matches("\\w"));//false
// 非单词字符 \\W
System.out.println("你".matches("\\W")); // true
匹配多个字符
六,生成正则表达式插件
看效果
上面的正则表达式的书写给大家写的很浅,大家只要能读懂即可,正则表达式大部分都可以直接搜到
直接拿来用即可,不过能看懂还是有点用的!!
总结
大家只要了解并能够使用正则表达式解决问题即可,最好还要能够读懂正则表达式并能写出简单的正则表达式,下一次再见到正则表达式估计就是给大家讲爬取的地方了,尽情期待吧!