一、是什么
是一种用来匹配字符串的强有力的武器
它的设计思想是用一种描述性的语言定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的
在 JavaScript中,正则表达式也是对象,构建正则表达式有两种方式
1.字面量创建,其由包含在斜杠之间的模式组成
const re = /\d+/g;
2.调用 RegExp 对象的构造函数
const re = new RegExp("\\d+","g");
const rul = "\\d+"
const re1 = new RegExp(rul,"g")
使用构建函数创建,第一个参数可以是一个变量,遇到特殊字符 \ 需要使用 \ 进行转义
二、匹配规则(有很多,可查阅资料)
常见的表达式标记有
- g 全局搜索
- i 不区分大小写搜索
- m 多行搜索
- s 允许 . 匹配换行符
- u 使用 unicode 码的模式进行匹配
- y 执行“粘性(sticky)”搜索,匹配从目标字符串的当前位置开始
使用方法
var re = /pattern/flags;
var re = new RegExp("pattern","flags");
在了解下正则表达式基本的之外,还可以掌握几个正则表达式的特性
贪婪模式
在了解贪婪模式前,首先举个例子
const reg = /ab{1,3}c/
在匹配过程中,尝试可能的顺序是从多往少的方向去尝试。首先会尝试bbb,然后再看整个正则是否能匹配。不能匹配时,吐出一个b,即在bb的基础上,再继续尝试,以此重复
如果多个贪婪量词挨着,则深度优先搜索
const string = "12345";
const regx = /(\d{1,3})(\d{1,3})/;
console.log( string.match(reg) );
// => ["12345", "123", "45", index: 0, input: "12345"]
其中,前面的\d{1,3}匹配的是"123",后面的\d{1,3}匹配的是"45"
懒惰模式
惰性量词就是在贪婪量词后面加个问号。表示尽可能少的匹配
var string = "12345";
var regex = /(\d{1,3}?)(\d{1,3})/;
console.log( string.match(regex) );
// => ["1234", "1", "234", index: 0, input: "12345"]
分组
分组主要是用过()进行实现,比如beyond{3},是匹配d字母3次。而(beyond){3}是匹配beyond三次
在()内使用|达到或的效果,如(abc | xxx)可以匹配abc或者xxx
反向引用,巧用$分组捕获
let str = "John Smith";
// 交换名字和姓氏
console.log(str.replace(/(john)(smith)/i,'$2,$1'))// Smith, John
三、匹配方法
常被用于某些方法,我们可以分成两类
- 字符串(str) 方法:match、matchAll、search、replace、split
- 正则对象(regexp):test、exec
str.match(regexp)
🍟🍟🍟str.match(regexp) 方法在字符串 str 中找到匹配 regexp 的字符
如果 regexp 不带有 g 标记,则它以数组的形式返回第一个匹配项,其中包含分组和属性 index(匹配项的位置)、input(输入字符串,等于 str)
let str = "I love JavaScript";
let result = str.match(/Java(Script)/);
console.log(result[0]) //完全匹配
console.log(result[1]) // Script(第一个分组)
console.log(result.length);// 2
// 其他信息
console.log(result.index) // 7(匹配位置)
console.log(result.input) // I love JavaScript(源字符串)
如果 regexp 带有 g 标记,则它将所有匹配项的数组作为字符串返回,而不包含分组和其他详细信息
let str = "I love JavaScript";
let result = str.match(/Java(Script)/g);
console.log( result[0] ); // JavaScript
console.log( result.length ); // 1
如果没有匹配项,则无论是否带有标记 g ,都将返回 null
let str = "I love JavaScript";
let result = str.match(/HTML/);
console.log(result); // null
str.matchAll(regexp)
返回一个包含所有匹配正则表达式的结果及分组捕获组的迭代器
const regexp = /t(e)(st(\d?))/g;
const str = 'test1test2';
const array = [...str.matchAll(regexp)];
console.log(array[0]);
// expected output: Array ["test1", "e", "st1", "1"]
console.log(array[1]);
// expected output: Array ["test2", "e", "st2", "2"]
str.search(regexp)
🌭🌭🌭返回第一个匹配项的位置,如果未找到,则返回 -1
let str = "A drop of ink may make a million think";
console.log( str.search( /ink/i ) ); // 10(第一个匹配位置)
这里需要注意的是,search 仅查找第一个匹配项
str.replace(regexp)
🍿🍿🍿替换与正则表达式匹配的子串,并返回替换后的字符串。在不设置全局匹配g的时候,只替换第一个匹配成功的字符串片段
const reg1=/javascript/i;
const reg2=/javascript/ig;
console.log('hello Javascript Javascript Javascript'.replace(reg1,'js'));
//hello js Javascript Javascript
console.log('hello Javascript Javascript Javascript'.replace(reg2,'js'));
//hello js js js
str.split(regexp)
使用正则表达式(或子字符串)作为分隔符来分割字符串
console.log('12, 34, 56'.split(/,\s*/)) // 数组 ['12', '34', '56']
regexp.exec(str)
🍿🍿🍿regexp.exec(str) 方法返回字符串 str 中的 regexp 匹配项,与以前的方法不同,它是在正则表达式而不是字符串上调用的
根据正则表达式是否带有标志 g,它的行为有所不同
如果没有 g,那么 regexp.exec(str) 返回的第一个匹配与 str.match(regexp) 完全相同
如果有标记 g,调用 regexp.exec(str) 会返回第一个匹配项,并将紧随其后的位置保存在属性regexp.lastIndex 中。 下一次同样的调用会从位置 regexp.lastIndex 开始搜索,返回下一个匹配项,并将其后的位置保存在 regexp.lastIndex 中
let str = 'More about JavaScript at https://javascript.info';
let regexp = /javascript/ig;
let result;
while (result = regexp.exec(str)) {
console.log( `Found ${result[0]} at position ${result.index}` );
// Found JavaScript at position 11
// Found javascript at position 33
}
regexp.test(str)
查找匹配项,然后返回 true/false 表示是否存在
let str = "I love JavaScript";
console.log( /love/i.test(str) ); // true
四、应用场景
QQ合法性(5~15位、全是数字、不以0开头)
const s = 1212121;
const regexp = /^[1-9][0-9]{4,14}$/
const isvalid = regexp.exec(s)
校验用户账号合法性(只能输入5-20个以字母开头、可带数字、“_”、“.”的字串)
var s = 46546che_qwe
var patrn=/^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/;
const isvalid = patrn.exec(s)