java数据结构与算法刷题目录(剑指Offer、LeetCode、ACM)-----主目录-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/123063846
正则表达式基础:https://blog.csdn.net/grd_java/article/details/136120841
文章目录
一、简单的应用实例 1. 验证输入的是否是汉字 2. 数字相关 3. 验证复杂的URL
二、反向引用案例 三、结巴去重案例 四、算法题
一、简单的应用实例
1. 验证输入的是否是汉字
百度,或者问人工智能ChatGPT等,查询unicode对应的汉字编码,我们查到是16进制的4e00 - 9fa5. 对应到正则表达式就是\u4e00-\u9fa5 我们对一个字符串进行匹配,必须满足汉字开头,汉字结尾,也就是全部都得是汉字,所以需要用到正则定位符^
和$
来定位开头和结尾。匹配所有汉字1个或多个,使用[\u4e00-\u9fa5]+
此时如果我们匹配的字符串并不全由汉字组成,就会返回false
2. 数字相关
6位数,第一个数不能为0,其余5个数随便。例如123890
public static void main ( String [ ] args) {
String content = "125806" ;
Pattern pattern = Pattern . compile ( "^[1-9]\\d{5}$" ) ;
Matcher matcher = pattern. matcher ( content) ;
if ( matcher. find ( ) ) System . out. println ( "匹配成功" ) ;
else System . out. println ( "匹配失败" ) ;
}
qq号码:1-9开头,剩余数字随便的5-10位数,例如12389,914401258
关键在于使用{num1,num2}来限定数量,因为一共5-10个数,开头确定不能为0,剩余4-9个就可以用\\d{4,9}
来作为匹配规则
手机号码:以13、14、15、18开头的11位数,例如13722095854
3. 验证复杂的URL
下面的案例并不严谨,只是练习,如果想要正在利用正则表达式解决相关问题,做字符串相关的算法题会达到专项提升的效果。类似于数据库中sql语句的运用,就是不断解决问题,提高自己的处理问题的能力。
随便找一个URL为例:https://www.bilibili.com/video/BV1j4411W7F7/?spm_id_from=333.337.search-card.all.click&vd_source=f0637064fb8570e4bb79c51a3c016b30
第一部分:https://或者http://。正则表达式非常简单:(?<one>http(?:s|))://
,首先是命名捕获分组,名称为one,限定匹配https或者http。后面跟:// 第二部分:域名,前面的部分可能由若干个:数字、字母、下划线、横线+一个点
组成。最后会跟.cn或.com等等。(?<two>(?:[\\w-]+\\.)+[\\w-]+)
命名捕获为two,\\w
表示任意字母数字或下划线,[\\w-]
表示从\\w
或者-
选一个。后面跟+,表示匹配若干个,然后\\.
表示匹配点。然后将这部分整体用+修饰,表示匹配若干个。最后通过[\\w-]+
匹配最后的.cn等内容 第3部分:后面的路径和文件名。主要由/分隔,并且由数字、字母、下划线、-、?、=、&、/、%、.、组成。当然第3部分是可有可无的,例如www.baidu.com就没有第三部分。所以用?修饰,表示0个或1个第三部分。正则表达式为(?<three>(?:\/[\w-?=&/%.]*))?$
各位可能有些许疑问,[.]
中的点,为什么不加转义符号,因为点是特殊字符,如果我们想要原样匹配,需要加转义符号[\\.]
的形式。这是因为,类似(?:pattern)和[pattern]这种,都可以不需要转义符,而直接原样匹配特殊字符
public static void main ( String [ ] args) {
String content = "https://www.bilibili.com/video/BV1j4411W7F7/?spm_id_from=333.337.search-card.all.click&vd_source=f0637064fb8570e4bb79c51a3c016b30" ;
Pattern pattern = Pattern . compile (
"(?<one>http(?:s|))://" +
"(?<two>(?:[\\w-]+\\.)+[\\w-]+)" +
"(?<three>(?:\\/[\\w-?=&/%.]*))?$"
) ;
Matcher matcher = pattern. matcher ( content) ;
while ( matcher. find ( ) ) {
System . out. println ( "匹配到的URL:" + matcher. group ( 0 ) ) ;
System . out. println ( "http协议为:" + matcher. group ( "one" ) ) ;
System . out. println ( "主机资源地址(ip+端口号或者域名):" + matcher. group ( "two" ) ) ;
System . out. println ( "路径和文件位置:" + matcher. group ( "three" ) ) ;
}
}
二、反向引用案例
三、结巴去重案例
四、算法题